AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION

A method for detecting rooftop photovoltaic systems in satellite and aerial imagery under degraded spatial resolution is proposed. Object detection is based on solving an image classification task using a large language model to reduce computational load and accelerate the identification process. Th...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2026
Hauptverfasser: Shapovalova , S., Matіakh , S., Holovakin , M.
Format: Artikel
Sprache:Ukrainisch
Veröffentlicht: Institute of Renewable Energy National Academy of Sciences of Ukraine 2026
Schlagworte:
Online Zugang:https://ve.org.ua/index.php/journal/article/view/604
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Vidnovluvana energetika

Institution

Vidnovluvana energetika
_version_ 1861137264511287296
author Shapovalova , S.
Matіakh , S.
Holovakin , M.
author_facet Shapovalova , S.
Matіakh , S.
Holovakin , M.
author_sort Shapovalova , S.
baseUrl_str https://ve.org.ua/index.php/journal/oai
collection OJS
datestamp_date 2026-03-30T21:07:05Z
description A method for detecting rooftop photovoltaic systems in satellite and aerial imagery under degraded spatial resolution is proposed. Object detection is based on solving an image classification task using a large language model to reduce computational load and accelerate the identification process. The proposed method is intended for rapid inventory of solar generation facilities to enhance the resilience of Ukraine’s energy infrastructure. Unlike semantic segmentation approaches, which require specialized model training and significant computational resources, the proposed method reformulates the task as binary classification of local image fragments using a large language model. This approach eliminates the need for additional training and reduces overall computational costs by replacing the resource-intensive semantic segmentation task with a binary classification problem applied to local image patches. Four prompt strategies for target object detection are developed and evaluated. An algorithm for simulating limited spatial resolution through controlled scaling and interpolation is introduced. Computational experiments were performed using the GPT-4o large language model to assess alternative strategies for formulating identification criteria for solar generation assets at different levels of spatial resolution. Degradation in the range of 1–2 m/pixel significantly affects detection accuracy. At high detail levels (0.1 – 0.3 m/pixel), the highest performance is achieved by the “binary classification based on image examples” strategy (F1-score = 0.9523). At lower resolutions (1–2 m/pixel), the more robust approaches are “classification based on step-by-step feature analysis” (F1-score = 0.6801) and “classification based on hypotheses” (F1-score = 0.6502). The results demonstrate that multimodal language models can support scalable automated inventory of distributed solar installations over large territories without task-specific training.
doi_str_mv 10.36296/1819-8058.2026.1(84).166-180
first_indexed 2026-03-31T01:00:08Z
format Article
id veorgua-article-604
institution Vidnovluvana energetika
keywords_txt_mv keywords
language Ukrainian
last_indexed 2026-03-31T01:00:08Z
publishDate 2026
publisher Institute of Renewable Energy National Academy of Sciences of Ukraine
record_format ojs
spelling veorgua-article-6042026-03-30T21:07:05Z AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION АВТОМАТИЗОВАНА ІДЕНТИФІКАЦІЯ ДАХОВИХ СОНЯЧНИХ ЕЛЕКТРОСТАНЦІЙ НА ОСНОВІ ВЕЛИКИХ МУЛЬТИМОДАЛЬНИХ МОДЕЛЕЙ В УМОВАХ ОБМЕЖЕНОЇ ВІЗУАЛЬНОЇ ІНФОРМАЦІЇ Shapovalova , S. Matіakh , S. Holovakin , M. aerial photograph, satellite image, solar panels, object detection in images, LLM, GPT, spatial resolution of aerial photographs, energy infrastructure. аерофотознімок, супутниковий знімок, сонячні панелі, визначення об’єктів на зображеннях, LLM, GPT, просторове розділення аерофотознімків, енергетична інфраструктура. A method for detecting rooftop photovoltaic systems in satellite and aerial imagery under degraded spatial resolution is proposed. Object detection is based on solving an image classification task using a large language model to reduce computational load and accelerate the identification process. The proposed method is intended for rapid inventory of solar generation facilities to enhance the resilience of Ukraine’s energy infrastructure. Unlike semantic segmentation approaches, which require specialized model training and significant computational resources, the proposed method reformulates the task as binary classification of local image fragments using a large language model. This approach eliminates the need for additional training and reduces overall computational costs by replacing the resource-intensive semantic segmentation task with a binary classification problem applied to local image patches. Four prompt strategies for target object detection are developed and evaluated. An algorithm for simulating limited spatial resolution through controlled scaling and interpolation is introduced. Computational experiments were performed using the GPT-4o large language model to assess alternative strategies for formulating identification criteria for solar generation assets at different levels of spatial resolution. Degradation in the range of 1–2 m/pixel significantly affects detection accuracy. At high detail levels (0.1 – 0.3 m/pixel), the highest performance is achieved by the “binary classification based on image examples” strategy (F1-score = 0.9523). At lower resolutions (1–2 m/pixel), the more robust approaches are “classification based on step-by-step feature analysis” (F1-score = 0.6801) and “classification based on hypotheses” (F1-score = 0.6502). The results demonstrate that multimodal language models can support scalable automated inventory of distributed solar installations over large territories without task-specific training. Запропоновано метод визначення дахових об’єктів сонячної генерації на супутникових та аерофотознімках за умов деградації їх просторової роздільної здатності. Виявлення об’єкта базується на розв’язанні задачі класифікації на зображеннях великою мовною моделлю для зменшення обчислювального навантаження та пришвидшення процесу ідентифікації. Запропонований метод призначено для оперативної інвентаризації об’єктів сонячної генерації з метою підвищення стійкості енергетичної інфраструктури України. На відміну від підходів семантичної сегментації, що потребують спеціалізованого навчання моделей і значних обчислювальних ресурсів, запропонований підхід з бінарною класифікацією локальних фрагментів зображення LLM не потребує додаткового навчання та дає змогу зменшити сумарні обчислювальні витрати за рахунок переходу від ресурсоємної задачі семантичної сегментації до задачі бінарної класифікації локальних фрагментів зображення. Запропоновано чотири промпт-стратегії виявлення заданого об’єкта на зображеннях. Розроблено алгоритм моделювання обмеженої просторової роздільної здатності знімків, що базується на контрольованому масштабуванні та інтерполяції локальних фрагментів зображення. Проведено обчислювальні експерименти на великій мовній моделі GPT-4o з порівняння стратегій формування критеріїв ідентифікації об’єктів сонячної генерації за різної просторової роздільної здатності. Встановлено закономірності впливу деградації просторової інформації в діапазоні 1–2 м/піксель на ефективність автоматизованої ідентифікації об’єктів. Підтверджено доцільність експериментального вибору логіки ідентифікації до умов просторової деградації зображення. Встановлено, що за високої деталізації, 0.1–0.3 м/піксель, найвищу точність забезпечує стратегія «бінарна класифікація на прикладах зображень» (F1-score = 0.9523), тоді як у разі збільшення масштабу пікселя, 1–2 м/піксель, стійкішими виявляються «класифікація на основі покрокового аналізу ознак» (F1-score = 0.6801) та «класифікація на основі гіпотез» (F1-score = 0.6502). Запропонований метод застосування мультимодальних мовних моделей надає можливість масштабованої автоматизованої інвентаризації об’єктів розподіленої сонячної генерації на великих територіях. Institute of Renewable Energy National Academy of Sciences of Ukraine 2026-03-28 Article Article application/pdf https://ve.org.ua/index.php/journal/article/view/604 10.36296/1819-8058.2026.1(84).166-180 Возобновляемая энергетика; № 1(84) (2026): Scientific and applied Journal renewable energy ; 166-180 Відновлювана енергетика; № 1(84) (2026): Науково-прикладний журнал Відновлювана енергетика; 166-180 Vidnovluvana energetika ; No. 1(84) (2026): Scientific and applied Journal renewable energy ; 166-180 2664-8172 1819-8058 10.36296/1819-8058.2026.1(84) uk https://ve.org.ua/index.php/journal/article/view/604/515 Copyright (c) 2026 Vidnovluvana energetika
spellingShingle aerial photograph
satellite image
solar panels
object detection in images
LLM
GPT
spatial resolution of aerial photographs
energy infrastructure.
Shapovalova , S.
Matіakh , S.
Holovakin , M.
AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION
title AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION
title_alt АВТОМАТИЗОВАНА ІДЕНТИФІКАЦІЯ ДАХОВИХ СОНЯЧНИХ ЕЛЕКТРОСТАНЦІЙ НА ОСНОВІ ВЕЛИКИХ МУЛЬТИМОДАЛЬНИХ МОДЕЛЕЙ В УМОВАХ ОБМЕЖЕНОЇ ВІЗУАЛЬНОЇ ІНФОРМАЦІЇ
title_full AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION
title_fullStr AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION
title_full_unstemmed AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION
title_short AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION
title_sort automated identification of rooftop solar power plants using large multimodal models under limited visual information
topic aerial photograph
satellite image
solar panels
object detection in images
LLM
GPT
spatial resolution of aerial photographs
energy infrastructure.
topic_facet aerial photograph
satellite image
solar panels
object detection in images
LLM
GPT
spatial resolution of aerial photographs
energy infrastructure.
аерофотознімок
супутниковий знімок
сонячні панелі
визначення об’єктів на зображеннях
LLM
GPT
просторове розділення аерофотознімків
енергетична інфраструктура.
url https://ve.org.ua/index.php/journal/article/view/604
work_keys_str_mv AT shapovalovas automatedidentificationofrooftopsolarpowerplantsusinglargemultimodalmodelsunderlimitedvisualinformation
AT matíakhs automatedidentificationofrooftopsolarpowerplantsusinglargemultimodalmodelsunderlimitedvisualinformation
AT holovakinm automatedidentificationofrooftopsolarpowerplantsusinglargemultimodalmodelsunderlimitedvisualinformation
AT shapovalovas avtomatizovanaídentifíkacíâdahovihsonâčnihelektrostancíjnaosnovívelikihmulʹtimodalʹnihmodelejvumovahobmeženoívízualʹnoíínformacíí
AT matíakhs avtomatizovanaídentifíkacíâdahovihsonâčnihelektrostancíjnaosnovívelikihmulʹtimodalʹnihmodelejvumovahobmeženoívízualʹnoíínformacíí
AT holovakinm avtomatizovanaídentifíkacíâdahovihsonâčnihelektrostancíjnaosnovívelikihmulʹtimodalʹnihmodelejvumovahobmeženoívízualʹnoíínformacíí