AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION
A method for detecting rooftop photovoltaic systems in satellite and aerial imagery under degraded spatial resolution is proposed. Object detection is based on solving an image classification task using a large language model to reduce computational load and accelerate the identification process. Th...
Збережено в:
| Дата: | 2026 |
|---|---|
| Автори: | , , |
| Формат: | Стаття |
| Мова: | Українська |
| Опубліковано: |
Institute of Renewable Energy National Academy of Sciences of Ukraine
2026
|
| Теми: | |
| Онлайн доступ: | https://ve.org.ua/index.php/journal/article/view/604 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Vidnovluvana energetika |
Репозитарії
Vidnovluvana energetika| _version_ | 1861137264511287296 |
|---|---|
| author | Shapovalova , S. Matіakh , S. Holovakin , M. |
| author_facet | Shapovalova , S. Matіakh , S. Holovakin , M. |
| author_sort | Shapovalova , S. |
| baseUrl_str | https://ve.org.ua/index.php/journal/oai |
| collection | OJS |
| datestamp_date | 2026-03-30T21:07:05Z |
| description | A method for detecting rooftop photovoltaic systems in satellite and aerial imagery under degraded spatial resolution is proposed. Object detection is based on solving an image classification task using a large language model to reduce computational load and accelerate the identification process. The proposed method is intended for rapid inventory of solar generation facilities to enhance the resilience of Ukraine’s energy infrastructure. Unlike semantic segmentation approaches, which require specialized model training and significant computational resources, the proposed method reformulates the task as binary classification of local image fragments using a large language model. This approach eliminates the need for additional training and reduces overall computational costs by replacing the resource-intensive semantic segmentation task with a binary classification problem applied to local image patches. Four prompt strategies for target object detection are developed and evaluated. An algorithm for simulating limited spatial resolution through controlled scaling and interpolation is introduced. Computational experiments were performed using the GPT-4o large language model to assess alternative strategies for formulating identification criteria for solar generation assets at different levels of spatial resolution. Degradation in the range of 1–2 m/pixel significantly affects detection accuracy. At high detail levels (0.1 – 0.3 m/pixel), the highest performance is achieved by the “binary classification based on image examples” strategy (F1-score = 0.9523). At lower resolutions (1–2 m/pixel), the more robust approaches are “classification based on step-by-step feature analysis” (F1-score = 0.6801) and “classification based on hypotheses” (F1-score = 0.6502). The results demonstrate that multimodal language models can support scalable automated inventory of distributed solar installations over large territories without task-specific training. |
| doi_str_mv | 10.36296/1819-8058.2026.1(84).166-180 |
| first_indexed | 2026-03-31T01:00:08Z |
| format | Article |
| id | veorgua-article-604 |
| institution | Vidnovluvana energetika |
| keywords_txt_mv | keywords |
| language | Ukrainian |
| last_indexed | 2026-03-31T01:00:08Z |
| publishDate | 2026 |
| publisher | Institute of Renewable Energy National Academy of Sciences of Ukraine |
| record_format | ojs |
| spelling | veorgua-article-6042026-03-30T21:07:05Z AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION АВТОМАТИЗОВАНА ІДЕНТИФІКАЦІЯ ДАХОВИХ СОНЯЧНИХ ЕЛЕКТРОСТАНЦІЙ НА ОСНОВІ ВЕЛИКИХ МУЛЬТИМОДАЛЬНИХ МОДЕЛЕЙ В УМОВАХ ОБМЕЖЕНОЇ ВІЗУАЛЬНОЇ ІНФОРМАЦІЇ Shapovalova , S. Matіakh , S. Holovakin , M. aerial photograph, satellite image, solar panels, object detection in images, LLM, GPT, spatial resolution of aerial photographs, energy infrastructure. аерофотознімок, супутниковий знімок, сонячні панелі, визначення об’єктів на зображеннях, LLM, GPT, просторове розділення аерофотознімків, енергетична інфраструктура. A method for detecting rooftop photovoltaic systems in satellite and aerial imagery under degraded spatial resolution is proposed. Object detection is based on solving an image classification task using a large language model to reduce computational load and accelerate the identification process. The proposed method is intended for rapid inventory of solar generation facilities to enhance the resilience of Ukraine’s energy infrastructure. Unlike semantic segmentation approaches, which require specialized model training and significant computational resources, the proposed method reformulates the task as binary classification of local image fragments using a large language model. This approach eliminates the need for additional training and reduces overall computational costs by replacing the resource-intensive semantic segmentation task with a binary classification problem applied to local image patches. Four prompt strategies for target object detection are developed and evaluated. An algorithm for simulating limited spatial resolution through controlled scaling and interpolation is introduced. Computational experiments were performed using the GPT-4o large language model to assess alternative strategies for formulating identification criteria for solar generation assets at different levels of spatial resolution. Degradation in the range of 1–2 m/pixel significantly affects detection accuracy. At high detail levels (0.1 – 0.3 m/pixel), the highest performance is achieved by the “binary classification based on image examples” strategy (F1-score = 0.9523). At lower resolutions (1–2 m/pixel), the more robust approaches are “classification based on step-by-step feature analysis” (F1-score = 0.6801) and “classification based on hypotheses” (F1-score = 0.6502). The results demonstrate that multimodal language models can support scalable automated inventory of distributed solar installations over large territories without task-specific training. Запропоновано метод визначення дахових об’єктів сонячної генерації на супутникових та аерофотознімках за умов деградації їх просторової роздільної здатності. Виявлення об’єкта базується на розв’язанні задачі класифікації на зображеннях великою мовною моделлю для зменшення обчислювального навантаження та пришвидшення процесу ідентифікації. Запропонований метод призначено для оперативної інвентаризації об’єктів сонячної генерації з метою підвищення стійкості енергетичної інфраструктури України. На відміну від підходів семантичної сегментації, що потребують спеціалізованого навчання моделей і значних обчислювальних ресурсів, запропонований підхід з бінарною класифікацією локальних фрагментів зображення LLM не потребує додаткового навчання та дає змогу зменшити сумарні обчислювальні витрати за рахунок переходу від ресурсоємної задачі семантичної сегментації до задачі бінарної класифікації локальних фрагментів зображення. Запропоновано чотири промпт-стратегії виявлення заданого об’єкта на зображеннях. Розроблено алгоритм моделювання обмеженої просторової роздільної здатності знімків, що базується на контрольованому масштабуванні та інтерполяції локальних фрагментів зображення. Проведено обчислювальні експерименти на великій мовній моделі GPT-4o з порівняння стратегій формування критеріїв ідентифікації об’єктів сонячної генерації за різної просторової роздільної здатності. Встановлено закономірності впливу деградації просторової інформації в діапазоні 1–2 м/піксель на ефективність автоматизованої ідентифікації об’єктів. Підтверджено доцільність експериментального вибору логіки ідентифікації до умов просторової деградації зображення. Встановлено, що за високої деталізації, 0.1–0.3 м/піксель, найвищу точність забезпечує стратегія «бінарна класифікація на прикладах зображень» (F1-score = 0.9523), тоді як у разі збільшення масштабу пікселя, 1–2 м/піксель, стійкішими виявляються «класифікація на основі покрокового аналізу ознак» (F1-score = 0.6801) та «класифікація на основі гіпотез» (F1-score = 0.6502). Запропонований метод застосування мультимодальних мовних моделей надає можливість масштабованої автоматизованої інвентаризації об’єктів розподіленої сонячної генерації на великих територіях. Institute of Renewable Energy National Academy of Sciences of Ukraine 2026-03-28 Article Article application/pdf https://ve.org.ua/index.php/journal/article/view/604 10.36296/1819-8058.2026.1(84).166-180 Возобновляемая энергетика; № 1(84) (2026): Scientific and applied Journal renewable energy ; 166-180 Відновлювана енергетика; № 1(84) (2026): Науково-прикладний журнал Відновлювана енергетика; 166-180 Vidnovluvana energetika ; No. 1(84) (2026): Scientific and applied Journal renewable energy ; 166-180 2664-8172 1819-8058 10.36296/1819-8058.2026.1(84) uk https://ve.org.ua/index.php/journal/article/view/604/515 Copyright (c) 2026 Vidnovluvana energetika |
| spellingShingle | aerial photograph satellite image solar panels object detection in images LLM GPT spatial resolution of aerial photographs energy infrastructure. Shapovalova , S. Matіakh , S. Holovakin , M. AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION |
| title | AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION |
| title_alt | АВТОМАТИЗОВАНА ІДЕНТИФІКАЦІЯ ДАХОВИХ СОНЯЧНИХ ЕЛЕКТРОСТАНЦІЙ НА ОСНОВІ ВЕЛИКИХ МУЛЬТИМОДАЛЬНИХ МОДЕЛЕЙ В УМОВАХ ОБМЕЖЕНОЇ ВІЗУАЛЬНОЇ ІНФОРМАЦІЇ |
| title_full | AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION |
| title_fullStr | AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION |
| title_full_unstemmed | AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION |
| title_short | AUTOMATED IDENTIFICATION OF ROOFTOP SOLAR POWER PLANTS USING LARGE MULTIMODAL MODELS UNDER LIMITED VISUAL INFORMATION |
| title_sort | automated identification of rooftop solar power plants using large multimodal models under limited visual information |
| topic | aerial photograph satellite image solar panels object detection in images LLM GPT spatial resolution of aerial photographs energy infrastructure. |
| topic_facet | aerial photograph satellite image solar panels object detection in images LLM GPT spatial resolution of aerial photographs energy infrastructure. аерофотознімок супутниковий знімок сонячні панелі визначення об’єктів на зображеннях LLM GPT просторове розділення аерофотознімків енергетична інфраструктура. |
| url | https://ve.org.ua/index.php/journal/article/view/604 |
| work_keys_str_mv | AT shapovalovas automatedidentificationofrooftopsolarpowerplantsusinglargemultimodalmodelsunderlimitedvisualinformation AT matíakhs automatedidentificationofrooftopsolarpowerplantsusinglargemultimodalmodelsunderlimitedvisualinformation AT holovakinm automatedidentificationofrooftopsolarpowerplantsusinglargemultimodalmodelsunderlimitedvisualinformation AT shapovalovas avtomatizovanaídentifíkacíâdahovihsonâčnihelektrostancíjnaosnovívelikihmulʹtimodalʹnihmodelejvumovahobmeženoívízualʹnoíínformacíí AT matíakhs avtomatizovanaídentifíkacíâdahovihsonâčnihelektrostancíjnaosnovívelikihmulʹtimodalʹnihmodelejvumovahobmeženoívízualʹnoíínformacíí AT holovakinm avtomatizovanaídentifíkacíâdahovihsonâčnihelektrostancíjnaosnovívelikihmulʹtimodalʹnihmodelejvumovahobmeženoívízualʹnoíínformacíí |