Technology of improving the land use data accuracy for geospatial modeling tasks

The aim of the research is increasing the accuracy of land cover classification (LULC) based on Dynamic World (DW) data for the controlled territory of Ukraine. One of the key problems of such data is the regional specificity of the land use regime, which reduces the reliability of the global averag...

Full description

Saved in:
Bibliographic Details
Date:2026
Main Authors: Okhariev, Viacheslav, Pidsadnii, Serhii
Format: Article
Language:Ukrainian
Published: Kyiv National University of Construction and Architecture 2026
Subjects:
Online Access:https://es-journal.in.ua/article/view/364955
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Environmental safety and natural resources
Download file: Pdf

Institution

Environmental safety and natural resources
_version_ 1868294496310001664
author Okhariev, Viacheslav
Pidsadnii, Serhii
author_facet Okhariev, Viacheslav
Pidsadnii, Serhii
author_institution_txt_mv [ { "author": "Viacheslav Okhariev", "institution": "Кандидат технічних наук, старший дослідник, старший науковий співробітник відділу природних ресурсів, в.о. заступника директора з науково-організаційної роботи Інституту телекомунікацій і глобального інформаційного простору Національної академії наук України, Київ" }, { "author": "Serhii Pidsadnii", "institution": "Аспірант Інституту телекомунікацій і глобального інформаційного простору Національної академії наук України, Київ" } ]
author_sort Okhariev, Viacheslav
baseUrl_str http://es-journal.in.ua/oai
collection OJS
datestamp_date 2026-06-17T08:46:16Z
description The aim of the research is increasing the accuracy of land cover classification (LULC) based on Dynamic World (DW) data for the controlled territory of Ukraine. One of the key problems of such data is the regional specificity of the land use regime, which reduces the reliability of the global average world classification. The basic accuracy of the DW classification for all of Ukraine is 51%, which is significantly lower than the declared one (~72%). The exclusion of occupied and frontline territories and partial re-verification of reference points allowed to increase the accuracy to 64.58%, Kappa coefficient (κ) 0.600. Methods for refining the classification based on the seasonal amplitude of NDVI and the summer phenology filter did not provide an increase in accuracy due to the significant spectral overlap of vegetation cover classes. The method of object-oriented analysis based on cadastral boundaries showed the inaccuracy of such an approach even at the stage of material preparation. Instead, the Random Forest machine learning model, built on NDVI phenological indicators, annual mean class, and DW probability bands, achieved an accuracy of 68.10%, Kappa 0.637, which corresponds to the category of substantial agreement and is the best result among the studied methods.
doi_str_mv 10.32347/2411-4049.2026.2.72-82
first_indexed 2026-06-18T01:01:16Z
format Article
fulltext ~ 72 ~ ISSN: 2411-4049. Екологічна безпека та природокористування, вип. 2 (58), 2026 УДК 502.51:504 Viacheslav Okhariev, Candidate of Engineering Sciences, Senior Researcher, Acting Deputy Director for Scientific and Organizational Affairs of Institute of Telecommunications and Global Information Space of NAS of Ukraine ORCID ID: https://orcid.org/0000-0001-6270-6293 e-mail: okhariev.vo@gmail.com Serhii Pidsadnii, Postgraduate of Institute of Telecommunications and Global Information Space of NAS of Ukraine ORCID ID: https://orcid.org/0009-0003-7406-500X e-mail: sergiy.pidsadniy@gmail.com Institute of Telecommunications and Global Information Space of NASU, Kyiv, Ukraine TECHNOLOGY OF IMPROVING THE LAND USE DATA ACCURACY FOR GEOSPATIAL MODELING TASKS Abstract. The aim of the research is increasing the accuracy of land cover classification (LULC) based on Dynamic World (DW) data for the controlled territory of Ukraine. One of the key problems of such data is the regional specificity of the land use regime, which reduces the reliability of the global average world classification. The basic accuracy of the DW classification for all of Ukraine is 51%, which is significantly lower than the declared one (~72%). The exclusion of occupied and frontline territories and partial re-verification of reference points allowed to increase the accuracy to 64.58%, Kappa coefficient (κ) 0.600. Methods for refining the classification based on the seasonal amplitude of NDVI and the summer phenology filter did not provide an increase in accuracy due to the significant spectral overlap of vegetation cover classes. The method of object- oriented analysis based on cadastral boundaries showed the inaccuracy of such an approach even at the stage of material preparation. Instead, the Random Forest machine learning model, built on NDVI phenological indicators, annual mean class, and DW probability bands, achieved an accuracy of 68.10%, Kappa 0.637, which corresponds to the category of substantial agreement and is the best result among the studied methods. Keywords: geospatial modeling, land use data, machine learning. В.О. Охарєв, С.Г. Підсадній Інститут телекомунікацій і глобального інформаційного простору НАН України, м. Київ, Україна ТЕХНОЛОГІЯ ПІДВИЩЕННЯ ТОЧНОСТІ ДАНИХ ЗЕМЛЕКОРИСТУВАННЯ ДЛЯ ЗАДАЧ ГЕОПРОСТОРОВОГО МОДЕЛЮВАННЯ Анотація. Дослідження присвячене підвищенню точності класифікації земного покриву (LULC) за даними Dynamic World (DW) для підконтрольної території України. Однією з ключових проблем таких даних є регіональна специфіка режиму землекористування, яка знижує достовірність глобальної середньосвітової класифікації. Базова точність класифікації DW для всієї України становить 51%, що суттєво нижче заявленої (~72%). Виключення окупованих та прифронтових територій і часткова повторна верифікація опорних точок дозволили підвищити точність до 64,58%, коефіцієнт Каппа (κ) © В.О. Охарєв, С.Г. Підсадній, 2026 mailto:okhariev.vo@gmail.com https://orcid.org/0009-0003-7406-500X mailto:sergiy.pidsadniy@gmail.com ~ 73 ~ ISSN: 2411-4049. Екологічна безпека та природокористування, вип. 2 (58), 2026 0,600. Методи уточнення класифікації на основі сезонної амплітуди NDVI та фільтру літньої фенології не забезпечили приросту точності через значне спектральне перекриття класів рослинного покриву. Метод об’єктно- орієнтованого аналізу на базі кадастрових меж ще на стадії підготовки матеріалу показав хибність такого підходу. Натомість модель машинного навчання Random Forest, побудована на фенологічних індикаторах NDVI, середньорічному класі та імовірнісних bands DW, досягла точності 68,10%, Каппа 0,637, що відповідає категорії суттєвої узгодженості та є найкращим результатом серед досліджених методів. Ключові слова: геопросторове моделювання, дані землекористування, машинне навчання. https://doi.org/10.32347/2411-4049.2026.2.72-82 Вступ У попередніх дослідженнях динаміки землекористування в Україні було застосовано класифікацію Dynamic World – глобальний продукт дистанційного зондування, розроблений Google та WRI, із заявленою точністю ~72%. Однак верифікація на основі репрезентативної вибірки виявила точність лише 51,15% для всієї території України [1], що свідчить про наявність специфічних регіональних факторів, які суттєво впливають на якість класифікації. Одним із таких факторів є військові дії: починаючи з 2014 року близько 20% території України перебуває під окупацією або в зоні активних бойових дій, що призводить до порушення характерного патерну землекористування і ускладнює автоматичну ідентифікацію класів [2, 3]. Оскільки подальші дослідження передбачають аналіз процесів, пов'язаних зі сталим режимом господарювання (зокрема динаміки приповерхневої температури LST), зазначені території було виключено з аналізу. Серед інших джерел помилок класифікації – плутанина між класом сільськогосподарських угідь (crops) та суміжними класами рослинного покриву. Структура агроландшафту України з переважанням великих монокультурних полів [5] теоретично створює передумови для чіткої диференціації класів на основі сезонної амплітуди NDVI [6] та фенологічних індикаторів [7]. Однак широкий діапазон подібності спектральних характеристик між класами зумовив необхідність застосування моделі машинного навчання Random Forest [8], яка враховує комплекс фенологічних параметрів разом з імовірнісними характеристиками класифікації DW. Обмеження зони дослідження Як показано попередньо [1], класифікація DW для всієї України демонструє точність нижчу заявленій ~22%. Така розбіжність пояснюється, зокрема, підвищеною просторово-часовою неоднорідністю землекористування внаслідок військових дій 2014-2024 рр. Значні площі сільськогосподарських угідь у зонах бойових дій тимчасово не обробляються або використовуються нерегулярно [2, 3], що ускладнює їх однозначну ідентифікацію алгоритмами класифікації. З метою підвищення достовірності оцінки точності з аналізу було виключено: тимчасово окуповані території, 25-кілометрову буферну зону від лінії фронту та державного кордону з РФ (станом на літо 2024 р.), а також ~ 74 ~ ISSN: 2411-4049. Екологічна безпека та природокористування, вип. 2 (58), 2026 окремі деокуповані регіони (рис. 1). Північ Київської та Чернігівської областей, деокуповані раніше, за даними Supporting Transparent Land Governance in Ukraine [9] у 2024 році мали відносно стабільний режим господарювання і були включені до аналізу. Рис. 1. Зони обмеження дослідження: окуповані території та буферні зони Після виключення зазначених територій кількість верифікаційних точок зменшилась з 2168 до 1466. Для компенсації щільності вибірки було додано 534 нові точки методом випадкової стратифікованої вибірки та доведено до загальної кількості в 2000 точок. Щільність вибірки зросла з 0,0036 до 0,0046 т/км², що становить +28% та відповідає рекомендованим значенням [10]. До растру була застосована морфологічна фільтрація – фільтр просіювання (Sieve filter, < 5 пікселів) – та проведено операцію ерозії (3×3) для зменшення впливу змішаних пікселів. Верифікаційні точки розміщувались виключно в межах однорідних ділянок для мінімізації крайових ефектів. Оновлена оцінка точності після перерахунку вибірки становила 58,7%, κ-0,53. Додатково було проведено повторну верифікацію 150 випадково обраних точок з підмножини невідповідностей між еталонними даними та результатами класифікації на основі багаточасових знімків Sentinel-2 за 2024 рік з виключенням дрібних анклавів (5-15 пікселів). У результаті точність зросла до 64,58%, κ-0,600 (рис. 2а). Аналіз матриці помилок виявив, що основним джерелом невизначеності є плутанина між класом crops та класами рослинного покриву (trees, grass, flooded vegetation, shrub & scrub). Після об'єднання цих класів у єдину категорію (GZ) точність зросла до 76,14%, κ-0,661 (рис. 2b), що узгоджується із заявленими показниками продукту та свідчить про те, що класифікація надійно розрізняє рослинні та нерослинні класи, однак має суттєві труднощі у диференціації сільськогосподарських угідь та природної рослинності. Додатково виявлено плутанину між crops та bare ground, що пов'язано із сезонними змінами стану посівів (фенологічна плутанина). ~ 75 ~ ISSN: 2411-4049. Екологічна безпека та природокористування, вип. 2 (58), 2026 a b Рис. 2. Матриця помилок класифікації DW та верифікованих даних за 2024 р. Базова (a), з об'єднаним класом (b) Об'єктно-орієнтований аналіз (OBIA) Було розглянуто можливість використання кадастрових меж [11] як допоміжних даних для уточнення класу crops. Однак попередній аналіз показав, що категорії земельного призначення в кадастрі (land use) не забезпечують достатньої відповідності фактичному земному покриву (land cover): в межах ділянок сільськогосподарського призначення спостерігається значна внутрішня неоднорідність – лісосмуги, трав'яниста рослинність, забудова (рис. 3). Це призводить до систематичних помилок при агрегації на рівні ділянок, тому використання кадастрових меж для автоматизованої корекції класифікації було визнано недоцільним. Рис. 3. Приклад кадастрових ділянок категорії Землі сільськогосподарського призначення, які включають в себе не тільки сільськогосподарські угіддя (crops), а і trees, grass та інші. Sentinel-2 L2A, 2024 р. Держгеокадастр [12] NDVI amplitude та фільтр літньої фенології (SPF) Оскільки класи crops, bare ground, grass та shrub & scrub можуть мати схожу спектральну характеристику в різні сезони, річна мода класифікації DW може відображати перехідні стани рослинності, що підвищує ймовірність помилкової ідентифікації. Щоб частково подолати це обмеження, застосовано метод NDVI amplitude у поєднанні з фільтром літньої фенології. В основі методу NDVI amplitude лежить аналіз сезонної динаміки рослинності. Для сільськогосподарських угідь характерна висока сезонна амплітуда NDVI [6, 13], на відміну від інших класів (табл. 1). ~ 76 ~ ISSN: 2411-4049. Екологічна безпека та природокористування, вип. 2 (58), 2026 Таблиця 1. Стабільність індексу NDVI в класах DW клас фенологічне вікно trees стабільно високий NDVI grass помірна сезонна зміна scrub & scrub відносно стабільний сигнал crops різкий сезонний пік (NDVI max (липень-серпень), NDVI min (квітень, жовтень)) Для NDVI amplitude застосовано поріг > 0,45 як індикатор інтенсивної сезонної зміни рослинності, характерної для crops. Однак даний метод може хибно спрацьовувати для пікселів природної трав'янистої рослинності, яка також демонструє сезонний пік влітку. Для зменшення цієї плутанини додатково застосовувався SPF, що обмежує аналіз класифікації літнім періодом (червень-серпень), коли більшість культур перебуває у фазі максимальної біомаси або демонструє різкий спад після збирання врожаю, а спектральний сигнал crops є найбільш вираженим. Рис. 4. Матриця помилок після реалізації методів NDVI amplitude та фільтру літньої фенології Рис. 5. Діапазон амплітуди NDVI для класів LULC в Україні Матриця помилок (рис. 4) показала зниження точності до 58,78%, коефіцієнта Каппа до 0,534 порівняно з базовою DW. Проте потрібно врахувати величину похибки перепроєктування растру з EPSG:4326 в EPSG:3035, який був використаний для оцінки площ. Вона може становити 2-3% через реінтерполяцію пікселів, реальне зниження точності оцінюється в межах 2,95%-5.8%, κ-0,034-0,066. Підвищення рівня плутанини між crops та суміжними класами рослинності пояснюється тим, що природна трав'яниста рослинність України також демонструє літній спектральний сигнал, близький до crops. Класи не можуть бути надійно розрізнені виключно пороговими значеннями NDVI через значне перекриття їх діапазонів амплітуди (рис. 5). ~ 77 ~ ISSN: 2411-4049. Екологічна безпека та природокористування, вип. 2 (58), 2026 Аналіз фенологічних порогів Для детальнішої перевірки можливостей NDVI-корекції було відібрано точки вибірки, де DW помилково класифікував crops як grass, shrub, trees або flooded vegetation. Хмарні пікселі маскувались на основі SCL-каналу (Scene Classification Layer). Аналіз охопив 1364 точки з 2000, для яких були наявні безхмарні знімки у чотирьох фенологічних вікнах: T1 (березень), T2 (червень), T3 (серпень–вересень), T4 (жовтень). Розраховано індикатори сезонної динаміки NDVI: літнє падіння (T2-T3), весняне зростання (T2-T1), амплітуда (T2-min (T1,T4)). Аналіз показав, що медіанні значення NDVI у помилково класифікованих пікселях crops статистично не відрізняються від справжніх пікселів grass та shrub & shrub у жодному з фенологічних вікон – різниця медіан не перевищує 0,05-0,07 одиниць NDVI (рис. 6). Якість порогової корекції оцінювалась через показники: F1 = 2 × (Precision × Recall) / (Precision + Recall) , де Precision – частка істинних crops серед відібраних підозрілих пікселів, Recall – частка істинних crops серед усіх верифікованих точок crops, для яких індикатор перевищив заданий поріг. При малих порогах (0,05-0,15) відбирається значна кількість пікселів (132-459) але лише 10-15% з них є реальними crops. При високих порогах (≥ 0,30) Precision зростає до 75-100%, але охоплює лише 1-8 пікселів, що унеможливлює практичне застосування. Максимальне значення F1 = 0,14 при жодному з порогів не досягає прийнятного рівня – криві Precision і Recall розходяться без точки збалансованого перетину. Це свідчить про відсутність чіткої фенологічної межі між crops та суміжними класами за індикатором NDVI і підтверджує недостатність одновимірних спектральних ознак для надійної піксельної корекції. Рис. 6. Залежність Precision, Recall та F1-міри від порогового значення індикатора літнього падіння (різниця (NDVI(T2-T3)) при виявленні помилково класифікованих пікселів сільськогосподарських угідь (crops) серед класів grass, shrub, trees та flooded vegetation у класифікації DW (Sentinel-2 L2A, 2024 р.). Пунктирна лінія відповідає цільовому значенню точності 70% ~ 78 ~ ISSN: 2411-4049. Екологічна безпека та природокористування, вип. 2 (58), 2026 Random Forest з DW probability bands Глобально навчені класифікатори, такі як DW, часто демонструють систематичні помилки в регіонах зі специфічними агроландшафтними патернами, недостатньо представленими у глобальній навчальній вибірці. Досвід подібних досліджень показує, що навчання моделі на місцевих верифікованих даних помітно покращує результат порівняно з глобальними підходами. Продукт DW для кожного пікселя надає не лише домінуючий клас, але й середньорічні ймовірності належності до кожного з 9 класів (probability bands) – відкриті дані, доступні через Google Earth Engine. До прикладу індекс пікселя crops = 0,41 та grass = 0,38, що є значно менш надійним, ніж піксель з crops = 0,89. Така інформація про невизначеність класифікації може бути використана для її уточнення. Тому для корекції класів нами було застосовано алгоритм Random Forest (RF) [8] – метод, що будує множину незалежних дерев рішень і визначає клас голосуванням більшості, та забезпечує стійкість до перенавчання та здатність обробляти нелінійні залежності між ознаками [14, 15]. Модель реалізована засобами бібліотеки scikit-learn (Python) [16]. Для навчання моделі використано 17 ознак для 1242 верифікованих точок: - фенологічні індикатори NDVI (Sentinel-2 L2A, маскування через SCL): значення NDVI у вікнах T1-T4, літнє падіння, весняне зростання, сезонна амплітуда; - середньорічний клас DW за 2024 р.; - DW probability bands: середньорічна ймовірність належності пікселя до кожного з 9 класів. Клас пікселя визначався голосуванням B = 500 дерев: ŷ = argmax Σ(b=1 до B) I(hb(x) = c), де ŷ – передбачений клас, hb – b-те дерево рішень, x – вектор ознак, c – клас, I – індикаторна функція. Вибірка розділена на тренувальну (70%, n = 869) і тестову (30%, n = 373) частини зі стратифікацією. Проведена 5-кратна крос-валідація для оцінки стабільності. Рис. 7. Баланс виправлень класів моделі RF відносно DW. Тестова вибірка (n = 373 точки) ~ 79 ~ ISSN: 2411-4049. Екологічна безпека та природокористування, вип. 2 (58), 2026 Результати Модель RF досягла точності 68,10%, κ-0,637, що відповідає категорії “суттєвої узгодженості” за шкалою Landis & Koch [17] і є найкращим результатом серед усіх досліджених методів (табл. 2) та найбільш наближена до заявленої точності [18]. Стабільність підтверджена крос-валідацією: 67,32% ± 2,79%. Найбільший внесок у класифікацію зробили probability bands flooded_vegetation, built area, water та bare ground, що свідчить про більшу дискримінативну цінність інформації про невизначеність класифікації порівняно з фенологічними індикаторами NDVI окремо. Аналіз балансу виправлень на тестовій вибірці (рис. 6) показав, що RF найефективніше виправив помилки для класів crops (+14), flooded vegetation (+11) та bare ground (+10), водночас погіршив класифікацію для shrub & scrub (-9) та trees (-9) – класів з найбільшим спектральним перекриттям. Таблиця 2. Порівняння результатів методів підвищення точності класифікації LULC DW метод точність (accuracy) коефіцієнт Kaппa Базовий (перепроєктований в EPSG:3035) DW 64.58% 0.600 Базовий DW (GEE) 61.73% 0.568 NDVI amplitude + summer filter 60.28% 0.551 RF + DW probability bands 68.10% 0.637 Висновки Дослідження показало, що класифікація LULC DW, попри науково обґрунтовану загальну точність > 70%, демонструє суттєве зниження якості для території України. Найбільший приріст точності (+10,6%-13,4%, κ-0,128-0,160) досягнуто шляхом виключення окупованих та прифронтових територій і часткової повторної верифікації опорних точок, що підтверджує значний вплив військового чинника на якість класифікації. Методи на основі сезонної амплітуди NDVI та фільтру літньої фенології виявились неефективними через значне спектральне перекриття класів рослинного покриву в умовах України (зниження точності на 2,95%-5,8%). Серед усіх випробуваних підходів найкращий результат показала модель RF – 68,10% точності, κ-0,637. Це максимально наближений результат до заявленої точності і є достатнім, щоб використовувати уточнену класифікацію як основу для подальшого аналізу землекористування. Перспективним напрямком для подальшого підвищення точності є включення даних радарного зондування Sentinel-1 SAR, які не залежать від хмарності та забезпечують додаткову інформацію про структуру поверхні. ~ 80 ~ ISSN: 2411-4049. Екологічна безпека та природокористування, вип. 2 (58), 2026 СПИСОК ЛІТЕРАТУРИ 1. Охарєв, В., & Підсадній, С. (2025). Геоінформаційна технологія моніторингу динаміки структури землекористування на основі аналізу супутникових зображень. Екологічна безпека та природокористування, 55(3), 87–96. https://doi.org/10.32347/2411-4049.2025.3.87-96 2. Kussul, N., Shelestov, A., Yailymov, B., Yailimova, H., & Lemoine, G. (2025). Assessment of war-induced agricultural land use changes in Ukraine using machine learning applied to Sentinel satellite data. International Journal of Applied Earth Observation and Geoinformation, 140, 104551. https://doi.org/10.1016/j.jag.2025.104551 3. Zavodiana, M., Ibatullin, Sh., Sakal, O., Kharytonenko, R., & Derkulskyi, R. (2025). Detecting war-induced abandoned cropland in Ukraine using remote sensing. In International Conference of Young Professionals «GeoTerrace-2025» (pp. 1-5). https://doi.org/10.3997/2214-4609.202552075 4. Wang, W., Li, W., Zhang, C., & Zhang, W. (2018). Improving object-based land use/cover classification from medium resolution imagery by Markov chain geostatistical post-classification. Land, 7(1), 31. https://doi.org/10.3390/land7010031 5. Столярчук, Н., & Крилов, М. (2026). Структура сільських територій України до та під час війни – економічні аспекти. Економіка та суспільство, (84). https://doi.org/10.32782/2524-0072/2026-84-162 6. Ramírez-Cuesta, J. M., Minacapilli, M., Motisi, A., Consoli, S., Intrigliolo, D. S., & Vanella, D. (2021). Characterization of the main land processes occurring in Europe (2000-2018) through a MODIS NDVI seasonal parameter-based procedure. Science of The Total Environment, 799, 149346. https://doi.org/10.1016/j.scitotenv.2021.149346 7. Dash, P., Sanders, S. L., Parajuli, P., & Ouyang, Y. (2023). Improving the accuracy of land use and land cover classification of Landsat data in an agricultural watershed. Remote Sensing, 15(16), 4020. https://doi.org/10.3390/rs15164020 8. Breiman, L. (2001). Random forests. Machine Learning, 45, 5-32. https://doi.org/10.1023/A:1010933404324 9. World Food Programme. (n.d.). Ukraine Crop Maps. https://ukraine-cropmaps.com/ 10. Olofsson, P., Foody, G. M., Herold, M., Stehman, S. V., Woodcock, C. E., & Wulder, M. A. (2014). Good practices for estimating area and assessing accuracy of land change. Remote Sensing of Environment, 148, 42-57. https://doi.org/10.1016/j.rse. 2014.01.015 11. Hütt, C., Waldhoff, G., & Bareth, G. (2020). Fusion of Sentinel-1 with official topographic and cadastral geodata for crop-type enriched LULC mapping using FOSS and open data. ISPRS International Journal of Geo-Information, 9(2), 120. https://doi.org/10.3390/ijgi9020120 12. State Service of Ukraine for Geodesy, Cartography and Cadastre. (n.d.). Main page. https://land.gov.ua/ 13. Сергєєва, К., Кавац, Ю., Ковров, О., & Чумичов, Д. (2025). Інформаційна технологія виявлення покинутих сільськогосподарських угідь на основі супутникового моніторингу. У Системи контролю інформації та інтелектуальні технології: досягнення та застосування (с. 197-211). https://doi.org/10.36059/978-966-397-538-2-11 14. Rodriguez-Galiano, V., Ghimire, B., Rogan, J., Chica, M., & Rigol-Sanchez, J. (2012). An assessment of the effectiveness of a random forest classifier for land-cover classification. ISPRS Journal of Photogrammetry and Remote Sensing, 67, 93-104. 15. Belgiu, M., & Drǎguţ, L. (2016). Random forest in remote sensing: A review of applications and future directions. ISPRS Journal of Photogrammetry and Remote Sensing, 114, 24-31. 16. Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., ... & Duchesnay, E. (2012). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825-2830. ~ 81 ~ ISSN: 2411-4049. Екологічна безпека та природокористування, вип. 2 (58), 2026 17. McHugh, M. L. (2012). Interrater reliability: the kappa statistic. Biochemia Medica, 22(3), 276-282. https://hrcak.srce.hr/89395 18. Brown, C. F., Brumby, S. P., Guzder-Williams, B., et al. (2022). Dynamic World, Near real-time global 10 m land use land cover mapping. Scientific Data, 9, 251. https://doi.org/10.1038/s41597-022-01307-4 Стаття надійшла до редакції 29.01.2026, надійшла після рецензування 10.03.2026, прийнята 31.03.2026 REFERENCES 1. Okhariev, V., & Pidsadnii, S. (2025). Geoinformation technology for land use dynamics monitoring based on the analysis of satellite images. Environmental Safety and Natural Resources, 55(3), 87–96. https://doi.org/10.32347/2411-4049.2025.3.87-96 2. Kussul, N., Shelestov, A., Yailymov, B., Yailimova, H., & Lemoine, G. (2025). Assessment of war-induced agricultural land use changes in Ukraine using machine learning applied to Sentinel satellite data. International Journal of Applied Earth Observation and Geoinformation, 140, 104551. https://doi.org/10.1016/j.jag.2025.104551 3. Zavodiana, M., Ibatullin, Sh., Sakal, O., Kharytonenko, R., & Derkulskyi, R. (2025). Detecting war-induced abandoned cropland in Ukraine using remote sensing. In International Conference of Young Professionals «GeoTerrace-2025» (pp. 1-5). https://doi.org/10.3997/2214-4609.202552075 4. Wang, W., Li, W., Zhang, C., & Zhang, W. (2018). Improving object-based land use/cover classification from medium resolution imagery by Markov chain geostatistical post-classification. Land, 7(1), 31. https://doi.org/10.3390/land7010031 5. Stoliarchuk, N., & Krylov, M. (2026). Structura silskih teritorii Ukrainy do ta pid chas viyny – ekonomichni aspecty. Ekonomika ta suspilstvo, (84). https://doi.org/10.32782/2524- 0072/2026-84-162 6. Ramírez-Cuesta, J. M., Minacapilli, M., Motisi, A., Consoli, S., Intrigliolo, D. S., & Vanella, D. (2021). Characterization of the main land processes occurring in Europe (2000-2018) through a MODIS NDVI seasonal parameter-based procedure. Science of The Total Environment, 799, 149346. https://doi.org/10.1016/j.scitotenv.2021.149346 7. Dash, P., Sanders, S. L., Parajuli, P., & Ouyang, Y. (2023). Improving the accuracy of land use and land cover classification of Landsat data in an agricultural watershed. Remote Sensing, 15(16), 4020. https://doi.org/10.3390/rs15164020 8. Breiman, L. (2001). Random forests. Machine Learning, 45, 5-32. https://doi.org/10.1023/A:1010933404324 9. World Food Programme. (n.d.). Ukraine Crop Maps. https://ukraine-cropmaps.com/ 10. Olofsson, P., Foody, G. M., Herold, M., Stehman, S. V., Woodcock, C. E., & Wulder, M. A. (2014). Good practices for estimating area and assessing accuracy of land change. Remote Sensing of Environment, 148, 42-57. https://doi.org/10.1016/j.rse. 2014.01.015 11. Hütt, C., Waldhoff, G., & Bareth, G. (2020). Fusion of Sentinel-1 with official topographic and cadastral geodata for crop-type enriched LULC mapping using FOSS and open data. ISPRS International Journal of Geo-Information, 9(2), 120. https://doi.org/10.3390/ijgi9020120 12. State Service of Ukraine for Geodesy, Cartography and Cadastre. (n.d.). Main page. https://land.gov.ua/ 13. Sergeieva, K., Kavats, Y., Kovrov, O., & Chumichov, D. (2025). Informatsiyna tehnologiya vyiavlennia pokynutyh silskohospodarskyh ugid na osnovi suputnykovoho monitoryngu. In Systemy kontroliu informatsii ta intelektualni tehnologii: dosiagnennia ta zastosuvannia (pp. 197-211). https://doi.org/10.36059/978-966-397-538-2-11 ~ 82 ~ ISSN: 2411-4049. Екологічна безпека та природокористування, вип. 2 (58), 2026 14. Rodriguez-Galiano, V., Ghimire, B., Rogan, J., Chica, M., & Rigol-Sanchez, J. (2012). An assessment of the effectiveness of a random forest classifier for land-cover classification. ISPRS Journal of Photogrammetry and Remote Sensing, 67, 93-104. 15. Belgiu, M., & Drǎguţ, L. (2016). Random forest in remote sensing: A review of applications and future directions. ISPRS Journal of Photogrammetry and Remote Sensing, 114, 24-31. 16. Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., ... & Duchesnay, E. (2012). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825-2830. 17. McHugh, M. L. (2012). Interrater reliability: the kappa statistic. Biochemia Medica, 22(3), 276-282. https://hrcak.srce.hr/89395 18. Brown, C. F., Brumby, S. P., Guzder-Williams, B., et al. (2022). Dynamic World, Near real-time global 10 m land use land cover mapping. Scientific Data, 9, 251. https://doi.org/10.1038/s41597-022-01307-4 The article was received 29.01.2026, received after revision 10.03.2026, accepted 31.03.2026 Охарєв Вячеслав Олександрович кандидат технічних наук, старший дослідник, старший науковий співробітник відділу природних ресурсів, в.о. заступника директора з науково-організаційної роботи Інституту телекомунікацій і глобального інформаційного простору Національної академії наук України Адреса робоча: Україна, м. Київ, Чоколівський бульвар, 13 ORCID ID: https://orcid.org/0000-0001-6270-6293 e-mail: okhariev.vo@gmail.com Підсадній Сергій Григорович аспірант Інституту телекомунікацій і глобального інформаційного простору Національної академії наук України Адреса робоча: Україна, м. Київ, Чоколівський бульвар, 13 ORCID ID: https://orcid.org/0009-0003-7406-500X3 e-mail: sergiy.pidsadniy@gmail.com https://orcid.org/0000-0001-6270-6293 mailto:okhariev.vo@gmail.com https://orcid.org/0009-0003-7406-500X https://orcid.org/0009-0003-7406-500X mailto:sergiy.pidsadniy@gmail.com
id es-journalinua-article-364955
institution Environmental safety and natural resources
keywords_txt_mv keywords
language Ukrainian
last_indexed 2026-06-18T01:01:16Z
publishDate 2026
publisher Kyiv National University of Construction and Architecture
record_format ojs
resource_txt_mv es-journalinua/df/dd87b774f6dc97fd40f52d48782de1df.pdf
spelling es-journalinua-article-3649552026-06-17T08:46:16Z Technology of improving the land use data accuracy for geospatial modeling tasks Технологія підвищення точності даних землекористування для задач геопросторового моделювання Okhariev, Viacheslav Pidsadnii, Serhii geospatial modeling land use data machine learning геопросторове моделювання дані землекористування машинне навчання The aim of the research is increasing the accuracy of land cover classification (LULC) based on Dynamic World (DW) data for the controlled territory of Ukraine. One of the key problems of such data is the regional specificity of the land use regime, which reduces the reliability of the global average world classification. The basic accuracy of the DW classification for all of Ukraine is 51%, which is significantly lower than the declared one (~72%). The exclusion of occupied and frontline territories and partial re-verification of reference points allowed to increase the accuracy to 64.58%, Kappa coefficient (κ) 0.600. Methods for refining the classification based on the seasonal amplitude of NDVI and the summer phenology filter did not provide an increase in accuracy due to the significant spectral overlap of vegetation cover classes. The method of object-oriented analysis based on cadastral boundaries showed the inaccuracy of such an approach even at the stage of material preparation. Instead, the Random Forest machine learning model, built on NDVI phenological indicators, annual mean class, and DW probability bands, achieved an accuracy of 68.10%, Kappa 0.637, which corresponds to the category of substantial agreement and is the best result among the studied methods. Дослідження присвячене підвищенню точності класифікації земного покриву (LULC) за даними Dynamic World (DW) для підконтрольної території України. Однією з ключових проблем таких даних є регіональна специфіка режиму землекористування, яка знижує достовірність глобальної середньосвітової класифікації. Базова точність класифікації DW для всієї України становить 51%, що суттєво нижче заявленої (~72%). Виключення окупованих та прифронтових територій і часткова повторна верифікація опорних точок дозволили підвищити точність до 64,58%, коефіцієнт Каппа (κ) 0,600. Методи уточнення класифікації на основі сезонної амплітуди NDVI та фільтру літньої фенології не забезпечили приросту точності через значне спектральне перекриття класів рослинного покриву. Метод об’єктно-орієнтованого аналізу на базі кадастрових меж ще на стадії підготовки матеріалу показав хибність такого підходу. Натомість модель машинного навчання Random Forest, побудована на фенологічних індикаторах NDVI, середньорічному класі та імовірнісних bands DW, досягла точності 68,10%, Каппа 0,637, що відповідає категорії суттєвої узгодженості та є найкращим результатом серед досліджених методів. Kyiv National University of Construction and Architecture 2026-05-01 Article Article application/pdf https://es-journal.in.ua/article/view/364955 10.32347/2411-4049.2026.2.72-82 Environmental safety and natural resources; Vol. 58 No. 2 (2026): Environmental safety and natural resources; 72-82 Екологічна безпека та природокористування; Том 58 № 2 (2026): Екологічна безпека та природокористування; 72-82 2616-2121 2411-4049 10.32347/2411-4049.2026.2 uk https://es-journal.in.ua/article/view/364955/350481 Copyright (c) 2026 В.О. Охарєв, С.Г. Підсадній http://creativecommons.org/licenses/by/4.0
spellingShingle geospatial modeling
land use data
machine learning
Okhariev, Viacheslav
Pidsadnii, Serhii
Technology of improving the land use data accuracy for geospatial modeling tasks
title Technology of improving the land use data accuracy for geospatial modeling tasks
title_alt Технологія підвищення точності даних землекористування для задач геопросторового моделювання
title_full Technology of improving the land use data accuracy for geospatial modeling tasks
title_fullStr Technology of improving the land use data accuracy for geospatial modeling tasks
title_full_unstemmed Technology of improving the land use data accuracy for geospatial modeling tasks
title_short Technology of improving the land use data accuracy for geospatial modeling tasks
title_sort technology of improving the land use data accuracy for geospatial modeling tasks
topic geospatial modeling
land use data
machine learning
topic_facet geospatial modeling
land use data
machine learning
геопросторове моделювання
дані землекористування
машинне навчання
url https://es-journal.in.ua/article/view/364955
work_keys_str_mv AT okharievviacheslav technologyofimprovingthelandusedataaccuracyforgeospatialmodelingtasks
AT pidsadniiserhii technologyofimprovingthelandusedataaccuracyforgeospatialmodelingtasks
AT okharievviacheslav tehnologíâpídviŝennâtočnostídanihzemlekoristuvannâdlâzadačgeoprostorovogomodelûvannâ
AT pidsadniiserhii tehnologíâpídviŝennâtočnostídanihzemlekoristuvannâdlâzadačgeoprostorovogomodelûvannâ