Application of machine learning models to predict energy consumption in smart home systems
The article investigates the application of machine learning methods to forecast energy consumption in the con text of smart home systems. The research is based on the internationally renowned PSML (Power System Ma chine Learning) time series dataset, which includes information on electricity consum...
Збережено в:
| Дата: | 2025 |
|---|---|
| Автори: | , |
| Формат: | Стаття |
| Мова: | Ukrainian |
| Опубліковано: |
PROBLEMS IN PROGRAMMING
2025
|
| Теми: | |
| Онлайн доступ: | https://pp.isofts.kiev.ua/index.php/ojs1/article/view/856 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Problems in programming |
| Завантажити файл: | |
Репозитарії
Problems in programming| id |
pp_isofts_kiev_ua-article-856 |
|---|---|
| record_format |
ojs |
| resource_txt_mv |
ppisoftskievua/fe/20fdde03ec4fd7b43adde91a6a1398fe.pdf |
| spelling |
pp_isofts_kiev_ua-article-8562025-11-20T15:20:12Z Application of machine learning models to predict energy consumption in smart home systems Застосування моделей машинного навчання для прогнозування енергоспоживання в системах розумного дому Haidukevych, V.O. Doroshenko, A.Yu. machine learning; forecasting; smart home; energy optimization; PSML UDC 004.4'24 машинне навчання; прогнозування; розумний дім; оптимізаціяенергоспоживання; PSML УДК 004.4'24 The article investigates the application of machine learning methods to forecast energy consumption in the con text of smart home systems. The research is based on the internationally renowned PSML (Power System Ma chine Learning) time series dataset, which includes information on electricity consumption, generation, balanc ing and load forecasting in the context of a decarbonized energy network. The PSML dataset is characterized by high detail and covers different time scales - from hourly to daily values, which allows assessing both short-term and medium-term trends in energy consumption. The paper provides a comparative analysis of classical and modern machine learning methods, including regres sion, classification and clustering, for load forecasting and identifying patterns in electricity consumption in the domestic environment. Particular attention is paid to optimizing models for working with big data, processing gaps and anomalies, as well as integrating forecasts into automatic smart home energy management systems.Prombles in programming 2025; 3: 29-38 У статті досліджено застосування методів машинного навчання для прогнозування енергоспоживання в умовах функціонування систем розумного дому. Основу дослідження становить міжнародно відомий ча совий набір даних PSML (Power System Machine Learning), який включає інформацію про споживання електроенергії, генерацію, балансування та прогнозування навантаження в умовах декарбонізованої енергетичної мережі. Набір даних PSML характеризується високою деталізацією та охоплює різні часові масштаби — від годинних до щоденних значень, що дозволяє оцінювати як короткострокові, так і се редньострокові тенденції енергоспоживання. У роботі проведено порівняльний аналіз класичних та сучасних методів машинного навчання, включно з регресією, класифікацією та кластеризацією, для прогнозування навантаження та виявлення шаблонів споживання електроенергії в побутовому середовищі. Особлива увага приділена оптимізації моделей для роботи з великими даними, обробці пропусків та аномалій, а також інтеграції прогнозів у системи авто матичного управління енергоресурсами розумного дому.Prombles in programming 2025; 3: 29-38 PROBLEMS IN PROGRAMMING ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ ПРОБЛЕМИ ПРОГРАМУВАННЯ 2025-11-14 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/856 10.15407/pp2025.03.029 PROBLEMS IN PROGRAMMING; No 3 (2025); 29-38 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 3 (2025); 29-38 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 3 (2025); 29-38 1727-4907 10.15407/pp2025.03 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/856/907 Copyright (c) 2025 PROBLEMS IN PROGRAMMING |
| institution |
Problems in programming |
| baseUrl_str |
https://pp.isofts.kiev.ua/index.php/ojs1/oai |
| datestamp_date |
2025-11-20T15:20:12Z |
| collection |
OJS |
| language |
Ukrainian |
| topic |
machine learning forecasting smart home energy optimization PSML UDC 004.4'24 |
| spellingShingle |
machine learning forecasting smart home energy optimization PSML UDC 004.4'24 Haidukevych, V.O. Doroshenko, A.Yu. Application of machine learning models to predict energy consumption in smart home systems |
| topic_facet |
machine learning forecasting smart home energy optimization PSML UDC 004.4'24 машинне навчання прогнозування розумний дім оптимізаціяенергоспоживання PSML УДК 004.4'24 |
| format |
Article |
| author |
Haidukevych, V.O. Doroshenko, A.Yu. |
| author_facet |
Haidukevych, V.O. Doroshenko, A.Yu. |
| author_sort |
Haidukevych, V.O. |
| title |
Application of machine learning models to predict energy consumption in smart home systems |
| title_short |
Application of machine learning models to predict energy consumption in smart home systems |
| title_full |
Application of machine learning models to predict energy consumption in smart home systems |
| title_fullStr |
Application of machine learning models to predict energy consumption in smart home systems |
| title_full_unstemmed |
Application of machine learning models to predict energy consumption in smart home systems |
| title_sort |
application of machine learning models to predict energy consumption in smart home systems |
| title_alt |
Застосування моделей машинного навчання для прогнозування енергоспоживання в системах розумного дому |
| description |
The article investigates the application of machine learning methods to forecast energy consumption in the con text of smart home systems. The research is based on the internationally renowned PSML (Power System Ma chine Learning) time series dataset, which includes information on electricity consumption, generation, balanc ing and load forecasting in the context of a decarbonized energy network. The PSML dataset is characterized by high detail and covers different time scales - from hourly to daily values, which allows assessing both short-term and medium-term trends in energy consumption. The paper provides a comparative analysis of classical and modern machine learning methods, including regres sion, classification and clustering, for load forecasting and identifying patterns in electricity consumption in the domestic environment. Particular attention is paid to optimizing models for working with big data, processing gaps and anomalies, as well as integrating forecasts into automatic smart home energy management systems.Prombles in programming 2025; 3: 29-38 |
| publisher |
PROBLEMS IN PROGRAMMING |
| publishDate |
2025 |
| url |
https://pp.isofts.kiev.ua/index.php/ojs1/article/view/856 |
| work_keys_str_mv |
AT haidukevychvo applicationofmachinelearningmodelstopredictenergyconsumptioninsmarthomesystems AT doroshenkoayu applicationofmachinelearningmodelstopredictenergyconsumptioninsmarthomesystems AT haidukevychvo zastosuvannâmodelejmašinnogonavčannâdlâprognozuvannâenergospoživannâvsistemahrozumnogodomu AT doroshenkoayu zastosuvannâmodelejmašinnogonavčannâdlâprognozuvannâenergospoživannâvsistemahrozumnogodomu |
| first_indexed |
2025-11-15T02:08:52Z |
| last_indexed |
2025-11-21T02:19:49Z |
| _version_ |
1850423542009561088 |
| fulltext |
Штучний інтелект
29
© В.С. Гайдукевич, А.Ю. Дорошенко, 2025
ISSN 1727-4907. Проблеми програмування. 2025. №3
УДК 004.4'24 https://doi.org/10.15407/pp2025.03.029
В.О. Гайдукевич, А.Ю. Дорошенко
ЗАСТОСУВАННЯ МОДЕЛЕЙ МАШИННОГО НАВЧАННЯ
ДЛЯ ПРОГНОЗУВАННЯ ЕНЕРГОСПОЖИВАННЯ В СИСТЕМАХ
РОЗУМНОГО ДОМУ
У статті досліджено застосування методів машинного навчання для прогнозування енергоспоживання в
умовах функціонування систем розумного дому. Основу дослідження становить міжнародно відомий ча-
совий набір даних PSML (Power System Machine Learning), який включає інформацію про споживання
електроенергії, генерацію, балансування та прогнозування навантаження в умовах декарбонізованої
енергетичної мережі. Набір даних PSML характеризується високою деталізацією та охоплює різні часові
масштаби — від годинних до щоденних значень, що дозволяє оцінювати як короткострокові, так і се-
редньострокові тенденції енергоспоживання.
У роботі проведено порівняльний аналіз класичних та сучасних методів машинного навчання, включно
з регресією, класифікацією та кластеризацією, для прогнозування навантаження та виявлення шаблонів
споживання електроенергії в побутовому середовищі. Особлива увага приділена оптимізації моделей для
роботи з великими даними, обробці пропусків та аномалій, а також інтеграції прогнозів у системи авто-
матичного управління енергоресурсами розумного дому.
Ключові слова: машинне навчання, прогнозування, розумний дім, оптимізація енергоспоживання, PSML.
V.O. Haidukevych, A.Y. Doroshenko
APPLICATION OF MACHINE LEARNING MODELS TO PREDICT
ENERGY CONSUMPTION IN SMART HOME SYSTEMS
The article investigates the application of machine learning methods to forecast energy consumption in the con-
text of smart home systems. The research is based on the internationally renowned PSML (Power System Ma-
chine Learning) time series dataset, which includes information on electricity consumption, generation, balanc-
ing and load forecasting in the context of a decarbonized energy network. The PSML dataset is characterized by
high detail and covers different time scales - from hourly to daily values, which allows assessing both short-term
and medium-term trends in energy consumption.
The paper provides a comparative analysis of classical and modern machine learning methods, including regres-
sion, classification and clustering, for load forecasting and identifying patterns in electricity consumption in the
domestic environment. Particular attention is paid to optimizing models for working with big data, processing
gaps and anomalies, as well as integrating forecasts into automatic smart home energy management systems.
Keywords: machine learning, forecasting, smart home, energy optimization, PSML.
Вступ
Цифрова трансформація енергетичної
галузі, зростання ролі децентралізованих
джерел енергії та активна участь спожива-
чів у процесах керування навантаженням
актуалізують потребу у новітніх підходах
до прогнозування енергоспоживання [1]. В
умовах високої варіативності, сезонних ко-
ливань та метеозалежної генерації класичні
статистичні методи дедалі частіше виявля-
ються недостатньо ефективними [2]. У
цьому контексті методи штучного інтеле-
кту, зокрема, машинного навчання, відкри-
вають нові можливості для побудови
точних і гнучких моделей, здатних вияв-
ляти приховані нелінійні закономірності у
часових рядах, обробляти великі обсяги да-
них та автоматизувати процеси прогнозу-
вання [3].
У статті представлено підхід до регре-
сії, класифікації та кластеризації енерго-
споживання на основі відкритого набору
даних PSML [4], який охоплює багаторів-
неві часові ряди різної роздільності — від
індивідуальних побутових споживачів до
регіональних енергетичних систем. Особ-
ливу увагу зосереджено на моделюванні
сценаріїв для розумного дому як типового
елемента сучасної енергомережі. Такий
Штучний інтелект
30
підхід дозволяє проаналізувати поведінку
кінцевого споживача, протестувати ефекти-
вність алгоритмів у реалістичних умовах та
оцінити їхню придатність для інтеграції в
автоматизовані системи енергоменеджме-
нту [5].
Метою дослідження є аналіз точності
та генералізаційної спроможності сучасних
моделей машинного навчання у вирішенні
задач прогнозування навантаження, класи-
фікації типових режимів роботи та вияв-
лення схожих шаблонів споживання. У ме-
жах експериментальної частини було про-
тестовано низку моделей, включаючи ме-
тод опорних векторів, алгоритми градієнт-
ного підсилення, метод щільнісної класте-
ризації та інші, які оцінювалися за метри-
ками точності, ефективності та інтерпрето-
ваності результатів [6].
Варто відзначити, що у статті [7] ос-
новний акцент зроблено на застосуванні
методів машинного навчання для підви-
щення енергоефективності будівель шля-
хом оптимізації роботи інженерних систем.
На відміну від цього, наше дослідження зо-
середжується на аналізі багаторівневих ча-
сових рядів споживання енергії, прогнозу-
ванні навантаження та виявленні типових
сценаріїв роботи побутових пристроїв у
контексті розумного дому, що робить його
більш орієнтованим на інтеграцію в сис-
теми енергетичного менеджменту з динамі-
чними моделями прогнозування.
1. Системи розумного дому як
контекст для прогнозування
Розумний дім — це інтегрований ком-
плекс апаратних і програмних рішень, що
забезпечують автоматизований контроль
над освітленням, мікрокліматом, безпекою,
мультимедійними пристроями та особливо
енергоспоживанням у житловому просторі
[3]. У центрі такої системи знаходиться ін-
телектуальний модуль керування, здатний
отримувати дані з численних сенсорів, ви-
конувати аналіз у реальному часі та ухва-
лювати оптимальні рішення для підви-
щення комфорту мешканців та ефективно-
сті використання ресурсів.
Одним із ключових напрямів розви-
тку розумного дому є прогнозування спо-
живання електроенергії. Це завдання має
низку стратегічно важливих переваг [8]:
зменшення втрат енергії — точні про-
гнози дозволяють уникнути роботи
обладнання у холостому режимі, оп-
тимізувати цикли роботи техніки та
знизити загальні витрати.
автоматичне керування побутовими
приладами — система може само-
стійно вмикати чи вимикати прилади,
регулювати інтенсивність роботи кон-
диціонерів, нагрівачів та освітлення.
адаптація до пікових навантажень у
мережі — прогнозні моделі допомага-
ють зміщувати споживання на години
з меншими тарифами або меншими
навантаженнями у мережі, що особ-
ливо важливо для енергетичних сис-
тем з обмеженими ресурсами.
На практиці це означає, що система розум-
ного дому може:
активувати обігрів або охолодження
заздалегідь, з урахуванням прогнозу
температури та графіку перебування
мешканців;
автоматично заряджати акумуляторні
системи або електромобілі у період
нічних тарифів;
відключати непотрібні пристрої, коли
мешканців немає вдома;
інтегруватися з відновлюваними дже-
релами енергії, прогнозуючи потуж-
ність від сонячних панелей або вітро-
генераторів.
Використання методів машинного на-
вчання у цьому контексті дає змогу буду-
вати адаптивні моделі, які враховують не
лише часові патерни енергоспоживання, а й
зовнішні фактори, зокрема, погодні умови,
вологість, графік використання побутової
техніки та навіть індивідуальні звички ме-
шканців [9]. Крім того, прогнозування в ро-
зумному домі сприяє побудові мікромереж
(microgrid) — локальних енергетичних сис-
тем, де баланс між генерацією та споживан-
ням може підтримуватися автоматично. Це
зменшує залежність від центральної ме-
режі та підвищує енергетичну автономність
житла [10].
Штучний інтелект
31
Рис. 1. Схема архітектури системи розумного дому з модулем прогнозування
2. Огляд і підготовка
даних PSML
Набір PSML є спеціалізованою колек-
цією високодеталізованих часових рядів,
які відображають динаміку побутового спо-
живання електроенергії з інтервалом у 15
хвилин. Такі дані зазвичай надходять від
сучасних розумних лічильників та систем
енергомоніторингу, що інтегруються в ін-
фраструктуру розумного дому. Цей набір
містить як основні показники енергоспожи-
вання, так і супутні фактори, що впливають
на нього:
timestamp — мітка часу вимірювання,
яка дає змогу синхронізувати записи з
іншими джерелами, наприклад про-
гнозами погоди або даними про гене-
рацію електроенергії.
house_id — унікальний ідентифікатор
домогосподарства, що дозволяє від-
слідковувати індивідуальні або гру-
пові профілі.
power_kwh— обсяг спожитої електро-
енергії (у кВт·год) за фіксований ча-
совий інтервал; ключовий показник
для побудови моделей прогнозу-
вання.
temperature — температура зовнішнь-
ого середовища (°C), важлива для ана-
лізу впливу кліматичних факторів.
humidity — відносна вологість (%),
параметр, що впливає на роботу клі-
матичних систем.
day_of_week, hour, is_weekend —
cтворені часові ознаки, що допомага-
ють враховувати добові й тижневі
патерни.
Завдяки своїй структурі, PSML є ти-
повим прикладом IoT-збірника даних, що
використовується для інтелектуального уп-
равління енергоспоживанням у приватних
будинках та комерційних об’єктах. Він де-
монструє природні коливання наванта-
ження, зумовлені часом доби, погодними
умовами та поведінкою мешканців.
Використання PSML у аналітичних
платформах відкриває широкі можливості
для підвищення енергоефективності. На ос-
нові цих даних можна:
- прогнозувати рівень споживання з
урахуванням сезонних і погодних
змін;
- автоматично регулювати роботу
побутових приладів, адаптуючи їх
до пікових тарифів та знижуючи
витрати;
- оптимізувати роботу домашніх
акумуляторних систем, визнача-
ючи найвигідніший час для заря-
джання й розряджання;
- виявляти аномалії — від потенцій-
них несправностей обладнання до
нераціонального використання ре-
сурсів.
Таким чином, цей набір даних є не
лише основою для побудови прогнозних
моделей, а й служить базою для створення
самоадаптивних алгоритмів управління
енергетикою в розумних будинках.
Штучний інтелект
32
Для забезпечення високої якості та на-
дійності подальшого моделювання, дані
PSML пройшли ретельну попередню обро-
бку:
1. Заповнення пропусків — відновлення
відсутніх значень за допомогою інтерполя-
ції або медіан для уникнення викривлення
трендів.
2. Розширення часових ознак — з часо-
вих міток згенеровано додаткові атрибути
(година доби, день тижня, вихідний день).
3. Масштабування — нормалізація чис-
лових параметрів для стабільної роботи ал-
горитмів машинного навчання.
4. Виділення трендів і сезонності — за-
стосування декомпозиції часових рядів для
точнішого прогнозування.
Рис. 2. Фрагмент датасету PSML
3. Методика дослідження
У межах цього дослідження ста-
виться задача прогнозування навантаження
в електричних мережах на основі розум-
ного дому. Метою є передбачення значення
енергоспоживання у майбутні часові пері-
оди. Такий тип задач є критично важливим
для планування генерації, балансування на-
вантаження, оптимізації роботи енергетич-
них систем і запобігання перевантаженням.
Завданням моделі є знаходження за-
лежності між часовими характеристиками
(день тижня, година, місяць тощо) та фак-
тичним навантаженням.
У дослідженні застосовано кілька
класів алгоритмів машинного навчання для
вирішення задач прогнозування, класифіка-
ції та кластеризації побутового електроспо-
живання на прикладі даних PSML. Підхід
базується на поєднанні класичних методів
обробки часових рядів та сучасних алгори-
тмів, здатних виявляти складні нелінійні за-
лежності.
Для аналізу використано PSML —
відкритий набір даних, що містить показ-
ники навантаження енергоспоживання з ча-
совою роздільністю 1 година. Набір вклю-
чає дані за декілька років, що дозволяє мо-
делі враховувати сезонні й добові коли-
вання.
Перед моделюванням дані було нор-
малізовано та закодовано категоріальні
змінні (наприклад, день тижня — one-hot
encoding). Перед моделюванням виконано:
нормалізацію числових ознак (Min-
Max) для приведення значень у діа-
пазон [0,1] та уникнення доміну-
вання одних змінних над іншими;
one-hot encoding для категоріальних
змінних (dayofweek), щоб уникнути
хибного порядкування днів;
циклічне кодування (sin, cos) для го-
дин та місяців, щоб зберегти їхню
періодичність;
розділення вибірки за часом (нав-
чання на минулих даних, тестування
на нових), що відповідає реальним
умовам прогнозування.
Для побудови моделей машинного
навчання необхідно було розділити дані на
незалежні підмножини, щоб оцінка якості
моделі була об’єктивною, а прогнозна здат-
ність — прийнятною для нових даних.
Штучний інтелект
33
У даному дослідженні застосовано
наступну схему:
навчальна вибірка — 70% даних -
використовувалась для тренування
моделей та підбору параметрів;
тестова вибірка — 30% даних - при-
значена для остаточного тестування
якості моделей на «невиданих» при-
кладах.
Валідаційна вибірка не виділялась ок-
ремо, оскільки її роль виконує внутрішнє
розбиття у процесі крос-валідації та під-
бору гіперпараметрів, наприклад, із вико-
ристанням алгоритму GridSearchCV.
Розбиття виконувалося за допомогою фу-
нкції train_test_split() з бібліотеки scikit-learn
із фіксацією параметра random_state=42 для
забезпечення відтворюваності результатів у
повторних експериментах.
4. Прогнозування параметрів
споживання (регресія)
Для вирішення задач прогнозування
та аналізу структури даних використано на-
ступні моделі:
1. Support Vector Regressor (SVR)
Метод опорних векторів дозволяє будувати
нелінійні моделі за рахунок використання
ядрових функцій. Було протестовано
Gaussian RBF kernel. Модель показала по-
зитивні результати на короткострокових
прогнозах. Використані гіперпараметри:
kernel = 'rbf' — радіальна базисна функція
C = 1000 — штраф за помилку
epsilon = 0.1 — ширина "труби" точності
gamma = 'scale' — автоматичне визначення
параметра
2. Random Forest Regressor (RFR),
Метод Випадкового Лісу як ансамблевий
метод дозволив врахувати взаємозв’язки
між температурою, годиною доби та обся-
гом споживання. RF був обраний завдяки
високій стійкості до перенавчання і здатно-
сті працювати з некорельованими озна-
ками. Використані гіперпараметри:
n_estimators = 200 — кількість дерев
max_depth = 15 — максимальна глибина де-
рева
min_samples_split = 5 — мінімальна кіль-
кість прикладів для розбиття
random_state = 42 — для стабільності ре-
зультатів.
3. XGBoost Regressor
Алгоритм градієнтного підсилення над де-
ревами рішень, який показав високу ефек-
тивність у задачах регресії на складних ви-
бірках. Завдяки регуляризації він зменшує
ризик перенавчання. Використані гіперпа-
раметри:
n_estimators = 300 — кількість ітерацій
learning_rate = 0.05 — швидкість навчання
max_depth = 10 — максимальна глибина де-
рев
subsample = 0.8 — частка даних для побу-
дови кожного дерева
colsample_bytree = 0.8 — частка ознак для
кожного дерева
У додатку 1 наведено фрагмент програ-
много коду на Python, який реалізує прогно-
зування енергоспоживання на основі метео-
рологічних ознак з використанням моделі
Random Forest.
Для оцінки точності прогнозування ви-
користано три основні метрики регресії:
MAE (Mean Absolute Error) — середня
абсолютна похибка;
RMSE (Root Mean Squared Error) — ко-
рінь середньоквадратичної помилки;
R² (коефіцієнт детермінації) — частка
поясненої дисперсії;
MAPE (Mean Absolute Percentage Error)
— середня абсолютна відносна похи-
бка, яка показує похибку у відсотках від
фактичного значення.
Метрики обчислювались як для тес-
тової, так і для крос-валідаційної вибірки.
Моделі SVR, RFR та XGBoost було
протестовано на одній і тій самій вибірці.
Результати представлено у таблиці 1:
Таблиця1.
Похибка регресії у прогнозуванні
спожитої електроенергії (параметр
power_kwh)
Модель MAE
(кВт)
RMSE
(кВт)
R² (коеф.
детермі-
нації)
MAPE
(%)
SVR 0.112 0.157 0.930 6.8
RFR 0.098 0.141 0.944 5.9
XGBoost
Regres-
sor
0.091 0.136 0.951 5.2
Штучний інтелект
34
Як видно з результатів (табл.1), най-
кращі показники продемонструвала модель
XGBoost Regressor. Вона забезпечила най-
нижчі значення MAE та RMSE, а також най-
вищий коефіцієнт детермінації (R² = 0.951).
Додатково важливим показником є MAPE,
який склав лише 5.2%, що свідчить про ви-
соку відносну точність прогнозу навіть за
умови коливань у структурі споживання. За
цільовий параметр прогнозування обрано
споживання електроенергії (power_kwh).
Порівняно з іншими моделями:
Support Vector Regressor (SVR) пока-
зав позитивні результати на корот-
кострокових прогнозах, проте мав
вищу відносну похибку (MAPE
6.8%) у порівнянні з ансамблевими
методами.
Random Forest Regressor (RFR) про-
демонстрував стабільність та кращу
точність від SVR за всіма метри-
ками, зокрема, зменшив середню по-
хибку до MAE = 0.098 кВт та MAPE
= 5.9%.
XGBoost Regressor перевершив оби-
дві моделі, забезпечивши найбільш
збалансоване поєднання високої то-
чності та узагальнювальної здатно-
сті.
Тож результати експериментів підтвер-
дили доцільність використання більш
складних ансамблевих методів для задач
прогнозування енергоспоживання. Зав-
дяки здатності враховувати нелінійні за-
лежності та ефективно працювати з вели-
кими обсягами даних, XGBoost може бути
рекомендований як базова модель для
практичних систем прогнозування у сфері
«розумних мереж» та управління енергос-
поживанням.
Рис. 3. Порівняння прогнозів моделей регресії (SVR, RFR, XGBoost)
5. Класифікація режимів роботи
У другому етапі дослідження вирі-
шувалася задача класифікації режимів ро-
боти енергоспоживання (device_mode), яка
передбачала приналежності кожного відрі-
зка часу до однієї з трьох категорій:
низький режим (low) — відповідає
періодам мінімального базового на-
вантаження, зазвичай у нічний час
або у випадку тривалої відсутності
мешканців;
середній режим (medium) — харак-
теризує типовий денний рівень спо-
живання у робочі дні, коли викорис-
товуються побутові прилади серед-
ньої потужності;
піковий режим (peak) — відображає
короткочасні стрибки наванта-
ження, що виникають у вечірні го-
дини або у моменти одночасної ро-
боти кількох енергоємних пристроїв
(наприклад, кондиціонера, пральної
машини та кухонної техніки).
Для розв’язання задачі було застосо-
вано алгоритмічні підходи:
Random Forest Classifier — ансамб-
левий метод на основі дерев рішень,
стійкий до шуму та добре працює з
некорельованими ознаками;
Штучний інтелект
35
SVM Classifier — метод опорних ве-
кторів із використанням RBF-ядра,
здатний будувати нелінійні межі рі-
шень для складних даних подаль-
шого порівняння;
XGBoost Classifier — алгоритм гра-
дієнтного підсилення над деревами
рішень, що продемонстрував ви-
соку гнучкість у роботі з великими
та частково зашумленими даними.
Його застосування виявилося доці-
льним з огляду на складність розпо-
ділу навантаження та можливу ная-
вність нелінійних залежностей у
даних.
Навчання та тестування обох моделей
здійснювалося на тих самих вибірках, що і
в задачі регресії: 70% даних було викорис-
тано для навчання, 30% — для тестування
(параметр random_state=42 забезпечив відт-
ворюваність результатів).
Якість класифікації оцінювалася за
стандартними метриками: точність
(Accuracy), точність передбачення
(Precision), повнота (Recall) та F1-міра.
Отримані результати подано у таблиці 2.
Таблиця 2.
Метрики класифікації режиму
електроспоживання розумного дому
Модель Accu-
racy
Preci-
sion
Recall F1-
score
Random
Forest
0.894 0.901 0.889 0.894
SVM
Classifier
0.881 0.887 0.873 0.879
XGBoost
Classifier
0.912 0.918 0.905 0.911
Аналіз показує, що XGBoost
Classifier знову перевершує інші моделі за
всіма показниками. Водночас Random
Forest показав кращі результати за метри-
ками порівняно з SVM, що підтверджує
його здатність ефективно працювати із за-
шумленими даними (Рис.4).
Зокрема, точність і повнота у
XGBoost Classifier перевищили 91%, що
підтверджує його придатність для впрова-
дження у системах розумного дому. Це від-
криває можливості для задач балансування
енергоспоживання, попередження переван-
тажень електромережі та побудови адапти-
вних тарифних стратегій.
Рис. 4. Порівняння моделей класифікації режимів роботи
6. Кластеризація профілів
енергоспоживання
На третьому етапі дослідження було
проведено кластеризацію добових профілів
енергоспоживання з метою виявлення груп
днів із подібною структурою наванта-
ження. Для цього вихідні дані PSML були
агреговані до добового масштабу та норма-
лізовані, що дало можливість зосередитися
Штучний інтелект
36
на формі профілю, а не на абсолютних ве-
личинах споживання.
Першим було застосовано алгоритм
KMeans, який належить до класу методів
розбиття даних на заздалегідь визначену кі-
лькість кластерів. Для вибору оптималь-
ного значення параметра k використову-
вали метод «лікоть» та коефіцієнт силуету,
що дозволило визначити три стійкі групи
профілів. Перша група відповідала типовим
будням із вираженими піками споживання
у ранкові та вечірні години, друга – вихід-
ним дням із більш рівномірним та згладже-
ним навантаженням, а третя група відобра-
жала аномальні випадки, коли споживання
електроенергії мало нетипово високі або
низькі значення протягом доби. Таким чи-
ном KMeans дозволив сформувати структу-
ровану типологію днів за їхніми характер-
ними режимами роботи побутових при-
строїв.
Паралельно було використано алго-
ритм DBSCAN, який, на відміну від
KMeans, не потребує попереднього визна-
чення кількості кластерів. Цей метод пока-
зав себе ефективним у пошуку щільних зон
подібних профілів та автоматичного вияв-
лення «шумових» точок, що не належали
жодному кластеру. Як результат, DBSCAN
виявив компактні групи днів із подібною
поведінкою споживання, а також виділив
окремі аномалії, які відображають нетипові
сценарії використання електроенергії в си-
стемах розумного дому.
Порівняльний аналіз продемонстру-
вав, що KMeans є більш придатним для
опису повторюваних і структурованих ша-
блонів енергоспоживання, тоді як DBSCAN
надає кращі результати у випадках пошуку
рідкісних або відхилених від норми режи-
мів. Відповідні результати візуалізовано на
рисунку 5, де відображено типові кластери,
отримані за допомогою обох методів. Для
кожного кластера побудовано середній
профіль споживання, який обчислюється як
середнє значення добового споживання для
всіх днів, що належать до кластера. Альте-
рнативно, може використовуватися медіан-
ний профіль, щоб зменшити вплив анома-
лій. Саме ці середні або медіанні графіки
показані на рисунку 5, і вони ілюструють
типову форму навантаження для кожного
кластера.
Отримані кластери мають важливе
прикладне значення. Вони можуть бути ви-
користані для персоналізації прогнозів за-
лежно від типу дня, оптимізації графіків ро-
боти енергоємних приладів, а також для ро-
зробки більш гнучких та справедливих та-
рифних стратегій, що враховують різні мо-
делі споживання електроенергії. Таким чи-
ном, кластеризація дозволяє не лише ви-
явити приховані закономірності у даних, а
й забезпечує основу для практичного засто-
сування в системах розумного дому та ене-
ргетичному менеджменті.
Рис. 5. Результати кластеризації профілів енергоспоживання (KMeans та DBSCAN)
Штучний інтелект
37
Висновки
У статті досліджено можливості за-
стосування методів машинного навчання
для аналізу та прогнозування енергоспожи-
вання в системах розумного дому на основі
датасету PSML. Було реалізовано комплек-
сний підхід, що включає три основні етапи:
регресійне прогнозування, класифікацію
режимів роботи та кластеризацію профілів
споживання.
На етапі регресії порівнювались мо-
делі SVR, RFR, XGBoost Regressor. Най-
кращі результати показав XGBoost
Regressor, що забезпечив найнижчі похи-
бки (MAE = 0.091, RMSE = 0.136, MAPE =
5.2%) та найвище значення коефіцієнта де-
термінації (R² = 0.951). Це свідчить про ви-
соку здатність моделі враховувати нелі-
нійні залежності та узагальнювати дані, що
робить її найбільш придатною для задач
прогнозування енергоспоживання.
Етап класифікації дозволив виді-
лити три основні режими роботи: низький,
середній та піковий. Порівняння моделей
показало, що XGBoost Classifier також пе-
ревершив Random Forest та SVM за всіма
метриками, досягнувши точності понад
91%. Це підтверджує його ефективність для
задач віднесення споживання до різних ре-
жимів (низький, середній, піковий), що є
критично важливим для балансування нава-
нтаження та запобігання перевантаженням
мережі.
Кластеризація добових профілів
споживання із застосуванням KMeans та
DBSCAN дозволила виділити типові будні,
вихідні та аномальні дні. KMeans виявив
повторювані шаблони, тоді як DBSCAN
ефективно ідентифікував рідкісні або нети-
пові сценарії, що забезпечує можливість
адаптивного планування роботи енергоєм-
них пристроїв та розробки стратегій тари-
фікації.
Завдяки комплексному застосу-
ванню методів регресії, класифікації та кла-
стеризації досягнуто:
• точного прогнозування енергоспо-
живання;
• коректної ідентифікації режимів ро-
боти пристроїв;
• виділення типових та аномальних
сценаріїв споживання.
Узагальнюючи результати, можна
зробити висновок, що поєднання різних
підходів машинного навчання дозволяє не
лише досягти високої точності прогнозу-
вання енергоспоживання, а й гнучко управ-
ляти режимами роботи пристроїв та вияв-
ляти приховані закономірності у даних.
Найбільш ефективним алгоритмом у зада-
чах як регресії, так і класифікації виявився
XGBoost, що робить його перспективною
базовою моделлю для впровадження у
практичні системи розумного дому та розу-
мних мереж.
References
1. Hyndman, R. J., & Athanasopoulos, G. (2018).
Forecasting: Principles and practice (2nd ed.).
OTexts. https://otexts.com/fpp2/
2. Weron, R. (2014). Electricity price forecasting:
A review of the state-of-the-art with a look into
the future. International Journal of Forecasting,
30(4), 1030–1081.
3. Ryu, S., Noh, J., & Kim, H. (2017). Deep neu-
ral network based demand side short term load
forecasting. Energies, 10(1).
4. Open source PSML dataset
https://github.com/tamu-engineering-re-
search/Open-source-power-dataset?tab=re-
adme-ov-file
5. Sinitsyn, I. P., Shevchenko, V. L., Doro-
shenko, A. Yu., & Yatsenko, O. A. (2025). Re-
search of software solutions for forecasting
electricity production and consumption in
Ukraine based on machine learning methods.
Problems of programming and information
technologies, 15(1), 45–58.
https://pp.isofts.kiev.ua/ojs1/article/view/586
6. Python Software Foundation. (2024). Scikit-
learn: Machine learning in Python.
https://scikit-learn.org
7. Vyshnevskyy, O. V., & Zhuravchak, L. (2023).
Machine Learning Methods to Increase the En-
ergy Efficiency of Buildings. Computer Sys-
tems and Networks, 14, 189–209.
https://www.researchgate.net/publica-
tion/378031111_Machine_Learning_Meth-
ods_to_Increase_the_Energy_Effi-
ciency_of_Buildings
8. Li, W., & Wang, J. (2019). Electricity con-
sumption forecasting using a hybrid model
based on data preprocessing and long short-
Штучний інтелект
38
term memory neural network. Energy, 169,
1099–1110.
9. Ahmed, R., & Khalid, M. (2020). A review on
the selected applications of forecasting models
in renewable energy systems. Renewable and
Sustainable Energy Reviews, 124, 109792.
10. Khac, T. N., & Bui, T. V. (2021). Load fore-
casting using machine learning: A comparative
study of neural networks and random forests.
Energy Reports, 7, 394–403.
Додаток 1.
Фрагмент програмного коду для
прогнозування енергоспоживання
в системі розумний дім
import pandas as pd
from sklearn.ensemble import Random-
ForestRegressor
from sklearn.model_selection import
train_test_split
from sklearn.metrics import
mean_squared_error
# 1. Завантаження та попередня обробка да-
них
df = pd.read_csv("psml_data.csv",
parse_dates=["datetime"])
df = df.dropna(subset=["load"]) # видалення
рядків з відсутнім споживанням
# 2. Вибір ознак та цільової змінної
features = ["temperature", "humidity",
"wind_speed"] # метео-параметри як ознаки
target = "load" # споживання енергії
X = df[features]
y = df[target]
# 3. Розділення даних на тренувальні та тес-
тові множини
X_train, X_test, y_train, y_test =
train_test_split(
X, y, test_size=0.2, random_state=42
)
# 4. Ініціалізація та навчання моделі Random
Forest
model = RandomForestRegressor(n_estima-
tors=100, random_state=42)
model.fit(X_train, y_train)
# 5. Прогнозування та оцінка точності мо-
делі
y_pred = model.predict(X_test)
rmse = mean_squared_error(y_test, y_pred,
squared=False)
print(f"RMSE на тестових даних: {rmse:.2f}
кВт·год")
Одержано: 26.09.2025
Внутрішня рецензія отримана: 13.10.2025
Зовнішня рецензія отримана: 04.10.2025
Про авторів:
Гайдукевич Владислав Олегович,
аспірант
https://orcid.org/0000-0002-0614-6778
Дорошенко Анатолій Юхимович,
доктор фізико-математичних наук,
професор,
завідувач відділу теорії комп'ютерних
обчислень ІПС НАН України,
професор кафедри інформаційних систем
та технологій КПІ імені Ігоря Сікорського.
http://orcid.org/0000-0002-8435-1451,
Місце роботи авторів:
Інститут програмних систем НАН України,
03187, м. Київ-187, проспект Академіка
Глушкова, 40.
e-mail: doroshenkoanatoliy2@gmail.com,
gaidukevichvlad@gmail.com
|