Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу
In this paper, the methods for processing missing data are reviewed. The classification of methods depending on input data, data types and formats, and causes of data incompleteness associated with influence of uncertainties of the outside world and modeling object is proposed. The commonalities and...
Збережено в:
| Дата: | 2016 |
|---|---|
| Автор: | |
| Формат: | Стаття |
| Мова: | Українська |
| Опубліковано: |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
2016
|
| Теми: | |
| Онлайн доступ: | http://journal.iasa.kpi.ua/article/view/75213 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | System research and information technologies |
Репозитарії
System research and information technologies| _version_ | 1856543212319014912 |
|---|---|
| author | Kuznietsova, Nataliia V. |
| author_facet | Kuznietsova, Nataliia V. |
| author_sort | Kuznietsova, Nataliia V. |
| baseUrl_str | |
| collection | OJS |
| datestamp_date | 2018-03-30T15:27:05Z |
| description | In this paper, the methods for processing missing data are reviewed. The classification of methods depending on input data, data types and formats, and causes of data incompleteness associated with influence of uncertainties of the outside world and modeling object is proposed. The commonalities and differences between existing methods are investigated. The application peculiarities of these methods for filling missing data depending on properties of uncertainties are determined. It is shown that the traditional approach for filling the missing data by average values does not allow obtaining correct forecasts in many cases due to changes in sample’s properties. The usage of data mining methods technologies for dealing with missing data is proposed. An example of using regression methods is shown for filling missing data, in particular, using the forecast evaluation. |
| first_indexed | 2025-07-17T10:20:48Z |
| format | Article |
| id | journaliasakpiua-article-75213 |
| institution | System research and information technologies |
| language | Ukrainian |
| last_indexed | 2025-07-17T10:20:48Z |
| publishDate | 2016 |
| publisher | The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" |
| record_format | ojs |
| spelling | journaliasakpiua-article-752132018-03-30T15:27:05Z Identification and dealing with uncertainties in the form of incomplete data by data mining methods Выявление и обработка неопределенностей в форме неполных данных методами интеллектуального анализа Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу Kuznietsova, Nataliia V. risks analysis data mining Bayesian networks informational technologies system analysis анализ рисков методы анализа данных сети Баеса информационные технологии системный анализ аналіз ризиків методи аналізу даних мережі Байєса інформаційні технології системний аналіз In this paper, the methods for processing missing data are reviewed. The classification of methods depending on input data, data types and formats, and causes of data incompleteness associated with influence of uncertainties of the outside world and modeling object is proposed. The commonalities and differences between existing methods are investigated. The application peculiarities of these methods for filling missing data depending on properties of uncertainties are determined. It is shown that the traditional approach for filling the missing data by average values does not allow obtaining correct forecasts in many cases due to changes in sample’s properties. The usage of data mining methods technologies for dealing with missing data is proposed. An example of using regression methods is shown for filling missing data, in particular, using the forecast evaluation. Рассмотрены методы обработки пропущенных данных и предложена их классификация с учетом видов входных данных, типов и форматов данных, причин пропусков, обусловленых проявлением влияния неопределенности внешнего мира и объекта моделирования. Исследованы общие черты и отличия существующих методов обработки, определены особенности их использования для заполнения пропу-щенных данных в зависимости от характера неопределенностей. Показано, что традиционный подход заполнения пропусков средним значением не позволяет получить достоверные прогнозы во многих случаях из-за изменения характера выборки. Предложено использование методов интеллектуального анализа данных для обработки пропущенных значений и приведен пример заполнения пропусков данных методами регрессионного анализа, в частности с помощью оценок прогнозов. Розглянуто методи оброблення пропущених даних і запропоновано їх класифікацію з урахуванням видів вхідних даних, типів та форматів даних, причин пропусків, зумовлених проявом впливу невизначеностей навколишнього світу і об’єкта моделювання. Досліджено спільні ознаки та відмінності існуючих методів оброблення, визначено особливості їх застосування для дозаповнення пропущених даних залежно від характеру невизначеностей. Показано, що традиційний підхід до заповнення пропусків середнім значенням не дозволяє отримати достовірні прогнози у багатьох випадках через зміну характеру вибірки. Запропоновано використання методів інтелектуального аналізу даних для оброблення пропущених значень та наведено приклад заповнення пропусків даних методами регресійного аналізу, зокрема за допомогою оцінок прогнозів. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2016-06-21 Article Article application/pdf http://journal.iasa.kpi.ua/article/view/75213 10.20535/SRIT.2308-8893.2016.2.10 System research and information technologies; No. 2 (2016); 104-115 Системные исследования и информационные технологии; № 2 (2016); 104-115 Системні дослідження та інформаційні технології; № 2 (2016); 104-115 2308-8893 1681-6048 uk http://journal.iasa.kpi.ua/article/view/75213/70695 Copyright (c) 2021 System research and information technologies |
| spellingShingle | аналіз ризиків методи аналізу даних мережі Байєса інформаційні технології системний аналіз Kuznietsova, Nataliia V. Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу |
| title | Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу |
| title_alt | Identification and dealing with uncertainties in the form of incomplete data by data mining methods Выявление и обработка неопределенностей в форме неполных данных методами интеллектуального анализа |
| title_full | Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу |
| title_fullStr | Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу |
| title_full_unstemmed | Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу |
| title_short | Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу |
| title_sort | виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу |
| topic | аналіз ризиків методи аналізу даних мережі Байєса інформаційні технології системний аналіз |
| topic_facet | risks analysis data mining Bayesian networks informational technologies system analysis анализ рисков методы анализа данных сети Баеса информационные технологии системный анализ аналіз ризиків методи аналізу даних мережі Байєса інформаційні технології системний аналіз |
| url | http://journal.iasa.kpi.ua/article/view/75213 |
| work_keys_str_mv | AT kuznietsovanataliiav identificationanddealingwithuncertaintiesintheformofincompletedatabydataminingmethods AT kuznietsovanataliiav vyâvlenieiobrabotkaneopredelennostejvformenepolnyhdannyhmetodamiintellektualʹnogoanaliza AT kuznietsovanataliiav viâvlennâtaobroblennâneviznačenostejuformínepovnihdanihmetodamiíntelektualʹnogoanalizu |