Метод редукции мажоритарного класса в несбалансированных выборках
Рассмотрены проблемы формирования обучающих выборок для построения диагностических и распознающих моделей по прецедентам в условиях несбалансированности классов. Предложен метод автоматизации формирования обучающих выборок из исходных несбалансированных выборок большого размера. Метод позволяет знач...
Збережено в:
| Опубліковано в: : | Реєстрація, зберігання і обробка даних |
|---|---|
| Дата: | 2018 |
| Автори: | , |
| Формат: | Стаття |
| Мова: | Russian |
| Опубліковано: |
Інститут проблем реєстрації інформації НАН України
2018
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/168688 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Метод редукции мажоритарного класса в несбалансированных выборках / Д.А. Каврин, С.А. Субботин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 1. — С. 51–59. — Бібліогр.: 14 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-168688 |
|---|---|
| record_format |
dspace |
| spelling |
Каврин, Д.А. Субботин, С.А. 2020-05-07T18:31:39Z 2020-05-07T18:31:39Z 2018 Метод редукции мажоритарного класса в несбалансированных выборках / Д.А. Каврин, С.А. Субботин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 1. — С. 51–59. — Бібліогр.: 14 назв. — рос. 1560-9189 DOI: https://doi.org/10.35681/1560-9189.2018.20.1.142902 https://nasplib.isofts.kiev.ua/handle/123456789/168688 004.93 Рассмотрены проблемы формирования обучающих выборок для построения диагностических и распознающих моделей по прецедентам в условиях несбалансированности классов. Предложен метод автоматизации формирования обучающих выборок из исходных несбалансированных выборок большого размера. Метод позволяет значительно сократить размер исходной выборки с сохранением важных топологических свойств путем редукции мажоритарного класса и восстановить количественный баланс классов. Разработано программное обеспечение, реализующее предложенный метод, которое было использовано при проведении вычислительных экспериментов на синтетических и реальных данных. Проведенные эксперименты подтвердили работоспособность и эффективность предложенного метода и реализующего его программного обеспечения. Розглянуто проблему формування навчальних вибірок для побудови діагностичних і розпізнавальних моделей за прецедентами в умовах незбалансованості класів. Запропоновано метод автоматизації формування навчальних вибірок з вихідних незбалансованих вибірок великого розміру. Метод дозволяє значно скоротити розмір вихідної вибірки зі збереженням важливих топологічних властивостей шляхом редукції мажоритарного класу та відновити кількісний баланс класів. Розроблено програмне забезпечення, що реалізує запропонований метод, яке було використано при виконанні обчислювальних експериментів на синтетичних і реальних даних. Проведені експерименти підтвердили працездатність та ефективність запропонованого методу та програмного забезпечення, що його реалізує. The problem of the sample selection from the imbalanced large-sized datasets has been addressed for constructing of the diagnostic and pattern recognition models. The goal of the work is the creation of the sampling’s automatization method from the imbalanced large-sized dataset, based on the principles of undersampling. The method of automatization of sample selection from the original imbalanced large-sized dataset has been proposed. he software implementing proposed method has been developed and used in the computational experiments on synthetic and real imbalanced datasets. The conducted experiments confirmed the efficiency and working capacity of the proposed method and its implemented software. ru Інститут проблем реєстрації інформації НАН України Реєстрація, зберігання і обробка даних Технічні засоби отримання і обробки даних Метод редукции мажоритарного класса в несбалансированных выборках Метод редукції мажоритарного класу в незбалансованих вибірка The majority classes’ reducing method of imbalanced datasets Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Метод редукции мажоритарного класса в несбалансированных выборках |
| spellingShingle |
Метод редукции мажоритарного класса в несбалансированных выборках Каврин, Д.А. Субботин, С.А. Технічні засоби отримання і обробки даних |
| title_short |
Метод редукции мажоритарного класса в несбалансированных выборках |
| title_full |
Метод редукции мажоритарного класса в несбалансированных выборках |
| title_fullStr |
Метод редукции мажоритарного класса в несбалансированных выборках |
| title_full_unstemmed |
Метод редукции мажоритарного класса в несбалансированных выборках |
| title_sort |
метод редукции мажоритарного класса в несбалансированных выборках |
| author |
Каврин, Д.А. Субботин, С.А. |
| author_facet |
Каврин, Д.А. Субботин, С.А. |
| topic |
Технічні засоби отримання і обробки даних |
| topic_facet |
Технічні засоби отримання і обробки даних |
| publishDate |
2018 |
| language |
Russian |
| container_title |
Реєстрація, зберігання і обробка даних |
| publisher |
Інститут проблем реєстрації інформації НАН України |
| format |
Article |
| title_alt |
Метод редукції мажоритарного класу в незбалансованих вибірка The majority classes’ reducing method of imbalanced datasets |
| description |
Рассмотрены проблемы формирования обучающих выборок для построения диагностических и распознающих моделей по прецедентам в условиях несбалансированности классов. Предложен метод автоматизации формирования обучающих выборок из исходных несбалансированных выборок большого размера. Метод позволяет значительно сократить размер исходной выборки с сохранением важных топологических свойств путем редукции мажоритарного класса и восстановить количественный баланс классов. Разработано программное обеспечение, реализующее предложенный метод, которое было использовано при проведении вычислительных экспериментов на синтетических и реальных данных. Проведенные эксперименты подтвердили работоспособность и эффективность предложенного метода и реализующего его программного обеспечения.
Розглянуто проблему формування навчальних вибірок для побудови діагностичних і розпізнавальних моделей за прецедентами в умовах незбалансованості класів. Запропоновано метод автоматизації формування навчальних вибірок з вихідних незбалансованих вибірок великого розміру. Метод дозволяє значно скоротити розмір вихідної вибірки зі збереженням важливих топологічних властивостей шляхом редукції мажоритарного класу та відновити кількісний баланс класів. Розроблено програмне забезпечення, що реалізує запропонований метод, яке було використано при виконанні обчислювальних експериментів на синтетичних і реальних даних. Проведені експерименти підтвердили працездатність та ефективність запропонованого методу та програмного забезпечення, що його реалізує.
The problem of the sample selection from the imbalanced large-sized datasets has been addressed for constructing of the diagnostic and pattern recognition models. The goal of the work is the creation of the sampling’s automatization method from the imbalanced large-sized dataset, based on the principles of undersampling. The method of automatization of sample selection from the original imbalanced large-sized dataset has been proposed. he software implementing proposed method has been developed and used in the computational experiments on synthetic and real imbalanced datasets. The conducted experiments confirmed the efficiency and working capacity of the proposed method and its implemented software.
|
| issn |
1560-9189 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/168688 |
| citation_txt |
Метод редукции мажоритарного класса в несбалансированных выборках / Д.А. Каврин, С.А. Субботин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 1. — С. 51–59. — Бібліогр.: 14 назв. — рос. |
| work_keys_str_mv |
AT kavrinda metodredukciimažoritarnogoklassavnesbalansirovannyhvyborkah AT subbotinsa metodredukciimažoritarnogoklassavnesbalansirovannyhvyborkah AT kavrinda metodredukcíímažoritarnogoklasuvnezbalansovanihvibírka AT subbotinsa metodredukcíímažoritarnogoklasuvnezbalansovanihvibírka AT kavrinda themajorityclassesreducingmethodofimbalanceddatasets AT subbotinsa themajorityclassesreducingmethodofimbalanceddatasets |
| first_indexed |
2025-12-07T17:18:44Z |
| last_indexed |
2025-12-07T17:18:44Z |
| _version_ |
1850870778884521984 |