Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні

Розглядається проблема неоднозначності в задачах класифікації в області машинного навчання. Задача класифікації полягає у навчанні моделі відрізняти екземпляри даних, що належать різним класам. Однак можливі ситуації, коли правильна класифікація певної множини екземплярів даних складна або навіть не...

Повний опис

Збережено в:

Бібліографічні деталі
Опубліковано в: :	Проблеми керування та інформатики
Дата:	2023
Автори:	Охріменко, А.О., Куссуль, Н.М.
Формат:	Стаття
Мова:	Українська
Опубліковано:	Інститут кібернетики ім. В.М. Глушкова НАН України 2023
Теми:	Космічні інформаційні технології та системи
Онлайн доступ:	https://nasplib.isofts.kiev.ua/handle/123456789/211050
Теги:	Додати тег Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:	Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні / А.О. Охріменко, Н.М. Куссуль // Проблеми керування та інформатики. — 2023. — № 4. — С. 84-95. — Бібліогр.: 23 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine

_version_	1862698422115500032
author	Охріменко, А.О. Куссуль, Н.М.
author_facet	Охріменко, А.О. Куссуль, Н.М.
citation_txt	Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні / А.О. Охріменко, Н.М. Куссуль // Проблеми керування та інформатики. — 2023. — № 4. — С. 84-95. — Бібліогр.: 23 назв. — укр.
collection	DSpace DC
container_title	Проблеми керування та інформатики
description	Розглядається проблема неоднозначності в задачах класифікації в області машинного навчання. Задача класифікації полягає у навчанні моделі відрізняти екземпляри даних, що належать різним класам. Однак можливі ситуації, коли правильна класифікація певної множини екземплярів даних складна або навіть неможлива, незалежно від складності моделі машинного навчання. Запропоновано метод та алгоритм виявлення таких неоднозначних екземплярів даних, що базуються на використанні методу найближчого сусіда та аналізу класів екземплярів даних, розташованих поряд у просторі ознак, та дозволяють виділити підмножину неоднозначних екземплярів даних, що можуть негативно впливати на процес навчання моделі класифікації. З метою демонстрації практичного застосування алгоритму проведено експеримент на чотириканальному супутниковому композиті, що використовується для попіксельної класифікації сільськогосподарських культур. The problem of ambiguity in classification tasks in the field of machine learning is considered. The classification task involves training a model to distinguish instances of data belonging to different classes. However, situations may arise where the correct classification of a certain set of data instances is difficult or even impossible, regardless of the complexity of the machine learning model. A method and algorithm for detecting such ambiguous data instances are proposed, based on the use of the nearest neighbor method and analysis of the classes of data instances located close to each other in the feature space. These methods allow for identifying a subset of ambiguous data instances that may negatively affect the training process of the classification model. To demonstrate the practical application of the algorithm, an experiment was conducted on a four-channel satellite composite used for pixel-wise classification of agricultural crops.
first_indexed	2026-03-18T10:19:56Z
format	Article
fulltext
id	nasplib_isofts_kiev_ua-123456789-211050
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn	0572-2691
language	Ukrainian
last_indexed	2026-03-18T10:19:56Z
publishDate	2023
publisher	Інститут кібернетики ім. В.М. Глушкова НАН України
record_format	dspace
spelling	Охріменко, А.О. Куссуль, Н.М. 2025-12-23T03:36:25Z 2023 Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні / А.О. Охріменко, Н.М. Куссуль // Проблеми керування та інформатики. — 2023. — № 4. — С. 84-95. — Бібліогр.: 23 назв. — укр. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/211050 004.8, 004.93 10.34229/1028-0979-2023-4-7 Розглядається проблема неоднозначності в задачах класифікації в області машинного навчання. Задача класифікації полягає у навчанні моделі відрізняти екземпляри даних, що належать різним класам. Однак можливі ситуації, коли правильна класифікація певної множини екземплярів даних складна або навіть неможлива, незалежно від складності моделі машинного навчання. Запропоновано метод та алгоритм виявлення таких неоднозначних екземплярів даних, що базуються на використанні методу найближчого сусіда та аналізу класів екземплярів даних, розташованих поряд у просторі ознак, та дозволяють виділити підмножину неоднозначних екземплярів даних, що можуть негативно впливати на процес навчання моделі класифікації. З метою демонстрації практичного застосування алгоритму проведено експеримент на чотириканальному супутниковому композиті, що використовується для попіксельної класифікації сільськогосподарських культур. The problem of ambiguity in classification tasks in the field of machine learning is considered. The classification task involves training a model to distinguish instances of data belonging to different classes. However, situations may arise where the correct classification of a certain set of data instances is difficult or even impossible, regardless of the complexity of the machine learning model. A method and algorithm for detecting such ambiguous data instances are proposed, based on the use of the nearest neighbor method and analysis of the classes of data instances located close to each other in the feature space. These methods allow for identifying a subset of ambiguous data instances that may negatively affect the training process of the classification model. To demonstrate the practical application of the algorithm, an experiment was conducted on a four-channel satellite composite used for pixel-wise classification of agricultural crops. Робота виконана в межах проєкту Національного фонду досліджень України 2020.02/0292 «Методи і моделі глибинного навчання для прикладних задач супутникового моніторингу» (конкурс «Підтримка досліджень провідних та молодих учених»). uk Інститут кібернетики ім. В.М. Глушкова НАН України Проблеми керування та інформатики Космічні інформаційні технології та системи Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні Data mining of machine learning datasets for hard case identification Article published earlier
spellingShingle	Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні Охріменко, А.О. Куссуль, Н.М. Космічні інформаційні технології та системи
title	Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні
title_alt	Data mining of machine learning datasets for hard case identification
title_full	Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні
title_fullStr	Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні
title_full_unstemmed	Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні
title_short	Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні
title_sort	метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні
topic	Космічні інформаційні технології та системи
topic_facet	Космічні інформаційні технології та системи
url	https://nasplib.isofts.kiev.ua/handle/123456789/211050
work_keys_str_mv	AT ohrímenkoao metodviâvlennâskladnihdlârozpíznavannâzrazkívunaborahdanihdlâzadačklasifíkacííumašinnomunavčanní AT kussulʹnm metodviâvlennâskladnihdlârozpíznavannâzrazkívunaborahdanihdlâzadačklasifíkacííumašinnomunavčanní AT ohrímenkoao dataminingofmachinelearningdatasetsforhardcaseidentification AT kussulʹnm dataminingofmachinelearningdatasetsforhardcaseidentification

Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні

Репозитарії

Схожі ресурси