Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта

Предложен новый метод разбиения исходной выборки на обучающую и тестовую, сохраняющий в сгенерированной подвыборке наиболее важные топологические свойства исходной выборки и не требующий ее загрузки в память. Он обеспечивает последовательную обработку экземпляров, а также выполняет преобразование мн...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Реєстрація, зберігання і обробка даних
Дата:2013
Автор: Субботин, С.А.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут проблем реєстрації інформації НАН України 2013
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/87083
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта / С.А. Субботин // Реєстрація, зберігання і обробка даних. — 2013. — Т. 15, № 4. — С. 13-22. — Бібліогр.: 12 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-87083
record_format dspace
spelling Субботин, С.А.
2015-10-10T17:45:12Z
2015-10-10T17:45:12Z
2013
Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта / С.А. Субботин // Реєстрація, зберігання і обробка даних. — 2013. — Т. 15, № 4. — С. 13-22. — Бібліогр.: 12 назв. — рос.
1560-9189
https://nasplib.isofts.kiev.ua/handle/123456789/87083
004.93
Предложен новый метод разбиения исходной выборки на обучающую и тестовую, сохраняющий в сгенерированной подвыборке наиболее важные топологические свойства исходной выборки и не требующий ее загрузки в память. Он обеспечивает последовательную обработку экземпляров, а также выполняет преобразование многомерных координат в одномерные и дискретизацию для улучшения обобщающих свойств. Метод позволяет значительно уменьшить размер выборки и снизить требования к ресурсам компьютера.
The new method of training and test sample forming from primary sample is proposed. It preserves in a generated sub-sample the most important topological properties of the original sample and did not even needs to load of the original sample into computer memory. It provides a sequential exemplar processing and performs transformation of the multi-dimensional coordinate set to the one-dimensional, which is also discretized to improve the data generalization properties. This allows to significantly reduce the sample size, and to significantly decrease the requirements to computer resources.
Работа выполнена в Запорожском национальном техническом университете в рамках научно-исследовательской темы «Интеллектуальные информационные технологии автоматизации проектирования, моделирования, управления и диагностирования производственных процессов и систем» (№ гос. регистрации 0112U005350).
ru
Інститут проблем реєстрації інформації НАН України
Реєстрація, зберігання і обробка даних
Математичні методи обробки даних
Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта
Primary Large Sample Partitioning for Diagnosis and Recognition Problem Solving on the Basis of Computational Intelligence Methods
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта
spellingShingle Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта
Субботин, С.А.
Математичні методи обробки даних
title_short Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта
title_full Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта
title_fullStr Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта
title_full_unstemmed Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта
title_sort разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта
author Субботин, С.А.
author_facet Субботин, С.А.
topic Математичні методи обробки даних
topic_facet Математичні методи обробки даних
publishDate 2013
language Russian
container_title Реєстрація, зберігання і обробка даних
publisher Інститут проблем реєстрації інформації НАН України
format Article
title_alt Primary Large Sample Partitioning for Diagnosis and Recognition Problem Solving on the Basis of Computational Intelligence Methods
description Предложен новый метод разбиения исходной выборки на обучающую и тестовую, сохраняющий в сгенерированной подвыборке наиболее важные топологические свойства исходной выборки и не требующий ее загрузки в память. Он обеспечивает последовательную обработку экземпляров, а также выполняет преобразование многомерных координат в одномерные и дискретизацию для улучшения обобщающих свойств. Метод позволяет значительно уменьшить размер выборки и снизить требования к ресурсам компьютера. The new method of training and test sample forming from primary sample is proposed. It preserves in a generated sub-sample the most important topological properties of the original sample and did not even needs to load of the original sample into computer memory. It provides a sequential exemplar processing and performs transformation of the multi-dimensional coordinate set to the one-dimensional, which is also discretized to improve the data generalization properties. This allows to significantly reduce the sample size, and to significantly decrease the requirements to computer resources.
issn 1560-9189
url https://nasplib.isofts.kiev.ua/handle/123456789/87083
citation_txt Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта / С.А. Субботин // Реєстрація, зберігання і обробка даних. — 2013. — Т. 15, № 4. — С. 13-22. — Бібліогр.: 12 назв. — рос.
work_keys_str_mv AT subbotinsa razbienieishodnoivyborkibolʹšogoobʺemadlârešeniâzadačdiagnostikiiraspoznavaniâobrazovnaosnovemetodovvyčislitelʹnogointellekta
AT subbotinsa primarylargesamplepartitioningfordiagnosisandrecognitionproblemsolvingonthebasisofcomputationalintelligencemethods
first_indexed 2025-12-07T19:59:34Z
last_indexed 2025-12-07T19:59:34Z
_version_ 1850880897815937024