Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта

Предложен новый метод разбиения исходной выборки на обучающую и тестовую, сохраняющий в сгенерированной подвыборке наиболее важные топологические свойства исходной выборки и не требующий ее загрузки в память. Он обеспечивает последовательную обработку экземпляров, а также выполняет преобразование мн...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Реєстрація, зберігання і обробка даних
Дата:2013
Автор: Субботин, С.А.
Формат: Стаття
Мова:Російська
Опубліковано: Інститут проблем реєстрації інформації НАН України 2013
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/87083
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Разбиение исходной выборки большого объема для решения задач диагностики и распознавания образов на основе методов вычислительного интеллекта / С.А. Субботин // Реєстрація, зберігання і обробка даних. — 2013. — Т. 15, № 4. — С. 13-22. — Бібліогр.: 12 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Опис
Резюме:Предложен новый метод разбиения исходной выборки на обучающую и тестовую, сохраняющий в сгенерированной подвыборке наиболее важные топологические свойства исходной выборки и не требующий ее загрузки в память. Он обеспечивает последовательную обработку экземпляров, а также выполняет преобразование многомерных координат в одномерные и дискретизацию для улучшения обобщающих свойств. Метод позволяет значительно уменьшить размер выборки и снизить требования к ресурсам компьютера. The new method of training and test sample forming from primary sample is proposed. It preserves in a generated sub-sample the most important topological properties of the original sample and did not even needs to load of the original sample into computer memory. It provides a sequential exemplar processing and performs transformation of the multi-dimensional coordinate set to the one-dimensional, which is also discretized to improve the data generalization properties. This allows to significantly reduce the sample size, and to significantly decrease the requirements to computer resources.
ISSN:1560-9189