Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу

У статті наведено результати досліджень процесів перетворення інформації від форми текстового повідомлення до форми двовимірного масиву чисельних характеристик. Ці характеристики використовуються як масив вхідних даних (МВД) при синтезі моделі-класифікатора індуктивними методами, зокрема, багаторядн...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2018
Автор: Голуб, М.С.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут проблем математичних машин і систем НАН України 2018
Назва видання:Математичні машини і системи
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/132011
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу / М.С. Голуб // Математичні машини і системи. — 2018. — № 1. — С. 59-66. — Бібліогр.: 10 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-132011
record_format dspace
spelling irk-123456789-1320112018-04-09T03:02:54Z Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу Голуб, М.С. Інформаційні і телекомунікаційні технології У статті наведено результати досліджень процесів перетворення інформації від форми текстового повідомлення до форми двовимірного масиву чисельних характеристик. Ці характеристики використовуються як масив вхідних даних (МВД) при синтезі моделі-класифікатора індуктивними методами, зокрема, багаторядним алгоритмом методу групового урахування аргументів (МГУА). Запропоновано новий метод визначення переліку інформативних ознак тексту, який є адаптивним до поставленої задачі та до властивостей МВД. Створені умови для 100% вірної класифікації текстів. Це свідчить про забезпечення достатньої інформативності МВД у технологіях моніторингу текстових повідомлень. В статье приведены результаты исследований процессов преобразования информации от формы текстового сообщения в форму двумерного массива численных характеристик. Эти характеристики используются в качестве массива входных данных (МВД) при синтезе модели-классификатора индуктивными методами, в частности, многорядным алгоритмом метода группового учёта аргументов (МГУА). Предложен новый метод формирования перечня информативных признаков текста, который является адаптивным к поставленной задаче и свойствам МВД. Созданы условия для 100% верной классификации текстов. Это свидетельствует о том, что обеспечена достаточная информативность МВД в технологиях мониторинга текстовых сообщений. The article presents investigation results of information transformation from a form of the text message into the two-dimensional array of numerical characteristics. These characteristics are used as an array of input data (AID) when synthesizing the model-classifier by using inductive methods, in particular the multi-row algorithm of group method of data handling (GMDH). A new method for defining the list of informative text features that are adaptive to a given task and properties of the AID are suggested. Conditions for 100% correct classification of texts are created. This enables sufficient informativeness of AID in technologies of text message monitoring. 2018 Article Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу / М.С. Голуб // Математичні машини і системи. — 2018. — № 1. — С. 59-66. — Бібліогр.: 10 назв. — укр. 1028-9763 http://dspace.nbuv.gov.ua/handle/123456789/132011 004.942 uk Математичні машини і системи Інститут проблем математичних машин і систем НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
topic Інформаційні і телекомунікаційні технології
Інформаційні і телекомунікаційні технології
spellingShingle Інформаційні і телекомунікаційні технології
Інформаційні і телекомунікаційні технології
Голуб, М.С.
Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
Математичні машини і системи
description У статті наведено результати досліджень процесів перетворення інформації від форми текстового повідомлення до форми двовимірного масиву чисельних характеристик. Ці характеристики використовуються як масив вхідних даних (МВД) при синтезі моделі-класифікатора індуктивними методами, зокрема, багаторядним алгоритмом методу групового урахування аргументів (МГУА). Запропоновано новий метод визначення переліку інформативних ознак тексту, який є адаптивним до поставленої задачі та до властивостей МВД. Створені умови для 100% вірної класифікації текстів. Це свідчить про забезпечення достатньої інформативності МВД у технологіях моніторингу текстових повідомлень.
format Article
author Голуб, М.С.
author_facet Голуб, М.С.
author_sort Голуб, М.С.
title Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_short Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_full Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_fullStr Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_full_unstemmed Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_sort формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
publisher Інститут проблем математичних машин і систем НАН України
publishDate 2018
topic_facet Інформаційні і телекомунікаційні технології
url http://dspace.nbuv.gov.ua/handle/123456789/132011
citation_txt Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу / М.С. Голуб // Математичні машини і системи. — 2018. — № 1. — С. 59-66. — Бібліогр.: 10 назв. — укр.
series Математичні машини і системи
work_keys_str_mv AT golubms formuvannâmasivuvhídnihdanihpriklasifíkacíítekstívutehnologííínformacíjnogomonítoringu
first_indexed 2023-10-18T21:03:26Z
last_indexed 2023-10-18T21:03:26Z
_version_ 1796151810612789248