Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу

У статті наведено результати досліджень процесів перетворення інформації від форми текстового повідомлення до форми двовимірного масиву чисельних характеристик. Ці характеристики використовуються як масив вхідних даних (МВД) при синтезі моделі-класифікатора індуктивними методами, зокрема, багаторядн...

Full description

Saved in:
Bibliographic Details
Published in:Математичні машини і системи
Date:2018
Main Author: Голуб, М.С.
Format: Article
Language:Ukrainian
Published: Інститут проблем математичних машин і систем НАН України 2018
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/132011
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу / М.С. Голуб // Математичні машини і системи. — 2018. — № 1. — С. 59-66. — Бібліогр.: 10 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-132011
record_format dspace
spelling Голуб, М.С.
2018-04-08T18:04:48Z
2018-04-08T18:04:48Z
2018
Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу / М.С. Голуб // Математичні машини і системи. — 2018. — № 1. — С. 59-66. — Бібліогр.: 10 назв. — укр.
1028-9763
https://nasplib.isofts.kiev.ua/handle/123456789/132011
004.942
У статті наведено результати досліджень процесів перетворення інформації від форми текстового повідомлення до форми двовимірного масиву чисельних характеристик. Ці характеристики використовуються як масив вхідних даних (МВД) при синтезі моделі-класифікатора індуктивними методами, зокрема, багаторядним алгоритмом методу групового урахування аргументів (МГУА). Запропоновано новий метод визначення переліку інформативних ознак тексту, який є адаптивним до поставленої задачі та до властивостей МВД. Створені умови для 100% вірної класифікації текстів. Це свідчить про забезпечення достатньої інформативності МВД у технологіях моніторингу текстових повідомлень.
В статье приведены результаты исследований процессов преобразования информации от формы текстового сообщения в форму двумерного массива численных характеристик. Эти характеристики используются в качестве массива входных данных (МВД) при синтезе модели-классификатора индуктивными методами, в частности, многорядным алгоритмом метода группового учёта аргументов (МГУА). Предложен новый метод формирования перечня информативных признаков текста, который является адаптивным к поставленной задаче и свойствам МВД. Созданы условия для 100% верной классификации текстов. Это свидетельствует о том, что обеспечена достаточная информативность МВД в технологиях мониторинга текстовых сообщений.
The article presents investigation results of information transformation from a form of the text message into the two-dimensional array of numerical characteristics. These characteristics are used as an array of input data (AID) when synthesizing the model-classifier by using inductive methods, in particular the multi-row algorithm of group method of data handling (GMDH). A new method for defining the list of informative text features that are adaptive to a given task and properties of the AID are suggested. Conditions for 100% correct classification of texts are created. This enables sufficient informativeness of AID in technologies of text message monitoring.
uk
Інститут проблем математичних машин і систем НАН України
Математичні машини і системи
Інформаційні і телекомунікаційні технології
Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
Формирование массива входных данных при классификации текстов в технологии информационного мониторинга
Formation of an array of input data under the classification of texts in information monitoring technology
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
spellingShingle Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
Голуб, М.С.
Інформаційні і телекомунікаційні технології
title_short Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_full Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_fullStr Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_full_unstemmed Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_sort формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
author Голуб, М.С.
author_facet Голуб, М.С.
topic Інформаційні і телекомунікаційні технології
topic_facet Інформаційні і телекомунікаційні технології
publishDate 2018
language Ukrainian
container_title Математичні машини і системи
publisher Інститут проблем математичних машин і систем НАН України
format Article
title_alt Формирование массива входных данных при классификации текстов в технологии информационного мониторинга
Formation of an array of input data under the classification of texts in information monitoring technology
description У статті наведено результати досліджень процесів перетворення інформації від форми текстового повідомлення до форми двовимірного масиву чисельних характеристик. Ці характеристики використовуються як масив вхідних даних (МВД) при синтезі моделі-класифікатора індуктивними методами, зокрема, багаторядним алгоритмом методу групового урахування аргументів (МГУА). Запропоновано новий метод визначення переліку інформативних ознак тексту, який є адаптивним до поставленої задачі та до властивостей МВД. Створені умови для 100% вірної класифікації текстів. Це свідчить про забезпечення достатньої інформативності МВД у технологіях моніторингу текстових повідомлень. В статье приведены результаты исследований процессов преобразования информации от формы текстового сообщения в форму двумерного массива численных характеристик. Эти характеристики используются в качестве массива входных данных (МВД) при синтезе модели-классификатора индуктивными методами, в частности, многорядным алгоритмом метода группового учёта аргументов (МГУА). Предложен новый метод формирования перечня информативных признаков текста, который является адаптивным к поставленной задаче и свойствам МВД. Созданы условия для 100% верной классификации текстов. Это свидетельствует о том, что обеспечена достаточная информативность МВД в технологиях мониторинга текстовых сообщений. The article presents investigation results of information transformation from a form of the text message into the two-dimensional array of numerical characteristics. These characteristics are used as an array of input data (AID) when synthesizing the model-classifier by using inductive methods, in particular the multi-row algorithm of group method of data handling (GMDH). A new method for defining the list of informative text features that are adaptive to a given task and properties of the AID are suggested. Conditions for 100% correct classification of texts are created. This enables sufficient informativeness of AID in technologies of text message monitoring.
issn 1028-9763
url https://nasplib.isofts.kiev.ua/handle/123456789/132011
citation_txt Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу / М.С. Голуб // Математичні машини і системи. — 2018. — № 1. — С. 59-66. — Бібліогр.: 10 назв. — укр.
work_keys_str_mv AT golubms formuvannâmasivuvhídnihdanihpriklasifíkacíítekstívutehnologííínformacíinogomonítoringu
AT golubms formirovaniemassivavhodnyhdannyhpriklassifikaciitekstovvtehnologiiinformacionnogomonitoringa
AT golubms formationofanarrayofinputdataundertheclassificationoftextsininformationmonitoringtechnology
first_indexed 2025-12-07T18:26:27Z
last_indexed 2025-12-07T18:26:27Z
_version_ 1850875039151292416