Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу

У статті наведено результати досліджень процесів перетворення інформації від форми текстового повідомлення до форми двовимірного масиву чисельних характеристик. Ці характеристики використовуються як масив вхідних даних (МВД) при синтезі моделі-класифікатора індуктивними методами, зокрема, багаторядн...

Full description

Saved in:
Bibliographic Details
Published in:Математичні машини і системи
Date:2018
Main Author: Голуб, М.С.
Format: Article
Language:Ukrainian
Published: Інститут проблем математичних машин і систем НАН України 2018
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/132011
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу / М.С. Голуб // Математичні машини і системи. — 2018. — № 1. — С. 59-66. — Бібліогр.: 10 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1862720687169339392
author Голуб, М.С.
author_facet Голуб, М.С.
citation_txt Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу / М.С. Голуб // Математичні машини і системи. — 2018. — № 1. — С. 59-66. — Бібліогр.: 10 назв. — укр.
collection DSpace DC
container_title Математичні машини і системи
description У статті наведено результати досліджень процесів перетворення інформації від форми текстового повідомлення до форми двовимірного масиву чисельних характеристик. Ці характеристики використовуються як масив вхідних даних (МВД) при синтезі моделі-класифікатора індуктивними методами, зокрема, багаторядним алгоритмом методу групового урахування аргументів (МГУА). Запропоновано новий метод визначення переліку інформативних ознак тексту, який є адаптивним до поставленої задачі та до властивостей МВД. Створені умови для 100% вірної класифікації текстів. Це свідчить про забезпечення достатньої інформативності МВД у технологіях моніторингу текстових повідомлень. В статье приведены результаты исследований процессов преобразования информации от формы текстового сообщения в форму двумерного массива численных характеристик. Эти характеристики используются в качестве массива входных данных (МВД) при синтезе модели-классификатора индуктивными методами, в частности, многорядным алгоритмом метода группового учёта аргументов (МГУА). Предложен новый метод формирования перечня информативных признаков текста, который является адаптивным к поставленной задаче и свойствам МВД. Созданы условия для 100% верной классификации текстов. Это свидетельствует о том, что обеспечена достаточная информативность МВД в технологиях мониторинга текстовых сообщений. The article presents investigation results of information transformation from a form of the text message into the two-dimensional array of numerical characteristics. These characteristics are used as an array of input data (AID) when synthesizing the model-classifier by using inductive methods, in particular the multi-row algorithm of group method of data handling (GMDH). A new method for defining the list of informative text features that are adaptive to a given task and properties of the AID are suggested. Conditions for 100% correct classification of texts are created. This enables sufficient informativeness of AID in technologies of text message monitoring.
first_indexed 2025-12-07T18:26:27Z
format Article
fulltext
id nasplib_isofts_kiev_ua-123456789-132011
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1028-9763
language Ukrainian
last_indexed 2025-12-07T18:26:27Z
publishDate 2018
publisher Інститут проблем математичних машин і систем НАН України
record_format dspace
spelling Голуб, М.С.
2018-04-08T18:04:48Z
2018-04-08T18:04:48Z
2018
Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу / М.С. Голуб // Математичні машини і системи. — 2018. — № 1. — С. 59-66. — Бібліогр.: 10 назв. — укр.
1028-9763
https://nasplib.isofts.kiev.ua/handle/123456789/132011
004.942
У статті наведено результати досліджень процесів перетворення інформації від форми текстового повідомлення до форми двовимірного масиву чисельних характеристик. Ці характеристики використовуються як масив вхідних даних (МВД) при синтезі моделі-класифікатора індуктивними методами, зокрема, багаторядним алгоритмом методу групового урахування аргументів (МГУА). Запропоновано новий метод визначення переліку інформативних ознак тексту, який є адаптивним до поставленої задачі та до властивостей МВД. Створені умови для 100% вірної класифікації текстів. Це свідчить про забезпечення достатньої інформативності МВД у технологіях моніторингу текстових повідомлень.
В статье приведены результаты исследований процессов преобразования информации от формы текстового сообщения в форму двумерного массива численных характеристик. Эти характеристики используются в качестве массива входных данных (МВД) при синтезе модели-классификатора индуктивными методами, в частности, многорядным алгоритмом метода группового учёта аргументов (МГУА). Предложен новый метод формирования перечня информативных признаков текста, который является адаптивным к поставленной задаче и свойствам МВД. Созданы условия для 100% верной классификации текстов. Это свидетельствует о том, что обеспечена достаточная информативность МВД в технологиях мониторинга текстовых сообщений.
The article presents investigation results of information transformation from a form of the text message into the two-dimensional array of numerical characteristics. These characteristics are used as an array of input data (AID) when synthesizing the model-classifier by using inductive methods, in particular the multi-row algorithm of group method of data handling (GMDH). A new method for defining the list of informative text features that are adaptive to a given task and properties of the AID are suggested. Conditions for 100% correct classification of texts are created. This enables sufficient informativeness of AID in technologies of text message monitoring.
uk
Інститут проблем математичних машин і систем НАН України
Математичні машини і системи
Інформаційні і телекомунікаційні технології
Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
Формирование массива входных данных при классификации текстов в технологии информационного мониторинга
Formation of an array of input data under the classification of texts in information monitoring technology
Article
published earlier
spellingShingle Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
Голуб, М.С.
Інформаційні і телекомунікаційні технології
title Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_alt Формирование массива входных данных при классификации текстов в технологии информационного мониторинга
Formation of an array of input data under the classification of texts in information monitoring technology
title_full Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_fullStr Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_full_unstemmed Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_short Формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
title_sort формування масиву вхідних даних при класифікації текстів у технології інформаційного моніторингу
topic Інформаційні і телекомунікаційні технології
topic_facet Інформаційні і телекомунікаційні технології
url https://nasplib.isofts.kiev.ua/handle/123456789/132011
work_keys_str_mv AT golubms formuvannâmasivuvhídnihdanihpriklasifíkacíítekstívutehnologííínformacíinogomonítoringu
AT golubms formirovaniemassivavhodnyhdannyhpriklassifikaciitekstovvtehnologiiinformacionnogomonitoringa
AT golubms formationofanarrayofinputdataundertheclassificationoftextsininformationmonitoringtechnology