Модель вторинних некорельованих семантичних полів для анализу текстових даних

The model of derived uncorrelated semantic fields generated by the method of principal components and singular decomposition of the matrix of semantic fields frequencies has been considered. This model describes a new semantic space with orthonormal basis of displaying text documents. The dimension...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2014
Автор: Pavlyshenko, B. M.
Формат: Стаття
Мова:Ukrainian
Опубліковано: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2014
Онлайн доступ:http://journal.iasa.kpi.ua/article/view/33341
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:System research and information technologies

Репозитарії

System research and information technologies
id journaliasakpiua-article-33341
record_format ojs
spelling journaliasakpiua-article-333412014-12-22T16:35:13Z The model of derived uncorrelated semantic fields for text data analysis Модель вторичных некоррелированных семантических полей для анализа текстовых данных Модель вторинних некорельованих семантичних полів для анализу текстових даних Pavlyshenko, B. M. The model of derived uncorrelated semantic fields generated by the method of principal components and singular decomposition of the matrix of semantic fields frequencies has been considered. This model describes a new semantic space with orthonormal basis of displaying text documents. The dimension of the space of derived semantic fields is significantly less than the dimension of the space of initial semantic fields as a result of replacement of interconnected components by uncorrelated semantic characteristics. The analysis of the test sample of text documents showed the possibility to take into consideration only those components of secondary semantic fields which are described by the first singular numbers. The use of the low-dimension orthonormal basis of derived semantic fields can be effective in the problems of the text data classification and clustering.  Рассмотрена модель некоррелированных вторичных семантических полей образованных с помощью метода главных компонент и сингулярного разложения матрицы частот семантических полей. Эта модель характеризирует новое семантическое пространство отображения текстовых документов с ортонормированным базисом. Размерность пространства вторичных семантических полей существенно меньше размерности пространства первичных семантических полей вследствие замены взаимосвязанных составляющих некоррелированными семантическими характеристиками. Анализ тестовой выборки текстовых документов показал возможность принимать к рассмотрению только те составляющие вторичных семантических полей, которые описываются первыми сингулярными числами. Использование низкоразмерного ортонормированного базиса вторичных семантических полей может быть эффективным в задачах классификации и кластеризации текстовых даннях.  Розглянуто модель некорельованих вторинних семантичних полів утворених на основі методу головних компонент та сингулярного розкладу матриці частот семантичних полів. Ця модель характеризує новий семантичний простір відображення текстових документів із ортонормованим базисом. Розмірність простору вторинних семантичних полів є суттєво меншою за розмірність простору первинних семантичних полів внаслідок заміни взаємопов’язаних складових некорельованими семантичними характеристиками. Аналіз тестової вибірки текстових документів показав можливість брати до розгляду лише ті складові вторинних семантичних полів, які описуються першими сингулярними числами. Використання низькорозмірного ортонормованого базису вторинних семантичних полів може бути ефективним в задачах класифікації та кластеризації текстових даних.  The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2014-09-30 Article Article application/pdf http://journal.iasa.kpi.ua/article/view/33341 System research and information technologies; No. 3 (2014); 130-138 Системные исследования и информационные технологии; № 3 (2014); 130-138 Системні дослідження та інформаційні технології; № 3 (2014); 130-138 2308-8893 1681-6048 uk http://journal.iasa.kpi.ua/article/view/33341/29902 Copyright (c) 2021 System research and information technologies
institution System research and information technologies
collection OJS
language Ukrainian
format Article
author Pavlyshenko, B. M.
spellingShingle Pavlyshenko, B. M.
Модель вторинних некорельованих семантичних полів для анализу текстових даних
author_facet Pavlyshenko, B. M.
author_sort Pavlyshenko, B. M.
title Модель вторинних некорельованих семантичних полів для анализу текстових даних
title_short Модель вторинних некорельованих семантичних полів для анализу текстових даних
title_full Модель вторинних некорельованих семантичних полів для анализу текстових даних
title_fullStr Модель вторинних некорельованих семантичних полів для анализу текстових даних
title_full_unstemmed Модель вторинних некорельованих семантичних полів для анализу текстових даних
title_sort модель вторинних некорельованих семантичних полів для анализу текстових даних
title_alt The model of derived uncorrelated semantic fields for text data analysis
Модель вторичных некоррелированных семантических полей для анализа текстовых данных
description The model of derived uncorrelated semantic fields generated by the method of principal components and singular decomposition of the matrix of semantic fields frequencies has been considered. This model describes a new semantic space with orthonormal basis of displaying text documents. The dimension of the space of derived semantic fields is significantly less than the dimension of the space of initial semantic fields as a result of replacement of interconnected components by uncorrelated semantic characteristics. The analysis of the test sample of text documents showed the possibility to take into consideration only those components of secondary semantic fields which are described by the first singular numbers. The use of the low-dimension orthonormal basis of derived semantic fields can be effective in the problems of the text data classification and clustering. 
publisher The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
publishDate 2014
url http://journal.iasa.kpi.ua/article/view/33341
work_keys_str_mv AT pavlyshenkobm themodelofderiveduncorrelatedsemanticfieldsfortextdataanalysis
AT pavlyshenkobm modelʹvtoričnyhnekorrelirovannyhsemantičeskihpolejdlâanalizatekstovyhdannyh
AT pavlyshenkobm modelʹvtorinnihnekorelʹovanihsemantičnihpolívdlâanalizutekstovihdanih
AT pavlyshenkobm modelofderiveduncorrelatedsemanticfieldsfortextdataanalysis
first_indexed 2024-04-08T15:03:49Z
last_indexed 2024-04-08T15:03:49Z
_version_ 1795779335021395968