Модель вторинних некорельованих семантичних полів для анализу текстових даних

Розглянуто модель некорельованих вторинних семантичних полів утворених на основі методу головних компонент та сингулярного розкладу матриці частот семантичних полів. Ця модель характеризує новий семантичний простір відображення текстових документів із ортонормованим базисом. Розмірність простору вто...

Повний опис

Збережено в:

Бібліографічні деталі
Опубліковано в: :	Системні дослідження та інформаційні технології
Дата:	2014
Автор:	Павлишенко, Б.М.
Формат:	Стаття
Мова:	Українська
Опубліковано:	Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України 2014
Теми:	Нові методи в системному аналізі, інформатиці та теорії прийняття рішень
Онлайн доступ:	https://nasplib.isofts.kiev.ua/handle/123456789/85560
Теги:	Додати тег Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:	Модель вторинних некорельованих семантичних полів для анализу текстових даних / Б.М. Павлишенко // Системні дослідження та інформаційні технології. — 2014. — № 3. — С. 130-138. — Бібліогр.: 11 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine

_version_	1862620610303098880
author	Павлишенко, Б.М.
author_facet	Павлишенко, Б.М.
citation_txt	Модель вторинних некорельованих семантичних полів для анализу текстових даних / Б.М. Павлишенко // Системні дослідження та інформаційні технології. — 2014. — № 3. — С. 130-138. — Бібліогр.: 11 назв. — укр.
collection	DSpace DC
container_title	Системні дослідження та інформаційні технології
description	Розглянуто модель некорельованих вторинних семантичних полів утворених на основі методу головних компонент та сингулярного розкладу матриці частот семантичних полів. Ця модель характеризує новий семантичний простір відображення текстових документів із ортонормованим базисом. Розмірність простору вторинних семантичних полів є суттєво меншою за розмірність простору первинних семантичних полів внаслідок заміни взаємопов’язаних складових некорельованими семантичними характеристиками. Аналіз тестової вибірки текстових документів показав можливість брати до розгляду лише ті складові вторинних семантичних полів, які описуються першими сингулярними числами. Використання низькорозмірного ортонормованого базису вторинних семантичних полів може бути ефективним в задачах класифікації та кластеризації текстових даних. Рассмотрена модель некоррелированных вторичных семантических полей образованных с помощью метода главных компонент и сингулярного разложения матрицы частот семантических полей. Эта модель характеризирует новое семантическое пространство отображения текстовых документов с ортонормированным базисом. Размерность пространства вторичных семантических полей существенно меньше размерности пространства первичных семантических полей вследствие замены взаимосвязанных составляющих некоррелированными семантическими характеристиками. Анализ тестовой выборки текстовых документов показал возможность принимать к рассмотрению только те составляющие вторичных семантических полей, которые описываются первыми сингулярными числами. Использование низкоразмерного ортонормированного базиса вторичных семантических полей может быть эффективным в задачах классификации и кластеризации текстовых данных. The model of derived uncorrelated semantic fields generated by the method of principal components and singular decomposition of the matrix of semantic fields frequencies has been considered. This model describes a new semantic space with orthonormal basis of displaying text documents. The dimension of the space of derived semantic fields is significantly less than the dimension of the space of initial semantic fields as a result of replacement of interconnected components by uncorrelated semantic characteristics. The analysis of the test sample of text documents showed the possibility to take into consideration only those components of secondary semantic fields which are described by the first singular numbers. The use of the low-dimension orthonormal basis of derived semantic fields can be effective in the problems of the text data classification and clustering.
first_indexed	2025-12-07T13:22:22Z
format	Article
fulltext
id	nasplib_isofts_kiev_ua-123456789-85560
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn	1681–6048
language	Ukrainian
last_indexed	2025-12-07T13:22:22Z
publishDate	2014
publisher	Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
record_format	dspace
spelling	Павлишенко, Б.М. 2015-08-07T12:33:24Z 2015-08-07T12:33:24Z 2014 Модель вторинних некорельованих семантичних полів для анализу текстових даних / Б.М. Павлишенко // Системні дослідження та інформаційні технології. — 2014. — № 3. — С. 130-138. — Бібліогр.: 11 назв. — укр. 1681–6048 https://nasplib.isofts.kiev.ua/handle/123456789/85560 519.765:519.767:004.89 Розглянуто модель некорельованих вторинних семантичних полів утворених на основі методу головних компонент та сингулярного розкладу матриці частот семантичних полів. Ця модель характеризує новий семантичний простір відображення текстових документів із ортонормованим базисом. Розмірність простору вторинних семантичних полів є суттєво меншою за розмірність простору первинних семантичних полів внаслідок заміни взаємопов’язаних складових некорельованими семантичними характеристиками. Аналіз тестової вибірки текстових документів показав можливість брати до розгляду лише ті складові вторинних семантичних полів, які описуються першими сингулярними числами. Використання низькорозмірного ортонормованого базису вторинних семантичних полів може бути ефективним в задачах класифікації та кластеризації текстових даних. Рассмотрена модель некоррелированных вторичных семантических полей образованных с помощью метода главных компонент и сингулярного разложения матрицы частот семантических полей. Эта модель характеризирует новое семантическое пространство отображения текстовых документов с ортонормированным базисом. Размерность пространства вторичных семантических полей существенно меньше размерности пространства первичных семантических полей вследствие замены взаимосвязанных составляющих некоррелированными семантическими характеристиками. Анализ тестовой выборки текстовых документов показал возможность принимать к рассмотрению только те составляющие вторичных семантических полей, которые описываются первыми сингулярными числами. Использование низкоразмерного ортонормированного базиса вторичных семантических полей может быть эффективным в задачах классификации и кластеризации текстовых данных. The model of derived uncorrelated semantic fields generated by the method of principal components and singular decomposition of the matrix of semantic fields frequencies has been considered. This model describes a new semantic space with orthonormal basis of displaying text documents. The dimension of the space of derived semantic fields is significantly less than the dimension of the space of initial semantic fields as a result of replacement of interconnected components by uncorrelated semantic characteristics. The analysis of the test sample of text documents showed the possibility to take into consideration only those components of secondary semantic fields which are described by the first singular numbers. The use of the low-dimension orthonormal basis of derived semantic fields can be effective in the problems of the text data classification and clustering. uk Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України Системні дослідження та інформаційні технології Нові методи в системному аналізі, інформатиці та теорії прийняття рішень Модель вторинних некорельованих семантичних полів для анализу текстових даних Модель вторичных некоррелированных семантических полей для анализа текстовых данных The model of derived uncorrelated semantic fields for text data analysis Article published earlier
spellingShingle	Модель вторинних некорельованих семантичних полів для анализу текстових даних Павлишенко, Б.М. Нові методи в системному аналізі, інформатиці та теорії прийняття рішень
title	Модель вторинних некорельованих семантичних полів для анализу текстових даних
title_alt	Модель вторичных некоррелированных семантических полей для анализа текстовых данных The model of derived uncorrelated semantic fields for text data analysis
title_full	Модель вторинних некорельованих семантичних полів для анализу текстових даних
title_fullStr	Модель вторинних некорельованих семантичних полів для анализу текстових даних
title_full_unstemmed	Модель вторинних некорельованих семантичних полів для анализу текстових даних
title_short	Модель вторинних некорельованих семантичних полів для анализу текстових даних
title_sort	модель вторинних некорельованих семантичних полів для анализу текстових даних
topic	Нові методи в системному аналізі, інформатиці та теорії прийняття рішень
topic_facet	Нові методи в системному аналізі, інформатиці та теорії прийняття рішень
url	https://nasplib.isofts.kiev.ua/handle/123456789/85560
work_keys_str_mv	AT pavlišenkobm modelʹvtorinnihnekorelʹovanihsemantičnihpolívdlâanalizutekstovihdanih AT pavlišenkobm modelʹvtoričnyhnekorrelirovannyhsemantičeskihpoleidlâanalizatekstovyhdannyh AT pavlišenkobm themodelofderiveduncorrelatedsemanticfieldsfortextdataanalysis

Модель вторинних некорельованих семантичних полів для анализу текстових даних

Репозитарії

Схожі ресурси