Векторные и распределенные представления, отражающие меру семантической связи слов

Рассматриваются методы формирования многомерных векторных представлений слов, 
 отражающих их семантическую близость. Используется статистика совместной встречаемости слов и 
 контекстов, извлекаемая из больших корпусов текстов. Реализован прототип программных средств 
 обраб...

Full description

Saved in:
Bibliographic Details
Published in:Математичні машини і системи
Date:2005
Main Authors: Місуно, І.С., Рачковський, Д.А., Сліпченко, С.В.
Format: Article
Language:Russian
Published: Інститут проблем математичних машин і систем НАН України 2005
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/58450
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Векторные и распределенные представления, отражающие меру семантической связи слов / І.С. Місуно, Д.А. Рачковський, С.В. Сліпченко // Мат. машини і системи. — 2005. — № 3. — С. 50-66. — Бібліогр.: 30 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Description
Summary:Рассматриваются методы формирования многомерных векторных представлений слов, 
 отражающих их семантическую близость. Используется статистика совместной встречаемости слов и 
 контекстов, извлекаемая из больших корпусов текстов. Реализован прототип программных средств 
 обработки текстовой информации, формирования семантических представлений и текстового поиска. 
 Приводятся результаты экспериментальных исследований адекватности разработанных представлений 
 в ряде тестовых задач. Розглянуто методи формування багатовимірних векторних представлень слів, що 
 відображають їх семантичну близькість. Використовується статистика сумісного вживання слів і 
 контекстів у великих корпусах текстів. Реалізовано прототип програмних засобів обробки текстової 
 інформації, формування семантичних представлень та текстового пошуку. Приведено результати 
 експериментальних досліджень адекватності розроблених представлень у ряді тестових задач. Methods for formation of multidimensional vector representation of words reflecting their semantic similarity 
 are considered. The methods are based on statistics of co-occurrence of words and contexts that is extracted from 
 large text corpuses. Prototypes of software systems for processing of textual information, formation of semantic 
 representations and text search are implemented. Results of experimental investigation of the developed 
 representations in a number of tests are provided.
ISSN:1028-9763