Векторные и распределенные представления, отражающие меру семантической связи слов
Рассматриваются методы формирования многомерных векторных представлений слов, 
 отражающих их семантическую близость. Используется статистика совместной встречаемости слов и 
 контекстов, извлекаемая из больших корпусов текстов. Реализован прототип программных средств 
 обраб...
Saved in:
| Published in: | Математичні машини і системи |
|---|---|
| Date: | 2005 |
| Main Authors: | , , |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут проблем математичних машин і систем НАН України
2005
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/58450 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Векторные и распределенные представления, отражающие меру семантической связи слов / І.С. Місуно, Д.А. Рачковський, С.В. Сліпченко // Мат. машини і системи. — 2005. — № 3. — С. 50-66. — Бібліогр.: 30 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| Summary: | Рассматриваются методы формирования многомерных векторных представлений слов, 
отражающих их семантическую близость. Используется статистика совместной встречаемости слов и 
контекстов, извлекаемая из больших корпусов текстов. Реализован прототип программных средств 
обработки текстовой информации, формирования семантических представлений и текстового поиска. 
Приводятся результаты экспериментальных исследований адекватности разработанных представлений 
в ряде тестовых задач.
Розглянуто методи формування багатовимірних векторних представлень слів, що 
відображають їх семантичну близькість. Використовується статистика сумісного вживання слів і 
контекстів у великих корпусах текстів. Реалізовано прототип програмних засобів обробки текстової 
інформації, формування семантичних представлень та текстового пошуку. Приведено результати 
експериментальних досліджень адекватності розроблених представлень у ряді тестових задач.
Methods for formation of multidimensional vector representation of words reflecting their semantic similarity 
are considered. The methods are based on statistics of co-occurrence of words and contexts that is extracted from 
large text corpuses. Prototypes of software systems for processing of textual information, formation of semantic 
representations and text search are implemented. Results of experimental investigation of the developed 
representations in a number of tests are provided.
|
|---|---|
| ISSN: | 1028-9763 |