Матричные критерии качества выявления подобных документов в информационных потоках
Новостные потоки информации, публикуемой на веб-сайтах сети Интернет, включают сообщения, важнейшие и интереснейшие из которых многократно дублируются (в виде перепечаток или содержательных
 пересказов). Системы автоматического контент-мониторинга, сетевые информационно-поисковые системы сод...
Gespeichert in:
| Veröffentlicht in: | Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України |
|---|---|
| Datum: | 2009 |
| Hauptverfasser: | , , |
| Format: | Artikel |
| Sprache: | Russisch |
| Veröffentlicht: |
Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України
2009
|
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/27078 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Матричные критерии качества выявления подобных документов в информационных потоках / Д.В. Ландэ, А.Т. Дармохвал, В.В. Жигало // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 53. — Бібліогр.: 13 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1862750599465926656 |
|---|---|
| author | Ландэ, Д.В. Дармохвал, А.Т. Жигало, В.В. |
| author_facet | Ландэ, Д.В. Дармохвал, А.Т. Жигало, В.В. |
| citation_txt | Матричные критерии качества выявления подобных документов в информационных потоках / Д.В. Ландэ, А.Т. Дармохвал, В.В. Жигало // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 53. — Бібліогр.: 13 назв. — рос. |
| collection | DSpace DC |
| container_title | Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України |
| description | Новостные потоки информации, публикуемой на веб-сайтах сети Интернет, включают сообщения, важнейшие и интереснейшие из которых многократно дублируются (в виде перепечаток или содержательных
пересказов). Системы автоматического контент-мониторинга, сетевые информационно-поисковые системы содержат отдельные компоненты,
предназначенные для определения содержательного дублирования. При этом
проблема качества выявления подобных документов при использовании различных критериев является открытой научно-практической проблемой. В данной статье описываются критерии качества выявления подобных документов, основанные на анализе таких свойств так называемой матрицы
подобия, как симметричность и транзитивность. Ранее близкие по смыслу
критерии рассматривались авторами в работе [1], в настоящей статье представлены более точные и универсальные аналитические выражения для расчета этих критериев, а также приведены результаты экспериментов на
многоязычных текстовых корпусах, формируемых с помощью системы контент-мониторинга InfoStream.
|
| first_indexed | 2025-12-07T21:06:41Z |
| format | Article |
| fulltext | |
| id | nasplib_isofts_kiev_ua-123456789-27078 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | XXXX-0067 |
| language | Russian |
| last_indexed | 2025-12-07T21:06:41Z |
| publishDate | 2009 |
| publisher | Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України |
| record_format | dspace |
| spelling | Ландэ, Д.В. Дармохвал, А.Т. Жигало, В.В. 2011-09-27T15:10:33Z 2011-09-27T15:10:33Z 2009 Матричные критерии качества выявления подобных документов в информационных потоках / Д.В. Ландэ, А.Т. Дармохвал, В.В. Жигало // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 53. — Бібліогр.: 13 назв. — рос. XXXX-0067 https://nasplib.isofts.kiev.ua/handle/123456789/27078 681.3 Новостные потоки информации, публикуемой на веб-сайтах сети Интернет, включают сообщения, важнейшие и интереснейшие из которых многократно дублируются (в виде перепечаток или содержательных
 пересказов). Системы автоматического контент-мониторинга, сетевые информационно-поисковые системы содержат отдельные компоненты,
 предназначенные для определения содержательного дублирования. При этом
 проблема качества выявления подобных документов при использовании различных критериев является открытой научно-практической проблемой. В данной статье описываются критерии качества выявления подобных документов, основанные на анализе таких свойств так называемой матрицы
 подобия, как симметричность и транзитивность. Ранее близкие по смыслу
 критерии рассматривались авторами в работе [1], в настоящей статье представлены более точные и универсальные аналитические выражения для расчета этих критериев, а также приведены результаты экспериментов на
 многоязычных текстовых корпусах, формируемых с помощью системы контент-мониторинга InfoStream. ru Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України Матричные критерии качества выявления подобных документов в информационных потоках Article published earlier |
| spellingShingle | Матричные критерии качества выявления подобных документов в информационных потоках Ландэ, Д.В. Дармохвал, А.Т. Жигало, В.В. |
| title | Матричные критерии качества выявления подобных документов в информационных потоках |
| title_full | Матричные критерии качества выявления подобных документов в информационных потоках |
| title_fullStr | Матричные критерии качества выявления подобных документов в информационных потоках |
| title_full_unstemmed | Матричные критерии качества выявления подобных документов в информационных потоках |
| title_short | Матричные критерии качества выявления подобных документов в информационных потоках |
| title_sort | матричные критерии качества выявления подобных документов в информационных потоках |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/27078 |
| work_keys_str_mv | AT landédv matričnyekriteriikačestvavyâvleniâpodobnyhdokumentovvinformacionnyhpotokah AT darmohvalat matričnyekriteriikačestvavyâvleniâpodobnyhdokumentovvinformacionnyhpotokah AT žigalovv matričnyekriteriikačestvavyâvleniâpodobnyhdokumentovvinformacionnyhpotokah |