Матричные критерии качества выявления подобных документов в информационных потоках
Новостные потоки информации, публикуемой на веб-сайтах сети Интернет, включают сообщения, важнейшие и интереснейшие из которых многократно дублируются (в виде перепечаток или содержательных пересказов). Системы автоматического контент-мониторинга, сетевые информационно-поисковые системы содержат от...
Збережено в:
Дата: | 2009 |
---|---|
Автори: | , , |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України
2009
|
Назва видання: | Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/27078 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Матричные критерии качества выявления подобных документов в информационных потоках / Д.В. Ландэ, А.Т. Дармохвал, В.В. Жигало // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 53. — Бібліогр.: 13 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-27078 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-270782011-09-28T12:45:46Z Матричные критерии качества выявления подобных документов в информационных потоках Ландэ, Д.В. Дармохвал, А.Т. Жигало, В.В. Новостные потоки информации, публикуемой на веб-сайтах сети Интернет, включают сообщения, важнейшие и интереснейшие из которых многократно дублируются (в виде перепечаток или содержательных пересказов). Системы автоматического контент-мониторинга, сетевые информационно-поисковые системы содержат отдельные компоненты, предназначенные для определения содержательного дублирования. При этом проблема качества выявления подобных документов при использовании различных критериев является открытой научно-практической проблемой. В данной статье описываются критерии качества выявления подобных документов, основанные на анализе таких свойств так называемой матрицы подобия, как симметричность и транзитивность. Ранее близкие по смыслу критерии рассматривались авторами в работе [1], в настоящей статье представлены более точные и универсальные аналитические выражения для расчета этих критериев, а также приведены результаты экспериментов на многоязычных текстовых корпусах, формируемых с помощью системы контент-мониторинга InfoStream. 2009 Article Матричные критерии качества выявления подобных документов в информационных потоках / Д.В. Ландэ, А.Т. Дармохвал, В.В. Жигало // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 53. — Бібліогр.: 13 назв. — рос. XXXX-0067 http://dspace.nbuv.gov.ua/handle/123456789/27078 681.3 ru Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
description |
Новостные потоки информации, публикуемой на веб-сайтах сети Интернет, включают сообщения, важнейшие и интереснейшие из которых многократно дублируются (в виде перепечаток или содержательных
пересказов). Системы автоматического контент-мониторинга, сетевые информационно-поисковые системы содержат отдельные компоненты,
предназначенные для определения содержательного дублирования. При этом
проблема качества выявления подобных документов при использовании различных критериев является открытой научно-практической проблемой. В данной статье описываются критерии качества выявления подобных документов, основанные на анализе таких свойств так называемой матрицы
подобия, как симметричность и транзитивность. Ранее близкие по смыслу
критерии рассматривались авторами в работе [1], в настоящей статье представлены более точные и универсальные аналитические выражения для расчета этих критериев, а также приведены результаты экспериментов на
многоязычных текстовых корпусах, формируемых с помощью системы контент-мониторинга InfoStream. |
format |
Article |
author |
Ландэ, Д.В. Дармохвал, А.Т. Жигало, В.В. |
spellingShingle |
Ландэ, Д.В. Дармохвал, А.Т. Жигало, В.В. Матричные критерии качества выявления подобных документов в информационных потоках Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України |
author_facet |
Ландэ, Д.В. Дармохвал, А.Т. Жигало, В.В. |
author_sort |
Ландэ, Д.В. |
title |
Матричные критерии качества выявления подобных документов в информационных потоках |
title_short |
Матричные критерии качества выявления подобных документов в информационных потоках |
title_full |
Матричные критерии качества выявления подобных документов в информационных потоках |
title_fullStr |
Матричные критерии качества выявления подобных документов в информационных потоках |
title_full_unstemmed |
Матричные критерии качества выявления подобных документов в информационных потоках |
title_sort |
матричные критерии качества выявления подобных документов в информационных потоках |
publisher |
Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України |
publishDate |
2009 |
url |
http://dspace.nbuv.gov.ua/handle/123456789/27078 |
citation_txt |
Матричные критерии качества выявления подобных документов в информационных потоках / Д.В. Ландэ, А.Т. Дармохвал, В.В. Жигало // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 53. — Бібліогр.: 13 назв. — рос. |
series |
Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України |
work_keys_str_mv |
AT landédv matričnyekriteriikačestvavyâvleniâpodobnyhdokumentovvinformacionnyhpotokah AT darmohvalat matričnyekriteriikačestvavyâvleniâpodobnyhdokumentovvinformacionnyhpotokah AT žigalovv matričnyekriteriikačestvavyâvleniâpodobnyhdokumentovvinformacionnyhpotokah |
first_indexed |
2023-10-18T17:10:04Z |
last_indexed |
2023-10-18T17:10:04Z |
_version_ |
1796140845315915776 |