Матричные критерии качества выявления подобных документов в информационных потоках

Новостные потоки информации, публикуемой на веб-сайтах сети Интернет, включают сообщения, важнейшие и интереснейшие из которых многократно дублируются (в виде перепечаток или содержательных пересказов). Системы автоматического контент-мониторинга, сетевые информационно-поисковые системы содержат от...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України
Datum:2009
Hauptverfasser: Ландэ, Д.В., Дармохвал, А.Т., Жигало, В.В.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України 2009
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/27078
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Матричные критерии качества выявления подобных документов в информационных потоках / Д.В. Ландэ, А.Т. Дармохвал, В.В. Жигало // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 53. — Бібліогр.: 13 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-27078
record_format dspace
spelling Ландэ, Д.В.
Дармохвал, А.Т.
Жигало, В.В.
2011-09-27T15:10:33Z
2011-09-27T15:10:33Z
2009
Матричные критерии качества выявления подобных документов в информационных потоках / Д.В. Ландэ, А.Т. Дармохвал, В.В. Жигало // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 53. — Бібліогр.: 13 назв. — рос.
XXXX-0067
https://nasplib.isofts.kiev.ua/handle/123456789/27078
681.3
Новостные потоки информации, публикуемой на веб-сайтах сети Интернет, включают сообщения, важнейшие и интереснейшие из которых многократно дублируются (в виде перепечаток или содержательных пересказов). Системы автоматического контент-мониторинга, сетевые информационно-поисковые системы содержат отдельные компоненты, предназначенные для определения содержательного дублирования. При этом проблема качества выявления подобных документов при использовании различных критериев является открытой научно-практической проблемой. В данной статье описываются критерии качества выявления подобных документов, основанные на анализе таких свойств так называемой матрицы подобия, как симметричность и транзитивность. Ранее близкие по смыслу критерии рассматривались авторами в работе [1], в настоящей статье представлены более точные и универсальные аналитические выражения для расчета этих критериев, а также приведены результаты экспериментов на многоязычных текстовых корпусах, формируемых с помощью системы контент-мониторинга InfoStream.
ru
Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України
Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України
Матричные критерии качества выявления подобных документов в информационных потоках
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Матричные критерии качества выявления подобных документов в информационных потоках
spellingShingle Матричные критерии качества выявления подобных документов в информационных потоках
Ландэ, Д.В.
Дармохвал, А.Т.
Жигало, В.В.
title_short Матричные критерии качества выявления подобных документов в информационных потоках
title_full Матричные критерии качества выявления подобных документов в информационных потоках
title_fullStr Матричные критерии качества выявления подобных документов в информационных потоках
title_full_unstemmed Матричные критерии качества выявления подобных документов в информационных потоках
title_sort матричные критерии качества выявления подобных документов в информационных потоках
author Ландэ, Д.В.
Дармохвал, А.Т.
Жигало, В.В.
author_facet Ландэ, Д.В.
Дармохвал, А.Т.
Жигало, В.В.
publishDate 2009
language Russian
container_title Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України
publisher Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України
format Article
description Новостные потоки информации, публикуемой на веб-сайтах сети Интернет, включают сообщения, важнейшие и интереснейшие из которых многократно дублируются (в виде перепечаток или содержательных пересказов). Системы автоматического контент-мониторинга, сетевые информационно-поисковые системы содержат отдельные компоненты, предназначенные для определения содержательного дублирования. При этом проблема качества выявления подобных документов при использовании различных критериев является открытой научно-практической проблемой. В данной статье описываются критерии качества выявления подобных документов, основанные на анализе таких свойств так называемой матрицы подобия, как симметричность и транзитивность. Ранее близкие по смыслу критерии рассматривались авторами в работе [1], в настоящей статье представлены более точные и универсальные аналитические выражения для расчета этих критериев, а также приведены результаты экспериментов на многоязычных текстовых корпусах, формируемых с помощью системы контент-мониторинга InfoStream.
issn XXXX-0067
url https://nasplib.isofts.kiev.ua/handle/123456789/27078
citation_txt Матричные критерии качества выявления подобных документов в информационных потоках / Д.В. Ландэ, А.Т. Дармохвал, В.В. Жигало // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 53. — Бібліогр.: 13 назв. — рос.
work_keys_str_mv AT landédv matričnyekriteriikačestvavyâvleniâpodobnyhdokumentovvinformacionnyhpotokah
AT darmohvalat matričnyekriteriikačestvavyâvleniâpodobnyhdokumentovvinformacionnyhpotokah
AT žigalovv matričnyekriteriikačestvavyâvleniâpodobnyhdokumentovvinformacionnyhpotokah
first_indexed 2025-12-07T21:06:41Z
last_indexed 2025-12-07T21:06:41Z
_version_ 1850885119547539456