Построение и применение модели отсеивания нерелевантных источников при поиске научно-технической информации в Интернете

Описано построение и применение модели отсеивания нерелевантной информации в рамках решения задачи повышения эффективности поиска научно-технической информации в условиях присутствия в выдаче поисковых систем большого количества поискового спама и искусственно раскручиваемых сайтов. Рассмотрены осно...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Кибернетика и вычислительная техника
Дата:2013
Автор: Зосимов, В.В.
Формат: Стаття
Мова:Russian
Опубліковано: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України 2013
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/45916
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Построение и применение модели отсеивания нерелевантных источников при поиске научно-технической информации в Интернете / В.В. Зосимов // Кибернетика и вычисл. техника. — 2013. — Вип. 171. — С. 52-67. — Бібліогр.: 7 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Опис
Резюме:Описано построение и применение модели отсеивания нерелевантной информации в рамках решения задачи повышения эффективности поиска научно-технической информации в условиях присутствия в выдаче поисковых систем большого количества поискового спама и искусственно раскручиваемых сайтов. Рассмотрены основные группы сайтов, генерирующих поисковый спам. Показана эффективность построенной модели при отсеивании поискового спама. Описано побудову і застосування моделі відсіювання нерелевантної інформації в рамках розв’язання задачі підвищення ефективності пошуку науково-технічної інформації в умовах присутності у видачі пошукових систем великої кількості пошукового спаму та штучно розкручуваних сайтів. Розглянуто основні групи сайтів, що генерують пошуковий спам. Показано ефективність побудованої моделі при відсіюванні пошукового спаму. During the analysis of commercial sites content there were identified a number of characteristic features, allowing uniquely identify them. Based on the identified features it was built a new model of automatic information classification to relevant and commercial. A new model of automatic information classification to the relevant and commercial by the set of characteristic features was developed. This technology allows to increase the percentage of relevant information in search results to 83-92%.
ISSN:0452-9910