Построение и применение модели отсеивания нерелевантных источников при поиске научно-технической информации в Интернете
Описано построение и применение модели отсеивания нерелевантной информации в рамках решения задачи повышения эффективности поиска научно-технической информации в условиях присутствия в выдаче поисковых систем большого количества поискового спама и искусственно раскручиваемых сайтов. Рассмотрены осно...
Saved in:
| Published in: | Кибернетика и вычислительная техника |
|---|---|
| Date: | 2013 |
| Main Author: | |
| Format: | Article |
| Language: | Russian |
| Published: |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України
2013
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/45916 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Построение и применение модели отсеивания нерелевантных источников при поиске научно-технической информации в Интернете / В.В. Зосимов // Кибернетика и вычисл. техника. — 2013. — Вип. 171. — С. 52-67. — Бібліогр.: 7 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| Summary: | Описано построение и применение модели отсеивания нерелевантной информации в рамках решения задачи повышения эффективности поиска научно-технической информации в условиях присутствия в выдаче поисковых систем большого количества поискового спама и искусственно раскручиваемых сайтов. Рассмотрены основные группы сайтов, генерирующих поисковый спам. Показана эффективность построенной модели при отсеивании поискового спама.
Описано побудову і застосування моделі відсіювання нерелевантної інформації в рамках розв’язання задачі підвищення ефективності пошуку науково-технічної інформації в умовах присутності у видачі пошукових систем великої кількості пошукового спаму та штучно розкручуваних сайтів. Розглянуто основні групи сайтів, що генерують пошуковий спам. Показано ефективність побудованої моделі при відсіюванні пошукового спаму.
During the analysis of commercial sites content there were identified a number of characteristic features, allowing uniquely identify them. Based on the identified features it was built a new model of automatic information classification to relevant and commercial. A new model of automatic information classification to the relevant and commercial by the set of characteristic features was developed. This technology allows to increase the percentage of relevant information in search results to 83-92%.
|
|---|---|
| ISSN: | 0452-9910 |