Застосування кластерного аналізу для відсіювання пошукового спаму

Представлений підхід до відсіювання певного виду пошукового спаму з результатів видачі пошукових систем. Відсіювання здійснюється за рахунок об'єднання неунікальної інформації в кластери з подальшим їх вилученням з видачі пошукових систем. Для групування веб-сторінок запропоновано використовува...

Full description

Saved in:
Bibliographic Details
Published in:Індуктивне моделювання складних систем
Date:2017
Main Author: Зосімов, В.В.
Format: Article
Language:Ukrainian
Published: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України 2017
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/133643
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Застосування кластерного аналізу для відсіювання пошукового спаму / В.В. Зосімов // Індуктивне моделювання складних систем: Зб. наук. пр. — К.: МННЦ ІТС НАН та МОН України, 2017. — Вип. 9. — С. 95-100. — Бібліогр.: 5 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Description
Summary:Представлений підхід до відсіювання певного виду пошукового спаму з результатів видачі пошукових систем. Відсіювання здійснюється за рахунок об'єднання неунікальної інформації в кластери з подальшим їх вилученням з видачі пошукових систем. Для групування веб-сторінок запропоновано використовувати метод кластерного аналізу на основі моделей, побудованих із застосуванням індуктивних алгоритмів. Представлен подход к отсеиванию определенного вида поискового спама из результатов выдачи поисковых систем. Отсеивание осуществляется за счет объединения неуникальной информации в кластеры с последующим их исключением из выдачи поисковых систем. Для группировки веб-страниц предложено использовать метод кластерного анализа на основе моделей, построеных с применением индуктивных алгоритмов. This paper presents an approach to sifting out a certain type of search spam from the search engines results. Dispersion is carried out by combining non-unique information in clusters with their subsequent exclusion from the search engines. It was suggested to use the cluster analysis method based on models built using inductive algorithms to group similar web pages.
ISSN:XXXX-0044