Тематичне моделювання науковців на основі їх інтересів у Google Scholar

The article proposes an algorithm for topic modeling of researchers based on their interests from Google Scholar profiles. The algorithm uses the set of fields of research from research classification system ANZSRC. An information resource for topic modeling is a corpus of categorized publications f...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2021
Автори: Shtovba, Serhiy, Petrychko, Mykola
Формат: Стаття
Мова:Ukrainian
Опубліковано: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2021
Теми:
Онлайн доступ:http://journal.iasa.kpi.ua/article/view/225166
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:System research and information technologies

Репозитарії

System research and information technologies
id journaliasakpiua-article-225166
record_format ojs
spelling journaliasakpiua-article-2251662021-09-16T11:48:22Z Topic modeling of researchers based on their interests from Google Scholar Тематическое моделирование ученых на основе их интересов в Google Scholar Тематичне моделювання науковців на основі їх інтересів у Google Scholar Shtovba, Serhiy Petrychko, Mykola topic modeling categorization Google Scholar Dimensions ANZSRC researcher’s profile research interests Czekanowski metric Jaccard index тематическое моделирование категоризация Google Scholar Dimensions ANZSRC профиль ученого научные интересы метрика Чекановского индекс Жакарра тематичне моделювання категоризація Google Scholar Dimensions ANZSRC профіль науковця наукові інтереси метрика Чекановського індекс Жакара The article proposes an algorithm for topic modeling of researchers based on their interests from Google Scholar profiles. The algorithm uses the set of fields of research from research classification system ANZSRC. An information resource for topic modeling is a corpus of categorized publications from Dimensions. Interests from researchers’ profiles are used as search queries to Dimensions that outputs distributions of documents over categories. To reduce information noise these distributions are taken through a few stages of processing. The article also compares the results of topic modeling based on interests from Google Scholar profiles and based on a categorized list of publications from Dimensions. The comparison is done using modified Czekanowski metric that takes into account the similarity between categories. The results of comparing the topic modeling outputs based on different information sources show a good match. Предложен алгоритм тематического моделирования ученых по научным специальностям на основе их интересов в профилях в Google Scholar. Алгоритм использует перечень научных специальностей из системы классификации наук ANZSRC. Информационным ресурсом для тематического моделирования является база категоризированных научных публикаций из системы Dimensions. Интересы из профилей ученых используются как поисковые запросы для Dimensions, сервисы которой выдают распределения релевантных документов по специальностям. Для уменьшения информационного шума эти распределения проходят несколько этапов обработки. Сравниваются результаты тематического моделирования на основе профильных интересов в Google Scholar и категоризированного списка авторских публикаций в Dimensions по метрике Чекановского с учетом схожести специальностей. Для тестовых ученых выявлена высокая согласованность результатов тематического моделирования при различной исходной информации. Запропоновано алгоритм тематичного моделювання науковців за науковими спеціальностям на основі їх інтересів у профілях у Google Scholar. Алгоритм використовує перелік наукових спеціальностей із системи класифікації наук ANZSRC. Інформаційним ресурсом для тематичного моделювання є база категоризованих наукових публікацій із системи Dimensions. Інтереси з профілів науковців використовуються як пошукові запити для Dimensions, сервіси якої видають розподіли релевантних документів за спеціальностями. Для зменшення інформаційного шуму ці розподіли проходять декілька етапів оброблення. Порівнюються результати тематичного моделювання на основі профільних інтересів у Google Scholar і категоризованого списку авторських публікацій у Dimensions за метрикою Чекановського з урахуванням спорідненості спеціальностей. Для тестових науковців виявлено високу узгодженість результатів тематичного моделювання за різної початкової інформації. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2021-09-14 Article Article application/pdf http://journal.iasa.kpi.ua/article/view/225166 10.20535/SRIT.2308-8893.2021.2.09 System research and information technologies; No. 2 (2021); 113-129 Системные исследования и информационные технологии; № 2 (2021); 113-129 Системні дослідження та інформаційні технології; № 2 (2021); 113-129 2308-8893 1681-6048 uk http://journal.iasa.kpi.ua/article/view/225166/238486
institution System research and information technologies
collection OJS
language Ukrainian
topic topic modeling
categorization
Google Scholar
Dimensions
ANZSRC
researcher’s profile
research interests
Czekanowski metric
Jaccard index
тематическое моделирование
категоризация
Google Scholar
Dimensions
ANZSRC
профиль ученого
научные интересы
метрика Чекановского
индекс Жакарра
тематичне моделювання
категоризація
Google Scholar
Dimensions
ANZSRC
профіль науковця
наукові інтереси
метрика Чекановського
індекс Жакара
spellingShingle topic modeling
categorization
Google Scholar
Dimensions
ANZSRC
researcher’s profile
research interests
Czekanowski metric
Jaccard index
тематическое моделирование
категоризация
Google Scholar
Dimensions
ANZSRC
профиль ученого
научные интересы
метрика Чекановского
индекс Жакарра
тематичне моделювання
категоризація
Google Scholar
Dimensions
ANZSRC
профіль науковця
наукові інтереси
метрика Чекановського
індекс Жакара
Shtovba, Serhiy
Petrychko, Mykola
Тематичне моделювання науковців на основі їх інтересів у Google Scholar
topic_facet topic modeling
categorization
Google Scholar
Dimensions
ANZSRC
researcher’s profile
research interests
Czekanowski metric
Jaccard index
тематическое моделирование
категоризация
Google Scholar
Dimensions
ANZSRC
профиль ученого
научные интересы
метрика Чекановского
индекс Жакарра
тематичне моделювання
категоризація
Google Scholar
Dimensions
ANZSRC
профіль науковця
наукові інтереси
метрика Чекановського
індекс Жакара
format Article
author Shtovba, Serhiy
Petrychko, Mykola
author_facet Shtovba, Serhiy
Petrychko, Mykola
author_sort Shtovba, Serhiy
title Тематичне моделювання науковців на основі їх інтересів у Google Scholar
title_short Тематичне моделювання науковців на основі їх інтересів у Google Scholar
title_full Тематичне моделювання науковців на основі їх інтересів у Google Scholar
title_fullStr Тематичне моделювання науковців на основі їх інтересів у Google Scholar
title_full_unstemmed Тематичне моделювання науковців на основі їх інтересів у Google Scholar
title_sort тематичне моделювання науковців на основі їх інтересів у google scholar
title_alt Topic modeling of researchers based on their interests from Google Scholar
Тематическое моделирование ученых на основе их интересов в Google Scholar
description The article proposes an algorithm for topic modeling of researchers based on their interests from Google Scholar profiles. The algorithm uses the set of fields of research from research classification system ANZSRC. An information resource for topic modeling is a corpus of categorized publications from Dimensions. Interests from researchers’ profiles are used as search queries to Dimensions that outputs distributions of documents over categories. To reduce information noise these distributions are taken through a few stages of processing. The article also compares the results of topic modeling based on interests from Google Scholar profiles and based on a categorized list of publications from Dimensions. The comparison is done using modified Czekanowski metric that takes into account the similarity between categories. The results of comparing the topic modeling outputs based on different information sources show a good match.
publisher The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
publishDate 2021
url http://journal.iasa.kpi.ua/article/view/225166
work_keys_str_mv AT shtovbaserhiy topicmodelingofresearchersbasedontheirinterestsfromgooglescholar
AT petrychkomykola topicmodelingofresearchersbasedontheirinterestsfromgooglescholar
AT shtovbaserhiy tematičeskoemodelirovanieučenyhnaosnoveihinteresovvgooglescholar
AT petrychkomykola tematičeskoemodelirovanieučenyhnaosnoveihinteresovvgooglescholar
AT shtovbaserhiy tematičnemodelûvannânaukovcívnaosnovííhínteresívugooglescholar
AT petrychkomykola tematičnemodelûvannânaukovcívnaosnovííhínteresívugooglescholar
first_indexed 2024-04-08T15:07:45Z
last_indexed 2024-04-08T15:07:45Z
_version_ 1795779582161321984