Побудова мережі предметних областей на базі ресурсу arXiv

Запропоновано новий спосіб опрацювання інформації системи бібліотеки Корнуельского університету — ресурсу препринтів arXiv. Авторами розроблено та реалізовано алгоритм пошуку публікацій за заданим концептом з урахуванням наукового напрямку, до якого відноситься публікація. Основну увагу зосереджено...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2018
Автори: Ланде, Д.В., Андрущенко, В.Б.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут проблем реєстрації інформації НАН України 2018
Назва видання:Реєстрація, зберігання і обробка даних
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/168694
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Побудова мережі предметних областей на базі ресурсу arXiv / Д.В. Ланде, В.Б. Андрущенко // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 2. — С. 12–22. — Бібліогр.: 8 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-168694
record_format dspace
spelling nasplib_isofts_kiev_ua-123456789-1686942025-02-09T13:51:03Z Побудова мережі предметних областей на базі ресурсу arXiv Построение сети предметных областей на базе ресурса arXiv Formation of the subject domains network on the basis of the ArXiv Ланде, Д.В. Андрущенко, В.Б. Інформаційно-аналітичні системи обробки даних Запропоновано новий спосіб опрацювання інформації системи бібліотеки Корнуельского університету — ресурсу препринтів arXiv. Авторами розроблено та реалізовано алгоритм пошуку публікацій за заданим концептом з урахуванням наукового напрямку, до якого відноситься публікація. Основну увагу зосереджено на розподілі публікацій за визначеними науковими напрямками та відповідними підгрупами, що передбачені ресурсом. Основні методи, які було використано для реалізації роботи, — це робота з текстовими масивами та подальша обробка отриманих результатів, параметри оцінки роботи пошуку та результатів пошуку. Сформульовано визначення мережі предметних областей. Для кожної предметної області складено словник як довідковий інструмент для реалізації поставленої задачі. Також відображено основні етапи побудови мережі предметних областей на базі ресурсу препринтів arXiv. Результатом роботи стало візуальне представлення мережі предметних областей для концепту — «cavitation» та тлумачення отриманих результатів. Дані, що представлені у матеріалі, опрацьовано в лютому-березні 2018 року. Предложен новый способ оценки информации системы библиотеки Корнуэльского университета — ресурса препринтов arXiv. Авторами разработан и реализован алгоритм поиска публикаций по заданному концепту с учетом научного направления, к которому относится публикация. Основное внимание сосредоточено на распределении публикаций по определенным научным направлениям и соответствующим подгруппам, которые предусмотрены ресурсом. Основные методы, которые использовались для реализации задачи, — это работа с текстовыми массивами и дальнейшая обработка полученных результатов, параметры оценки работы поиска и результатов поиска. Сформулировано определение сети предметных областей. Для каждой предметной области составлен словарь как справочный инструмент для решения поставленной задачи. Также отображены основные этапы построения сети предметных областей на базе ресурса препринтов arXiv. Результатом работы стало визуальное представление сети предметных областей для концепта — «cavitation» и обоснование полученных результатов. Данные, представленные в статье, были собраны и протестированы в феврале-марте 2018 года. The new method of information processing, which is based on the Kornuel University Library resource ArXiv is represented. An algorithm of publications search by the given notion taking into conside-ration the research field of the found publication has been developed and actualized. The mail accents were made on the allocation of the publications according to the predefined research fields and appropriate subgroups, established by the resource. Main methods being applied for the realization of the problem are text mining methods and further interpretation of the results, evaluation parameters of the search results.The definition of the subject domains network has been also suggested. For every subject domain predefined by the resource there was formed a vocabulary — a reference tool. The main steps of the subject domains network formation are depicted in the paper.The result of the work is a visual representation of the subjects’ domain network for the concept — «cavitation» and further interpretation of obtained results. For the search results there was calculated the parameter which identify the inherency of the given concept to several subject domain and according to the traditional approaches of the text search evaluation there was calculated the metrics — recall, which characterizes the ability of system to find out the needed documents, but it doesn’t consider the number of non-relevant documents shown to user. The main conclusion of the research is the suggestion of new approaches to form the view on the notion affiliation to several research fields and is based on the open access preprint resource. The developed approach gives an opportunity to analyze, visualize and represent the concept in attribution to research fields; it allows to form the research picture and to widen the ways to form the big projects. Data obtained and represented in the research was processed in February-March, 2018. 2018 Article Побудова мережі предметних областей на базі ресурсу arXiv / Д.В. Ланде, В.Б. Андрущенко // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 2. — С. 12–22. — Бібліогр.: 8 назв. — укр. 1560-9189 DOI: https://doi.org/10.35681/1560-9189.2018.20.2.142907 https://nasplib.isofts.kiev.ua/handle/123456789/168694 004.421 uk Реєстрація, зберігання і обробка даних application/pdf Інститут проблем реєстрації інформації НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
topic Інформаційно-аналітичні системи обробки даних
Інформаційно-аналітичні системи обробки даних
spellingShingle Інформаційно-аналітичні системи обробки даних
Інформаційно-аналітичні системи обробки даних
Ланде, Д.В.
Андрущенко, В.Б.
Побудова мережі предметних областей на базі ресурсу arXiv
Реєстрація, зберігання і обробка даних
description Запропоновано новий спосіб опрацювання інформації системи бібліотеки Корнуельского університету — ресурсу препринтів arXiv. Авторами розроблено та реалізовано алгоритм пошуку публікацій за заданим концептом з урахуванням наукового напрямку, до якого відноситься публікація. Основну увагу зосереджено на розподілі публікацій за визначеними науковими напрямками та відповідними підгрупами, що передбачені ресурсом. Основні методи, які було використано для реалізації роботи, — це робота з текстовими масивами та подальша обробка отриманих результатів, параметри оцінки роботи пошуку та результатів пошуку. Сформульовано визначення мережі предметних областей. Для кожної предметної області складено словник як довідковий інструмент для реалізації поставленої задачі. Також відображено основні етапи побудови мережі предметних областей на базі ресурсу препринтів arXiv. Результатом роботи стало візуальне представлення мережі предметних областей для концепту — «cavitation» та тлумачення отриманих результатів. Дані, що представлені у матеріалі, опрацьовано в лютому-березні 2018 року.
format Article
author Ланде, Д.В.
Андрущенко, В.Б.
author_facet Ланде, Д.В.
Андрущенко, В.Б.
author_sort Ланде, Д.В.
title Побудова мережі предметних областей на базі ресурсу arXiv
title_short Побудова мережі предметних областей на базі ресурсу arXiv
title_full Побудова мережі предметних областей на базі ресурсу arXiv
title_fullStr Побудова мережі предметних областей на базі ресурсу arXiv
title_full_unstemmed Побудова мережі предметних областей на базі ресурсу arXiv
title_sort побудова мережі предметних областей на базі ресурсу arxiv
publisher Інститут проблем реєстрації інформації НАН України
publishDate 2018
topic_facet Інформаційно-аналітичні системи обробки даних
url https://nasplib.isofts.kiev.ua/handle/123456789/168694
citation_txt Побудова мережі предметних областей на базі ресурсу arXiv / Д.В. Ланде, В.Б. Андрущенко // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 2. — С. 12–22. — Бібліогр.: 8 назв. — укр.
series Реєстрація, зберігання і обробка даних
work_keys_str_mv AT landedv pobudovamerežípredmetnihoblastejnabazíresursuarxiv
AT andruŝenkovb pobudovamerežípredmetnihoblastejnabazíresursuarxiv
AT landedv postroeniesetipredmetnyhoblastejnabazeresursaarxiv
AT andruŝenkovb postroeniesetipredmetnyhoblastejnabazeresursaarxiv
AT landedv formationofthesubjectdomainsnetworkonthebasisofthearxiv
AT andruŝenkovb formationofthesubjectdomainsnetworkonthebasisofthearxiv
first_indexed 2025-11-26T11:55:41Z
last_indexed 2025-11-26T11:55:41Z
_version_ 1849853891368189952
fulltext 12 004.421 . . , . . . . , 2, 03113 , arXiv - — arXiv. - - , - . , . , , — , . . - . - arXiv. - — «cavitation» . , - , - 2018 . : , , - , , . , . , , - ( - ), , , , . , ’ - , , , - © . . , . . arXiv ISSN 1560-9189 , , 2018, . 20, 2 13 . - . [1]: — ; — ; — ; — , - , . - , - . , - , . - - . - , - . - , - . arXiv — arXiv, . 1991 . - , « », - . ’ , - . arXiv — . 50 , - . - . 8 , - : 1) Computer Science (42 ); 2) Economics (1 ); 3) Electrical Engineering and System Science (3 ); 4) Mathematics (32 ); 5) Physics (13 ); 6) Quantitative Biology (10 ); 7) Quantitative Finance (9 ); . . , . . 14 8) Statistics (6 ). - arXiv 10 , 10 ( 27) . , - : — arXiv, «OAI protocol v1.0» [2]. - ; — , arXiv [3]. , - . 284,834 14 , - ; — [4] — , - , - ; — arXiv, Mendeley Scopus [5]. , - - . - — - . , - , arXiv. — - . . - . , , - , . arXiv ISSN 1560-9189 , , 2018, . 20, 2 15 — - , — , - , , - , . , - , , . - , - . - , . 8 , - — , arXiv. . — . , , - , [6]. 1. , , . 2. , ( . 1), : 1) , , : arXiv: XXXX.XXXXX [***], . — - ; *** — ; 2) ; 3) ( ); 4) Comments — , , , , , ( ); 5) Journal-ref — , , - ( , ); 6) Subject — , ( , - ). 3. , - ( . 2). 4. , - , . , — , ’ , . . . , . . 16 . 1. , - . 2. , 5. — , . ’ , , ( . 3). 6. . 7. — - , — , ’ — . 8. , . 6. - , . 4. 9. , «Subject», - , — arXiv ISSN 1560-9189 , , 2018, . 20, 2 17 , , , ’ — . 10. - . . 3. - Gephi. - , , . 1. (collection frequency weight — CFW) [7], : n — , ; N — , - . : CFW = log N – log n. 2. , - . : ikTF n , ik — , - , n — , . - , - [8]. (recall, r) - . . , . . 18 , - , , - : ar a c , — , ; — , . «cavitation». - . 1. 254 . 2. 5 , , : 1) Physics — 25 ; 2) Computer Science — 5 ; 3) Mathematics — 4 ; 4) Quantitative Biology — 2 ; 6) Statistics — 1 . , , - 5 , , — « », « » (Fluid Physics) — 82 . Gephi . . 4 - . . 4. «cavitation» arXiv ISSN 1560-9189 , , 2018, . 20, 2 19 (collection frequency weight — CFW) - : CFW = log N – log n = 3,734, : N — - , 1,377,332 ( 23.04.2018 .); n — , , 254. Term frequency - : 25 5 5 TF . ( , ) : Physics — 25 0,09 25 229 r ; Computer Science — 5 0,01 254 r ; Mathematics — 4 0,02 254 r ; Quantitative Biology — 2 0,008 254 r ; Statistics — 1 0,004 254 r . , - , , - , . . - , - , , , ’ . - , - . « – », . , , : , , . - . . , . . 20 - , . . , , - , . arXiv, , 1. Computer Science Computing Research Repository Artificial Intelligence Computation and Language Computational Complexity Computational Engineering Finance, and Science Computational Geometry Computer Science and Game Theory Computer Vision and Pattern Recognition Computers and Society Cryptography and Security Data Structures and Algorithms Databases Digital Libraries Discrete Mathematics Distributed, Parallel, and Cluster Computing Emerging Technologies Formal Languages and Automata Theory General Literature Graphics Hardware Architecture Human-Computer Interaction Information Retrieval Information Theory Learning Logic in Computer Science Mathematical Software Multiagent Systems Multimedia Networking and Internet Architecture Neural and Evolutionary Computing Numerical Analysis Operating Systems Other Computer Science Performance Programming Languages Robotics Social and Information Networks Software Engineering Sound Symbolic Computation Systems and Control 2. Economics Econometrics 3. Electrical Engineering and System Science Audio and Speech Processing Image and Video Processing Signal Processing 4. Mathematics Algebraic Geometry Algebraic Topology Analysis of PDEs Category Theory Classical Analysis and ODEs arXiv ISSN 1560-9189 , , 2018, . 20, 2 21 Combinatorics Commutative Algebra Complex Variables Differential Geometry Dynamical Systems Functional Analysis General Mathematics General Topology Geometric Topology Group Theory History and Overview Information Theory K-Theory and Homology Logic Mathematical Physics Metric Geometry Number Theory Numerical Analysis Operator Algebras Optimization and Control Probability Quantum Algebra Representation Theory Rings and Algebras Spectral Theory Statistics Theory Symplectic Geometry 5. Physics Astrophysics Astrophysics of Galaxies Cosmology and Nongalactic Astrophysics Earth and Planetary Astrophysics High Energy Astrophysical Phe- nomena Instrumentation and Methods for Astrophysics Solar and Stellar Astrophysics Condensed Matter Disordered Systems and Neural Networks Materials Science Mesoscale and Nanoscale Physics Other Condensed Matter Quantum Gases Soft Condensed Matter Statistical Mechanics Strongly Correlated Electrons Superconductivity General Relativity and Quantum Cosmology High Energy Physics — Experiment High Energy Physics — Lattice High Energy Physics — Phenomenology High Energy Physics — Theory Mathematical Physics Nonlinear Sciences Adaptation and Self-Organizing Systems Cellular Automata and Lattice Gases Chaotic Dynamics Exactly Solvable and Integrable Systems Pattern Formation and Solitons Nuclear Experiment Nuclear Theory Physics Accelerator Physics Applied Physics Atmospheric and Oceanic Physics Atomic Physics Atomic and Molecular Clusters Biological Physics Chemical Physics Data Analysis Statistics and Probability Fluid Dynamics General Physics Geophysics History and Philosophy of Physics Instrumentation and Detectors Medical Physics Optics Physics Education Physics and Society Plasma Physics . . , . . 22 Popular Physics Space Physics Quantum Physics 6. Quantitative biology Biomolecules Cell Behavior Genomics Molecular Networks Neurons and Cognition Other Quantitative Biology Populations and Evolution Quantitative Methods Subcellular Processes Tissues and Organs 7. Quantitative Finance Computational Finance Economics General Finance Mathematical Finance Portfolio Management Pricing and Securities Risk Management Staticstical Finance Trading and Market Microsrtructure 8. Statistics Machine learning Methodology Other Statistics 1. . ., . ., . . - , — , , . - - « » (2 . 2016, . ). : , 2017. . 180–191. 2. Warner Simeon. Open Archives Initiative protocol development and implementation at arXiv. URL: https://arxiv.org/pdf/cs/0101027.pdf (Last accessed: 10.03.2018). 3. Sorokina Daria, Gehrke Johannes, Warner Simeon, Ginsparg Paul. Plagiarism Detection in arXiv. URL: https://ieeexplore.ieee.org/abstract/document/4053155/ (Last accessed: 10.03.2018) 4. Asif-ul Haque, Paul Ginsparg. Positional effects on citation and readership in arXiv. URL: https://onlinelibrary.wiley.com/doi/full/10.1002/asi.21166 (Last accessed: 10.03.2018). 5. Judit Bar-Ilan. Astrophysics publications on arXiv, Scopus and Mendeley: a case study. URL: https://link.springer.com/article/10.1007/s11192-013-1215-1 (Last accessed: 10.03.2018). 6. . . - ArXiv. - « - » (24–25 . 2017, . ). : - , 2017. . 20. 7. TREC. Common evaluation measures. URL: https://trec.nist.gov/pubs/trec16/appendices/ measures.pdf (Last accessed: 27.03.2018). 8. « -2010». URL: http://romip.ru/romip2010/20_appendix_a_ metrics.pdf ( : 27.03.2018). 22.05.2018 https://arxiv.org/pdf/cs/0101027.pdf https://ieeexplore.ieee.org/abstract/document/4053155/ https://onlinelibrary.wiley.com/doi/full/10.1002/asi.21166 https://link.springer.com/article/10.1007/s11192-013-1215-1 https://trec.nist.gov/pubs/trec16/appendices/ http://romip.ru/romip2010/20_appendix_a_