Побудова мережі предметних областей на базі ресурсу arXiv
Запропоновано новий спосіб опрацювання інформації системи бібліотеки Корнуельского університету — ресурсу препринтів arXiv. Авторами розроблено та реалізовано алгоритм пошуку публікацій за заданим концептом з урахуванням наукового напрямку, до якого відноситься публікація. Основну увагу зосереджено...
Збережено в:
| Дата: | 2018 |
|---|---|
| Автори: | , |
| Формат: | Стаття |
| Мова: | Ukrainian |
| Опубліковано: |
Інститут проблем реєстрації інформації НАН України
2018
|
| Назва видання: | Реєстрація, зберігання і обробка даних |
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/168694 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Побудова мережі предметних областей на базі ресурсу arXiv / Д.В. Ланде, В.Б. Андрущенко // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 2. — С. 12–22. — Бібліогр.: 8 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-168694 |
|---|---|
| record_format |
dspace |
| spelling |
nasplib_isofts_kiev_ua-123456789-1686942025-02-09T13:51:03Z Побудова мережі предметних областей на базі ресурсу arXiv Построение сети предметных областей на базе ресурса arXiv Formation of the subject domains network on the basis of the ArXiv Ланде, Д.В. Андрущенко, В.Б. Інформаційно-аналітичні системи обробки даних Запропоновано новий спосіб опрацювання інформації системи бібліотеки Корнуельского університету — ресурсу препринтів arXiv. Авторами розроблено та реалізовано алгоритм пошуку публікацій за заданим концептом з урахуванням наукового напрямку, до якого відноситься публікація. Основну увагу зосереджено на розподілі публікацій за визначеними науковими напрямками та відповідними підгрупами, що передбачені ресурсом. Основні методи, які було використано для реалізації роботи, — це робота з текстовими масивами та подальша обробка отриманих результатів, параметри оцінки роботи пошуку та результатів пошуку. Сформульовано визначення мережі предметних областей. Для кожної предметної області складено словник як довідковий інструмент для реалізації поставленої задачі. Також відображено основні етапи побудови мережі предметних областей на базі ресурсу препринтів arXiv. Результатом роботи стало візуальне представлення мережі предметних областей для концепту — «cavitation» та тлумачення отриманих результатів. Дані, що представлені у матеріалі, опрацьовано в лютому-березні 2018 року. Предложен новый способ оценки информации системы библиотеки Корнуэльского университета — ресурса препринтов arXiv. Авторами разработан и реализован алгоритм поиска публикаций по заданному концепту с учетом научного направления, к которому относится публикация. Основное внимание сосредоточено на распределении публикаций по определенным научным направлениям и соответствующим подгруппам, которые предусмотрены ресурсом. Основные методы, которые использовались для реализации задачи, — это работа с текстовыми массивами и дальнейшая обработка полученных результатов, параметры оценки работы поиска и результатов поиска. Сформулировано определение сети предметных областей. Для каждой предметной области составлен словарь как справочный инструмент для решения поставленной задачи. Также отображены основные этапы построения сети предметных областей на базе ресурса препринтов arXiv. Результатом работы стало визуальное представление сети предметных областей для концепта — «cavitation» и обоснование полученных результатов. Данные, представленные в статье, были собраны и протестированы в феврале-марте 2018 года. The new method of information processing, which is based on the Kornuel University Library resource ArXiv is represented. An algorithm of publications search by the given notion taking into conside-ration the research field of the found publication has been developed and actualized. The mail accents were made on the allocation of the publications according to the predefined research fields and appropriate subgroups, established by the resource. Main methods being applied for the realization of the problem are text mining methods and further interpretation of the results, evaluation parameters of the search results.The definition of the subject domains network has been also suggested. For every subject domain predefined by the resource there was formed a vocabulary — a reference tool. The main steps of the subject domains network formation are depicted in the paper.The result of the work is a visual representation of the subjects’ domain network for the concept — «cavitation» and further interpretation of obtained results. For the search results there was calculated the parameter which identify the inherency of the given concept to several subject domain and according to the traditional approaches of the text search evaluation there was calculated the metrics — recall, which characterizes the ability of system to find out the needed documents, but it doesn’t consider the number of non-relevant documents shown to user. The main conclusion of the research is the suggestion of new approaches to form the view on the notion affiliation to several research fields and is based on the open access preprint resource. The developed approach gives an opportunity to analyze, visualize and represent the concept in attribution to research fields; it allows to form the research picture and to widen the ways to form the big projects. Data obtained and represented in the research was processed in February-March, 2018. 2018 Article Побудова мережі предметних областей на базі ресурсу arXiv / Д.В. Ланде, В.Б. Андрущенко // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 2. — С. 12–22. — Бібліогр.: 8 назв. — укр. 1560-9189 DOI: https://doi.org/10.35681/1560-9189.2018.20.2.142907 https://nasplib.isofts.kiev.ua/handle/123456789/168694 004.421 uk Реєстрація, зберігання і обробка даних application/pdf Інститут проблем реєстрації інформації НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Ukrainian |
| topic |
Інформаційно-аналітичні системи обробки даних Інформаційно-аналітичні системи обробки даних |
| spellingShingle |
Інформаційно-аналітичні системи обробки даних Інформаційно-аналітичні системи обробки даних Ланде, Д.В. Андрущенко, В.Б. Побудова мережі предметних областей на базі ресурсу arXiv Реєстрація, зберігання і обробка даних |
| description |
Запропоновано новий спосіб опрацювання інформації системи бібліотеки Корнуельского університету — ресурсу препринтів arXiv. Авторами розроблено та реалізовано алгоритм пошуку публікацій за заданим концептом з урахуванням наукового напрямку, до якого відноситься публікація. Основну увагу зосереджено на розподілі публікацій за визначеними науковими напрямками та відповідними підгрупами, що передбачені ресурсом. Основні методи, які було використано для реалізації роботи, — це робота з текстовими масивами та подальша обробка отриманих результатів, параметри оцінки роботи пошуку та результатів пошуку. Сформульовано визначення мережі предметних областей. Для кожної предметної області складено словник як довідковий інструмент для реалізації поставленої задачі. Також відображено основні етапи побудови мережі предметних областей на базі ресурсу препринтів arXiv. Результатом роботи стало візуальне представлення мережі предметних областей для концепту — «cavitation» та тлумачення отриманих результатів. Дані, що представлені у матеріалі, опрацьовано в лютому-березні 2018 року. |
| format |
Article |
| author |
Ланде, Д.В. Андрущенко, В.Б. |
| author_facet |
Ланде, Д.В. Андрущенко, В.Б. |
| author_sort |
Ланде, Д.В. |
| title |
Побудова мережі предметних областей на базі ресурсу arXiv |
| title_short |
Побудова мережі предметних областей на базі ресурсу arXiv |
| title_full |
Побудова мережі предметних областей на базі ресурсу arXiv |
| title_fullStr |
Побудова мережі предметних областей на базі ресурсу arXiv |
| title_full_unstemmed |
Побудова мережі предметних областей на базі ресурсу arXiv |
| title_sort |
побудова мережі предметних областей на базі ресурсу arxiv |
| publisher |
Інститут проблем реєстрації інформації НАН України |
| publishDate |
2018 |
| topic_facet |
Інформаційно-аналітичні системи обробки даних |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/168694 |
| citation_txt |
Побудова мережі предметних областей на базі ресурсу arXiv / Д.В. Ланде, В.Б. Андрущенко // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 2. — С. 12–22. — Бібліогр.: 8 назв. — укр. |
| series |
Реєстрація, зберігання і обробка даних |
| work_keys_str_mv |
AT landedv pobudovamerežípredmetnihoblastejnabazíresursuarxiv AT andruŝenkovb pobudovamerežípredmetnihoblastejnabazíresursuarxiv AT landedv postroeniesetipredmetnyhoblastejnabazeresursaarxiv AT andruŝenkovb postroeniesetipredmetnyhoblastejnabazeresursaarxiv AT landedv formationofthesubjectdomainsnetworkonthebasisofthearxiv AT andruŝenkovb formationofthesubjectdomainsnetworkonthebasisofthearxiv |
| first_indexed |
2025-11-26T11:55:41Z |
| last_indexed |
2025-11-26T11:55:41Z |
| _version_ |
1849853891368189952 |
| fulltext |
12
004.421
. . , . .
. . , 2, 03113 ,
arXiv
-
— arXiv. -
-
, -
.
,
. ,
, —
,
.
. -
. -
arXiv. -
— «cavitation»
. , -
, - 2018 .
: , , -
, , .
, .
, , -
( -
), , ,
, .
, ’ -
,
, , -
© . . , . .
arXiv
ISSN 1560-9189 , , 2018, . 20, 2 13
. -
.
[1]:
— ;
— ;
— ;
— , -
, .
-
, -
.
, -
, . -
-
.
-
, -
. -
, -
.
arXiv
— arXiv,
.
1991 . -
, « », -
.
’ , -
.
arXiv — .
50 , -
. -
.
8 , -
:
1) Computer Science (42 );
2) Economics (1 );
3) Electrical Engineering and System Science (3 );
4) Mathematics (32 );
5) Physics (13 );
6) Quantitative Biology (10 );
7) Quantitative Finance (9 );
. . , . .
14
8) Statistics (6 ).
-
arXiv
10 ,
10 ( 27) . , -
:
— arXiv,
«OAI protocol v1.0» [2]. -
;
— , arXiv [3].
, -
. 284,834
14 , -
;
— [4] — , -
, -
;
—
arXiv, Mendeley Scopus [5].
, -
-
.
-
— -
.
, -
,
arXiv.
— -
.
.
-
.
,
, -
, .
arXiv
ISSN 1560-9189 , , 2018, . 20, 2 15
— -
,
— , -
, , -
, .
, -
, , .
-
, -
. -
, .
8 , -
— ,
arXiv. .
—
.
, , -
, [6].
1. , ,
.
2. ,
( . 1), :
1) , , :
arXiv: XXXX.XXXXX [***], . — -
; *** — ;
2) ;
3) ( );
4) Comments — , , , ,
, (
);
5) Journal-ref — , , -
( , );
6) Subject — ,
(
, -
).
3. , -
( . 2).
4. , -
, .
, —
, ’ , .
. . , . .
16
. 1. , -
. 2. ,
5. — ,
. ’ ,
,
( . 3).
6. .
7. — -
, — ,
’ — .
8.
, . 6. -
, . 4.
9. , «Subject», -
, —
arXiv
ISSN 1560-9189 , , 2018, . 20, 2 17
, , ,
’ — .
10. -
.
. 3.
-
Gephi.
-
, ,
.
1. (collection frequency weight — CFW) [7],
: n — ,
; N — , -
. : CFW = log N – log n.
2. , -
.
:
ikTF
n
,
ik — , -
, n — ,
.
-
, -
[8]. (recall, r) -
. . , . .
18
, -
, , -
:
ar
a c
,
— , ; — ,
.
«cavitation». -
.
1.
254 .
2. 5 ,
, :
1) Physics — 25 ;
2) Computer Science — 5 ;
3) Mathematics — 4 ;
4) Quantitative Biology — 2 ;
6) Statistics — 1 .
, , -
5 ,
, — « », « » (Fluid
Physics) — 82 .
Gephi . . 4 -
.
. 4. «cavitation»
arXiv
ISSN 1560-9189 , , 2018, . 20, 2 19
(collection frequency weight — CFW) -
:
CFW = log N – log n = 3,734,
: N — -
, 1,377,332 ( 23.04.2018 .); n —
, , 254.
Term frequency -
:
25 5
5
TF .
( ,
) :
Physics — 25 0,09
25 229
r ;
Computer Science — 5 0,01
254
r ;
Mathematics — 4 0,02
254
r ;
Quantitative Biology — 2 0,008
254
r ;
Statistics — 1 0,004
254
r .
, -
, , -
, .
. -
, -
, ,
, ’ .
-
,
-
.
« –
»,
.
,
, : , , . -
. . , . .
20
-
, .
.
,
, -
, .
arXiv,
,
1. Computer Science
Computing Research Repository
Artificial Intelligence
Computation and Language
Computational Complexity
Computational Engineering
Finance, and Science
Computational Geometry
Computer Science and Game Theory
Computer Vision and Pattern
Recognition
Computers and Society
Cryptography and Security
Data Structures and Algorithms
Databases
Digital Libraries
Discrete Mathematics
Distributed, Parallel, and Cluster
Computing
Emerging Technologies
Formal Languages and Automata
Theory
General Literature
Graphics
Hardware Architecture
Human-Computer Interaction
Information Retrieval
Information Theory
Learning
Logic in Computer Science
Mathematical Software
Multiagent Systems
Multimedia
Networking and Internet
Architecture
Neural and Evolutionary Computing
Numerical Analysis
Operating Systems
Other Computer Science
Performance
Programming Languages
Robotics
Social and Information Networks
Software Engineering
Sound
Symbolic Computation
Systems and Control
2. Economics
Econometrics
3. Electrical Engineering
and System Science
Audio and Speech Processing
Image and Video Processing
Signal Processing
4. Mathematics
Algebraic Geometry
Algebraic Topology
Analysis of PDEs
Category Theory
Classical Analysis and ODEs
arXiv
ISSN 1560-9189 , , 2018, . 20, 2 21
Combinatorics
Commutative Algebra
Complex Variables
Differential Geometry
Dynamical Systems
Functional Analysis
General Mathematics
General Topology
Geometric Topology
Group Theory
History and Overview
Information Theory
K-Theory and Homology
Logic
Mathematical Physics
Metric Geometry
Number Theory
Numerical Analysis
Operator Algebras
Optimization and Control
Probability
Quantum Algebra
Representation Theory
Rings and Algebras
Spectral Theory
Statistics Theory
Symplectic Geometry
5. Physics
Astrophysics
Astrophysics of Galaxies
Cosmology and Nongalactic
Astrophysics
Earth and Planetary Astrophysics
High Energy Astrophysical Phe-
nomena Instrumentation and
Methods for Astrophysics
Solar and Stellar Astrophysics
Condensed Matter
Disordered Systems and Neural
Networks
Materials Science
Mesoscale and Nanoscale Physics
Other Condensed Matter
Quantum Gases
Soft Condensed Matter
Statistical Mechanics
Strongly Correlated Electrons
Superconductivity
General Relativity and Quantum
Cosmology
High Energy Physics — Experiment
High Energy Physics — Lattice
High Energy Physics —
Phenomenology
High Energy Physics — Theory
Mathematical Physics
Nonlinear Sciences
Adaptation and Self-Organizing
Systems
Cellular Automata and Lattice Gases
Chaotic Dynamics
Exactly Solvable and Integrable
Systems
Pattern Formation and Solitons
Nuclear Experiment
Nuclear Theory
Physics
Accelerator Physics
Applied Physics
Atmospheric and Oceanic Physics
Atomic Physics
Atomic and Molecular Clusters
Biological Physics
Chemical Physics
Data Analysis
Statistics and Probability
Fluid Dynamics
General Physics
Geophysics
History and Philosophy of Physics
Instrumentation and Detectors
Medical Physics
Optics
Physics Education
Physics and Society
Plasma Physics
. . , . .
22
Popular Physics
Space Physics
Quantum Physics
6. Quantitative biology
Biomolecules
Cell Behavior
Genomics
Molecular Networks
Neurons and Cognition
Other Quantitative Biology
Populations and Evolution
Quantitative Methods
Subcellular Processes
Tissues and Organs
7. Quantitative Finance
Computational Finance
Economics
General Finance
Mathematical Finance
Portfolio Management
Pricing and Securities
Risk Management
Staticstical Finance
Trading and Market Microsrtructure
8. Statistics
Machine learning
Methodology
Other Statistics
1. . ., . ., . . -
, — , , . -
- « » (2 . 2016,
. ). : , 2017. . 180–191.
2. Warner Simeon. Open Archives Initiative protocol development and implementation at arXiv.
URL: https://arxiv.org/pdf/cs/0101027.pdf (Last accessed: 10.03.2018).
3. Sorokina Daria, Gehrke Johannes, Warner Simeon, Ginsparg Paul. Plagiarism Detection in
arXiv. URL: https://ieeexplore.ieee.org/abstract/document/4053155/ (Last accessed: 10.03.2018)
4. Asif-ul Haque, Paul Ginsparg. Positional effects on citation and readership in arXiv. URL:
https://onlinelibrary.wiley.com/doi/full/10.1002/asi.21166 (Last accessed: 10.03.2018).
5. Judit Bar-Ilan. Astrophysics publications on arXiv, Scopus and Mendeley: a case study. URL:
https://link.springer.com/article/10.1007/s11192-013-1215-1 (Last accessed: 10.03.2018).
6. . . -
ArXiv. - « -
» (24–25 . 2017, . ). : -
, 2017. . 20.
7. TREC. Common evaluation measures. URL: https://trec.nist.gov/pubs/trec16/appendices/
measures.pdf (Last accessed: 27.03.2018).
8. « -2010». URL: http://romip.ru/romip2010/20_appendix_a_
metrics.pdf ( : 27.03.2018).
22.05.2018
https://arxiv.org/pdf/cs/0101027.pdf
https://ieeexplore.ieee.org/abstract/document/4053155/
https://onlinelibrary.wiley.com/doi/full/10.1002/asi.21166
https://link.springer.com/article/10.1007/s11192-013-1215-1
https://trec.nist.gov/pubs/trec16/appendices/
http://romip.ru/romip2010/20_appendix_a_
|