Построение терминологической сети предметной области
Представлено описание методики построения сетей иерархий терминов на основе анализа массива текстов по выбранной проблематике (живучести технических и информационных систем). Методика базируется на применении компактифицированных графов горизонтальной видимости для терминов — отдельных слое, биграмм...
Gespeichert in:
| Veröffentlicht in: | Реєстрація, зберігання і обробка даних |
|---|---|
| Datum: | 2014 |
| Hauptverfasser: | , , |
| Format: | Artikel |
| Sprache: | Russian |
| Veröffentlicht: |
Інститут проблем реєстрації інформації НАН України
2014
|
| Schlagworte: | |
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/87119 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Построение терминологической сети предметной области / Д.В. Ланде, А.А. Снарский, В.Г. Путятин // Реєстрація, зберігання і обробка даних. — 2014. — Т. 16, № 2. — С. 114-121. — Бібліогр.: 8 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-87119 |
|---|---|
| record_format |
dspace |
| spelling |
Ланде, Д.В. Снарский, А.А. Путятин, В.Г. 2015-10-11T14:12:41Z 2015-10-11T14:12:41Z 2014 Построение терминологической сети предметной области / Д.В. Ланде, А.А. Снарский, В.Г. Путятин // Реєстрація, зберігання і обробка даних. — 2014. — Т. 16, № 2. — С. 114-121. — Бібліогр.: 8 назв. — рос. 1560-9189 https://nasplib.isofts.kiev.ua/handle/123456789/87119 004.7 Представлено описание методики построения сетей иерархий терминов на основе анализа массива текстов по выбранной проблематике (живучести технических и информационных систем). Методика базируется на применении компактифицированных графов горизонтальной видимости для терминов — отдельных слое, биграмм и триграмм, а также установлении связей между терминами. Построена и исследована сеть языка, сформированная на основе полных текстов научных статей по проблематике живучести. The building technique of networks of terms hierarchies being based on the analysis of chosen texts on selected issues (survivability of technical and information systems) is offered. The technique is based on the methodology of horizontal visibility graphs for individual words, bigrams and trigrams. It has been constructed and investigated a language network, formed on the basis of full texts of scientific papers on the issue of survivability. ru Інститут проблем реєстрації інформації НАН України Реєстрація, зберігання і обробка даних Системи збереження і масового розповсюдження даних Построение терминологической сети предметной области Building of Networks of Natural Hierarchies of Terms Based on Analysis of Texts Corpora Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Построение терминологической сети предметной области |
| spellingShingle |
Построение терминологической сети предметной области Ланде, Д.В. Снарский, А.А. Путятин, В.Г. Системи збереження і масового розповсюдження даних |
| title_short |
Построение терминологической сети предметной области |
| title_full |
Построение терминологической сети предметной области |
| title_fullStr |
Построение терминологической сети предметной области |
| title_full_unstemmed |
Построение терминологической сети предметной области |
| title_sort |
построение терминологической сети предметной области |
| author |
Ланде, Д.В. Снарский, А.А. Путятин, В.Г. |
| author_facet |
Ланде, Д.В. Снарский, А.А. Путятин, В.Г. |
| topic |
Системи збереження і масового розповсюдження даних |
| topic_facet |
Системи збереження і масового розповсюдження даних |
| publishDate |
2014 |
| language |
Russian |
| container_title |
Реєстрація, зберігання і обробка даних |
| publisher |
Інститут проблем реєстрації інформації НАН України |
| format |
Article |
| title_alt |
Building of Networks of Natural Hierarchies of Terms Based on Analysis of Texts Corpora |
| description |
Представлено описание методики построения сетей иерархий терминов на основе анализа массива текстов по выбранной проблематике (живучести технических и информационных систем). Методика базируется на применении компактифицированных графов горизонтальной видимости для терминов — отдельных слое, биграмм и триграмм, а также установлении связей между терминами. Построена и исследована сеть языка, сформированная на основе полных текстов научных статей по проблематике живучести.
The building technique of networks of terms hierarchies being based on the analysis of chosen texts on selected issues (survivability of technical and information systems) is offered. The technique is based on the methodology of horizontal visibility graphs for individual words, bigrams and trigrams. It has been constructed and investigated a language network, formed on the basis of full texts of scientific papers on the issue of survivability.
|
| issn |
1560-9189 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/87119 |
| citation_txt |
Построение терминологической сети предметной области / Д.В. Ланде, А.А. Снарский, В.Г. Путятин // Реєстрація, зберігання і обробка даних. — 2014. — Т. 16, № 2. — С. 114-121. — Бібліогр.: 8 назв. — рос. |
| work_keys_str_mv |
AT landedv postroenieterminologičeskoisetipredmetnoioblasti AT snarskiiaa postroenieterminologičeskoisetipredmetnoioblasti AT putâtinvg postroenieterminologičeskoisetipredmetnoioblasti AT landedv buildingofnetworksofnaturalhierarchiesoftermsbasedonanalysisoftextscorpora AT snarskiiaa buildingofnetworksofnaturalhierarchiesoftermsbasedonanalysisoftextscorpora AT putâtinvg buildingofnetworksofnaturalhierarchiesoftermsbasedonanalysisoftextscorpora |
| first_indexed |
2025-11-25T20:39:28Z |
| last_indexed |
2025-11-25T20:39:28Z |
| _version_ |
1850530512990371840 |
| fulltext |
114
004.7
. . , . . , . .
. H. , 2, 03113 ,
.: (044) 4542163
-
( ). -
-
— , ,
. -
, -
.
: , ,
, , .
( -
, )
, -
, , .
—
, , -
.
-
, - ,
[1], -
[2]. , , -
, . ,
.
, ,
( , « », « -
», « » )
.
© . . , . . , . .
ISSN 1560-9189 , , 2014, . 16, 2 115
,
( ), -
. « -
»
, -
. -
, -
. , ,
.
, -
, ,
, -
, , -
[3]. -
.
1. . -
, -
,
. 50
1 . .
(
, , , ), , -
( ).
2. ( ,
) « »,
TFIDF, -
(Term Frequency) -
, ,
(Inverse Document Frequency) [4].
TFIDF
(CHVG) -
. -
-
, -
. [3], -
. -
,
, -
(TFIDF). -
[5]. , -
. . , . . , . .
116
« », . . -
, . , -
, . -
, .
-
CHVG. -
CHVG. -
, - , -
, . ,
, .
- - ,
- :
http://code.google.com/p/stop-words/source/browse/trunk/stop-words/stop-
words/stop-words-russian.txt?spec=svn3&r=3;
https://github.com/punbb/langs/blob/master/Russian/stopwords.txt;
http://www.ranks.nl/stopwords/russian.html;
http://trac.mysvn.ru/punbb/punbb/browser/trunk/Russian/stopwords.txt.
( N),
,
( N+N+N )
CHVG.
3. ,
, -
. . 1 -
. -
.
, — , — -
. ,
, , .
, ,
.
. 1.
http://code.google.com/p/stop-words/source/browse/trunk/stop-words/stop-
https://github.com/punbb/langs/blob/master/Russian/stopwords.txt
http://www.ranks.nl/stopwords/russian.html
http://trac.mysvn.ru/punbb/punbb/browser/trunk/Russian/stopwords.txt.
ISSN 1560-9189 , , 2014, . 16, 2 117
.
-
csv.
. 2 -
20+20+20, Gephi
(https://gephi.org/).
. 2. 20+20+20
. 3
200+200+200.
. 3. 200+200+200
https://gephi.org/).
. . , . . , . .
118
-
, ( ( )p k Ck ), . . -
. , -
( 20+20+20 500+500+500) 2,1 2,3, -
(Language Networks) [6].
. 4.
( — ; — )
,
5 ( —
0 , 2 — 2 , 3
— 5 — ).
, -
, . ,
— -
, , , -
« » « ».
- , -
HITS (hyperlink induced topic search), . -
[7].
HITS
« » ( , ) « » ( ,
). , -
, , -
, ( ) ,
. HITS -
ISSN 1560-9189 , , 2014, . 16, 2 119
jv ja v -
jh v :
, .j i j i
i i
a v h v h v a v
, -
( — ) .
.
, .
,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
-
, -
. ,
« .
. 10–15 ,
» [8].
-
« - »
. . , . . , . .
120
. ,
. , , -
- , -
, ,
. . 5 , -
, , « » « -
», - « ».
. 5. 20+20+20
1.
.
2.
.
3. -
.
4.
.
5. HITS
.
6. .
, , -
( -
ISSN 1560-9189 , , 2014, . 16, 2 121
— ),
-
, -
- .
1. Yagunova E. Dynamic Frequency Features as the Basis for the Structural Description of Diverse
Linguistic Objects / E. Yagunova, D. Lande // CEUR Workshop Proceedings. Proceedings of the 14-th
All-Russian Scientific Conference «Digital Libraries: Advanced Methods and Technologies, Digital Col-
lections». — Pereslavl-Zalessky (Russia). — October 15–18, 2012. — P. 150–159.
2. The Use of Horizontal Visibility Graphs to Identify the Words that Define the Informational
Structure of a Text / Lande D.V., Snarskii A.A., Yagunova E.V., Pronoza E.V. // 12-th Mexican
Internation. Conf. on Artificial Intelligence, 2013. — P. 209–215.
3. Lande D.V. Building of Networks of Natural Hierarchies of Terms Based on Analysis of Texts
Corpora / D.V. Lande // E-preprint ArXiv 1405.6068
4. Salton G. Introduction to Modern Information Retrieval / G. Salton, M.J. McGill. — New York:
McGraw-Hill, 1983. — 448 p.
5. Horizontal Visibility Graphs: Exact Results for Random Time Series / Luque ., Lacasa L.,
Ballesteros F., Luque J. // Phys. Review E. — 2009. — P. 046103-1–046103-11.
6. :
. . / [ . ., . ., . . .]. — .: , 2011. —
272 .
7. Kleinberg J. Authoritative Aources in a Hyperlinked Environment / J. Kleinberg // In Processing
of ACM-SIAM Symposium on Discrete Algorithms, 1998. — 46(5). — P. 604–632.
8. . .
/ . . : . . . . -
. . . — , 2010. — . 1. — . 85–91.
08.06.2014
|