Построение терминологической сети предметной области
Представлено описание методики построения сетей иерархий терминов на основе анализа массива текстов по выбранной проблематике (живучести технических и информационных систем). Методика базируется на применении компактифицированных графов горизонтальной видимости для терминов — отдельных слое, биграмм...
Збережено в:
| Опубліковано в: : | Реєстрація, зберігання і обробка даних |
|---|---|
| Дата: | 2014 |
| Автори: | , , |
| Формат: | Стаття |
| Мова: | Російська |
| Опубліковано: |
Інститут проблем реєстрації інформації НАН України
2014
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/87119 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Построение терминологической сети предметной области / Д.В. Ланде, А.А. Снарский, В.Г. Путятин // Реєстрація, зберігання і обробка даних. — 2014. — Т. 16, № 2. — С. 114-121. — Бібліогр.: 8 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859515768645877760 |
|---|---|
| author | Ланде, Д.В. Снарский, А.А. Путятин, В.Г. |
| author_facet | Ланде, Д.В. Снарский, А.А. Путятин, В.Г. |
| citation_txt | Построение терминологической сети предметной области / Д.В. Ланде, А.А. Снарский, В.Г. Путятин // Реєстрація, зберігання і обробка даних. — 2014. — Т. 16, № 2. — С. 114-121. — Бібліогр.: 8 назв. — рос. |
| collection | DSpace DC |
| container_title | Реєстрація, зберігання і обробка даних |
| description | Представлено описание методики построения сетей иерархий терминов на основе анализа массива текстов по выбранной проблематике (живучести технических и информационных систем). Методика базируется на применении компактифицированных графов горизонтальной видимости для терминов — отдельных слое, биграмм и триграмм, а также установлении связей между терминами. Построена и исследована сеть языка, сформированная на основе полных текстов научных статей по проблематике живучести.
The building technique of networks of terms hierarchies being based on the analysis of chosen texts on selected issues (survivability of technical and information systems) is offered. The technique is based on the methodology of horizontal visibility graphs for individual words, bigrams and trigrams. It has been constructed and investigated a language network, formed on the basis of full texts of scientific papers on the issue of survivability.
|
| first_indexed | 2025-11-25T20:39:28Z |
| format | Article |
| fulltext |
114
004.7
. . , . . , . .
. H. , 2, 03113 ,
.: (044) 4542163
-
( ). -
-
— , ,
. -
, -
.
: , ,
, , .
( -
, )
, -
, , .
—
, , -
.
-
, - ,
[1], -
[2]. , , -
, . ,
.
, ,
( , « », « -
», « » )
.
© . . , . . , . .
ISSN 1560-9189 , , 2014, . 16, 2 115
,
( ), -
. « -
»
, -
. -
, -
. , ,
.
, -
, ,
, -
, , -
[3]. -
.
1. . -
, -
,
. 50
1 . .
(
, , , ), , -
( ).
2. ( ,
) « »,
TFIDF, -
(Term Frequency) -
, ,
(Inverse Document Frequency) [4].
TFIDF
(CHVG) -
. -
-
, -
. [3], -
. -
,
, -
(TFIDF). -
[5]. , -
. . , . . , . .
116
« », . . -
, . , -
, . -
, .
-
CHVG. -
CHVG. -
, - , -
, . ,
, .
- - ,
- :
http://code.google.com/p/stop-words/source/browse/trunk/stop-words/stop-
words/stop-words-russian.txt?spec=svn3&r=3;
https://github.com/punbb/langs/blob/master/Russian/stopwords.txt;
http://www.ranks.nl/stopwords/russian.html;
http://trac.mysvn.ru/punbb/punbb/browser/trunk/Russian/stopwords.txt.
( N),
,
( N+N+N )
CHVG.
3. ,
, -
. . 1 -
. -
.
, — , — -
. ,
, , .
, ,
.
. 1.
http://code.google.com/p/stop-words/source/browse/trunk/stop-words/stop-
https://github.com/punbb/langs/blob/master/Russian/stopwords.txt
http://www.ranks.nl/stopwords/russian.html
http://trac.mysvn.ru/punbb/punbb/browser/trunk/Russian/stopwords.txt.
ISSN 1560-9189 , , 2014, . 16, 2 117
.
-
csv.
. 2 -
20+20+20, Gephi
(https://gephi.org/).
. 2. 20+20+20
. 3
200+200+200.
. 3. 200+200+200
https://gephi.org/).
. . , . . , . .
118
-
, ( ( )p k Ck ), . . -
. , -
( 20+20+20 500+500+500) 2,1 2,3, -
(Language Networks) [6].
. 4.
( — ; — )
,
5 ( —
0 , 2 — 2 , 3
— 5 — ).
, -
, . ,
— -
, , , -
« » « ».
- , -
HITS (hyperlink induced topic search), . -
[7].
HITS
« » ( , ) « » ( ,
). , -
, , -
, ( ) ,
. HITS -
ISSN 1560-9189 , , 2014, . 16, 2 119
jv ja v -
jh v :
, .j i j i
i i
a v h v h v a v
, -
( — ) .
.
, .
,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
-
, -
. ,
« .
. 10–15 ,
» [8].
-
« - »
. . , . . , . .
120
. ,
. , , -
- , -
, ,
. . 5 , -
, , « » « -
», - « ».
. 5. 20+20+20
1.
.
2.
.
3. -
.
4.
.
5. HITS
.
6. .
, , -
( -
ISSN 1560-9189 , , 2014, . 16, 2 121
— ),
-
, -
- .
1. Yagunova E. Dynamic Frequency Features as the Basis for the Structural Description of Diverse
Linguistic Objects / E. Yagunova, D. Lande // CEUR Workshop Proceedings. Proceedings of the 14-th
All-Russian Scientific Conference «Digital Libraries: Advanced Methods and Technologies, Digital Col-
lections». — Pereslavl-Zalessky (Russia). — October 15–18, 2012. — P. 150–159.
2. The Use of Horizontal Visibility Graphs to Identify the Words that Define the Informational
Structure of a Text / Lande D.V., Snarskii A.A., Yagunova E.V., Pronoza E.V. // 12-th Mexican
Internation. Conf. on Artificial Intelligence, 2013. — P. 209–215.
3. Lande D.V. Building of Networks of Natural Hierarchies of Terms Based on Analysis of Texts
Corpora / D.V. Lande // E-preprint ArXiv 1405.6068
4. Salton G. Introduction to Modern Information Retrieval / G. Salton, M.J. McGill. — New York:
McGraw-Hill, 1983. — 448 p.
5. Horizontal Visibility Graphs: Exact Results for Random Time Series / Luque ., Lacasa L.,
Ballesteros F., Luque J. // Phys. Review E. — 2009. — P. 046103-1–046103-11.
6. :
. . / [ . ., . ., . . .]. — .: , 2011. —
272 .
7. Kleinberg J. Authoritative Aources in a Hyperlinked Environment / J. Kleinberg // In Processing
of ACM-SIAM Symposium on Discrete Algorithms, 1998. — 46(5). — P. 604–632.
8. . .
/ . . : . . . . -
. . . — , 2010. — . 1. — . 85–91.
08.06.2014
|
| id | nasplib_isofts_kiev_ua-123456789-87119 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1560-9189 |
| language | Russian |
| last_indexed | 2025-11-25T20:39:28Z |
| publishDate | 2014 |
| publisher | Інститут проблем реєстрації інформації НАН України |
| record_format | dspace |
| spelling | Ланде, Д.В. Снарский, А.А. Путятин, В.Г. 2015-10-11T14:12:41Z 2015-10-11T14:12:41Z 2014 Построение терминологической сети предметной области / Д.В. Ланде, А.А. Снарский, В.Г. Путятин // Реєстрація, зберігання і обробка даних. — 2014. — Т. 16, № 2. — С. 114-121. — Бібліогр.: 8 назв. — рос. 1560-9189 https://nasplib.isofts.kiev.ua/handle/123456789/87119 004.7 Представлено описание методики построения сетей иерархий терминов на основе анализа массива текстов по выбранной проблематике (живучести технических и информационных систем). Методика базируется на применении компактифицированных графов горизонтальной видимости для терминов — отдельных слое, биграмм и триграмм, а также установлении связей между терминами. Построена и исследована сеть языка, сформированная на основе полных текстов научных статей по проблематике живучести. The building technique of networks of terms hierarchies being based on the analysis of chosen texts on selected issues (survivability of technical and information systems) is offered. The technique is based on the methodology of horizontal visibility graphs for individual words, bigrams and trigrams. It has been constructed and investigated a language network, formed on the basis of full texts of scientific papers on the issue of survivability. ru Інститут проблем реєстрації інформації НАН України Реєстрація, зберігання і обробка даних Системи збереження і масового розповсюдження даних Построение терминологической сети предметной области Building of Networks of Natural Hierarchies of Terms Based on Analysis of Texts Corpora Article published earlier |
| spellingShingle | Построение терминологической сети предметной области Ланде, Д.В. Снарский, А.А. Путятин, В.Г. Системи збереження і масового розповсюдження даних |
| title | Построение терминологической сети предметной области |
| title_alt | Building of Networks of Natural Hierarchies of Terms Based on Analysis of Texts Corpora |
| title_full | Построение терминологической сети предметной области |
| title_fullStr | Построение терминологической сети предметной области |
| title_full_unstemmed | Построение терминологической сети предметной области |
| title_short | Построение терминологической сети предметной области |
| title_sort | построение терминологической сети предметной области |
| topic | Системи збереження і масового розповсюдження даних |
| topic_facet | Системи збереження і масового розповсюдження даних |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/87119 |
| work_keys_str_mv | AT landedv postroenieterminologičeskoisetipredmetnoioblasti AT snarskiiaa postroenieterminologičeskoisetipredmetnoioblasti AT putâtinvg postroenieterminologičeskoisetipredmetnoioblasti AT landedv buildingofnetworksofnaturalhierarchiesoftermsbasedonanalysisoftextscorpora AT snarskiiaa buildingofnetworksofnaturalhierarchiesoftermsbasedonanalysisoftextscorpora AT putâtinvg buildingofnetworksofnaturalhierarchiesoftermsbasedonanalysisoftextscorpora |