Метод построения и использования семантических моделей для мониторинга общественного мнения

Предложен метод построения и использования семантических моделей с целью непрерывного во времени мониторинга общественного мнения. Семантические модели позволяют использовать при мониторинге общественного мнения результаты лингвостатистического анализа текстов, применения методов извлечения информац...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Реєстрація, зберігання і обробка даних
Дата:2018
Автори: Додонов, А.Г., Ландэ, Д.В., Березин, Б.А.
Формат: Стаття
Мова:Російська
Опубліковано: Інститут проблем реєстрації інформації НАН України 2018
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/169072
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Метод построения и использования семантических моделей для мониторинга общественного мнения / А.Г. Додонов, Д.В. Ландэ, Б.А. Березин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 53–63. — Бібліогр.: 12 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859821853542973440
author Додонов, А.Г.
Ландэ, Д.В.
Березин, Б.А.
author_facet Додонов, А.Г.
Ландэ, Д.В.
Березин, Б.А.
citation_txt Метод построения и использования семантических моделей для мониторинга общественного мнения / А.Г. Додонов, Д.В. Ландэ, Б.А. Березин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 53–63. — Бібліогр.: 12 назв. — рос.
collection DSpace DC
container_title Реєстрація, зберігання і обробка даних
description Предложен метод построения и использования семантических моделей с целью непрерывного во времени мониторинга общественного мнения. Семантические модели позволяют использовать при мониторинге общественного мнения результаты лингвостатистического анализа текстов, применения методов извлечения информации, содержащейся в текстах из сети Интернет. Предложена процедура мониторинга общественного мнения, которая включает три этапа: построение и кластеризацию; отбор документов и определение тональности тематик; визуализацию результатов. Показано построение семантических моделей, применение методов кластерного анализа для определения актуальных тематик, оценивание доли и тональности отдельных подтем в составе общего тематического потока информации. Полученные результаты подтверждают возможность использования предложенного метода мониторинга общественного мнения в различных предметных областях. Запропоновано метод побудови та використання семантичних моделей (СМ) з метою безперервного в часі моніторингу громадської думки (МГД). Під семантичною моделлю в рамках даної роботи розуміється модель предметної області, що має вигляд орієнтованого графа, вершини якого відповідають концептам предметної області, а дуги задають відносини між ними. Семантичні моделі дозволяють використовувати при моніторингу громадської думки результати лінгвостатистичного аналізу текстів (Text Mining), застосування методів екстрагування інформації (Information Extraction), що містяться в текстах з мережі Інтернет. У той час, як існуючі проекти аналізу громадської думки більше орієнтовані на разові (статичні) дослідження громадської думки щодо об’єктів і явищ, запропоновано метод автоматизованої побудови та використання СМ на основі безперервного в часі моніторингу громадської думки в мережі Інтернет. Процедура МГД включає три етапи: побудову та кластеризацію СМ; відбір документів і визначення тональності тематик; візуалізацію результатів. Показано побудову СМ за допомогою алгоритму компактифікованого графа горизонтальній видимості, застосування методів кластерного аналізу для визначення актуальних тематик, оцінювання частки та тональності окремих підтем у складі загального тематичного потоку інформації. Як приклади розглянуто моделі предметних областей, що відповідають темам: «One Belt, One Road», «Nord Stream», «Генетично модифіковані організми». Отримані результати підтверджують можливість використання запропонованого методу моніторингу громадської думки у різних предметних областях. It is proposed a method for constructing and using semantic models (SM) for the purpose of continuous monitoring of public opinion, opinion mining (OM). Under the semantic model in the framework of this work, it is implied the subject domain model, which has the form of a directed graph, the vertices of which correspond to the concepts of the domain, and the arcs define the relations between them. Semantic models make it possible to use the results of linguistic statistical analysis of texts (Text Mining) and the use of Information Extraction methods contained in texts from the Internet for opinion mining. While the existing public opinion analysis projects are more focused on one-time (static) public opinion research on objects and phenomena, it is proposed a method for automated construction and use of SM based on continuous monitoring of public opinion on the Internet. The OM procedure consists of three steps: the construction and clustering of the SM; selection of documents and the sentiment definition of topics; visualization of results. The SM construction using the compactified horizontal visibility graph algorithm, the use of cluster analysis methods for determining relevant topics, estimating the proportion and tonality of individual sub-themes in the overall thematic information flow is shown. As examples, the models of subject areas corresponding to the topics: «One Belt, One Road», «Nord Stream», «Genetically Modified Organisms» are examined. The obtained results confirm the possibility of using the proposed method of opinion monitoring in various subject areas.
first_indexed 2025-12-07T15:26:07Z
format Article
fulltext - ISSN 1560-9189 , , 2018, . 20, 4 53 004.421 . . , . . , . . . . , 2, 03113 , - . - , , - . , : ; - ; . - , , - - . - - . : , , , , - , - . ( ) , , , . , , , . . - - . , , - , - © . . , . . , . . . . , . . , . . 54 - - , . . - - (Text Mining), (Information Ext- raction), . ( - ) , - - . - (Natural Lan- guage Processing). . ( , ). , , , (Sentiment Analysis — SA, Opinion Mining — OM) , - , , , - , [1, 2]. : , , . , - , , ( , . .) . , . - , , . [3] - - , , . - Google, Google News, - , . . , - . , , . [4] Youtube. - . Youtube - . - . - . , ISSN 1560-9189 , , 2018, . 20, 4 55 . [5] 2012 . , . - 81 . 400 - . « - - » , , . . - - . - ( ) , - [6]: — ; — ; — . : — ; — ; - [7]; — ; — , ( - ). : — , ( ), ; — ; — . : — ; — ( ) . , . . . . . - , , - , - . ( - ). , , , TFIDF , - , [8]. . . , . . , . . 56 - . - - ( ) [7], . 1. , - , ( — ). 2. . - , « », . . , . 3. . , . - . , - . . , , , -2, - . , 28 - OBOR , . 1. . 1. 28 OBOR . - , — (clastering graph, community detection). [9] , . ISSN 1560-9189 , , 2018, . 20, 4 57 - - - . [9] , ( - ). - . , - , Louvain, Leading igenvector, Walktrap. - Louvain [10], - . . , . - , - , , . - , - . : , - - . , . Leading Eigenvector [11] - . , , . , , . . Walktrap [9], ( ) . - , , , . , . , . , , - («One Belt, One Road» — OBOR) - , . 1. , . - - , , . . . , - , , . - - , , , . OBOR, , - , . 2. , - . . , . . , . . 58 ( ), , . . . , , - , , . . , - InfoStream (one-road)&(one-belt)&china, OBOR, . 2. , , . 3. . — , , - , , . , - [5]. - , - , , - , , , . . - : - , , , , ( , « - » ). , - OBOR, . 3. . - . - . - , , - , - ( . 3, . 2). : , - ; ; - , . - - . ( ) OBOR . 3–5. , - Gephi (http://gephi.org), , R. . http://gephi.org ISSN 1560-9189 , , 2018, . 20, 4 59 . 2. . - - - : One Belt, One Road (OBOR) — « » « - XXI »; Nord Stream — ; GMO — - . OBOR - 1000 ( 30.11.2018 25.07.2018), - (one-road)&(one-belt)&china - InfoStream. , , ( , TFIDF) ( . 1). , Louvain, Leading Eigenvector Walktrap , . 1. . 1 , - . 1, 2 — - , , , 3–5 — , , TFIDF. - - , - . , - . . , . . , . . 60 - , , , - ( . 2). 1. , OBOR Louvain Walktrap Louvain (TFIDF) Walktrap (TFIDF) Leading eigenvector (TFIDF) economy military world countries country state global war trade projects economic cooperation security political infrastructure investment development international support national india military power pakistan country us strategic might russia american political iran russian defense syria turkey india world relations war united states russia japan think iran defense syria chinese president people government market xi business million debt including beijing billion summit leaders sri chinese president people government projects xi debt trump project investment cpec billion port bri sri chinese president obor people government projects xi cooperation debt project investment beijing summit port bri india china south asia power region pakistan relations influence us strategic east europe russia american trump japan africa part sea south region relations indian xinjiang economic cooperation africa development beijing summit pacific taiwan china's military south power region state global strategic might economic american security political africa research uighur pacific taiwan prime minister foreign policy prime minister foreign prime minister foreign japanese abe mahathir malaysia prime minister japanese abe mahathir malaysia prime minister foreign japanese abe mahathir russian china's road belt initiative project silk road belt initiative silk china's global obor market research 2. , , 1 xi projects investment ( ) bri 2 india pakistan us , , 3 south region development 4 japan minister abe ISSN 1560-9189 , , 2018, . 20, 4 61 , , - , . 3. , - OBOR. 3. «OBOR» xi projects investment 10,1 % (101) 2 % (2) 0 98 % (99) japan minister abe 9,2 % (92) 1 % (1) 0 99 % (91) india pakistan us 8 % (80) 5 % (4) 0 95 % (76) south region development 15,3 % (153) 5 % (8) 1 % (1) 94 % (144) . - , - . 2. OBOR . 3–5. . 3 ( 1 – 4, ) OBOR ( , ) . . 4 - , «South Region Development» . . 5 , - «India Pakistan US» . . 3. ( 1 – 4 — ) OBOR ( , ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 0 10 20 30 40 50 60 70 80 90 - 1 - 2 - 3 - 4 . . , . . , . . 62 . 4. , «South Region Development» . 5. , «India Pakistan US» OBOR Nord Stream, GMO . - , Nord Stream, 1000 , ( 02.11.2018 18.08.2018) - , : merkel putin meeting ( ); gas transit ukraine ( - ); european security energy market ( - 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 0 2 4 6 8 10 12 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 0 2 4 6 8 10 12 14 16 18 20 ISSN 1560-9189 , , 2018, . 20, 4 63 ), poland united states ( Nord Stream). - , : ; - ; . , , . - . 1. Schouten K., Frasincar F. Survey on aspect-level sentiment analysis. IEEE Transactions on Knowledge and Data Engineering. 2016. Issue 28(3). P. 813–830. 2. Medhat W., Hassan A., Korashy H. Sentiment analysis algorithms and applications: A survey // Ain Shams Engineering Journal. 2014. Issue 5(4). . 1093–1113. 3. Jiang K., Anderton B., Ronald, P., Barnett G. Semantic Network Analysis Reveals Opposing Online Representations of the Search Term «GMO». Global Challenges. 2018. Issue 2(1). . 1700082. DOI: https://doi.org/10.1002/gch2.201700082. 4. . ., . . - . . 2016. . 19(4). C. 71–83. 5. Sudhahar S., Veltri G., Cristianini N. Automated analysis of the US presidential elections using Big Data and network analysis. Big Data & Society. 2015. Issue 2(1). P. 21–49. 6. . ., . ., . . - . - « »: . : , 2018. . 6. 7. Lande D.V., Snarskii A.A., Yagunova E.V., Pronoza E.V. The use of horizontal visibility graphs to identify the words that define the informational structure of a text. 12th Mexican International Confer- ence on Artificial Intelligence (MICAI), 2013. P. 209–215. DOI: 10.1109/MICAI.2013.33 8. . . . . - « ». : , 2014. . 7–9. 9. Harenberg S., Bello G., Gjeltema L., Ranshous S., Harlalka J., Seay R., Samatova N. Commu- nity detection in large-scale networks: a survey and empirical evaluation. Wiley Interdisciplinary Re- views: Computational Statistics, 2014. Issue 6(6). . 426–439. 10. Blondel V.D., Guillaume J.L., Lambiotte R., Lefebvre E. Fast unfolding of communities in large networks. Journal of Statistical Mechanics: Theory and Experiment. 2008. Issue 10. . P10008 11. Newman M.E. Finding community structure in networks using the eigenvectors of matrices. Physical review E. 2006. Iss. 74(3). . 036104. 12. Lande D.V. Identification of information tonality based on Bayesian approach and neural net- works. E-preprint arXiv: 0806.2738 (2008). 14.12.2018 https://doi.org/10.1002/gch2.201700082.
id nasplib_isofts_kiev_ua-123456789-169072
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
isbn DOI: https://doi.org/10.35681/1560-9189.2018.20.4.178928
issn 1560-9189
language Russian
last_indexed 2025-12-07T15:26:07Z
publishDate 2018
publisher Інститут проблем реєстрації інформації НАН України
record_format dspace
spelling Додонов, А.Г.
Ландэ, Д.В.
Березин, Б.А.
2020-06-03T18:03:13Z
2020-06-03T18:03:13Z
2018
Метод построения и использования семантических моделей для мониторинга общественного мнения / А.Г. Додонов, Д.В. Ландэ, Б.А. Березин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 53–63. — Бібліогр.: 12 назв. — рос.
DOI: https://doi.org/10.35681/1560-9189.2018.20.4.178928
1560-9189
https://nasplib.isofts.kiev.ua/handle/123456789/169072
004.421
Предложен метод построения и использования семантических моделей с целью непрерывного во времени мониторинга общественного мнения. Семантические модели позволяют использовать при мониторинге общественного мнения результаты лингвостатистического анализа текстов, применения методов извлечения информации, содержащейся в текстах из сети Интернет. Предложена процедура мониторинга общественного мнения, которая включает три этапа: построение и кластеризацию; отбор документов и определение тональности тематик; визуализацию результатов. Показано построение семантических моделей, применение методов кластерного анализа для определения актуальных тематик, оценивание доли и тональности отдельных подтем в составе общего тематического потока информации. Полученные результаты подтверждают возможность использования предложенного метода мониторинга общественного мнения в различных предметных областях.
Запропоновано метод побудови та використання семантичних моделей (СМ) з метою безперервного в часі моніторингу громадської думки (МГД). Під семантичною моделлю в рамках даної роботи розуміється модель предметної області, що має вигляд орієнтованого графа, вершини якого відповідають концептам предметної області, а дуги задають відносини між ними. Семантичні моделі дозволяють використовувати при моніторингу громадської думки результати лінгвостатистичного аналізу текстів (Text Mining), застосування методів екстрагування інформації (Information Extraction), що містяться в текстах з мережі Інтернет. У той час, як існуючі проекти аналізу громадської думки більше орієнтовані на разові (статичні) дослідження громадської думки щодо об’єктів і явищ, запропоновано метод автоматизованої побудови та використання СМ на основі безперервного в часі моніторингу громадської думки в мережі Інтернет. Процедура МГД включає три етапи: побудову та кластеризацію СМ; відбір документів і визначення тональності тематик; візуалізацію результатів. Показано побудову СМ за допомогою алгоритму компактифікованого графа горизонтальній видимості, застосування методів кластерного аналізу для визначення актуальних тематик, оцінювання частки та тональності окремих підтем у складі загального тематичного потоку інформації. Як приклади розглянуто моделі предметних областей, що відповідають темам: «One Belt, One Road», «Nord Stream», «Генетично модифіковані організми». Отримані результати підтверджують можливість використання запропонованого методу моніторингу громадської думки у різних предметних областях.
It is proposed a method for constructing and using semantic models (SM) for the purpose of continuous monitoring of public opinion, opinion mining (OM). Under the semantic model in the framework of this work, it is implied the subject domain model, which has the form of a directed graph, the vertices of which correspond to the concepts of the domain, and the arcs define the relations between them. Semantic models make it possible to use the results of linguistic statistical analysis of texts (Text Mining) and the use of Information Extraction methods contained in texts from the Internet for opinion mining. While the existing public opinion analysis projects are more focused on one-time (static) public opinion research on objects and phenomena, it is proposed a method for automated construction and use of SM based on continuous monitoring of public opinion on the Internet. The OM procedure consists of three steps: the construction and clustering of the SM; selection of documents and the sentiment definition of topics; visualization of results. The SM construction using the compactified horizontal visibility graph algorithm, the use of cluster analysis methods for determining relevant topics, estimating the proportion and tonality of individual sub-themes in the overall thematic information flow is shown. As examples, the models of subject areas corresponding to the topics: «One Belt, One Road», «Nord Stream», «Genetically Modified Organisms» are examined. The obtained results confirm the possibility of using the proposed method of opinion monitoring in various subject areas.
ru
Інститут проблем реєстрації інформації НАН України
Реєстрація, зберігання і обробка даних
Інформаційно-аналітичні системи обробки даних
Метод построения и использования семантических моделей для мониторинга общественного мнения
Метод побудови і використання семантичних моделей для моніторингу суспільної думки
A method of semantic models for constructing and using for the public opinion monitoring
Article
published earlier
spellingShingle Метод построения и использования семантических моделей для мониторинга общественного мнения
Додонов, А.Г.
Ландэ, Д.В.
Березин, Б.А.
Інформаційно-аналітичні системи обробки даних
title Метод построения и использования семантических моделей для мониторинга общественного мнения
title_alt Метод побудови і використання семантичних моделей для моніторингу суспільної думки
A method of semantic models for constructing and using for the public opinion monitoring
title_full Метод построения и использования семантических моделей для мониторинга общественного мнения
title_fullStr Метод построения и использования семантических моделей для мониторинга общественного мнения
title_full_unstemmed Метод построения и использования семантических моделей для мониторинга общественного мнения
title_short Метод построения и использования семантических моделей для мониторинга общественного мнения
title_sort метод построения и использования семантических моделей для мониторинга общественного мнения
topic Інформаційно-аналітичні системи обробки даних
topic_facet Інформаційно-аналітичні системи обробки даних
url https://nasplib.isofts.kiev.ua/handle/123456789/169072
work_keys_str_mv AT dodonovag metodpostroeniâiispolʹzovaniâsemantičeskihmodeleidlâmonitoringaobŝestvennogomneniâ
AT landédv metodpostroeniâiispolʹzovaniâsemantičeskihmodeleidlâmonitoringaobŝestvennogomneniâ
AT berezinba metodpostroeniâiispolʹzovaniâsemantičeskihmodeleidlâmonitoringaobŝestvennogomneniâ
AT dodonovag metodpobudoviívikoristannâsemantičnihmodeleidlâmonítoringususpílʹnoídumki
AT landédv metodpobudoviívikoristannâsemantičnihmodeleidlâmonítoringususpílʹnoídumki
AT berezinba metodpobudoviívikoristannâsemantičnihmodeleidlâmonítoringususpílʹnoídumki
AT dodonovag amethodofsemanticmodelsforconstructingandusingforthepublicopinionmonitoring
AT landédv amethodofsemanticmodelsforconstructingandusingforthepublicopinionmonitoring
AT berezinba amethodofsemanticmodelsforconstructingandusingforthepublicopinionmonitoring