Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019
The main methods of machine learning for the sentiment analysis of the text are described and a comparative analysis of their effectiveness is performed. The stages of pre-processing of the text, such as stemming, deletion of stop words, algorithms for converting the text to vector form, such as bag...
Збережено в:
Дата: | 2020 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
2020
|
Теми: | |
Онлайн доступ: | http://journal.iasa.kpi.ua/article/view/202722 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | System research and information technologies |
Репозитарії
System research and information technologiesid |
journaliasakpiua-article-202722 |
---|---|
record_format |
ojs |
spelling |
journaliasakpiua-article-2027222021-01-19T12:18:25Z Machine learning in sentiment-analysis of text information on the example of user attitudes regarding candidates for Ukrainian presidential elections 2019 Методы машинного обучения в сентимент-анализе текстовой информации на примере настроений пользователей по отношению к кандидатам в президенты Украины 2019 Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019 Rudzevych, Anna-Mariia P. машинне навчання сентимент-аналіз аналіз тональності тексту інтелектуальний аналіз тексту машинное обучение сентимент-анализ анализ тональности текста интеллектуальный анализ данных machine learning sentiment analysis text mining The main methods of machine learning for the sentiment analysis of the text are described and a comparative analysis of their effectiveness is performed. The stages of pre-processing of the text, such as stemming, deletion of stop words, algorithms for converting the text to vector form, such as bag-of-words (Bag-of-Words), TF-IDF vectorizer and Word2Vec, are considered. The goal of this study was to determine the sentiment of the comments under the publications of Ukrainian Presidential candidates (V. Zelensky and P. Poroshenko) during the 2019 election campaign.Three algorithms were used to determine the tonality of the text: the naive Bayes classifier, the support vector machine, and the convolutional neural network. Separate models were built for each candidate and a comparison of the classification quality was performed (according to metric F1). The most precise model for both data samples was a convolutional neural network. Описаны основные методы машинного обучения для анализа тональности текста и проведен сравнительный анализ их эффективности. Рассмотрены этапы предварительной обработки текста, такие как стемминг, удаление стоп-слов, алгоритмы перевода текста в векторную форму: мешок слов TF-IDF векторизатор и Word2Vec. Исследование заключалось в определении тональности текста комментариев под публикациями кандидатов в Президенты Украины (В. Зеленского и П. Порошенка) в период предвыборной гонки 2019 г. Для определения тональности текста использованы три алгоритма: наивный байесовский классификатор, метод опорных векторов и сверточная нейронная сеть. Для каждого кандидата построены отдельные модели и проведено сравнение качества классификации (по метрике F1). Лучшей моделью для обеих выборок данных оказалась сверточная нейронная сеть. Описано основні методи машинного навчання для аналізу тональності тексту і виконано порівняльний аналіз їх ефективності. Розглянуто етапи попереднього оброблення тексту, такі як стемінг, видалення стоп-слів, алгоритми переведення тексту векторну форму: мішок слів (Bag-of-Words), TF-IDF векторайзер та Word2Vec. Дослідження полягало у визначенні тональності тексту коментарів під публікаціями кандидатів у Президенти України (В. Зеленського та П. Порошенка) у період передвиборчих перегонів 2019 р. Для визначення тональності тексту використано три алгоритми: наївний байєсівський класифікатор, метод опорних векторів та згорткову нейронну мережу. Для кожного кандидата побудовано окремі моделі та виконано порівняння якості класифікації (за метрикою F1). Найкращою моделлю для обох вибірок даних виявилась згорткова нейронна мережа. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2020-12-07 Article Article application/pdf http://journal.iasa.kpi.ua/article/view/202722 10.20535/SRIT.2308-8893.2020.3.06 System research and information technologies; No. 3 (2020); 78-88 Системные исследования и информационные технологии; № 3 (2020); 78-88 Системні дослідження та інформаційні технології; № 3 (2020); 78-88 2308-8893 1681-6048 uk http://journal.iasa.kpi.ua/article/view/202722/223558 Copyright (c) 2021 System research and information technologies |
institution |
System research and information technologies |
collection |
OJS |
language |
Ukrainian |
topic |
машинне навчання сентимент-аналіз аналіз тональності тексту інтелектуальний аналіз тексту машинное обучение сентимент-анализ анализ тональности текста интеллектуальный анализ данных machine learning sentiment analysis text mining |
spellingShingle |
машинне навчання сентимент-аналіз аналіз тональності тексту інтелектуальний аналіз тексту машинное обучение сентимент-анализ анализ тональности текста интеллектуальный анализ данных machine learning sentiment analysis text mining Rudzevych, Anna-Mariia P. Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019 |
topic_facet |
машинне навчання сентимент-аналіз аналіз тональності тексту інтелектуальний аналіз тексту машинное обучение сентимент-анализ анализ тональности текста интеллектуальный анализ данных machine learning sentiment analysis text mining |
format |
Article |
author |
Rudzevych, Anna-Mariia P. |
author_facet |
Rudzevych, Anna-Mariia P. |
author_sort |
Rudzevych, Anna-Mariia P. |
title |
Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019 |
title_short |
Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019 |
title_full |
Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019 |
title_fullStr |
Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019 |
title_full_unstemmed |
Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019 |
title_sort |
методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти україни 2019 |
title_alt |
Machine learning in sentiment-analysis of text information on the example of user attitudes regarding candidates for Ukrainian presidential elections 2019 Методы машинного обучения в сентимент-анализе текстовой информации на примере настроений пользователей по отношению к кандидатам в президенты Украины 2019 |
description |
The main methods of machine learning for the sentiment analysis of the text are described and a comparative analysis of their effectiveness is performed. The stages of pre-processing of the text, such as stemming, deletion of stop words, algorithms for converting the text to vector form, such as bag-of-words (Bag-of-Words), TF-IDF vectorizer and Word2Vec, are considered. The goal of this study was to determine the sentiment of the comments under the publications of Ukrainian Presidential candidates (V. Zelensky and P. Poroshenko) during the 2019 election campaign.Three algorithms were used to determine the tonality of the text: the naive Bayes classifier, the support vector machine, and the convolutional neural network. Separate models were built for each candidate and a comparison of the classification quality was performed (according to metric F1). The most precise model for both data samples was a convolutional neural network. |
publisher |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" |
publishDate |
2020 |
url |
http://journal.iasa.kpi.ua/article/view/202722 |
work_keys_str_mv |
AT rudzevychannamariiap machinelearninginsentimentanalysisoftextinformationontheexampleofuserattitudesregardingcandidatesforukrainianpresidentialelections2019 AT rudzevychannamariiap metodymašinnogoobučeniâvsentimentanalizetekstovojinformaciinaprimerenastroenijpolʹzovatelejpootnošeniûkkandidatamvprezidentyukrainy2019 AT rudzevychannamariiap metodimašinnogonavčannâvsentimentanalízítekstovoíínformacíínaprikladínastroívkoristuvačívstosovnokandidatívuprezidentiukraíni2019 |
first_indexed |
2024-04-08T15:07:36Z |
last_indexed |
2024-04-08T15:07:36Z |
_version_ |
1795779572968456192 |