Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019

The main methods of machine learning for the sentiment analysis of the text are described and a comparative analysis of their effectiveness is performed. The stages of pre-processing of the text, such as stemming, deletion of stop words, algorithms for converting the text to vector form, such as bag...

Повний опис

Збережено в:
Бібліографічні деталі
Видавець:The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
Дата:2020
Автор: Rudzevych, Anna-Mariia P.
Формат: Стаття
Мова:Ukrainian
Опубліковано: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2020
Теми:
Онлайн доступ:http://journal.iasa.kpi.ua/article/view/202722
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!

Репозиторії

System research and information technologies
id journaliasakpiua-article-202722
record_format ojs
spelling journaliasakpiua-article-2027222021-01-19T12:18:25Z Machine learning in sentiment-analysis of text information on the example of user attitudes regarding candidates for Ukrainian presidential elections 2019 Методы машинного обучения в сентимент-анализе текстовой информации на примере настроений пользователей по отношению к кандидатам в президенты Украины 2019 Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019 Rudzevych, Anna-Mariia P. машинне навчання сентимент-аналіз аналіз тональності тексту інтелектуальний аналіз тексту машинное обучение сентимент-анализ анализ тональности текста интеллектуальный анализ данных machine learning sentiment analysis text mining The main methods of machine learning for the sentiment analysis of the text are described and a comparative analysis of their effectiveness is performed. The stages of pre-processing of the text, such as stemming, deletion of stop words, algorithms for converting the text to vector form, such as bag-of-words (Bag-of-Words), TF-IDF vectorizer and Word2Vec, are considered. The goal of this study was to determine the sentiment of the comments under the publications of Ukrainian Presidential candidates (V. Zelensky and P. Poroshenko) during the 2019 election campaign.Three algorithms were used to determine the tonality of the text: the naive Bayes classifier, the support vector machine, and the convolutional neural network. Separate models were built for each candidate and a comparison of the classification quality was performed (according to metric F1). The most precise model for both data samples was a convolutional neural network. Описаны основные методы машинного обучения для анализа тональности текста и проведен сравнительный анализ их эффективности. Рассмотрены этапы предварительной обработки текста, такие как стемминг, удаление стоп-слов, алгоритмы перевода текста в векторную форму: мешок слов TF-IDF векторизатор и Word2Vec. Исследование заключалось в определении тональности текста комментариев под публикациями кандидатов в Президенты Украины (В. Зеленского и П. Порошенка) в период предвыборной гонки 2019 г. Для определения тональности текста использованы три алгоритма: наивный байесовский классификатор, метод опорных векторов и сверточная нейронная сеть. Для каждого кандидата построены отдельные модели и проведено сравнение качества классификации (по метрике F1). Лучшей моделью для обеих выборок данных оказалась сверточная нейронная сеть. Описано основні методи машинного навчання для аналізу тональності тексту і виконано порівняльний аналіз їх ефективності. Розглянуто етапи попереднього оброблення тексту, такі як стемінг, видалення стоп-слів, алгоритми переведення тексту векторну форму: мішок слів (Bag-of-Words), TF-IDF векторайзер та Word2Vec. Дослідження полягало у визначенні тональності тексту коментарів під публікаціями кандидатів у Президенти України (В. Зеленського та П. Порошенка) у період передвиборчих перегонів 2019 р. Для визначення тональності тексту використано три алгоритми: наївний байєсівський класифікатор, метод опорних векторів та згорткову нейронну мережу. Для кожного кандидата побудовано окремі моделі та виконано порівняння якості класифікації (за метрикою F1). Найкращою моделлю для обох вибірок даних виявилась згорткова нейронна мережа. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2020-12-07 Article Article application/pdf http://journal.iasa.kpi.ua/article/view/202722 10.20535/SRIT.2308-8893.2020.3.06 System research and information technologies; No. 3 (2020); 78-88 Системные исследования и информационные технологии; № 3 (2020); 78-88 Системні дослідження та інформаційні технології; № 3 (2020); 78-88 2308-8893 1681-6048 uk http://journal.iasa.kpi.ua/article/view/202722/223558 Copyright (c) 2021 System research and information technologies
institution System research and information technologies
collection OJS
language Ukrainian
topic машинне навчання
сентимент-аналіз
аналіз тональності тексту
інтелектуальний аналіз тексту
машинное обучение
сентимент-анализ
анализ тональности текста
интеллектуальный анализ данных
machine learning
sentiment analysis
text mining
spellingShingle машинне навчання
сентимент-аналіз
аналіз тональності тексту
інтелектуальний аналіз тексту
машинное обучение
сентимент-анализ
анализ тональности текста
интеллектуальный анализ данных
machine learning
sentiment analysis
text mining
Rudzevych, Anna-Mariia P.
Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019
topic_facet машинне навчання
сентимент-аналіз
аналіз тональності тексту
інтелектуальний аналіз тексту
машинное обучение
сентимент-анализ
анализ тональности текста
интеллектуальный анализ данных
machine learning
sentiment analysis
text mining
format Article
author Rudzevych, Anna-Mariia P.
author_facet Rudzevych, Anna-Mariia P.
author_sort Rudzevych, Anna-Mariia P.
title Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019
title_short Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019
title_full Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019
title_fullStr Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019
title_full_unstemmed Методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти України 2019
title_sort методи машинного навчання в сентимент-аналізі текстової інформації на прикладі настроїв користувачів стосовно кандидатів у президенти україни 2019
title_alt Machine learning in sentiment-analysis of text information on the example of user attitudes regarding candidates for Ukrainian presidential elections 2019
Методы машинного обучения в сентимент-анализе текстовой информации на примере настроений пользователей по отношению к кандидатам в президенты Украины 2019
description The main methods of machine learning for the sentiment analysis of the text are described and a comparative analysis of their effectiveness is performed. The stages of pre-processing of the text, such as stemming, deletion of stop words, algorithms for converting the text to vector form, such as bag-of-words (Bag-of-Words), TF-IDF vectorizer and Word2Vec, are considered. The goal of this study was to determine the sentiment of the comments under the publications of Ukrainian Presidential candidates (V. Zelensky and P. Poroshenko) during the 2019 election campaign.Three algorithms were used to determine the tonality of the text: the naive Bayes classifier, the support vector machine, and the convolutional neural network. Separate models were built for each candidate and a comparison of the classification quality was performed (according to metric F1). The most precise model for both data samples was a convolutional neural network.
publisher The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
publishDate 2020
url http://journal.iasa.kpi.ua/article/view/202722
work_keys_str_mv AT rudzevychannamariiap machinelearninginsentimentanalysisoftextinformationontheexampleofuserattitudesregardingcandidatesforukrainianpresidentialelections2019
AT rudzevychannamariiap metodymašinnogoobučeniâvsentimentanalizetekstovojinformaciinaprimerenastroenijpolʹzovatelejpootnošeniûkkandidatamvprezidentyukrainy2019
AT rudzevychannamariiap metodimašinnogonavčannâvsentimentanalízítekstovoíínformacíínaprikladínastroívkoristuvačívstosovnokandidatívuprezidentiukraíni2019
first_indexed 2024-04-08T15:07:36Z
last_indexed 2024-04-08T15:07:36Z
_version_ 1795779572968456192