Тематическая классификация украиноязычных текстов, трудности ее внедрения

Построены классификаторы украиноязычных текстов методами Random Forest Classifier, Support Vector Machines, Naive Bayes Сlassifier.и Logistic Regression. Для тренировки этих классификаторов использовался метод контролированного обучения. Суть этого метода заключается в том, что для обучения использу...

Full description

Saved in:
Bibliographic Details
Published in:Управляющие системы и машины
Date:2019
Main Authors: Бобровник, Е.А., Духновская, К.К., Пирог, Н.В.
Format: Article
Language:Russian
Published: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України 2019
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/161575
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Тематическая классификация украиноязычных текстов, трудности ее внедрения / Е.А. Бобровник, К.К. Духновская, Н.В. Пирог // Управляющие системы и машины. — 2019. — № 1. — С. 41–51. — Бібліогр.: 12 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-161575
record_format dspace
spelling Бобровник, Е.А.
Духновская, К.К.
Пирог, Н.В.
2019-12-14T15:51:53Z
2019-12-14T15:51:53Z
2019
Тематическая классификация украиноязычных текстов, трудности ее внедрения / Е.А. Бобровник, К.К. Духновская, Н.В. Пирог // Управляющие системы и машины. — 2019. — № 1. — С. 41–51. — Бібліогр.: 12 назв. — рос.
0130-5395
DOI: https://doi.org/10.15407/usim.2019.01.041
https://nasplib.isofts.kiev.ua/handle/123456789/161575
004.04.043; 004.912; 004.62
Построены классификаторы украиноязычных текстов методами Random Forest Classifier, Support Vector Machines, Naive Bayes Сlassifier.и Logistic Regression. Для тренировки этих классификаторов использовался метод контролированного обучения. Суть этого метода заключается в том, что для обучения используется уже готовый классифицированный набор текстов, в качестве которого выступают тексты Брауновский корпуса украинского языка. Лучшие результаты показала модель для классификации украиноязычных текстов на основе метода опорных векторов. Ее средняя точность — 0,80.
Мета роботи — визначити особливості автоматичної класифікації текстів, поданих на українській мові. Результати. БрУК — єдиний корпус українських текстів у відкритому доступі, тексти якого можна використовувати для розробки алгоритмів і методів класифікації українськомовних текстів.
Purpose. Specify the peculiarities of the automated classification of texts written in the Ukrainian language. Results.BrUC is the only corpus of Ukrainian texts on open access, the texts of which can be used to develop algorithms and methods of classification of texts in the Ukrainian language.
ru
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
Управляющие системы и машины
Интеллектуальные информационные технологии и системы
Тематическая классификация украиноязычных текстов, трудности ее внедрения
Тематична класифікація українськомовних текстiв, труднощі її впровадження
Thematic Classification of Ukrainian Texts, Difficulties of its Introductions
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Тематическая классификация украиноязычных текстов, трудности ее внедрения
spellingShingle Тематическая классификация украиноязычных текстов, трудности ее внедрения
Бобровник, Е.А.
Духновская, К.К.
Пирог, Н.В.
Интеллектуальные информационные технологии и системы
title_short Тематическая классификация украиноязычных текстов, трудности ее внедрения
title_full Тематическая классификация украиноязычных текстов, трудности ее внедрения
title_fullStr Тематическая классификация украиноязычных текстов, трудности ее внедрения
title_full_unstemmed Тематическая классификация украиноязычных текстов, трудности ее внедрения
title_sort тематическая классификация украиноязычных текстов, трудности ее внедрения
author Бобровник, Е.А.
Духновская, К.К.
Пирог, Н.В.
author_facet Бобровник, Е.А.
Духновская, К.К.
Пирог, Н.В.
topic Интеллектуальные информационные технологии и системы
topic_facet Интеллектуальные информационные технологии и системы
publishDate 2019
language Russian
container_title Управляющие системы и машины
publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
format Article
title_alt Тематична класифікація українськомовних текстiв, труднощі її впровадження
Thematic Classification of Ukrainian Texts, Difficulties of its Introductions
description Построены классификаторы украиноязычных текстов методами Random Forest Classifier, Support Vector Machines, Naive Bayes Сlassifier.и Logistic Regression. Для тренировки этих классификаторов использовался метод контролированного обучения. Суть этого метода заключается в том, что для обучения используется уже готовый классифицированный набор текстов, в качестве которого выступают тексты Брауновский корпуса украинского языка. Лучшие результаты показала модель для классификации украиноязычных текстов на основе метода опорных векторов. Ее средняя точность — 0,80. Мета роботи — визначити особливості автоматичної класифікації текстів, поданих на українській мові. Результати. БрУК — єдиний корпус українських текстів у відкритому доступі, тексти якого можна використовувати для розробки алгоритмів і методів класифікації українськомовних текстів. Purpose. Specify the peculiarities of the automated classification of texts written in the Ukrainian language. Results.BrUC is the only corpus of Ukrainian texts on open access, the texts of which can be used to develop algorithms and methods of classification of texts in the Ukrainian language.
issn 0130-5395
url https://nasplib.isofts.kiev.ua/handle/123456789/161575
citation_txt Тематическая классификация украиноязычных текстов, трудности ее внедрения / Е.А. Бобровник, К.К. Духновская, Н.В. Пирог // Управляющие системы и машины. — 2019. — № 1. — С. 41–51. — Бібліогр.: 12 назв. — рос.
work_keys_str_mv AT bobrovnikea tematičeskaâklassifikaciâukrainoâzyčnyhtekstovtrudnostieevnedreniâ
AT duhnovskaâkk tematičeskaâklassifikaciâukrainoâzyčnyhtekstovtrudnostieevnedreniâ
AT pirognv tematičeskaâklassifikaciâukrainoâzyčnyhtekstovtrudnostieevnedreniâ
AT bobrovnikea tematičnaklasifíkacíâukraínsʹkomovnihtekstivtrudnoŝííívprovadžennâ
AT duhnovskaâkk tematičnaklasifíkacíâukraínsʹkomovnihtekstivtrudnoŝííívprovadžennâ
AT pirognv tematičnaklasifíkacíâukraínsʹkomovnihtekstivtrudnoŝííívprovadžennâ
AT bobrovnikea thematicclassificationofukrainiantextsdifficultiesofitsintroductions
AT duhnovskaâkk thematicclassificationofukrainiantextsdifficultiesofitsintroductions
AT pirognv thematicclassificationofukrainiantextsdifficultiesofitsintroductions
first_indexed 2025-12-01T09:32:50Z
last_indexed 2025-12-01T09:32:50Z
_version_ 1850859797974351872