Тематическая классификация украиноязычных текстов, трудности ее внедрения
Построены классификаторы украиноязычных текстов методами Random Forest Classifier, Support Vector Machines, Naive Bayes Сlassifier.и Logistic Regression. Для тренировки этих классификаторов использовался метод контролированного обучения. Суть этого метода заключается в том, что для обучения использу...
Збережено в:
Дата: | 2019 |
---|---|
Автори: | , , |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
2019
|
Назва видання: | Управляющие системы и машины |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/161575 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Тематическая классификация украиноязычных текстов, трудности ее внедрения / Е.А. Бобровник, К.К. Духновская, Н.В. Пирог // Управляющие системы и машины. — 2019. — № 1. — С. 41–51. — Бібліогр.: 12 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-161575 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1615752019-12-15T01:25:44Z Тематическая классификация украиноязычных текстов, трудности ее внедрения Бобровник, Е.А. Духновская, К.К. Пирог, Н.В. Интеллектуальные информационные технологии и системы Построены классификаторы украиноязычных текстов методами Random Forest Classifier, Support Vector Machines, Naive Bayes Сlassifier.и Logistic Regression. Для тренировки этих классификаторов использовался метод контролированного обучения. Суть этого метода заключается в том, что для обучения используется уже готовый классифицированный набор текстов, в качестве которого выступают тексты Брауновский корпуса украинского языка. Лучшие результаты показала модель для классификации украиноязычных текстов на основе метода опорных векторов. Ее средняя точность — 0,80. Мета роботи — визначити особливості автоматичної класифікації текстів, поданих на українській мові. Результати. БрУК — єдиний корпус українських текстів у відкритому доступі, тексти якого можна використовувати для розробки алгоритмів і методів класифікації українськомовних текстів. Purpose. Specify the peculiarities of the automated classification of texts written in the Ukrainian language. Results.BrUC is the only corpus of Ukrainian texts on open access, the texts of which can be used to develop algorithms and methods of classification of texts in the Ukrainian language. 2019 Article Тематическая классификация украиноязычных текстов, трудности ее внедрения / Е.А. Бобровник, К.К. Духновская, Н.В. Пирог // Управляющие системы и машины. — 2019. — № 1. — С. 41–51. — Бібліогр.: 12 назв. — рос. 0130-5395 DOI: https://doi.org/10.15407/usim.2019.01.041 http://dspace.nbuv.gov.ua/handle/123456789/161575 004.04.043; 004.912; 004.62 ru Управляющие системы и машины Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Интеллектуальные информационные технологии и системы Интеллектуальные информационные технологии и системы |
spellingShingle |
Интеллектуальные информационные технологии и системы Интеллектуальные информационные технологии и системы Бобровник, Е.А. Духновская, К.К. Пирог, Н.В. Тематическая классификация украиноязычных текстов, трудности ее внедрения Управляющие системы и машины |
description |
Построены классификаторы украиноязычных текстов методами Random Forest Classifier, Support Vector Machines, Naive Bayes Сlassifier.и Logistic Regression. Для тренировки этих классификаторов использовался метод контролированного обучения. Суть этого метода заключается в том, что для обучения используется уже готовый классифицированный набор текстов, в качестве которого выступают тексты Брауновский корпуса украинского языка. Лучшие результаты показала модель для классификации украиноязычных текстов на основе метода опорных векторов. Ее средняя точность — 0,80. |
format |
Article |
author |
Бобровник, Е.А. Духновская, К.К. Пирог, Н.В. |
author_facet |
Бобровник, Е.А. Духновская, К.К. Пирог, Н.В. |
author_sort |
Бобровник, Е.А. |
title |
Тематическая классификация украиноязычных текстов, трудности ее внедрения |
title_short |
Тематическая классификация украиноязычных текстов, трудности ее внедрения |
title_full |
Тематическая классификация украиноязычных текстов, трудности ее внедрения |
title_fullStr |
Тематическая классификация украиноязычных текстов, трудности ее внедрения |
title_full_unstemmed |
Тематическая классификация украиноязычных текстов, трудности ее внедрения |
title_sort |
тематическая классификация украиноязычных текстов, трудности ее внедрения |
publisher |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України |
publishDate |
2019 |
topic_facet |
Интеллектуальные информационные технологии и системы |
url |
http://dspace.nbuv.gov.ua/handle/123456789/161575 |
citation_txt |
Тематическая классификация украиноязычных текстов, трудности ее внедрения / Е.А. Бобровник, К.К. Духновская, Н.В. Пирог // Управляющие системы и машины. — 2019. — № 1. — С. 41–51. — Бібліогр.: 12 назв. — рос. |
series |
Управляющие системы и машины |
work_keys_str_mv |
AT bobrovnikea tematičeskaâklassifikaciâukrainoâzyčnyhtekstovtrudnostieevnedreniâ AT duhnovskaâkk tematičeskaâklassifikaciâukrainoâzyčnyhtekstovtrudnostieevnedreniâ AT pirognv tematičeskaâklassifikaciâukrainoâzyčnyhtekstovtrudnostieevnedreniâ |
first_indexed |
2023-06-10T11:11:48Z |
last_indexed |
2023-06-10T11:11:48Z |
_version_ |
1796154687187058688 |