Тематическая классификация украиноязычных текстов, трудности ее внедрения

Построены классификаторы украиноязычных текстов методами Random Forest Classifier, Support Vector Machines, Naive Bayes Сlassifier.и Logistic Regression. Для тренировки этих классификаторов использовался метод контролированного обучения. Суть этого метода заключается в том, что для обучения использу...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Управляющие системы и машины
Дата:2019
Автори: Бобровник, Е.А., Духновская, К.К., Пирог, Н.В.
Формат: Стаття
Мова:Russian
Опубліковано: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України 2019
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/161575
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Тематическая классификация украиноязычных текстов, трудности ее внедрения / Е.А. Бобровник, К.К. Духновская, Н.В. Пирог // Управляющие системы и машины. — 2019. — № 1. — С. 41–51. — Бібліогр.: 12 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Опис
Резюме:Построены классификаторы украиноязычных текстов методами Random Forest Classifier, Support Vector Machines, Naive Bayes Сlassifier.и Logistic Regression. Для тренировки этих классификаторов использовался метод контролированного обучения. Суть этого метода заключается в том, что для обучения используется уже готовый классифицированный набор текстов, в качестве которого выступают тексты Брауновский корпуса украинского языка. Лучшие результаты показала модель для классификации украиноязычных текстов на основе метода опорных векторов. Ее средняя точность — 0,80. Мета роботи — визначити особливості автоматичної класифікації текстів, поданих на українській мові. Результати. БрУК — єдиний корпус українських текстів у відкритому доступі, тексти якого можна використовувати для розробки алгоритмів і методів класифікації українськомовних текстів. Purpose. Specify the peculiarities of the automated classification of texts written in the Ukrainian language. Results.BrUC is the only corpus of Ukrainian texts on open access, the texts of which can be used to develop algorithms and methods of classification of texts in the Ukrainian language.
ISSN:0130-5395