Аналіз методів машинного навчання в задачі класифікації документів

Публікація досліджує методи класифікації документів за наявністю печатки. Для цього, по-перше, проаналізовано вже існуючі методи вирішення поставленої проблеми; по-друге, запропоновано модель згорткової нейронної мережі для класифікації документів; по-третє, відображено залежність коректності роботи...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2020
Автори: Жиркова, А.П., Ігнатенко, О.П.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут програмних систем НАН України 2020
Назва видання:Проблеми програмування
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/180496
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Аналіз методів машинного навчання в задачі класифікації документів / А.П. Жиркова, О.П. Ігнатенко // Проблеми програмування. — 2020. — № 4. — С. 81-87. — Бібліогр.: 8 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-180496
record_format dspace
spelling irk-123456789-1804962021-10-01T01:25:46Z Аналіз методів машинного навчання в задачі класифікації документів Жиркова, А.П. Ігнатенко, О.П. Моделі та методи машинного навчання Публікація досліджує методи класифікації документів за наявністю печатки. Для цього, по-перше, проаналізовано вже існуючі методи вирішення поставленої проблеми; по-друге, запропоновано модель згорткової нейронної мережі для класифікації документів; по-третє, відображено залежність коректності роботи нейронної мережі від кількості вхідних даних, на яких навчається модель. В результаті отримано нейронну мережу, що класифікує документи за наявністю печатки з точністю трохи більше ніж 88 %. Публикация рассматривает методы классификации документов по наличию в них печати. Для этого проанализировано уже существующие методы решения данной задачи, предложено модель сверточной нейронной сети для классификации документов, а также отображено зависимость корректности работы нейронной сети от количества входных данных, на которых обучается модель. В результате получено нейронную сеть, которая классифицирует документы по наличию печати с точностью немного больше 88 %. Current situation with official documentary in the world, and especially in Ukraine, requires tools for electronical processing. One of the main tasks at this field is seal (or stamp) detection, which leads to documents classification based on mentioned criterion. Current article analyzes some of existed methods to resolve the problem, describes a new approach to classify documentary and reflects dependence of model accuracy to input data amount. As a result of this work is a convolutional neural network that classify 708 out of 804 images of official documents correctly. A corresponded percentage of model accuracy is 88.03, despite the fact of bias presence in input data. 2020 Article Аналіз методів машинного навчання в задачі класифікації документів / А.П. Жиркова, О.П. Ігнатенко // Проблеми програмування. — 2020. — № 4. — С. 81-87. — Бібліогр.: 8 назв. — укр. 1727-4907 DOI: https://doi.org/10.15407/pp2020.04.081 http://dspace.nbuv.gov.ua/handle/123456789/180496 004.85 uk Проблеми програмування Інститут програмних систем НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
topic Моделі та методи машинного навчання
Моделі та методи машинного навчання
spellingShingle Моделі та методи машинного навчання
Моделі та методи машинного навчання
Жиркова, А.П.
Ігнатенко, О.П.
Аналіз методів машинного навчання в задачі класифікації документів
Проблеми програмування
description Публікація досліджує методи класифікації документів за наявністю печатки. Для цього, по-перше, проаналізовано вже існуючі методи вирішення поставленої проблеми; по-друге, запропоновано модель згорткової нейронної мережі для класифікації документів; по-третє, відображено залежність коректності роботи нейронної мережі від кількості вхідних даних, на яких навчається модель. В результаті отримано нейронну мережу, що класифікує документи за наявністю печатки з точністю трохи більше ніж 88 %.
format Article
author Жиркова, А.П.
Ігнатенко, О.П.
author_facet Жиркова, А.П.
Ігнатенко, О.П.
author_sort Жиркова, А.П.
title Аналіз методів машинного навчання в задачі класифікації документів
title_short Аналіз методів машинного навчання в задачі класифікації документів
title_full Аналіз методів машинного навчання в задачі класифікації документів
title_fullStr Аналіз методів машинного навчання в задачі класифікації документів
title_full_unstemmed Аналіз методів машинного навчання в задачі класифікації документів
title_sort аналіз методів машинного навчання в задачі класифікації документів
publisher Інститут програмних систем НАН України
publishDate 2020
topic_facet Моделі та методи машинного навчання
url http://dspace.nbuv.gov.ua/handle/123456789/180496
citation_txt Аналіз методів машинного навчання в задачі класифікації документів / А.П. Жиркова, О.П. Ігнатенко // Проблеми програмування. — 2020. — № 4. — С. 81-87. — Бібліогр.: 8 назв. — укр.
series Проблеми програмування
work_keys_str_mv AT žirkovaap analízmetodívmašinnogonavčannâvzadačíklasifíkacíídokumentív
AT ígnatenkoop analízmetodívmašinnogonavčannâvzadačíklasifíkacíídokumentív
first_indexed 2023-10-18T22:50:08Z
last_indexed 2023-10-18T22:50:08Z
_version_ 1796156559781265408