Аналіз методів машинного навчання в задачі класифікації документів

Публікація досліджує методи класифікації документів за наявністю печатки. Для цього, по-перше, проаналізовано вже існуючі методи вирішення поставленої проблеми; по-друге, запропоновано модель згорткової нейронної мережі для класифікації документів; по-третє, відображено залежність коректності роботи...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Проблеми програмування
Datum:2020
Hauptverfasser: Жиркова, А.П., Ігнатенко, О.П.
Format: Artikel
Sprache:Ukrainisch
Veröffentlicht: Інститут програмних систем НАН України 2020
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/180496
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Аналіз методів машинного навчання в задачі класифікації документів / А.П. Жиркова, О.П. Ігнатенко // Проблеми програмування. — 2020. — № 4. — С. 81-87. — Бібліогр.: 8 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1862596857756123136
author Жиркова, А.П.
Ігнатенко, О.П.
author_facet Жиркова, А.П.
Ігнатенко, О.П.
citation_txt Аналіз методів машинного навчання в задачі класифікації документів / А.П. Жиркова, О.П. Ігнатенко // Проблеми програмування. — 2020. — № 4. — С. 81-87. — Бібліогр.: 8 назв. — укр.
collection DSpace DC
container_title Проблеми програмування
description Публікація досліджує методи класифікації документів за наявністю печатки. Для цього, по-перше, проаналізовано вже існуючі методи вирішення поставленої проблеми; по-друге, запропоновано модель згорткової нейронної мережі для класифікації документів; по-третє, відображено залежність коректності роботи нейронної мережі від кількості вхідних даних, на яких навчається модель. В результаті отримано нейронну мережу, що класифікує документи за наявністю печатки з точністю трохи більше ніж 88 %. Публикация рассматривает методы классификации документов по наличию в них печати. Для этого проанализировано уже существующие методы решения данной задачи, предложено модель сверточной нейронной сети для классификации документов, а также отображено зависимость корректности работы нейронной сети от количества входных данных, на которых обучается модель. В результате получено нейронную сеть, которая классифицирует документы по наличию печати с точностью немного больше 88 %. Current situation with official documentary in the world, and especially in Ukraine, requires tools for electronical processing. One of the main tasks at this field is seal (or stamp) detection, which leads to documents classification based on mentioned criterion. Current article analyzes some of existed methods to resolve the problem, describes a new approach to classify documentary and reflects dependence of model accuracy to input data amount. As a result of this work is a convolutional neural network that classify 708 out of 804 images of official documents correctly. A corresponded percentage of model accuracy is 88.03, despite the fact of bias presence in input data.
first_indexed 2025-11-27T16:04:48Z
format Article
fulltext
id nasplib_isofts_kiev_ua-123456789-180496
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1727-4907
language Ukrainian
last_indexed 2025-11-27T16:04:48Z
publishDate 2020
publisher Інститут програмних систем НАН України
record_format dspace
spelling Жиркова, А.П.
Ігнатенко, О.П.
2021-09-30T18:44:52Z
2021-09-30T18:44:52Z
2020
Аналіз методів машинного навчання в задачі класифікації документів / А.П. Жиркова, О.П. Ігнатенко // Проблеми програмування. — 2020. — № 4. — С. 81-87. — Бібліогр.: 8 назв. — укр.
1727-4907
DOI: https://doi.org/10.15407/pp2020.04.081
https://nasplib.isofts.kiev.ua/handle/123456789/180496
004.85
Публікація досліджує методи класифікації документів за наявністю печатки. Для цього, по-перше, проаналізовано вже існуючі методи вирішення поставленої проблеми; по-друге, запропоновано модель згорткової нейронної мережі для класифікації документів; по-третє, відображено залежність коректності роботи нейронної мережі від кількості вхідних даних, на яких навчається модель. В результаті отримано нейронну мережу, що класифікує документи за наявністю печатки з точністю трохи більше ніж 88 %.
Публикация рассматривает методы классификации документов по наличию в них печати. Для этого проанализировано уже существующие методы решения данной задачи, предложено модель сверточной нейронной сети для классификации документов, а также отображено зависимость корректности работы нейронной сети от количества входных данных, на которых обучается модель. В результате получено нейронную сеть, которая классифицирует документы по наличию печати с точностью немного больше 88 %.
Current situation with official documentary in the world, and especially in Ukraine, requires tools for electronical processing. One of the main tasks at this field is seal (or stamp) detection, which leads to documents classification based on mentioned criterion. Current article analyzes some of existed methods to resolve the problem, describes a new approach to classify documentary and reflects dependence of model accuracy to input data amount. As a result of this work is a convolutional neural network that classify 708 out of 804 images of official documents correctly. A corresponded percentage of model accuracy is 88.03, despite the fact of bias presence in input data.
uk
Інститут програмних систем НАН України
Проблеми програмування
Моделі та методи машинного навчання
Аналіз методів машинного навчання в задачі класифікації документів
Анализ методов машинного обучения в задачах классификации документов
Machine learning methods analysis in the document classification problem
Article
published earlier
spellingShingle Аналіз методів машинного навчання в задачі класифікації документів
Жиркова, А.П.
Ігнатенко, О.П.
Моделі та методи машинного навчання
title Аналіз методів машинного навчання в задачі класифікації документів
title_alt Анализ методов машинного обучения в задачах классификации документов
Machine learning methods analysis in the document classification problem
title_full Аналіз методів машинного навчання в задачі класифікації документів
title_fullStr Аналіз методів машинного навчання в задачі класифікації документів
title_full_unstemmed Аналіз методів машинного навчання в задачі класифікації документів
title_short Аналіз методів машинного навчання в задачі класифікації документів
title_sort аналіз методів машинного навчання в задачі класифікації документів
topic Моделі та методи машинного навчання
topic_facet Моделі та методи машинного навчання
url https://nasplib.isofts.kiev.ua/handle/123456789/180496
work_keys_str_mv AT žirkovaap analízmetodívmašinnogonavčannâvzadačíklasifíkacíídokumentív
AT ígnatenkoop analízmetodívmašinnogonavčannâvzadačíklasifíkacíídokumentív
AT žirkovaap analizmetodovmašinnogoobučeniâvzadačahklassifikaciidokumentov
AT ígnatenkoop analizmetodovmašinnogoobučeniâvzadačahklassifikaciidokumentov
AT žirkovaap machinelearningmethodsanalysisinthedocumentclassificationproblem
AT ígnatenkoop machinelearningmethodsanalysisinthedocumentclassificationproblem