Аналіз методів машинного навчання в задачі класифікації документів
Публікація досліджує методи класифікації документів за наявністю печатки. Для цього, по-перше, проаналізовано вже існуючі методи вирішення поставленої проблеми; по-друге, запропоновано модель згорткової нейронної мережі для класифікації документів; по-третє, відображено залежність коректності роботи...
Saved in:
| Published in: | Проблеми програмування |
|---|---|
| Date: | 2020 |
| Main Authors: | , |
| Format: | Article |
| Language: | Ukrainian |
| Published: |
Інститут програмних систем НАН України
2020
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/180496 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Аналіз методів машинного навчання в задачі класифікації документів / А.П. Жиркова, О.П. Ігнатенко // Проблеми програмування. — 2020. — № 4. — С. 81-87. — Бібліогр.: 8 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1862596857756123136 |
|---|---|
| author | Жиркова, А.П. Ігнатенко, О.П. |
| author_facet | Жиркова, А.П. Ігнатенко, О.П. |
| citation_txt | Аналіз методів машинного навчання в задачі класифікації документів / А.П. Жиркова, О.П. Ігнатенко // Проблеми програмування. — 2020. — № 4. — С. 81-87. — Бібліогр.: 8 назв. — укр. |
| collection | DSpace DC |
| container_title | Проблеми програмування |
| description | Публікація досліджує методи класифікації документів за наявністю печатки. Для цього, по-перше, проаналізовано вже існуючі методи вирішення поставленої проблеми; по-друге, запропоновано модель згорткової нейронної мережі для класифікації документів; по-третє, відображено залежність коректності роботи нейронної мережі від кількості вхідних даних, на яких навчається модель. В результаті отримано нейронну мережу, що класифікує документи за наявністю печатки з точністю трохи більше ніж 88 %.
Публикация рассматривает методы классификации документов по наличию в них печати. Для этого проанализировано уже существующие методы решения данной задачи, предложено модель сверточной нейронной сети для классификации документов, а также отображено зависимость корректности работы нейронной сети от количества входных данных, на которых обучается модель. В результате получено нейронную сеть, которая классифицирует документы по наличию печати с точностью немного больше 88 %.
Current situation with official documentary in the world, and especially in Ukraine, requires tools for electronical processing. One of the main tasks at this field is seal (or stamp) detection, which leads to documents classification based on mentioned criterion. Current article analyzes some of existed methods to resolve the problem, describes a new approach to classify documentary and reflects dependence of model accuracy to input data amount. As a result of this work is a convolutional neural network that classify 708 out of 804 images of official documents correctly. A corresponded percentage of model accuracy is 88.03, despite the fact of bias presence in input data.
|
| first_indexed | 2025-11-27T16:04:48Z |
| format | Article |
| fulltext | |
| id | nasplib_isofts_kiev_ua-123456789-180496 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1727-4907 |
| language | Ukrainian |
| last_indexed | 2025-11-27T16:04:48Z |
| publishDate | 2020 |
| publisher | Інститут програмних систем НАН України |
| record_format | dspace |
| spelling | Жиркова, А.П. Ігнатенко, О.П. 2021-09-30T18:44:52Z 2021-09-30T18:44:52Z 2020 Аналіз методів машинного навчання в задачі класифікації документів / А.П. Жиркова, О.П. Ігнатенко // Проблеми програмування. — 2020. — № 4. — С. 81-87. — Бібліогр.: 8 назв. — укр. 1727-4907 DOI: https://doi.org/10.15407/pp2020.04.081 https://nasplib.isofts.kiev.ua/handle/123456789/180496 004.85 Публікація досліджує методи класифікації документів за наявністю печатки. Для цього, по-перше, проаналізовано вже існуючі методи вирішення поставленої проблеми; по-друге, запропоновано модель згорткової нейронної мережі для класифікації документів; по-третє, відображено залежність коректності роботи нейронної мережі від кількості вхідних даних, на яких навчається модель. В результаті отримано нейронну мережу, що класифікує документи за наявністю печатки з точністю трохи більше ніж 88 %. Публикация рассматривает методы классификации документов по наличию в них печати. Для этого проанализировано уже существующие методы решения данной задачи, предложено модель сверточной нейронной сети для классификации документов, а также отображено зависимость корректности работы нейронной сети от количества входных данных, на которых обучается модель. В результате получено нейронную сеть, которая классифицирует документы по наличию печати с точностью немного больше 88 %. Current situation with official documentary in the world, and especially in Ukraine, requires tools for electronical processing. One of the main tasks at this field is seal (or stamp) detection, which leads to documents classification based on mentioned criterion. Current article analyzes some of existed methods to resolve the problem, describes a new approach to classify documentary and reflects dependence of model accuracy to input data amount. As a result of this work is a convolutional neural network that classify 708 out of 804 images of official documents correctly. A corresponded percentage of model accuracy is 88.03, despite the fact of bias presence in input data. uk Інститут програмних систем НАН України Проблеми програмування Моделі та методи машинного навчання Аналіз методів машинного навчання в задачі класифікації документів Анализ методов машинного обучения в задачах классификации документов Machine learning methods analysis in the document classification problem Article published earlier |
| spellingShingle | Аналіз методів машинного навчання в задачі класифікації документів Жиркова, А.П. Ігнатенко, О.П. Моделі та методи машинного навчання |
| title | Аналіз методів машинного навчання в задачі класифікації документів |
| title_alt | Анализ методов машинного обучения в задачах классификации документов Machine learning methods analysis in the document classification problem |
| title_full | Аналіз методів машинного навчання в задачі класифікації документів |
| title_fullStr | Аналіз методів машинного навчання в задачі класифікації документів |
| title_full_unstemmed | Аналіз методів машинного навчання в задачі класифікації документів |
| title_short | Аналіз методів машинного навчання в задачі класифікації документів |
| title_sort | аналіз методів машинного навчання в задачі класифікації документів |
| topic | Моделі та методи машинного навчання |
| topic_facet | Моделі та методи машинного навчання |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/180496 |
| work_keys_str_mv | AT žirkovaap analízmetodívmašinnogonavčannâvzadačíklasifíkacíídokumentív AT ígnatenkoop analízmetodívmašinnogonavčannâvzadačíklasifíkacíídokumentív AT žirkovaap analizmetodovmašinnogoobučeniâvzadačahklassifikaciidokumentov AT ígnatenkoop analizmetodovmašinnogoobučeniâvzadačahklassifikaciidokumentov AT žirkovaap machinelearningmethodsanalysisinthedocumentclassificationproblem AT ígnatenkoop machinelearningmethodsanalysisinthedocumentclassificationproblem |