A method for extracting data from semis-tructured documents
Linguistic method to solve the problem of data extraction from weakly structured documents is developed, approved, and described in detail in the paper. Sample data were taken from thesis catalogue of Vernadsky National Library of Ukraine. The sequence of all stages is described: document collection...
Збережено в:
| Дата: | 2020 |
|---|---|
| Автори: | Kudim, K.A., Proskudina, G.Yu. |
| Формат: | Стаття |
| Мова: | Російська |
| Опубліковано: |
PROBLEMS IN PROGRAMMING
2020
|
| Теми: | |
| Онлайн доступ: | https://pp.isofts.kiev.ua/index.php/ojs1/article/view/388 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Problems in programming |
| Завантажити файл: | |
Репозитарії
Problems in programmingСхожі ресурси
Methods and tools for extracting personal data from theses abstracts
за авторством: Kudim, K.A., та інші
Опубліковано: (2019)
за авторством: Kudim, K.A., та інші
Опубліковано: (2019)
Extracting structure from text documents based on machine learning
за авторством: Kudim, K.A., та інші
Опубліковано: (2023)
за авторством: Kudim, K.A., та інші
Опубліковано: (2023)
About technologies of use of external data on creating and editing of encyclopedic texts
за авторством: Proskudina, G.Yu., та інші
Опубліковано: (2018)
за авторством: Proskudina, G.Yu., та інші
Опубліковано: (2018)
Overview of global open access resource aggregation services and their requirements for data providers
за авторством: Proskudina, G.Yu., та інші
Опубліковано: (2025)
за авторством: Proskudina, G.Yu., та інші
Опубліковано: (2025)
Global open access resource aggregation services and their requirements for data providers
за авторством: Proskudina, G.Yu., та інші
Опубліковано: (2024)
за авторством: Proskudina, G.Yu., та інші
Опубліковано: (2024)
Decompositional Extraction and Retrieval of Conceptual Knowledge
за авторством: Terletskyi, D.O., та інші
Опубліковано: (2023)
за авторством: Terletskyi, D.O., та інші
Опубліковано: (2023)
Mixed topic-entity ontology for enhanced topic vector-spaced model
за авторством: Shabinskiy, A.S.
Опубліковано: (2025)
за авторством: Shabinskiy, A.S.
Опубліковано: (2025)
A method of tuning programs on .Net platform with rewriting rules
за авторством: Mamedov, T.A., та інші
Опубліковано: (2019)
за авторством: Mamedov, T.A., та інші
Опубліковано: (2019)
CREATING THE RT-32 RADIO TELESCOPE ON THE BASIC OF MARK-4B ANTENNA SYSTEM. 2. ESTIMATION OF THE POSSIBILITY FOR MAKING SPECTRAL OBSERVATIONS OF RADIO ASTRONOMICAL OBJECTS
за авторством: Antyufeyev, A. V., та інші
Опубліковано: (2019)
за авторством: Antyufeyev, A. V., та інші
Опубліковано: (2019)
INTERSTELLAR MEDIUM AND DECAMETER RADIO SPECTROSCOPY
за авторством: Stepkin, S. V., та інші
Опубліковано: (2021)
за авторством: Stepkin, S. V., та інші
Опубліковано: (2021)
Use of domain ontology for homonymy clarification into the natural language texts
за авторством: Lesko, O.N., та інші
Опубліковано: (2018)
за авторством: Lesko, O.N., та інші
Опубліковано: (2018)
Actual problems of long-term preservation of documentation in insurance fund of documentation of Ukraine
за авторством: Podorozhnyi, V. I.
Опубліковано: (2016)
за авторством: Podorozhnyi, V. I.
Опубліковано: (2016)
Review of methods of events extraction «from the stream of news»
за авторством: Pryshchepa, S. V.
Опубліковано: (2015)
за авторством: Pryshchepa, S. V.
Опубліковано: (2015)
Automated extraction of structured information from a variety of web pages
за авторством: Pogorilyy, S.D., та інші
Опубліковано: (2018)
за авторством: Pogorilyy, S.D., та інші
Опубліковано: (2018)
Analysis of formal models and standards for structured electronic document in corporate informational system
за авторством: Sharypanov, A.V., та інші
Опубліковано: (2018)
за авторством: Sharypanov, A.V., та інші
Опубліковано: (2018)
The technology of new events extraction on a defined topic from Twitter social network
за авторством: Pryshchepa, S. V.
Опубліковано: (2017)
за авторством: Pryshchepa, S. V.
Опубліковано: (2017)
The definition of formal languages in the meta language of normal forms of knowledge
за авторством: Kurgaev, A.F., та інші
Опубліковано: (2018)
за авторством: Kurgaev, A.F., та інші
Опубліковано: (2018)
The main functional blocks of the test bench for the archival electronic documents validation
за авторством: Melaschenko, A.O., та інші
Опубліковано: (2018)
за авторством: Melaschenko, A.O., та інші
Опубліковано: (2018)
A method for extracting data from semistructured documents
за авторством: K. A. Kudim, та інші
Опубліковано: (2020)
за авторством: K. A. Kudim, та інші
Опубліковано: (2020)
Satellite monitoring for the areas of illegal extraction of amber
за авторством: Filipovich, Volodymyr
Опубліковано: (2015)
за авторством: Filipovich, Volodymyr
Опубліковано: (2015)
UWN: The ontological basе of knowledge of the Ukrainian language
за авторством: Anisіmov, A.V., та інші
Опубліковано: (2015)
за авторством: Anisіmov, A.V., та інші
Опубліковано: (2015)
PROSPECTS TO THERMAL WATERS EXTRACTION AT ILLICHIVSK OF ODESA REGION
за авторством: DIDKIVSKA, G.G., та інші
Опубліковано: (2013)
за авторством: DIDKIVSKA, G.G., та інші
Опубліковано: (2013)
On equivalence of some subcategories of modules in Morita contexts
за авторством: Kashu, A. I.
Опубліковано: (2018)
за авторством: Kashu, A. I.
Опубліковано: (2018)
Estimation Method for Compatibility of Normative Documents
за авторством: Mezentsev, O. V.
Опубліковано: (2014)
за авторством: Mezentsev, O. V.
Опубліковано: (2014)
The implementation of legal electronic documents
за авторством: Melaschenko, A.O., та інші
Опубліковано: (2015)
за авторством: Melaschenko, A.O., та інші
Опубліковано: (2015)
Anti-proliferative effects of a blueberry extract on a panel of tumor cell lines of different origin
за авторством: Lamdan, H., та інші
Опубліковано: (2023)
за авторством: Lamdan, H., та інші
Опубліковано: (2023)
Performance analysis of a new LP stage located upstream the extraction point in a 225 MW turbine
за авторством: Шиманяк, М., та інші
Опубліковано: (2016)
за авторством: Шиманяк, М., та інші
Опубліковано: (2016)
Performance analysis of a new LP stage located upstream the extraction point in a 225 MW turbine
за авторством: Шиманяк, М., та інші
Опубліковано: (2016)
за авторством: Шиманяк, М., та інші
Опубліковано: (2016)
Semantic approach to automated formation of information security systems documentation
за авторством: Bova, Yu.V., та інші
Опубліковано: (2026)
за авторством: Bova, Yu.V., та інші
Опубліковано: (2026)
Ontological similar systems for analysis of texts of natural language
за авторством: Kryvyi, S.L., та інші
Опубліковано: (2018)
за авторством: Kryvyi, S.L., та інші
Опубліковано: (2018)
Metastatic cardiac tumors: literature review and own observation of testicular tumor metastasis in the right ventricle of the heart
за авторством: Zakhartseva, L.M., та інші
Опубліковано: (2018)
за авторством: Zakhartseva, L.M., та інші
Опубліковано: (2018)
Some issues of registration and reproduction of information touching upon objects of material and spiritual culture using technologies of the state insurance documentation fund of Ukraine.
за авторством: Babenko, V. V., та інші
Опубліковано: (2019)
за авторством: Babenko, V. V., та інші
Опубліковано: (2019)
Development support system formation and analysis of annual reports of institutions of NAS of Ukraine
за авторством: Tverdokhlib, Ye.M., та інші
Опубліковано: (2017)
за авторством: Tverdokhlib, Ye.M., та інші
Опубліковано: (2017)
Scientific documents metadata as a component of the system of the “open science” information resources
за авторством: Zakharova, O.V.
Опубліковано: (2023)
за авторством: Zakharova, O.V.
Опубліковано: (2023)
PECULIARITIES OF FORMING OF COAL SEAMS OF DEEP HORIZONS OF LVIV-VOLUN BASIN.Paper 2. Visean coal seam ʋ03
за авторством: SHULGA, V.F., та інші
Опубліковано: (2013)
за авторством: SHULGA, V.F., та інші
Опубліковано: (2013)
Antiproliferative and apoptotic effect of ethanolic extract of Calocybe indica on PANC-1 and MIAPaCa2 cell lines of pancreatic cancer
за авторством: Ghosh, S.K., та інші
Опубліковано: (2023)
за авторством: Ghosh, S.K., та інші
Опубліковано: (2023)
Methods and tools for extracting personal data from theses abstracts
за авторством: K. A. Kudim, та інші
Опубліковано: (2019)
за авторством: K. A. Kudim, та інші
Опубліковано: (2019)
On algebraic graph theory and non-bijective multivariate maps in cryptography
за авторством: Ustimenko, Vasyl
Опубліковано: (2015)
за авторством: Ustimenko, Vasyl
Опубліковано: (2015)
Fuzzy system for determining the quality of digital images of documents to be microfilmed
за авторством: Egorov, P. N.
Опубліковано: (2016)
за авторством: Egorov, P. N.
Опубліковано: (2016)
Automation of solving planimetry problems written in Ukrainian
за авторством: Zhezherun, O.P., та інші
Опубліковано: (2021)
за авторством: Zhezherun, O.P., та інші
Опубліковано: (2021)
Схожі ресурси
-
Methods and tools for extracting personal data from theses abstracts
за авторством: Kudim, K.A., та інші
Опубліковано: (2019) -
Extracting structure from text documents based on machine learning
за авторством: Kudim, K.A., та інші
Опубліковано: (2023) -
About technologies of use of external data on creating and editing of encyclopedic texts
за авторством: Proskudina, G.Yu., та інші
Опубліковано: (2018) -
Overview of global open access resource aggregation services and their requirements for data providers
за авторством: Proskudina, G.Yu., та інші
Опубліковано: (2025) -
Global open access resource aggregation services and their requirements for data providers
за авторством: Proskudina, G.Yu., та інші
Опубліковано: (2024)