Автоматическое реферирование китайской правовой информации

Работа посвящена методу автоматического реферирования правовой информации, представленной на китайском языке. Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения уровня важности предложений - перейти к определению весовых значений отдельных иер...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Реєстрація, зберігання і обробка даних
Datum:2018
Hauptverfasser: Ландэ, Д., Цзыцзян Ян, Шивэй Чжу, Цзяньпин Го, Моцзи Вэй
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут проблем реєстрації інформації НАН України 2018
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/168766
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Автоматическое реферирование китайской правовой информации / Д. Ландэ, Цзыцзян Ян, Шивэй Чжу, Цзяньпин Го, Моцзи Вэй // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 3. — С. 67–82. — Бібліогр.: 20 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-168766
record_format dspace
spelling Ландэ, Д.
Цзыцзян Ян
Шивэй Чжу
Цзяньпин Го
Моцзи Вэй
2020-05-08T19:14:32Z
2020-05-08T19:14:32Z
2018
Автоматическое реферирование китайской правовой информации / Д. Ландэ, Цзыцзян Ян, Шивэй Чжу, Цзяньпин Го, Моцзи Вэй // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 3. — С. 67–82. — Бібліогр.: 20 назв. — рос.
1560-9189
DOI: https://doi.org/10.35681/1560-9189.2018.20.3.158214
https://nasplib.isofts.kiev.ua/handle/123456789/168766
004.44:002.513.5
Работа посвящена методу автоматического реферирования правовой информации, представленной на китайском языке. Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения уровня важности предложений - перейти к определению весовых значений отдельных иероглифов, а не слов в тексте документов и рефератов. Также предложено рассмотрение модели документов как сети предложений для выявления наиболее важных предложений по параметрам этой сети. Реализованы и испытаны различные методы автоматического реферирования. Показано применение двух оценок качества реферата без участия экспертов - косинусной меры и дивергениции Дженсена-Шеннона (Jensen-Shannon). Реферирование на основе предложенной сетевой модели документа оказалось лучшим по критериям косинусной меры и расстояния Дженсена-Шеннона для рефератов, объем которых превышает 2 предложения. Предложенный подход с учетом небольших изменений может использоваться для текстов произвольной тематики, в частности, научно-технической и новостной информации.
Роботу присвячено методу автоматичного реферування правової інформації, що представ-лено китайською мовою. Розглянуто модель реферату та процедуру його формування. Запропоно-вано два підходи, а саме, для визначення рівня важливості речень — перейти до визначення ваго-вих значень окремих ієрогліфів, а не слів у тексті документів і рефератів. Також запропоновано розгляд моделі документів як мережі із речень для виявлення найбільш важливих речень за пара-метрами цієї мережі. Реалізовано та випробувано різні методи автоматичного реферування. Пока-зано застосування двох оцінок якості реферату без участі експертів — косинусної міри і відстані Дженсена-Шеннона (Jensen-Shannon). Реферування на основі запропонованої мережевої моделі документа виявилося кращим за критеріями косинусної міри та відстані Дженсена-Шеннона для рефератів, обсяг яких перевищує 2 речення. Запропонований підхід з урахуванням невеликих змін може використовуватися для текстів довільної тематики, зокрема, науково-технічної та новинної інформації.
A method of automatic text summarization of the legal information provided in Chinese has been developed. The model of the abstract and the procedure of his formation are considered. Two ap-proaches are proposed, namely, to determine the level of importance of sentences, it was suggested to proceed to determine the weight values of separate hieroglyphs, rather than words in the text of documents and abstracts. Also consideration of model of documents as networks of sentences for detection of the most important sentences on parameters of this network has been offered. A new hybrid method of automatic text summarization, covering statistical and marker methods, as well as taking into account the location of sentences in the text of the document is introduced.
ru
Інститут проблем реєстрації інформації НАН України
Реєстрація, зберігання і обробка даних
Реєстрація, зберігання і обробка даних
Інформаційно-аналітичні системи обробки даних
Автоматическое реферирование китайской правовой информации
Автоматичне реферування китайської правової інформації
A method for public opinion-based formal description of weakly structured subject domains
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Автоматическое реферирование китайской правовой информации
spellingShingle Автоматическое реферирование китайской правовой информации
Ландэ, Д.
Цзыцзян Ян
Шивэй Чжу
Цзяньпин Го
Моцзи Вэй
Інформаційно-аналітичні системи обробки даних
title_short Автоматическое реферирование китайской правовой информации
title_full Автоматическое реферирование китайской правовой информации
title_fullStr Автоматическое реферирование китайской правовой информации
title_full_unstemmed Автоматическое реферирование китайской правовой информации
title_sort автоматическое реферирование китайской правовой информации
author Ландэ, Д.
Цзыцзян Ян
Шивэй Чжу
Цзяньпин Го
Моцзи Вэй
author_facet Ландэ, Д.
Цзыцзян Ян
Шивэй Чжу
Цзяньпин Го
Моцзи Вэй
topic Інформаційно-аналітичні системи обробки даних
topic_facet Інформаційно-аналітичні системи обробки даних
publishDate 2018
language Russian
container_title Реєстрація, зберігання і обробка даних
publisher Інститут проблем реєстрації інформації НАН України
format Article
title_alt Автоматичне реферування китайської правової інформації
A method for public opinion-based formal description of weakly structured subject domains
description Работа посвящена методу автоматического реферирования правовой информации, представленной на китайском языке. Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения уровня важности предложений - перейти к определению весовых значений отдельных иероглифов, а не слов в тексте документов и рефератов. Также предложено рассмотрение модели документов как сети предложений для выявления наиболее важных предложений по параметрам этой сети. Реализованы и испытаны различные методы автоматического реферирования. Показано применение двух оценок качества реферата без участия экспертов - косинусной меры и дивергениции Дженсена-Шеннона (Jensen-Shannon). Реферирование на основе предложенной сетевой модели документа оказалось лучшим по критериям косинусной меры и расстояния Дженсена-Шеннона для рефератов, объем которых превышает 2 предложения. Предложенный подход с учетом небольших изменений может использоваться для текстов произвольной тематики, в частности, научно-технической и новостной информации. Роботу присвячено методу автоматичного реферування правової інформації, що представ-лено китайською мовою. Розглянуто модель реферату та процедуру його формування. Запропоно-вано два підходи, а саме, для визначення рівня важливості речень — перейти до визначення ваго-вих значень окремих ієрогліфів, а не слів у тексті документів і рефератів. Також запропоновано розгляд моделі документів як мережі із речень для виявлення найбільш важливих речень за пара-метрами цієї мережі. Реалізовано та випробувано різні методи автоматичного реферування. Пока-зано застосування двох оцінок якості реферату без участі експертів — косинусної міри і відстані Дженсена-Шеннона (Jensen-Shannon). Реферування на основі запропонованої мережевої моделі документа виявилося кращим за критеріями косинусної міри та відстані Дженсена-Шеннона для рефератів, обсяг яких перевищує 2 речення. Запропонований підхід з урахуванням невеликих змін може використовуватися для текстів довільної тематики, зокрема, науково-технічної та новинної інформації. A method of automatic text summarization of the legal information provided in Chinese has been developed. The model of the abstract and the procedure of his formation are considered. Two ap-proaches are proposed, namely, to determine the level of importance of sentences, it was suggested to proceed to determine the weight values of separate hieroglyphs, rather than words in the text of documents and abstracts. Also consideration of model of documents as networks of sentences for detection of the most important sentences on parameters of this network has been offered. A new hybrid method of automatic text summarization, covering statistical and marker methods, as well as taking into account the location of sentences in the text of the document is introduced.
issn 1560-9189
url https://nasplib.isofts.kiev.ua/handle/123456789/168766
citation_txt Автоматическое реферирование китайской правовой информации / Д. Ландэ, Цзыцзян Ян, Шивэй Чжу, Цзяньпин Го, Моцзи Вэй // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 3. — С. 67–82. — Бібліогр.: 20 назв. — рос.
work_keys_str_mv AT landéd avtomatičeskoereferirovaniekitaiskoipravovoiinformacii
AT czyczânân avtomatičeskoereferirovaniekitaiskoipravovoiinformacii
AT šivéičžu avtomatičeskoereferirovaniekitaiskoipravovoiinformacii
AT czânʹpingo avtomatičeskoereferirovaniekitaiskoipravovoiinformacii
AT moczivéi avtomatičeskoereferirovaniekitaiskoipravovoiinformacii
AT landéd avtomatičnereferuvannâkitaisʹkoípravovoíínformacíí
AT czyczânân avtomatičnereferuvannâkitaisʹkoípravovoíínformacíí
AT šivéičžu avtomatičnereferuvannâkitaisʹkoípravovoíínformacíí
AT czânʹpingo avtomatičnereferuvannâkitaisʹkoípravovoíínformacíí
AT moczivéi avtomatičnereferuvannâkitaisʹkoípravovoíínformacíí
AT landéd amethodforpublicopinionbasedformaldescriptionofweaklystructuredsubjectdomains
AT czyczânân amethodforpublicopinionbasedformaldescriptionofweaklystructuredsubjectdomains
AT šivéičžu amethodforpublicopinionbasedformaldescriptionofweaklystructuredsubjectdomains
AT czânʹpingo amethodforpublicopinionbasedformaldescriptionofweaklystructuredsubjectdomains
AT moczivéi amethodforpublicopinionbasedformaldescriptionofweaklystructuredsubjectdomains
first_indexed 2025-12-07T16:50:49Z
last_indexed 2025-12-07T16:50:49Z
_version_ 1850869022462050304