Автоматическое реферирование китайской правовой информации
Работа посвящена методу автоматического реферирования правовой информации, представленной на китайском языке. Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения уровня важности предложений - перейти к определению весовых значений отдельных иер...
Gespeichert in:
| Veröffentlicht in: | Реєстрація, зберігання і обробка даних |
|---|---|
| Datum: | 2018 |
| Hauptverfasser: | , , , , |
| Format: | Artikel |
| Sprache: | Russian |
| Veröffentlicht: |
Інститут проблем реєстрації інформації НАН України
2018
|
| Schlagworte: | |
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/168766 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Автоматическое реферирование китайской правовой информации / Д. Ландэ, Цзыцзян Ян, Шивэй Чжу, Цзяньпин Го, Моцзи Вэй // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 3. — С. 67–82. — Бібліогр.: 20 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-168766 |
|---|---|
| record_format |
dspace |
| spelling |
Ландэ, Д. Цзыцзян Ян Шивэй Чжу Цзяньпин Го Моцзи Вэй 2020-05-08T19:14:32Z 2020-05-08T19:14:32Z 2018 Автоматическое реферирование китайской правовой информации / Д. Ландэ, Цзыцзян Ян, Шивэй Чжу, Цзяньпин Го, Моцзи Вэй // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 3. — С. 67–82. — Бібліогр.: 20 назв. — рос. 1560-9189 DOI: https://doi.org/10.35681/1560-9189.2018.20.3.158214 https://nasplib.isofts.kiev.ua/handle/123456789/168766 004.44:002.513.5 Работа посвящена методу автоматического реферирования правовой информации, представленной на китайском языке. Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения уровня важности предложений - перейти к определению весовых значений отдельных иероглифов, а не слов в тексте документов и рефератов. Также предложено рассмотрение модели документов как сети предложений для выявления наиболее важных предложений по параметрам этой сети. Реализованы и испытаны различные методы автоматического реферирования. Показано применение двух оценок качества реферата без участия экспертов - косинусной меры и дивергениции Дженсена-Шеннона (Jensen-Shannon). Реферирование на основе предложенной сетевой модели документа оказалось лучшим по критериям косинусной меры и расстояния Дженсена-Шеннона для рефератов, объем которых превышает 2 предложения. Предложенный подход с учетом небольших изменений может использоваться для текстов произвольной тематики, в частности, научно-технической и новостной информации. Роботу присвячено методу автоматичного реферування правової інформації, що представ-лено китайською мовою. Розглянуто модель реферату та процедуру його формування. Запропоно-вано два підходи, а саме, для визначення рівня важливості речень — перейти до визначення ваго-вих значень окремих ієрогліфів, а не слів у тексті документів і рефератів. Також запропоновано розгляд моделі документів як мережі із речень для виявлення найбільш важливих речень за пара-метрами цієї мережі. Реалізовано та випробувано різні методи автоматичного реферування. Пока-зано застосування двох оцінок якості реферату без участі експертів — косинусної міри і відстані Дженсена-Шеннона (Jensen-Shannon). Реферування на основі запропонованої мережевої моделі документа виявилося кращим за критеріями косинусної міри та відстані Дженсена-Шеннона для рефератів, обсяг яких перевищує 2 речення. Запропонований підхід з урахуванням невеликих змін може використовуватися для текстів довільної тематики, зокрема, науково-технічної та новинної інформації. A method of automatic text summarization of the legal information provided in Chinese has been developed. The model of the abstract and the procedure of his formation are considered. Two ap-proaches are proposed, namely, to determine the level of importance of sentences, it was suggested to proceed to determine the weight values of separate hieroglyphs, rather than words in the text of documents and abstracts. Also consideration of model of documents as networks of sentences for detection of the most important sentences on parameters of this network has been offered. A new hybrid method of automatic text summarization, covering statistical and marker methods, as well as taking into account the location of sentences in the text of the document is introduced. ru Інститут проблем реєстрації інформації НАН України Реєстрація, зберігання і обробка даних Реєстрація, зберігання і обробка даних Інформаційно-аналітичні системи обробки даних Автоматическое реферирование китайской правовой информации Автоматичне реферування китайської правової інформації A method for public opinion-based formal description of weakly structured subject domains Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Автоматическое реферирование китайской правовой информации |
| spellingShingle |
Автоматическое реферирование китайской правовой информации Ландэ, Д. Цзыцзян Ян Шивэй Чжу Цзяньпин Го Моцзи Вэй Інформаційно-аналітичні системи обробки даних |
| title_short |
Автоматическое реферирование китайской правовой информации |
| title_full |
Автоматическое реферирование китайской правовой информации |
| title_fullStr |
Автоматическое реферирование китайской правовой информации |
| title_full_unstemmed |
Автоматическое реферирование китайской правовой информации |
| title_sort |
автоматическое реферирование китайской правовой информации |
| author |
Ландэ, Д. Цзыцзян Ян Шивэй Чжу Цзяньпин Го Моцзи Вэй |
| author_facet |
Ландэ, Д. Цзыцзян Ян Шивэй Чжу Цзяньпин Го Моцзи Вэй |
| topic |
Інформаційно-аналітичні системи обробки даних |
| topic_facet |
Інформаційно-аналітичні системи обробки даних |
| publishDate |
2018 |
| language |
Russian |
| container_title |
Реєстрація, зберігання і обробка даних |
| publisher |
Інститут проблем реєстрації інформації НАН України |
| format |
Article |
| title_alt |
Автоматичне реферування китайської правової інформації A method for public opinion-based formal description of weakly structured subject domains |
| description |
Работа посвящена методу автоматического реферирования правовой информации, представленной на китайском языке. Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения уровня важности предложений - перейти к определению весовых значений отдельных иероглифов, а не слов в тексте документов и рефератов. Также предложено рассмотрение модели документов как сети предложений для выявления наиболее важных предложений по параметрам этой сети. Реализованы и испытаны различные методы автоматического реферирования. Показано применение двух оценок качества реферата без участия экспертов - косинусной меры и дивергениции Дженсена-Шеннона (Jensen-Shannon). Реферирование на основе предложенной сетевой модели документа оказалось лучшим по критериям косинусной меры и расстояния Дженсена-Шеннона для рефератов, объем которых превышает 2 предложения. Предложенный подход с учетом небольших изменений может использоваться для текстов произвольной тематики, в частности, научно-технической и новостной информации.
Роботу присвячено методу автоматичного реферування правової інформації, що представ-лено китайською мовою. Розглянуто модель реферату та процедуру його формування. Запропоно-вано два підходи, а саме, для визначення рівня важливості речень — перейти до визначення ваго-вих значень окремих ієрогліфів, а не слів у тексті документів і рефератів. Також запропоновано розгляд моделі документів як мережі із речень для виявлення найбільш важливих речень за пара-метрами цієї мережі. Реалізовано та випробувано різні методи автоматичного реферування. Пока-зано застосування двох оцінок якості реферату без участі експертів — косинусної міри і відстані Дженсена-Шеннона (Jensen-Shannon). Реферування на основі запропонованої мережевої моделі документа виявилося кращим за критеріями косинусної міри та відстані Дженсена-Шеннона для рефератів, обсяг яких перевищує 2 речення. Запропонований підхід з урахуванням невеликих змін може використовуватися для текстів довільної тематики, зокрема, науково-технічної та новинної інформації.
A method of automatic text summarization of the legal information provided in Chinese has been developed. The model of the abstract and the procedure of his formation are considered. Two ap-proaches are proposed, namely, to determine the level of importance of sentences, it was suggested to proceed to determine the weight values of separate hieroglyphs, rather than words in the text of documents and abstracts. Also consideration of model of documents as networks of sentences for detection of the most important sentences on parameters of this network has been offered. A new hybrid method of automatic text summarization, covering statistical and marker methods, as well as taking into account the location of sentences in the text of the document is introduced.
|
| issn |
1560-9189 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/168766 |
| citation_txt |
Автоматическое реферирование китайской правовой информации / Д. Ландэ, Цзыцзян Ян, Шивэй Чжу, Цзяньпин Го, Моцзи Вэй // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 3. — С. 67–82. — Бібліогр.: 20 назв. — рос. |
| work_keys_str_mv |
AT landéd avtomatičeskoereferirovaniekitaiskoipravovoiinformacii AT czyczânân avtomatičeskoereferirovaniekitaiskoipravovoiinformacii AT šivéičžu avtomatičeskoereferirovaniekitaiskoipravovoiinformacii AT czânʹpingo avtomatičeskoereferirovaniekitaiskoipravovoiinformacii AT moczivéi avtomatičeskoereferirovaniekitaiskoipravovoiinformacii AT landéd avtomatičnereferuvannâkitaisʹkoípravovoíínformacíí AT czyczânân avtomatičnereferuvannâkitaisʹkoípravovoíínformacíí AT šivéičžu avtomatičnereferuvannâkitaisʹkoípravovoíínformacíí AT czânʹpingo avtomatičnereferuvannâkitaisʹkoípravovoíínformacíí AT moczivéi avtomatičnereferuvannâkitaisʹkoípravovoíínformacíí AT landéd amethodforpublicopinionbasedformaldescriptionofweaklystructuredsubjectdomains AT czyczânân amethodforpublicopinionbasedformaldescriptionofweaklystructuredsubjectdomains AT šivéičžu amethodforpublicopinionbasedformaldescriptionofweaklystructuredsubjectdomains AT czânʹpingo amethodforpublicopinionbasedformaldescriptionofweaklystructuredsubjectdomains AT moczivéi amethodforpublicopinionbasedformaldescriptionofweaklystructuredsubjectdomains |
| first_indexed |
2025-12-07T16:50:49Z |
| last_indexed |
2025-12-07T16:50:49Z |
| _version_ |
1850869022462050304 |