Некоторые способы моделирования входных данных для поиска информации в библиотеке эталонов при решении задач семантики

Для встановлення суті предмета використовують еталонну інформацію, що міститься в базах даних та є структурованою сукупністю взаємопов’язаних даних певної предметної області. Для швидкого знаходження в ній необхідної інформації ця база має бути структурована, а також відповідно змодельовані і вхідні...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2020
1. Verfasser: Тимофеева, Н.К.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут кібернетики ім. В.М. Глушкова НАН України 2020
Schriftenreihe:Проблемы управления и информатики
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/208790
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Некоторые способы моделирования входных данных для поиска информации в библиотеке эталонов при решении задач семантики / Н.К. Тимофеева // Проблемы управления и информатики. — 2020. — № 6. — С. 16-28. — Бібліогр.: 11 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Beschreibung
Zusammenfassung:Для встановлення суті предмета використовують еталонну інформацію, що міститься в базах даних та є структурованою сукупністю взаємопов’язаних даних певної предметної області. Для швидкого знаходження в ній необхідної інформації ця база має бути структурована, а також відповідно змодельовані і вхідні дані. Нині існують різні моделі даних зі своїми перевагами та недоліками, і кожна з них має свою область застосування. Наведено приклади задач семантики, що відносяться до задач розпізнавання і для встановлення суті певного об’єкта потребують знаходження його еталона в базі даних. Це — розпізнавання мовлення, розпізнавання дитячого, жіночого, чоловічого голосів, задача клінічної діагностики, порівняння текстів на плагіат, автоматичний переклад текстів з однієї мови на іншу тощо. Порівняння вхідної інформації та еталона проводиться двома способами: за первинними ознаками, які описують шуканий об’єкт, і за заданим об’єктом. При другому способі попереднє покриття певними ознаками еталона і об’єкта не проводиться. При моделюванні вхідних даних для пошуку інформації за першим способом має місце покриття певними ознаками заданих об’єктів. Ознаки розділяються на такі, які характеризують лише заданий об’єкт, за якими досить просто його визначити в базі даних. В цьому разі задача є розв’язною. Якщо однакові ознаки описують різні об’єкти, але за допомогою диференціального аналізу можна знайти потрібний об’єкт, то така задача є частково розв’язною. Якщо одні і ті ж ознаки характеризують різні об’єкти і за ними не можна ідентифікувати шуканий, то виникає ситуація невизначеності. Існують задачі, які для свого розпізнавання не потребують бібліотеки еталонів. У деяких задачах з розпізнавання вхідні дані розділяються на сегменти з подальшим визначенням подібності отриманих частин. Вхідна інформація в цьому разі містить і об’єкт, який необхідно розпізнати, і еталон, з яким він порівнюється. У деяких задачах за еталон приймають або вираз, за яким визначають подібність вхідної та еталонної інформації, або задають умови, за якими можна розпізнати заданий об’єкт. Для розв’язання таких задач бібліотека еталонів не використовується.