Онтологоподібні системи аналізу природномовних текстів

Розглянуто підхід до побудови онтологоподібних систем для аналізу текстів на природній мові (на разі тільки українською мовою). Такі системи будуються на основі формальних визначень онтології O = (X, R, F, A(D, Rc)) та синтаксичного і семантичного аналізу за допомогою елементів дескриптивної логіки....

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2018
Автори: Кривий, С.Л., Дарчук, Н.П., Провотар, О.І.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут програмних систем НАН України 2018
Назва видання:Проблеми програмування
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/144592
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Онтологоподібні системи аналізу природномовних текстів / С.Л. Кривий, Н.П. Дарчук, О.І. Провотар // Проблеми програмування. — 2018. — № 2-3. — С. 132-139. — Бібліогр.: 4 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Опис
Резюме:Розглянуто підхід до побудови онтологоподібних систем для аналізу текстів на природній мові (на разі тільки українською мовою). Такі системи будуються на основі формальних визначень онтології O = (X, R, F, A(D, Rc)) та синтаксичного і семантичного аналізу за допомогою елементів дескриптивної логіки. При побудові онтології вказується предметна область, до якої відносяться поняття з X і відношення із R. Фіксація області необхідна, оскільки сенс понять та відношень може бути різним в різних предметних областях. Специфікація області необхідна також для точнішого визначення інтерпретації F. Додаткові обмеження F описуються аксіоми А цієї області та обмеженнями Rc, які мають форму додаткових визначень (уточнення, обмеження на можливі значення і т. д.) властивостей області інтерпретації D. Вхідний текст T розглядається як область інтерпретації D(Т). З дескриптивної логіки використовуються визначення синтаксису понять та відношень. Використовуючи цей синтаксис, визначається тип логічної мови, яка в даному випадку є логікою предикатів першого порядку і стає можливим проводити логічне виведення та отримувати висновки з інформації, отриманої з вхідного тексту. Вхідний текст T розглядається як область інтерпретації F для понять X та відношень R, які з нього отримані. Результати синтактико-семантичного аналізу використовуються як вхідні дані для побудови онтології. В результаті такого аналізу відбувається розбиття об'єктів на групи, які відповідають частинам мови. Використовуючи цю інформацію та додаткові обмеження, будується онтологія даної предметної області. З точки зору користувача D(T) виглядає як об’єкт реляційної бази даних, який складається лише з унарних та бінарних відношень. Різниця полягає в тому, що в класичних БД відношення замкнуті в рамках даної бази даних, в той час як D(T), як база даних, є відкритою для даної ПО, тому що нормалізоване представлення знань виконується в ситуації, коли немає припущення про повноту цих знань. Крім того, D(T) зв'язує семантичними відношеннями концепти C i відношення R із R, що немає аналогу в семантиці реляційних БД.