Defining degree of semantic similarity using description logic tools

Establishing the semantic similarity of information is an integral part of the process of solving any information retrieval tasks, including tasks related to big data processing, discovery of semantic web services, categorization and classification of information, etc. The special functions to deter...

Full description

Saved in:

Bibliographic Details
Date:	2021
Main Author:	Zakharova, O.V.
Format:	Article
Language:	Ukrainian
Published:	PROBLEMS IN PROGRAMMING 2021
Subjects:	semantic similarity of information a value of similarity of concepts least concept subsumer measures for similarity evaluating most specific concept most specific is-a ancestor similarity function similarity measure information content UDC 004.94
Online Access:	https://pp.isofts.kiev.ua/index.php/ojs1/article/view/468
Tags:	Add Tag No Tags, Be the first to tag this record!
Journal Title:	Problems in programming
Download file:

Institution

Problems in programming

_version_	1865432004248469504
author	Zakharova, O.V.
author_facet	Zakharova, O.V.
author_institution_txt_mv	[ { "author": "O.V. Zakharova", "institution": "Institute of Software Systems NAS of Ukraine" } ]
author_sort	Zakharova, O.V.
baseUrl_str	https://pp.isofts.kiev.ua/index.php/ojs1/oai
collection	OJS
datestamp_date	2021-12-03T15:48:16Z
description	Establishing the semantic similarity of information is an integral part of the process of solving any information retrieval tasks, including tasks related to big data processing, discovery of semantic web services, categorization and classification of information, etc. The special functions to determine quantitative indicators of degree of semantic similarity of the information allow ranking the found information on its semantic proximity to the purpose or search request/template. Forming such measures should take into account many aspects from the meanings of the matched concepts to the specifics of the business-task in which it is done. Usually, to construct such similarity functions, semantic approaches are combined with structural ones, which provide syntactic comparison of concepts descriptions. This allows to do descriptions of the concepts more detail, and the impact of syntactic matching can be significantly reduced by using more expressive descriptive logics to represent information and by moving the focus to semantic properties. Today, DL-ontologies are the most developed tools for representing semantics, and the mechanisms of reasoning of descriptive logics (DL) provide the possibility of logical inference. Most of the estimates presented in this paper are based on basic DLs that support only the intersection constructor, but the described approaches can be applied to any DL that provides basic reasoning services.This article contains the analysis of existing approaches, models and measures based on descriptive logics. Classification of the estimation methods both on the levels of defining similarity and the matching types is proposed. The main attention is paid to establishing the similarity between concepts (conceptual level models). The task of establishing the value of similarity between instances and between concept and instance consists of finding the most specific concept for the instance / instances and evaluating the similarity between the concepts. The term of existential similarity is introduced. In this paper the examples of applying certain types of measures to evaluate the degree of semantic similarity of notions and/or knowledge based on the geometry ontology is demonstrated. Prombles in programming 2021; 3: 16-26
doi_str_mv	10.15407/pp2021.03.016
first_indexed	2025-07-17T09:46:08Z
format	Article
fulltext	16 Інформаційні системи Вступ Проблема знаходження семантично схо- жих понять та визначення ступеня їхньої поді- бності є нагальною як для вирішення приклад- них задач (виявлення семантичних сервісів, ефективного семантичного пошуку інформації, категоризації даних тощо), так і більш загаль- них задач інформаційних технологій, як, на- приклад, інтеграція онтологій, знань, інформа- ційний пошук тощо. Існує багато підходів, які намагаються вирішити проблеми визначення подібності методами текстового аналізу або за допомогою використання спеціальних словни- ків понять, зокрема, словника Wordnet [1]. Вод- ночас, зазвичай, розглядаються лише атомарні концепти, а складніші лишаються поза увагою. Окрім цього, опускаються варіанти виявлення подібності серед екземплярів понять та поді- бності екземпляра та концепту. Також, слід за- значити, що ступені інформаційної подібнос- ті повинні базуватися на семантиці, оскільки суто синтаксичний підхід є надто слабким, щоб забезпечити виконання стандартних ви- ведень, особливо, якщо взяти до уваги виразні дескриптивні логіки (зокрема, 𝓐𝓛𝓒), як засіб представлення знань. Зрозуміло, що алгоритми визначення та функції мір відповідності пови- нні бути ефективними. Якщо вони будуть надто складними, то навряд чи зможуть забезпечити потрібний результат у допустимий період часу та стати загально-використовуваними. Останнім часом з’явилося чимало до- сліджень, у яких наголошується на доцільності УДК 004.94 https://doi.org/10.15407/pp2021.03.016 О.В. Захарова ВИЗНАЧЕННЯ СТУПЕНЯ СЕМАНТИЧНОЇ ПОДІБНОСТІ З ВИКОРИСТАННЯМ АПАРАТУ ДЕСКРИПТИВНИХ ЛОГІК Встановлення семантичної подібності інформації є невід’ємою складовою процесу вирішення будь – яких задач інформаційного пошуку, в тому числі задач, пов’язаних з обробкою великих даних, виявлен- ням семантичних веб сервісів, категоризації та класифікації інформації тощо. Введення спеціальних функцій для визначення кількісних показників ступеня семантичної відповідності інформації дозво- ляють ранжувати знайдену інформацію за її семантичною близькістю до цілі або пошукового запиту/ шаблону. Формування таких оцінок повинно враховувати багато аспектів: від сутності самих понять, семантична близькість яких підлягає оцінюванню, до особливостей бізнес-задачі, в межах вирішення якої це робиться. Зазвичай при побудові таких функцій подібності семантичні підходи поєднуються зі структурними, що забезпечують синтаксичне порівняння описів концептів. Це дозволяє суттєво деталі- зувати сам опис концепту, а вплив синтаксичної відповідності можна значно зменшити, використовуючи для представлення інформації виразніші дескриптивні логіки (ДЛ) та шляхом перенесення фокусу на семантичні властивості. ДЛ-онтології, на сьогодні, є найбільш розвинутим засобом представлення се- мантики, а механізми міркувань ДЛ забезпечують можливість логічного висновку. Більшість наведених у статті оцінок будуються на основі базових ДЛ, що підтримують лише констуктор перетину, але описані підходи можуть бути застосовані для будь-якої ДЛ, що забезпечує базові сервіси міркувань. У роботі проведений аналіз існуючих підходів, моделей та способів оцінювання, заснованих на за- стосуванні апарату дескриптивних логік, запропонована їхня класифікація як за рівнем визначення подібності, так і за видами співставлення. Основна увага приділяється встановленню подібності концептів (моделям понятійного рівня). Задачі встановлення ступеня подібності між екземплярами та між концептом і екземпляром зводяться до знаходження найбільш специфічного концепту для ек- земпляра/екземплярів та оцінювання подібності відповідних концептів. Уведено поняття екзистен- ційної подібності та продемонстровано застосування певних видів оцінок для визначення ступеня семантичної подібності понять та/або знань на прикладі онтології геометричних понять. Ключові слова: семантична подібність інформації, ступінь подібності концептів, найменше спільне по- криття, оцінки вимірювання подібності, найбільш специфічний концепт, найбільш специфічний попере- дник, функція подібності, подібність за інформаційним змістом, семантична подібність за відповідністю ознак, функція відстані шляху, моделі оцінювання на основі властивостей, моделі оцінювання на основі семантичної мережі, моделі оцінювання на основі інформаційного контенту, екзистенційна подібність кон- цептів, подібність екземплярів, подібність концепту та екземпляра, подібність ДЛ описів, GCS-подібність. © О.В. Захарова, 2021 ISSN 1727-4907. Проблеми програмування. 2021. №3 17 Інформаційні системи використання онтологій та функцій семантич- ної подібності на їхній основі для порівняння концептів та/або екземплярів концептів, котрі можна отримати через інтеграцію гетероген- них джерел інформації [2,3,4,5]. Види та рівні визначення подібності Подібність інформації/знань можна розглядати та визначати на різних рівнях. А саме можна виділити: 1) понятійний рівнь – визначення подібності концептів; 2) рівень знань – визначення поді- бності екземплярів концептів; 3) змішаний рівень – визначення по- дібності концепту та екземпляра. Оцінки, що вимірюють подібність, за- звичай використовують базову теорію множин та базуються на спільності об’єктів. Зокрема, базовий критерій для визначення таких мір можна сформулювати наступним чином: зна- чення подібності між об’єктами є не лише результатом їх спільних характеристик, а й результатом їхніх відмінностей. Цей критерий відповідає теоретико-інформаційному визна- ченню подібності, а об’єктами в даному випад- ку є концепти та екземпляри концептів. Розглянемо підходи до визначення мож- ливих оцінок ступеня подібності та відповідні моделі оцінювання для кожного з перелічених рівнів. Але спочатку визначимо ряд понять, що використовуються більшістю існуючих моде- лей оцінювання. Базові поняття та визначення Визначення 1. LCS (Least Concept Subsumer) [23, 24] - найменше спільне по- криття концептів. Нехай L дескриптивна логіка (ДЛ). Опис концепту E дескриптивної логіки 𝓛 є найменшим загальним покриттям (LCS) опи- сів концептів C1, · · · ,Cn в 𝓛 (скорочено LCS(C1, · · · ,Cn)), якщо: 1) Ci ⊑ E для i = 1, · · · , n та 2) E є найменшим описом 𝓛-концептом, що задовільняє (1), тобто, якщо E0 є описом L-концепту такий, що Ci ⊑ E0 для всіх i = 1, · · · , n, то E ⊑ E0. Одразу слід зазначити, що LCS існує не для будь-якої ДЛ, що викорисутовується для представлення знань. Але, якщо LCS існує, то воно є унікальним з точністю до еквівалент- ності. Всі міри, що розглядатимуться нижче, базуються на базовій ДЛ 𝓐𝓛𝓒. У [6] показа- но, що для 𝓐𝓛𝓒 логіки LCS існує завжди та задається диз’юнкцією понять. У разі, якщо диз’юнкція не підтримується логікою, LCS обчислюється вибором загальних імен понять в описах концептів (у межах понять універсу- му та екзистенційних обмежень для тієї самої ролі), не зважаючи на TBox в цілому [6]. Але в такому разі результат обчислення LCS може бути надто загальним. За цими міркуваннями LCS обчислюється відносно TBox, на основі якого визначаються концепти [7]. Беручи до уваги TBox, визначення LCS можна переформулювати так. Визначення 2. Нехай 𝓛1 та 𝓛2 дескрип- тивні логіки такі, що 𝓛1 є під-логікою 𝓛2, тобто 𝓛1 містить менше конструкторів, які викорис- товуються для побудови виразів. Для заданого TBox логіки 𝓛2 𝓣, 𝓛1(𝓣) – множина описів концептів, які можуть містити концепти, що визначені у 𝓣. C1, . . . ,Cn описи концептів з 𝓛1(𝓣), тоді LCS(C1, . . . , Cn) у 𝓛1(𝓣) відносно TBox 𝓣 є опис найбільш специфічного 𝓛1(𝓣) концепту, який включає C1, . . . ,Cn на TBox 𝓣, а саме, це такий опис 𝓛1(𝓣)- концепту D, що: 3) Ci D для i = 1, · · · , n та 4) Якщо E є описом 𝓛1(𝓣)- концеп- ту, що задовільняє Ci E для всіх i = 1, · · · , n, то D ⊑ E Якщо LCS відповідно для TBox не іс- нує (наприклад, у разі циклічного TBox), об- числюється його апроксимація, що називається Гарне Загальне Покриття (GCS) [25] відносно TBox та існує навіть для загального TBox. GCS обчислюється через визначення наймен- шої кон’юнкції концептів та їхніх заперечень, що може включати кон’юнкцію імен концеп- тів вищого рівня для кожного з концептів, що розглядається, та аналогічної кон’юнкції кон- цептів, які становлять ранг екзистенційних та універсальних обмежень відносно тієї самої ролі. GCS є специфічнішим покриттям, ніж LCS, що обчислюється безвідносно Tbox. Хоча у загальному випадку воно включає (або є ек- вівалентним) LCS, що обчислюється відносно TBox [7]. MSA (Most Specifi c is-a Ancestor) [8] – найбільш специфічний попередник в ієрархії таксономії. Дане поняття визначається як бі- нарне відношення на таксономії концептів, але за семантикою воно подібне до LCS. Ці обидва поняття обчислюють найспецифічніше уза- 18 Інформаційні системи гальненя вхідних концептів (відносно операції включення). Різниця ж полягає в тому, що MSA працює на таксономії понять та повертає один концепт, який містить два вихідних концеп- ти (є їхнім is-a попередником) та не включає жодного іншого, який би задовільняв ті ж ви- моги. А LCS є описом, який покриває вихідні концепти, та, як результат, при його обчисленні повертаються всі включені до нього концепти. Якщо концепти зв’язані лише родо-видовими зв’язками, тобто TBox є таксономією, LCS по- криття концептів вироджується до одного по- передника і LCS(C1,C2)=MSA(C1,C2). MSC - найбільш специфічний концепт. Унарне відношення на множині екземплярів ABox. Визначення 3. [25] Нехай дано ABox 𝓐 та екземпляр α цього ABox, найбільш специ- фічним концептом для екземпляра a відносно ABox 𝓐 є концепт C, позначається , такий, що 𝓐C(), та такого, що 𝓐⊨D(), C⊑D (де ⊨ позна- чає оператор виведення). Одразу слід зазначити, що в загальному випадку ациклічного ABox у виразній ДЛ не може бути виражений кінцевим описом кон- цепту [2], можна отримати лише його апрокси- мацію. Тож, існування найбільш специфічного концепту для індивіда ABox не є гарантованим, або його складно обчислити, й апроксимацію обмежують певною встановленою глибиною. Максимальна глибина апроксимації, як визна- чено у [20], відповідає глибині ABox. У такому разі, для будь - якого екземпляра ABox α може- мо визначити найбільш специфічний концепт MSC(α) або його апроксимацію MSC(α). Визначення семантичної подібності концептів На сьогодні існує чимало досліджень, автори яких намагаються перевести семантич- ні відношення між поняттями у деякі кількісні показники. Зрозуміло, що на принципи фор- мування таких оцінок впливає, насамперед, сутність самих понять, семантична близькість яких оцінюється, а також задача, для вирішен- ня якої обираються чи визначаються функції подібності. Більшість існуючих досліджень за- стосовують семантичний підхід у поєднанні зі структурним, який порівнює описи концептів, що розглядаються. Звісно, це дозволяє суттєво деталізувати опис, а вплив синтаксичної від- повідності можна значно зменшити при вико- ристанні для представлення інформації більш виразних ДЛ та перенесення фокусу на семан- тичні властивості. При встановленні ступеня семантичної відповідності між концептами однієї онтології функція подібності фактично є відображенням 𝓢: 𝓛(𝓣)⨉ 𝓛(𝓣)→Y, де 𝓣 є TBox даної онтоло- гії, представлений у ДЛ 𝓛, а Y є дійсним чис- лом, що кількісно визначає ступінь подібності. В оцінках, що базуються на співвідношеннях (частках), Y ∈ [0,1], але існують й інші моделі вимірювань. У загальному випадку задача суттєво ускладнюється. Якщо відповідність встанов- люється між концептами двох різних онто- логій з TBox-амі 𝓣1 та 𝓣2 ДЛ, відповідно 𝓛1 та 𝓛2, необхідно побудувати відображення 𝓢: 𝓛1(𝓣1)⨉ 𝓛2(𝓣2)→Y. У будь-якому випадку функція повинна мати наступні властивості: 1) Нехай E – певна множина елемен- тів (об’єктів однієї чи різних онтологій), для яких визначається ступінь подібності, то функ- ція 𝓢 визначена на множині E ⨉ E 2) Функція 𝓢 є позитивно-визначе- ною, тобто 𝓢(C,D)≥03) ∀C,D: 𝓢(C,D)≤ 𝓢(C,C) При визначенні функції відповідності, необхідно розуміти, що подібність концептів можна розглядати як з боку ступеня їх поді- бності, так і ступеня їх відмінності. І функція подібності повинна мати позитивну кореля- цію зі ступенем подібності між концептами та негативну - з показником відмінності між ними. Зрозуміло, що цей числовий показник залежить від багатьох факторів, а саме: спе- цифіки досліджуваного контенту, виразнос- ті та однорідності мов представлення онто- логій тощо. Але ключовим питанням при створенні функції подібності є «як виміряти ступінь подібності (відмінності) концептів». Це, в свою чергу, пов’зано з тим, як збира- ється досліджувана інформація. Навряд чи показник подібності можна розцінювати, як абсолютну оцінку, але він має забезпечувати можливість достовірного ранжування кон- цептів за ступенем їхньої подібності. Серед основних підходів до побудови такої функції можна виділити: 1) визначення подібності як функції відстані шляху між таксонами в ієрархії, що лежить в основі цієї онтології [10, 11, 12]; 19 Інформаційні системи 2) оцінка семантичної подібності за відповідністю ознак [13]; 3) визначення ступеня подібності кон- цептів за інформаційним змістом [14,15]; 4) екзістенціональна подібність по- нять. Перший підхід може бути застосова- ний лише в межах однієї онтології, тобто його використання може бути доцільним лише, якщо оцінювання виконується на базі одного джерела інформації, і досліджувані поняття, є концептами однієї онтології або інтегрованої онтології вихідних джерел інформації. Другий підхід для обчислення семантичної подібності використовує як загальні, так і дискримінантні ознаки між поняттями та / або екземплярами понять. Методи третьої групи засновані на те- орії інформації. Вони визначають ступінь поді- бності між двома поняттями в рамках ієрархії понять з точки зору кількості інформації, що передається безпосередньо супер-концептом, який включає порівнювані концепти. Всі оцін- ки, які базуються на ознаках та властивостях концептів, можна назвати оцінками інтенсіо- нальної подібності. Під екзистенційною по- дібністю понять будемо розуміти ступінь їх- ньої близькості за множинами екземплярів, які вони містять. У разі встановлення ступеня відповід- ності між поняттями різних, можливо, різно- рідних, онтологій, перелічені вище підходи працюють за умови виконання певних чинни- ків та обмежень. По-перше, формальне пред- ставлення цих онтологій повинна підтримувати механізми міркувань, такі як включення. (Слід одразу зазначити, що механізм включення під- тримується базовими ДЛ такими, зокрема, як 𝓐𝓛𝓒). По-друге, застосування підходів оціню- вання базується на використанні узагальненої онтології, а локальні концепти в різних онто- логіях повинні успадковувати структуру визна- чення з їх узагальненої онтології. У [16] про- понуються деякі підходи до порівняння таких концептів із різних онтологій за складом їхніх екземплярів. А саме, робиться припущення, що при виконанні визначених вище обмежень, ознакою відповідності двох концептів може бути перетин множин їхніх екземплярів. А для порівняння описів понять, які можна поєднати у загальну онтологію, використовуються три основні підходи, а саме:  фільтрація на основі відстані-шля- ху між поняттями у загальній онтології;  визначення ступеня подібності на основі відповідності елементів графів (один до одного) описів понять;  визначення ймовірносних метрик, які визначають подібність з точки зору спіль- ного розподілу понять. Також, якщо обчислення оцінок поді- бності робиться для концептів з різних онтоло- гій, необхідно враховувати різницю між рівня- ми формалізації специфікацій цих онтологій. Зокрема, у [17] функція відповідності визначає класи подібних сутностей за допомогою спів- ставлення з використанням наборів синонімів, семантичного сусідства та дискримінаційних ознак, що класифіковані за частинами, функці- ями та атрибутами. У [9] представлений інший підхід, спрямований на знаходження спільних властивостей серед концептів або тверджень. Перелічені групи підходів до оцінювання подібності базуються на відповідних моделях. Основні моделі оцінювання До найбільш розповсюджених моделей оцінювання можна віднести:  моделі на основі властивостей;  моделі на основі семантичних мереж;  моделі на основі інформаційного контенту. В моделях на основі властивостей концепт C характеризується множиною своїх властивостей, що позначається ftrs(C). У [18] пропонується дві групи вимірювань для такої моделі: 1) контрастна модель, де подібність двох концептів C і D визначається лінійною функцією – , де \ - операція різниці множин, α, β та θ не негативні константи, а f(.) – виражає кількість ознак в множині 2) нормалізована модель співвідно- шення, де подібність визначається як частка множин: 20 Інформаційні системи Якщо вважати, що функція подібнос- ті є симетричною, то Якщо припустити, що функція є дистрибутивною по множинам, що не перетинаються, можна перетворити наступним чином: У моделях, що засновані на се- мантичній мережі, довідкова інформація надається у формі семантичної мережі, що включає концепти та, принаймні, is-a ребра (іноді розглядаються більш складні відно- сини, як у WordNet). Це є прикладом саме того випадку, коли оцінювання подібності базується на вимірюванні довжини шляху між концептами у мережі. Якщо концепти знаходяться у таксономії, тобто пов’язані родовидовими відношеннями, значення подібності між двома концептами обчис- люються кількістю ребер на шляху від кон- цептів, що розглядаються, до їх найближ- чого попередника. Якщо поняття розділені лише декількома зв’язками, то вони вважа- ються подібними. Чим більше зв’язків їх розділяють, тим менша схожість між ними [8, 19, 12, 20]. Тобто, для оцінювання від- повідності концептів C і D знаходиться найбільш специфічний is-a попередник E = MSA(C,D) концептів C і D та обчислюєть- ся міра подібності як сума довжин шляхів від C до E та від E до D. Розвинутіші оцін- ки можуть враховувати глибину концепту MSA(C, D), щільність ребер у вузлах шля- ху та вагу ребер. У моделях, заснованих на інформа- ційному контенті, разом із семантичною мережею використовується інформація про імовірність того, що сутність описується конкретним концептом C. Така імовірність зазвичай оцінюється на основі вихідної спе- цифічної задачі. Величина інформаційного контенту концепту вимірюється на основі імовірнос- ті , як . У [21] пропонується міра подібності концептів C та D на основі імовірносної оцінки їх MSA: . У [22] пропонується міра відстані концептів у мережі на основі їхнього інфор- маційного контенту, що враховує такі фак- тори, як глибина та щільність ребер шляху між концептами: У [18] пропонується міра подібності, що визначається часткою: Визначення оцінювання подібності для ДЛ описів Усі метрики, представлені вище, ви- значені на атомарних концептах. Але на- ведені оцінки можна переформулювати й для складних концептів, які визначаються через атомарні засобами ДЛ. Зазначимо, що при побудові оцінок ми вважаємо, що описи концептів представлені у базовій ДЛ, яка підтримує лише операцію перетину концептів. Будь-який опис концепту можна привести до його нормальної форми, тобто розкласти так, щоб він містив лише атомар- ні концепти. Зазвичай, це робиться просто шляхом підстановки у визначеня замість не- атомарних концептів їхні описи. Позначимо через nf(C) множину атомарних концептів, що зустрічаються у нормальній формі кон- цепта C. Зазначимо, що C⊑D (де ⊑ - просте структурне включення), якщо nf(D) ⊆ nf(C). Із урахуванням наведеного визначен- ня струкурного опису концепту можна пе- реформулювати наведені вище оцінки від- повідності наступним чином. Для моделі властивостей будемо розглядати властивості концепту як ато- марні концепти, а складний концепт як кон’юнкцію цих атомарних концептів. Вра- ховуючи особливості перетину та різниці множин атомарних властивостей, міри від- повідності, за умови їхньої симетричності, можна визначити так: Слід зазначити, що у наведених мі- рах функція f є лічильником властивостей, можливо зважених. Наразі розглянемо модель семантич- ної мережі. Якщо мережа є ієрархією, та 21 Інформаційні системи концепт C має is-a попередників: U1, U2, U3, …, Un-1, Un, введемо концепт C такий, що С := СU1U2U3…Un-1Un. У результуючому T-Box, концепт, що визначається, має таку саме ієрархію включення як вихідні вузли у семантичній мережі, більше того, якщо у вихідній мережі шлях U1, U2, . . . Un = до ко- реня is-a ієрархії, то нормальна форма кон- цепта U1 у ДЛ nf(U1) = . Іншими словами, якщо мережа є деревом, то кардинальність концепту, що є нормальною формою кон- цепту C \|nf(C)\| дорівнює довжині шляху від U1 до кореня. Шляхи від концептів C та D до кореня перетинаються в E=MSA(C,D), що на ієрархії включення співпадає з LCS(C,D). Тоді відстань між концептами C і D можна визначити, як: , , де \|X\| - кардинальність концепту X. Відповідно для інформаційних моде- лей: , Екзистенційні оцінки подібності концептів В екзистенційних підходах значення подібності обчислюється шляхом підрахун- ку спільних екземплярів розширень концеп- тів [26] або шляхом вимірювання варіації змісту між концептами, що розглядається у [27, 28, 29]. Зазвичай, онтологія має структуру, складнішу за просту таксономію, і оцін- ки подібності, що базуються на відстанях в таксономії або на використанні понят- тя найбільш специфічного попередника (MSA), використовуватися не можуть. Слід зазначити, що семантичне від- ношення включення базується на каноніч- ній інтерпретації ABox дескриптивної ло- гіки та припущенні унікального простору імен (UNA), з якої випливає, що інтерпрета- цією екземплярів ABox є вони самі, а також індивіди, що відповідають різним об’єктам предметної області, мають різні імена в про- сторі імен. Тому визначимо оцінку відповід- ності концептів на основі їх розширення у каноничній інтепретації ДЛ [25]. Нехай – множина концептів у ДЛ 𝓐𝓛𝓒, а 𝓐 – ABox з каноничною інтерпре- тацією 𝓘. Семантична подібність концептів 𝓼 є функцією: 𝓼:𝓛⨉𝓛→[0,1], що визнача- ється наступним чином: , де та розши- рення концепта в інтерпретації . Наведену оцінку можна обгрунтува- ти так. Якщо концепти C та D еквівалентні, тобто C⊑D та D⊑C, 𝓼=1. Якщо концепти є взагалі різними, та їхні розширення не пе- ретинаються, оцінка є мінімальною, тобто її значення дорівнює 0. У випадку непустого перетину концептів оцінка набуває значен- ня в діапазоні від 0 до 1. Тобто дана оцінка виражає ступінь подібності концептів C та D, зменшену на , що, у свою чергу, представляє несхожість цих концептів. Це означає, що ступінь поді- бності розглядається не як абсолютна вели- чина, а як зважена щодо ступеня несхожес- ті. Така оцінка відповідає досить міцному семантичному зв’язку між поняттями, що забезпечується відношенням включення. Оцінки GCS-подібності концептів Міри GCS-подібності визначають- ся на основі поняття GCS-покриття та мо- жуть бути застосовані, якщо оцінки, які базуються на перекритті розширень кон- цептів, інформаційному контенті чи на відстанях між концептами, не працюють. Оцінки на основі GCS також використо- вують поняття розширення концепту, але замість підрахунку спільних екземплярів даних концептів, значення подібності ви- значається як варіація числа екземплярів у розширенні концепту відносно числа екземплярів у розширенні їх загального супер-концепту. Загальний супер-концепт визначається через GCS концептів, а оцін- ка відносно TBox 𝓣 логіки 𝓐𝓛𝓒 формаль- но визначається таким чином. 𝓣 - 𝓐𝓛𝓒- TBox. 𝓛 – дескриптивна логіка, що включає 𝓐𝓛𝓒. C і D описи кон- цептів в 𝓛(𝓣). Тоді міра семантичної поді- бності 𝓢 є функцією 𝓢: 𝓛(𝓣) ⨉𝓛(𝓣) →[0,1], що визначається так: 22 Інформаційні системи де – обчислює розширення концепту відносно інтерпретації 𝓙 (канонічної інтер- претації [2, 9]). Тобто, якщо два концепти семан- тично подібні, вони повинні мати гарний спільний супер-концепт, що є близьким до обох концептів, а саме розширення супер- концепту, що містить багато екземплярів, спільних з вихідними концептами. В тако- му разі значення функції буде наближатися до одиниці. Навпаки, якщо вихідні концеп- ти дуже різні, то їхні GCS та суперконцепт містить багато екземплярів, що не належать вихідним концептам, тобто значення оцін- ки подібності буде наближатися до 0. Дана міра не вимагає перетину концептів, що розглядаються, та не бере до уваги відстань семантичного шляху. Більше того, щоб за- побігти отриманню некоректного значення подібності тоді, коли один концепт є дуже подібним до супер-концепту та дуже відріз- няється від іншого концепту, що порівню- ється, у визначенні міри розглядається міні- мальне розширення концептів. Визначення оцінок подібності на рівні знань та змішаному рівні Нагадаємо, що до оцінок цих рівнів відносяться оцінки визначення ступеня по- дібності екземплярів та екземпляра і кон- цепту. Визначення міри із залученням ек- земплярів базується на понятті Найбільш Специфічного Концепту (MSC). Для кож- ного екземпляра в ABox можна обчислити MSC або його апроксимацію. В деяких ви- падках ці поняття є еквівалентними. Нехай a і b – два екземпляри ABox, A=MSC(a), B=MSC(b). Тоді міри семан- тичної подібності можуть бути застосовані до описів концептів A та B, й результуюча оцінка виражатиме ступінь подібності від- повідних екземплярів: : s(a,b) = s(A,B) = s(MSC(a), MSC(b)) Аналогічно, значення подібності між описом концепту C та екземпляра a може бути обчислене шляхом визначення апрок- симації MSC екземпляра та наступного за- стосування міри подібності до концепта С та апроксимації MSC екземпляра a: : s(a,C) = s(A,C) = s(MSC(a), C) Тож, обидві оцінки зводяться до ви- значення подібності описів концептів після попередньої апроксимації екземплярів. Од- ночасно можуть бути використані будь-які наведені вище моделі обчислення ступеня відповідності концептів. Слід зазначити, що складність запро- понованих методів залежить від складності стандартних методів виведення в ДЛ. Застосування оцінок подібності на прикладі ДЛ онтології POGeometry Розглянемо застосування міри відпо- відності описів концептів на основі їхнього розширення у каноничній інтерпретації ДЛ на прикладі онтології домену геометричних понять POGeometry. TBox онтології домену POGeometry: Coordinate, GeometricFigure Vertex ⊑ has.XCoordinate Vertex ⊑ has.YCoordinate XCoordinate ⊑ Coordinate YCoordinate ⊑ Coordinate Coordinate ⊑ hasValue.NUMBER Vector ⊑ 2has.Vertex Vector ⊑ has.VectorLength Vector ⊑ has.VectorAngle VerterxLength ⊑ hasType.NUMBER VerterxAngle ⊑ hasType.NUMBER Height ⊑ hasType.NUMBER EdgeLenth ⊑ hasType.NUMBER … Polygon ≡ GeometricFigure ⊓=has. Vertex⊓ =has.Vector Circle ⊑ GeometricFigure Quadrangle ≡ Polygon ⊓=4has.Vertex⊓ =4has.Vector Triangle ≡ Polygon ⊓ =3has.Vertex =3has.Vector Polygon ⊑ has.Vertex Polygon ⊑ has.Vector Triangle ⊑ =3has.Height Square ⊑ hasType.NUMBER GeometricFigure ⊑ has.Square Circle ⊑ GeometricFigure 23 Інформаційні системи ABox: Triangle(ABC), Triangle(XYZ), Triangle(A1B1C1), Triangle(B1C1D1), Triangle( A1C1D1), Triangle( A1B1D1), Triangle(X1X2X3), Triangle(X2X3X4), Triangle(X3X4X5), Triangle( X4X5X6), ..., Quadrangle(A1B1C1D1), Polygon(X1X2X3X4X5X6.), Circle(O1), Circle(O2) Враховуючи визначення концеп- тів Quadrangle та Triangle можна вивести включення концептів Triangle ⊑ Polygon та Quadrangle ⊑ Polygon. Отже, всі екземпля- ри концептів Triangle та Quadrangle є ек- земплярами концепту Polygon. Тобто =47, =29, =17. Тоді відповідність концептів Triangle та Polygon можна визначити на основі їхніх множин екземплярів таким способом: Нехай , , тоді Зважаючи на те, що інтерпретації концептів Triangle та Quadrangle, в да- ному випадку не мають перетину, , їх оцін- ка відповідності за екземплярами також буде дорівнювати 0. В цьому випадку, напевне, більш достовірнішими будуть оцінювання ступенів відповідності кон- цептів за їхніми властивостями або з ви- користанням найменшого спільного по- криття. Слід зазначити, що наведений при- клад грунтується на базовій дескриптивній логиці, що використовує лише констук- тор перетину, а TBox фактично є таксоно- мією. Тому, для його концептів LCS існує завжди і для будь-яких концептів C і D з цього TBox LCS(C,D)=MSA(C,D). Зокрема, =LCS( , ) = MSA( , ). Функцію подібності концептів на базі LCS можна визначати на основі відста- ней між концептами або перекриття розши- рень відповідних концептів (їхніх множин екземплярів). =2+2-2*1=2 Використовуючи модель властивос- тей, оцінка подібності: Зважаючи на те, що в даному випадку GCS=LCS=MSA: Висновки У роботі здійснено аналіз семантич- них показників подібності, які класифіко- вані за підходами та моделями оцінювання. Наведені показники використовують семан- тичні висновки, такі, як, наприклад, пере- вірка екземплярів (що означає обчислен- ня розширення концептів) заданого ABox. Внутрішня складність виразних мов ДЛ, таких, як ALC, обумовлює неефективність структурних підходів до аналізу. Тому ви- значення функцій подібності базуються на використанні теорії множин, що дозволяє застосовувати числові підходи, хоча й на символічному рівні представлення ДЛ. 24 Інформаційні системи Проаналізовані також моделі оціню- вання та міри подібності на різних рівнях оцінювання. Основним є встановлення по- дібності між концептами (моделі понятій- ного рівня). Задачі обчислення ступеня поді- бності між екземплярами та між концептом та екземпляром зводяться до знаходження MSC та оцінювання подібності концептів. Більшість наведених оцінок грунту- ються на основі базових ДЛ, що підтриму- ють лише констуктор перетину, але описані підходи можуть бути застосовані для будь- якої ДЛ. Це забезпечує базові сервіси мірку- вань, а саме: перевірку екземплярів та MSC (апроксимацію). Представлені міри подібності мо- жуть бути корисними при вирішенні бага- тьох задач різних типів, зокрема задач ве- ликих даних, таких як-от, пошук інформації в контексті термінологічних систем пред- ставлення знань, категоризація та класифі- кація даних тощо. Література 1. Fellbaum, C. (Ed.). (1998). Wordnet: An Elec- tronic Lexical Database. MA: MIT Press. 2. Baader, F., Calvanese, D., McGuinness, D., Nardi, D., Patel-Schneider, P., eds.: The De- scription Logic Handbook. Cambridge Uni- versity Press (2003) 3. Staab, S., Studer, R., eds.: Handbook on On- tologies. International Handbooks on Informa- tion Systems. Springer (2004) 4. Thompson, K., Langley, P.: Concept forma- tion in structured domains. In Fisher, D., Paz- zani, M., Langley, P., eds.: Concept Formation: Knowledge and Experience in Unsupervised Learning. Morgan Kaufmann (1991) 5. Haussler, D.: Learning conjuntive concepts in structural domains. Machine Learning (1989) 7–40 6. F. Baader, R. K¨usters, and R. Molitor. Com- puting least common subsumers in description logics with existential restrictions. In T. Dean, editor, Proceedings of the 16th International Joint Conference on Artifi cial Intelligence, pages 96–101. Morgan Kaufmann, 1999. 7. F. Baader, R. Sertkaya, and Y. Turhan. Com- puting least common subsumers w.r.t. a background terminology. In V. Haarslev and R. M¨oller, editors, Proceedings of Proceed- ings of the 2004 International Workshop on Description Logics (DL2004). CEUR-WS. org, 2004. 8. R. Rada, H. Milli, E. Bicknell, M. Blettner, ”Development and Application of a metric on Semantic Nets”, IEEE Trans. on Systems, Man, and Cybernetics, 19(1): 17-30 (1989) 9. Mantay, T.: Commonality-based ABox retriev- al. Technical Report FBI-HH-M-291/2000, Department of Computer Science, University of Hamburg, Germany (2000) 10. Collet, C., Huhns, M.N., Shen, W.M.: Resource integration using a large knowledge base in carnot. IEEE Computer 24 (1991) 55–62 11. Fankhauser, P., Neuhold, E.J.: Knowledge based integration of heterogeneous databases. In Hsiao, D.K., Neuhold, E.J., Sacks-Davis, R., eds.: Proceedings of the IFIP WG 2.6 Da- tabase Semantics Conference on Interoperable Database Systems (DS-5). IFIP Transactions, North-Holland (1992) 12. Bright, M.W., Hurson, A.R., Pakzad, S.H.: Au- tomated resolution of semantic heterogeneity in multidatabases. ACM Transaction on Data- base Systems 19 (1994) 212–253 13. Tversky, A.: Features od similarity. Psycologi- cal Review 84 (1997) 327–352 14. Jang, J., Conrath, D.: Semantic symilarity based on corpus statistic and lexical taxonomy. In: Proceedings of the International Confer- ence on Computational Linguistics. (1997) 15. Resnik, P.: Semantic similarity in a taxonomy: An information-based measure and its ap- plication to problems of ambiguity in natural language. Journal of Artifi cial Intelligence Re- search 11 (1999) 95–130 16. Weinstein, P., Bimingham, P.: Comparing con- cepts in diff erentiated ontologies. In: Proceed- ings of 12th Workshop on Knowledge Acqui- sition, Modelling, and Management. (1999) 17. Rodr´ıguez, M.A., Egenhofer, M.J.: Determin- ing semantic similarity among entity classes from diff erent ontologies. IEEE Transac- tion on Knowledge and Data Engineering 15 (2003) 442–456 18. A. Tversky, “Features of Similarity”, Psycho- logical Review 84(4): 327-352, 1977. 19. J. Lee, M. Kim, and Y. Lee. Information re- trieval based on conceptual distance in is-a hierarchies. Journal of Documentation, 2(49):188–207, 1993. 25 Інформаційні системи 20. D. Maynard, W. Peters, and Y. Li. Metrics for evaluation of ontology-based information extraction. In Proceeding of the EON 2006 Workshop, 2006. 21. P. Resnik, ”Using Information Content to Evaluate Semantic Similarity”, Proc. IJCAI 1995 : 448-453 22. G. Miller & W.G. Charles, ”Contextual cor- relates of semantic similarity”, Language and Cognitive Processes, 6, 1-28, 1991. 23. W. Cohen, A. Borgida, H. Hirsh: “Comput- ing Least Common Subsumers in Description Logics”, AAAI 1992: 754-760 24. R. Kusters & R. Molitor, “Computing Least Common Subsumers in ALEN”, IJCAI 2001: 219-224 25. Claudia d’Amato, Steff en Staab, Nicola Fanizzi, F. Esposito: “Effi cient Discovery of Services Specifi ed in Description Logics Lan- guages”, SMRR 2007 26. C. d’Amato, N. Fanizzi, and F. Esposito. A semantic similarity measure for expressive de- scription logics. In A. Pettorossi, editor, Pro- ceedings of Convegno Italiano di Logica Com- putazionale, CILC05, Rome, Italy, 2005 27. C. d’Amato, N. Fanizzi, and F. Esposito. A dissimilarity measure for ALC concept de- scriptions. In Proc. of the 21st Annual ACM Symposium of Applied Computing, SAC2006, 2006. 28. P. Resnik. Semantic similarity in a taxonomy: An information-based measure and its ap- plication to problems of ambiguity in natural language. Journal of Artifi cial Intelligence Re- search, 11:95–130, 1999. 29. A. Borgida, T. Walsh, and H. Hirsh. Towards measuring similarity in description logics. In I. Horrocks, U. Sattler, and F. Wolter, editors, Proceedings of the 2005 International Work- shop on Description Logics (DL2005), volume 147 of CEURWorkshop Proceedings. CEUR- WS. org, 2005. References 1. Fellbaum, C. (Ed.). (1998). Wordnet: An Elec- tronic Lexical Database. MA: MIT Press. 2. Baader, F., Calvanese, D., McGuinness, D., Nardi, D., Patel-Schneider, P., eds.: The De- scription Logic Handbook. Cambridge Uni- versity Press (2003) 3. Staab, S., Studer, R., eds.: Handbook on On- tologies. International Handbooks on Informa- tion Systems. Springer (2004) 4. Thompson, K., Langley, P.: Concept forma- tion in structured domains. In Fisher, D., Paz- zani, M., Langley, P., eds.: Concept Formation: Knowledge and Experience in Unsupervised Learning. Morgan Kaufmann (1991) 5. Haussler, D.: Learning conjuntive concepts in struc- tural domains. Machine Learning (1989) 7–40 6. F. Baader, R. K¨usters, and R. Molitor. Com- puting least common subsumers in description logics with existential restrictions. In T. Dean, editor, Proceedings of the 16th International Joint Conference on Artifi cial Intelligence, pages 96–101. Morgan Kaufmann, 1999. 7. F. Baader, R. Sertkaya, and Y. Turhan. Comput- ing least common subsumers w.r.t. a background terminology. In V. Haarslev and R. M¨oller, edi- tors, Proceedings of Proceedings of the 2004 International Workshop on Description Logics (DL2004). CEUR-WS.org, 2004. 8. R. Rada, H. Milli, E. Bicknell, M. Blettner, ”Development and Application of a metric on Semantic Nets”, IEEE Trans. on Systems, Man, and Cybernetics, 19(1): 17-30 (1989) 9. Mantay, T.: Commonality-based ABox retriev- al. Technical Report FBI-HH-M-291/2000, Department of Computer Science, University of Hamburg, Germany (2000) 10. Collet, C., Huhns, M.N., Shen, W.M.: Resource integration using a large knowledge base in carnot. IEEE Computer 24 (1991) 55–62 11. Fankhauser, P., Neuhold, E.J.: Knowledge based integration of heterogeneous databases. In Hsiao, D.K., Neuhold, E.J., Sacks-Davis, R., eds.: Proceedings of the IFIP WG 2.6 Da- tabase Semantics Conference on Interoperable Database Systems (DS-5). IFIP Transactions, North-Holland (1992) 12. Bright, M.W., Hurson, A.R., Pakzad, S.H.: Au- tomated resolution of semantic heterogeneity in multidatabases. ACM Transaction on Data- base Systems 19 (1994) 212–253 13. Tversky, A.: Features od similarity. Psycologi- cal Review 84 (1997) 327–352 14. Jang, J., Conrath, D.: Semantic symilarity based on corpus statistic and lexical taxonomy. In: Proceedings of the International Confer- ence on Computational Linguistics. (1997) 15. Resnik, P.: Semantic similarity in a taxonomy: An information-based measure and its ap- 26 Інформаційні системи plication to problems of ambiguity in natural language. Journal of Artifi cial Intelligence Re- search 11 (1999) 95–130 16. Weinstein, P., Bimingham, P.: Comparing con- cepts in diff erentiated ontologies. In: Proceed- ings of 12th Workshop on Knowledge Acqui- sition, Modelling, and Management. (1999) 17. Rodr´ıguez, M.A., Egenhofer, M.J.: Determin- ing semantic similarity among entity classes from diff erent ontologies. IEEE Transac- tion on Knowledge and Data Engineering 15 (2003) 442–456 18. A. Tversky, “Features of Similarity”, Psycho- logical Review 84(4): 327-352, 1977. 19. J. Lee, M. Kim, and Y. Lee. Information re- trieval based on conceptual distance in is-a hierarchies. Journal of Documentation, 2(49):188–207, 1993. 20. D. Maynard, W. Peters, and Y. Li. Metrics for evaluation of ontology-based information extraction. In Proceeding of the EON 2006 Workshop, 2006. 21. P. Resnik, ”Using Information Content to Evaluate Semantic Similarity”, Proc. IJCAI 1995 : 448-453 22. G. Miller & W.G. Charles, ”Contextual cor- relates of semantic similarity”, Language and Cognitive Processes, 6, 1-28, 1991. 23. W. Cohen, A. Borgida, H. Hirsh: “Comput- ing Least Common Subsumers in Description Logics”, AAAI 1992: 754-760 24. R. Kusters & R. Molitor, “Computing Least Common Subsumers in ALEN”, IJCAI 2001: 219-224 25. Claudia d’Amato, Steff en Staab, Nicola Fanizzi, F. Esposito: “Effi cient Discovery of Services Specifi ed in Description Logics Lan- guages”, SMRR 2007 26. C. d’Amato, N. Fanizzi, and F. Esposito. A semantic similarity measure for expressive de- scription logics. In A. Pettorossi, editor, Pro- ceedings of Convegno Italiano di Logica Com- putazionale, CILC05, Rome, Italy, 2005 27. C. d’Amato, N. Fanizzi, and F. Esposito. A dissimilarity measure for ALC concept descriptions. In Proc. of the 21st Annual ACM Symposium of Applied Computing, SAC2006, 2006. 28. P. Resnik. Semantic similarity in a taxonomy: An information-based measure and its ap- plication to problems of ambiguity in natural language. Journal of Artifi cial Intelligence Re- search, 11:95–130, 1999. 29. A. Borgida, T. Walsh, and H. Hirsh. Towards measuring similarity in description logics. In I. Horrocks, U. Sattler, and F. Wolter, editors, Proceedings of the 2005 International Work- shop on Description Logics (DL2005), volume 147 of CEURWorkshop Proceedings. CEUR- WS. org, 2005. Про автора: Захарова Ольга Вікторівна, кандидат технічних наук, старший науковий співробітник. Кількість наукових публікацій в українських виданнях – 31. http://orcid.org/0000-0002-9579-2973. Одержано: 02.04.2021 Місце роботи автора: Інститут програмних систем НАН України, проспект Академіка Глушкова, 40. Тел.: 526 5139. E-mail: ozakharova68@gmail.com. Моб.тел.: +38(068)594756
id	pp_isofts_kiev_ua-article-468
institution	Problems in programming
keywords_txt_mv	keywords
language	Ukrainian
last_indexed	2025-07-17T09:46:08Z
publishDate	2021
publisher	PROBLEMS IN PROGRAMMING
record_format	ojs
resource_txt_mv	ppisoftskievua/88/98c55e899c167670edd605ac0331c888.pdf
spelling	pp_isofts_kiev_ua-article-4682021-12-03T15:48:16Z Defining degree of semantic similarity using description logic tools Визначення ступеня семантичної подібності з використанням апарату дескриптивних логік Zakharova, O.V. semantic similarity of information; a value of similarity of concepts; least concept subsumer; measures for similarity evaluating; most specific concept; most specific is-a ancestor; similarity function; similarity measure information content UDC 004.94 семантична подібність інформації; ступінь подібності концептів; найменше спільне покриття; оцінки вимірювання подібності; найбільш специфічний концепт; найбільш специфічний попередник, функція подібності; подібність за інформаційним змістом УДК 004.94 Establishing the semantic similarity of information is an integral part of the process of solving any information retrieval tasks, including tasks related to big data processing, discovery of semantic web services, categorization and classification of information, etc. The special functions to determine quantitative indicators of degree of semantic similarity of the information allow ranking the found information on its semantic proximity to the purpose or search request/template. Forming such measures should take into account many aspects from the meanings of the matched concepts to the specifics of the business-task in which it is done. Usually, to construct such similarity functions, semantic approaches are combined with structural ones, which provide syntactic comparison of concepts descriptions. This allows to do descriptions of the concepts more detail, and the impact of syntactic matching can be significantly reduced by using more expressive descriptive logics to represent information and by moving the focus to semantic properties. Today, DL-ontologies are the most developed tools for representing semantics, and the mechanisms of reasoning of descriptive logics (DL) provide the possibility of logical inference. Most of the estimates presented in this paper are based on basic DLs that support only the intersection constructor, but the described approaches can be applied to any DL that provides basic reasoning services.This article contains the analysis of existing approaches, models and measures based on descriptive logics. Classification of the estimation methods both on the levels of defining similarity and the matching types is proposed. The main attention is paid to establishing the similarity between concepts (conceptual level models). The task of establishing the value of similarity between instances and between concept and instance consists of finding the most specific concept for the instance / instances and evaluating the similarity between the concepts. The term of existential similarity is introduced. In this paper the examples of applying certain types of measures to evaluate the degree of semantic similarity of notions and/or knowledge based on the geometry ontology is demonstrated. Prombles in programming 2021; 3: 16-26 Встановлення семантичної подібності інформації є невід’ємою складовою процесу вирішення будь – яких задач інформаційного пошуку, в тому числі задач, пов’язаних з обробкою великих даних, виявлен- ням семантичних веб сервісів, категоризації та класифікації інформації тощо. Введення спеціальних функцій для визначення кількісних показників ступеня семантичної відповідності інформації дозво- ляють ранжувати знайдену інформацію за її семантичною близькістю до цілі або пошукового запиту/ шаблону. Формування таких оцінок повинно враховувати багато аспектів: від сутності самих понять, семантична близькість яких підлягає оцінюванню, до особливостей бізнес-задачі, в межах вирішення якої це робиться. Зазвичай при побудові таких функцій подібності семантичні підходи поєднуються зі структурними, що забезпечують синтаксичне порівняння описів концептів. Це дозволяє суттєво деталі- зувати сам опис концепту, а вплив синтаксичної відповідності можна значно зменшити, використовуючи для представлення інформації виразніші дескриптивні логіки (ДЛ) та шляхом перенесення фокусу на семантичні властивості. ДЛ-онтології, на сьогодні, є найбільш розвинутим засобом представлення се- мантики, а механізми міркувань ДЛ забезпечують можливість логічного висновку. Більшість наведених у статті оцінок будуються на основі базових ДЛ, що підтримують лише констуктор перетину, але описані підходи можуть бути застосовані для будь-якої ДЛ, що забезпечує базові сервіси міркувань.У роботі проведений аналіз існуючих підходів, моделей та способів оцінювання, заснованих на за- стосуванні апарату дескриптивних логік, запропонована їхня класифікація як за рівнем визначення подібності, так і за видами співставлення. Основна увага приділяється встановленню подібності концептів (моделям понятійного рівня). Задачі встановлення ступеня подібності між екземплярами та між концептом і екземпляром зводяться до знаходження найбільш специфічного концепту для ек- земпляра/екземплярів та оцінювання подібності відповідних концептів. Уведено поняття екзистен- ційної подібності та продемонстровано застосування певних видів оцінок для визначення ступеня семантичної подібності понять та/або знань на прикладі онтології геометричних понять.Prombles in programming 2021; 3: 16-26 PROBLEMS IN PROGRAMMING ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ ПРОБЛЕМИ ПРОГРАМУВАННЯ 2021-10-12 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/468 10.15407/pp2021.03.016 PROBLEMS IN PROGRAMMING; No 3 (2021); 16-26 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 3 (2021); 16-26 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 3 (2021); 16-26 1727-4907 10.15407/pp2021.03 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/468/472 Copyright (c) 2021 PROBLEMS IN PROGRAMMING
spellingShingle	semantic similarity of information a value of similarity of concepts least concept subsumer measures for similarity evaluating most specific concept most specific is-a ancestor similarity function similarity measure information content UDC 004.94 Zakharova, O.V. Defining degree of semantic similarity using description logic tools
title	Defining degree of semantic similarity using description logic tools
title_alt	Визначення ступеня семантичної подібності з використанням апарату дескриптивних логік
title_full	Defining degree of semantic similarity using description logic tools
title_fullStr	Defining degree of semantic similarity using description logic tools
title_full_unstemmed	Defining degree of semantic similarity using description logic tools
title_short	Defining degree of semantic similarity using description logic tools
title_sort	defining degree of semantic similarity using description logic tools
topic	semantic similarity of information a value of similarity of concepts least concept subsumer measures for similarity evaluating most specific concept most specific is-a ancestor similarity function similarity measure information content UDC 004.94
topic_facet	semantic similarity of information a value of similarity of concepts least concept subsumer measures for similarity evaluating most specific concept most specific is-a ancestor similarity function similarity measure information content UDC 004.94 семантична подібність інформації; ступінь подібності концептів; найменше спільне покриття; оцінки вимірювання подібності; найбільш специфічний концепт; найбільш специфічний попередник функція подібності; подібність за інформаційним змістом УДК 004.94
url	https://pp.isofts.kiev.ua/index.php/ojs1/article/view/468
work_keys_str_mv	AT zakharovaov definingdegreeofsemanticsimilarityusingdescriptionlogictools AT zakharovaov viznačennâstupenâsemantičnoípodíbnostízvikoristannâmaparatudeskriptivnihlogík

Defining degree of semantic similarity using description logic tools

Institution

Similar Items