Пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів

Аналізуються типи та формати подання мультимедійної інформації, її розташування в гіпермедійних ресурсах. Розглядаються питання, пов'язані з пошуком мультимедійних об’єктів, поданих в Інтернеті, на основі аналізу контексту і метаописів інформаційних ресурсів, що містять посилання на такі об’єкт...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2005
Hauptverfasser: Рогушина, Ю.В., Гришанова, І.Ю.
Format: Artikel
Sprache:Ukrainian
Veröffentlicht: Інститут програмних систем НАН України 2005
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/1310
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів/Ю.В.Рогушина, І.Ю.Гришанова// Проблеми програмування. — 2005. — N 3. — С. 83-96. — Бібліогр.: 17 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-1310
record_format dspace
spelling Рогушина, Ю.В.
Гришанова, І.Ю.
2008-07-25T15:22:29Z
2008-07-25T15:22:29Z
2005
Пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів/Ю.В.Рогушина, І.Ю.Гришанова// Проблеми програмування. — 2005. — N 3. — С. 83-96. — Бібліогр.: 17 назв. — укр.
1727-4907
https://nasplib.isofts.kiev.ua/handle/123456789/1310
004.738.52
Аналізуються типи та формати подання мультимедійної інформації, її розташування в гіпермедійних ресурсах. Розглядаються питання, пов'язані з пошуком мультимедійних об’єктів, поданих в Інтернеті, на основі аналізу контексту і метаописів інформаційних ресурсів, що містять посилання на такі об’єкти. Для підвищення релевантності пошуку пропонується порівнювати контекст і метаописи мультимедійних об’єктів з онтологією предметної області, що цікавить користувача.
uk
Інститут програмних систем НАН України
Інформаційні системи
Пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів
Multimedia object retrieval based on their context and metadata of hypermedia informational resources
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів
spellingShingle Пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів
Рогушина, Ю.В.
Гришанова, І.Ю.
Інформаційні системи
title_short Пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів
title_full Пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів
title_fullStr Пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів
title_full_unstemmed Пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів
title_sort пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів
author Рогушина, Ю.В.
Гришанова, І.Ю.
author_facet Рогушина, Ю.В.
Гришанова, І.Ю.
topic Інформаційні системи
topic_facet Інформаційні системи
publishDate 2005
language Ukrainian
publisher Інститут програмних систем НАН України
format Article
title_alt Multimedia object retrieval based on their context and metadata of hypermedia informational resources
description Аналізуються типи та формати подання мультимедійної інформації, її розташування в гіпермедійних ресурсах. Розглядаються питання, пов'язані з пошуком мультимедійних об’єктів, поданих в Інтернеті, на основі аналізу контексту і метаописів інформаційних ресурсів, що містять посилання на такі об’єкти. Для підвищення релевантності пошуку пропонується порівнювати контекст і метаописи мультимедійних об’єктів з онтологією предметної області, що цікавить користувача.
issn 1727-4907
url https://nasplib.isofts.kiev.ua/handle/123456789/1310
citation_txt Пошук мультимедійних об’єктів за контекстом та метаописами гіпермедійних інформаційних ресурсів/Ю.В.Рогушина, І.Ю.Гришанова// Проблеми програмування. — 2005. — N 3. — С. 83-96. — Бібліогр.: 17 назв. — укр.
work_keys_str_mv AT rogušinaûv pošukmulʹtimedíinihobêktívzakontekstomtametaopisamigípermedíinihínformacíinihresursív
AT grišanovaíû pošukmulʹtimedíinihobêktívzakontekstomtametaopisamigípermedíinihínformacíinihresursív
AT rogušinaûv multimediaobjectretrievalbasedontheircontextandmetadataofhypermediainformationalresources
AT grišanovaíû multimediaobjectretrievalbasedontheircontextandmetadataofhypermediainformationalresources
first_indexed 2025-11-24T02:31:02Z
last_indexed 2025-11-24T02:31:02Z
_version_ 1850838244444340224
fulltext Інформаційні системи © Ю.В. Рогушина, І.Ю.Гришанова, 2005 83 ISSN 1727-4907. Проблеми програмування. 2005. № 3 УДК 004.738.52 Ю.В.Рогушина, І.Ю.Гришанова ПОШУК МУЛЬТИМЕДIЙНИХ ОБ’ЄКТІВ ЗА КОНТЕКСТОМ ТА МЕТАОПИСАМИ ГІПЕРМЕДІЙНИХ ІНФОРМАЦІЙНИХ РЕСУРСІВ Аналізуються типи та формати подання мультимедійної інформації, її розташування в гіпермедійних ресурсах. Розглядаються питання, пов'язані з пошуком мультимедійних об’єктів, поданих в Інтернеті, на основі аналізу контексту і метаописів інформаційних ресурсів, що містять посилання на такі об’єкти. Для підвищення релевантності пошуку пропонується порівнювати контекст і метаописи мультимедійних об’єктів з онтологією предметної області, що цікавить користувача. Вступ Значна частина інформаційних ре- сурсів (ІР), доступ до яких забезпечує глобальна мережа Інтернету, містить елементи мультимедіа. Такі ресурси на- зиваються гіпермедійними. Гіпермедіа – формат даних, подібний до гіпертексту, у якому текст, звук, зображення або інші об'єкти, пов'язані з інформацією, відо- бражуваною на екрані, може бути виве- дений на дисплей за допомогою гіпертек- стового посилання [1]. Пошук мультиме- дійної інформації являє собою серйозну теоретичну проблему, яка ускладнюється різнорідністю представленої інформації, розходженнями у форматах та стандартах її подання. Аналіз наукових публікацій пока- зує, що світове наукове співтовариство вважає пошук мультимедіа важливою проблемою сьогодення і приділяє їй зна- чну увагу. ACM Multimedia Special Interest Group [2] займається, зокрема, дослідженням імен мультимедіа і пошу- ком, збереженням і використанням муль- тимедійних інформаційних ресурсів (МІР). Moving Picture Experts Group роз- робляє стандарти подання та опису ауді- овізуальної інформації. Synchronized Multimedia Working Group Консорціуму W3С пропонує механізм створення до- кументів, що містять синхронізовану му- льтимедійну інформацію SMIL [3]. Користувач, що шукає мультимедіа, зазвичай не може навести фрагмент по- трібної інформації у формі, придатній для автоматичної обробки. Параметри опису мультимедіа вкрай різноманітні та важко формалізовані й у значній мірі суб’єктивні. Постановка задачі Для того щоб забезпечити ефектив- ний пошук мультимедіа, потрібно визна- чити, що саме є об’єктом пошуку; які па- раметри може задавати користувач для ідентифікації інформаційних потреб; які відомості про мультимедіа можна отри- мати внаслідок аналізу ІР та як порівню- вати опис запиту з описом ІР. 1. Визначення мультимедіа Термін "мультимедіа" має багато визначень, але в більшості випадків це поєднання текстової, звукової та відео інформації. Під мультимедіа розуміють електронний носій інформації, що вклю- чає кілька її видів (текст, зображення, анімація тощо [4]), інтегроване представ- лення інформації в кількох формах, на- приклад, відео, голос, музика або дані [5]. Іноді під мультимедіа розуміють також потоки сигналів від віддаленого облад- нання (телескопів, датчиків тощо). Обробка мультимедіа засобами об- числювальної техніки почалася ще в 60-х роках, коли зображення та текст поєдну- вали в одному документі. Дослідження мультимедіа базується на таких дисцип- лінах, як обробка сигналів, комп’ютерна графіка, бази даних, когнітивна психоло- гія, інтерфейс користувача. Для подаль- шої роботи з аналізу мультимедіа вве- демо більш чітке поняття мультимедій- ного об’єкта. Це об'єкт, відтворений за допомогою комп'ютера і здатний впливати на одне або кілька людських почуттів – зір, слух тощо. Слід зазначити, Інформаційні системи 84 що основна частина інформації надходить через зір і слух, тому, розглядаючи мультимедіа, враховують вплив тільки на ці почуття (хоча в окремих випадках тактильна інформація також може відтворюватися за допомогою технічних пристроїв, напри- клад, тактильного монітора). Під мультимедійним об’єктом (МО) розумітимемо інформацію, подану в електронній формі, яка не є символьно- текстовою та може інтерпретуватися спеціалізованим програмним забезпечен- ням і периферійними пристроями виве- дення таким чином, щоб впливати на ор- гани почуттів користувача. Гіпермедійний інформаційний ре- сурс (ГІР) – це ІР, який містить МО або посилається на них (приміром, через гі- перпосилання). Контекст МО складається з конте- нту (вмісту) та метаопису ГІР, який міс- тить посилання на цей МО, та метаопису самого МО. Метаописи як МО, так і ГІР можуть бути відсутні. Пошук мультимедіа виконується існуючими інформаційно-пошуковими системами (ІПС) з низькою релевантні- стю. Важливо відмітити, що у випадку, коли пошук здійснюється у такому дина- мічному середовищі, як Інтернет (на від- міну від, приміром, електронних бібліо- тек), кожен ресурс потрібно індексувати знову при звертанні до нього. Тому сема- нтичний аналіз контента мультимедіа, що потребує великих обчислювальних ре- сурсів, не ефективен. Існуючі ІПС індексують МО за кон- текстом та назвами, вони не враховують семантичну спрямованість ІР, які на них посилаються. Пошук здійснюється за ключовими словами. Більш корисною для пошуку є об- робка вмісту ГІР, у якому зустрічається посилання на МО в текстових докумен- тах (сучасні ІПС дозволяють знаходити html-документи, документи у форматі MS Word та PDF, презентації MS PowerPoint тощо), та метаописи як са- мого цього документа, так і мультимедіа. Щоб аналізувати цю інформацію, потрі- бно з'ясувати, які типи МО подані в Ін- тернеті, в яких структурних елементах html-сторінки розміщуються посилання на них, які формати та елементи викори- стовуються для їх метаописів і знання про семантику МО здобуття з цієї інфор- мації. Мультимедійна інформація може бути подана у різних формах: у вигляді зображень, графіки, 3D-моделей, аудіо, відео тощо (рис.1). Загальноприйнятої класифікації МО на сьогодні немає, хоча цьому питанню приділяється значна увага. Оскільки МО різняться між собою за типом, фізичною сутністю і форматом, на семантичному рівні необхідно, абстра- гуючись від фізичної сутності об'єктів, виділити характеристики, які є загаль- ними для всіх ГІР або специфічними для кожного окремого типу. Джерелами інформації, до яких си- стема переадресує запит користувача, можуть бути локальними і глобальними ІПС. Надалі розглядається пошук МО тільки серед тих ІР Інтернету, доступ до яких здійснюється за протоколом http (а не ftp). 2. Стандарти подання та класифікація ГІР Зазвичай користувач, який хоче найти певний МО, може визначити його тип (вибрати з набору запропонованих). Проаналізуємо найбільш поширені під- ходи до класифікації ГІР. Стандарт подання мультимедій- ної інформації MPEG. Експертна група Moving Picture Experts Group Об'єднаного комітету зі стандартизації запропонувала сімейство стандартів подання мультиме- дійної інформації MPEG. MPEG-7 (Multimedia Content Description Interface – Інтерфейс для опису контента мультиме- діа ISO/IEC) [6] – це стандарт, орієнтова- ний на семантичне осмислення МО. Він базується на стандартах MPEG-1, MPEG- 2 та MPEG-4 і використовує синтаксис XML Schema. Розробники MPEG-7 вра- ховували інші стандарти (TV Anytime, Dublin Core [7], SMPTE Metadata Dictionary тощо), створені для досить ву- зьких доменів, і запропонували більш за- гальну модель. Зараз MPEG-7 доробля- Інформаційні системи 85 ють у напрямку інтероперабельності з компонентами проекту Semantic Web. MPEG-7 надає стандартизований опис різних типів мультимедійного мате- ріалу, підтримуючи певний рівень інтер- претації змісту інформації, що може бути передана для обробки ЕОМ, для забезпе- чення ефективного і швидкого пошуку. Він визначає стандартний набір дескрип- торів для різних типів МО, стандартизує спосіб визначення своїх дескрипторів і їхнього взаємозв'язку, вводячи для цього DDL (Description Definition Language) – мову опису визначень. Розробники MPEG-7 вважають аудіовізуальними даними статичні зо- браження, графіку, 3D моделі, аудіо, мову, відео і композиційну інформацію про те, як ці елементи комбінуються в мультимедійному поданні (сценарії). За- сіб опису, запропонований MPEG-7, не залежить від того, яка інформація опису- ється (аналоговий відеозапис чи оцифро- ваний контент). Описові можливості мають одно- значно і повністю інтерпретуватися в контексті застосування, тому вони зале- жать від доменів користувачів і сфери застосування, тобто той самий матеріал може бути описаний через різні типи властивостей, що відповідають специфіці і можливостям застосування. Приміром, графічне зображення на найнижчому рівні абстракції може бути описане через форму, розмір, текс- туру, кольори, палітру, траєкторію руху та положення; а аудіо – через тональ- ність, зміни темпу, положення в звуко- вому ряд, тоді як на верхньому рівні буде подана семантична інформація типу «Це сцена з зеленим автомобілем, який їде дорогою, що знаходиться ліворуч, і лю- диною в білому, яка переходить дорогу праворуч, у супроводі фонового звуку дощу». Можуть існувати також проміжні рівні абстракції. Рівень абстракції пов'я- заний зі способом здобуття інформації: багато низькорівневих властивостей мо- жуть бути витягнуті автоматично, тоді як високорівневі властивості вимагають втручання людини. Крім опису контента, для пошуку МО можуть використовуватися й інші відомості про нього: Форма – формат ко- дування (JPEG, MPEG-2 і т.п.), розмір даних; Умови доступу до матеріалу – умови реєстрації, вартість доступу, угоди про права користування тощо; Класифі- кація – оцінка походження матеріалу і тип його вмісту (обмежена кількість ка- тегорій задається заздалегідь); Посилання на інші релевантні матеріали; Контекст – обставини, за яких створено матеріал. Стандарт передачі інформації в Інтернеті MIME. Стандарт Multipurpose ІнформаціяІнформація Символьно- текстова інформація Символьно- текстова інформація Аудіо- інформація Аудіо- інформація Графічна інформація Графічна інформація Відео- інформація Відео- інформація МультимедіаМультимедіа HTML, XML MPEG3, MPEG4 GIF, JPEG Неструкту- рована інформація Неструкту- рована інформація Структу- рована інформація Структу- рована інформація DOC, PDF Рис. 1. Види інформаційних ресурсів Інтернету Інформаційні системи 86 Internet Mail Extensions (MIME) [8] при- значений для передачі інформації в Ін- тернеті з урахуванням її типу. Цей стан- дарт виділяє сім базових типів медіаін- формації, для кожного з яких визначені параметри, що характерні саме для цього типу інформації. У стандарті передбачена можливість розширення набору типів та їх параметрів. Основні дискретні медіатипи MIME: • Текст – текстова інформація. Під- тип "plain" – це текст, що не містить команд форматування і не використо- вує спеціальне програмне забезпе- чення (ПЗ), за винятком підтримки за- значеної кодової таблиці. Інші під- типи існують для збагаченого тексту (enriched text), що використовують спеціальне ПЗ для показу тексту, од- нак основний вміст контента можна отримати без цього ПЗ; • Зображення – вимагає для пере- гляду інформації пристрій візуаліза- ції. Основний підтип – формат зобра- жень JPEG (jpeg), що використовує кодування JFIF; • Аудіо – потребує для інтерпретації аудіопристрій, який відтворює зву- кову інформацію. Основний підтип – "basic", контент якого – одноканальне аудіо, закодоване з використанням 8bit ISDN mu-law [PCM] з частотою 8000 Hz; • Відео – зображення, що змінюється у часі і супроводжуються узгодженим звуком. Основний підтип – "mpeg", контент якого – відео, закодоване відповідно до стандарту MPEG; • Прикладні дані – бінарні дані, які обробляє спеціалізоване ПЗ. Підтипи: "octet-stream" інтерпретується як бі- нарні дані, "PostScript" визначає PostScript-дані. Вводяться також два композицій- них базових медіатипа: • multipart – це дані, що складаються з кількох частин, які представляють собою незалежні типи даних. Основ- ним підтипом є "mixed", що визначає загальний комбінований набір частин, "alternative" використовується для да- них у різних форматах, "parallel" – для частин, які необхідно переглядати одночасно, "digest" – для багаточаст- кових фрагментів, у яких кожна час- тина має тип "message/rfc822"; • message – інкапсульоване повідом- лення. Стандарт інтеграції синхронізо- ваної мультимедійної інформації SMIL. SMIL (Synchronized Multimedia Integration Language) рекомендований консорціумом W3С (Synchronized Multimedia Working Group) стандарт, який описує механізм створення докуме- нтів, що містять синхронізовану мульти- медійну інформацію. SMIL-презентації являють собою набір інструкцій, що опи- сують текстові, відео- і аудіодані і ви- значають послідовність їх відтворення. За допомогою SMIL можна сполу- чати в html-документі з метою синхроні- зованого відтворення елементи таких типів: • текст; • нерухомі зображення (формати jpeg, gif, png тощо); • відео (формати mpeg, avi, mov тощо); • аудіо (формати mp3, wav, au тощо); • анімацію, що використовує векто- рну графіку (svg, swf, vml, тощо); • текстовий потік, синхронізований у часі з іншою інформацією (sub, rt, sami тощо), приміром, стрічка новин або титри. Кожний медіаоб’єкт у SMIL має ін- дивідуальне ім'я і використовує атрибут src для вказівки імені і місця розташу- вання файлу, що містить медіа-інформа- цію. SMIL має атрибути: alt, запозиче- ний з html, longdesc (зміст, як і в html- елементі object) і readIndex, які дозволя- ють описувати медіа наступним чином: • alt – короткий текстовий опис файлу, найчастіше є навіть неповним реченням; • longdesc – посилання (uri) на дета- льний опис (набір категорій для типів описів ще не встановлено); Інформаційні системи 87 • readIndex – порядок презентації альтернативного тексту, що визнача- ється з використанням елементів par, seq і excl. Класифікація мультимедійних об’єктів у проекті SERIF. У виділенні характерних ознак мультимедійної інфо- рмації цікаві роботи з класифікації МО, виконані в рамках проекту організації доступу до інформації про дослідницькі ініціативи Європи SERIF [9]. Предметна область даної розробки – наукові дослідження, тому базовими поняттями є проекти, персоналії тощо. Важлива роль приділяється метаданим, що зберігаються у базі SERIF. У рамках даного дослідження розроблена онтоло- гія МО (рис.2). Виділяються такі ознаки МО, як розмір (у мегабайтах) та трива- лість (у хвилинах), жанр (наприклад, ле- кція, доповідь), цільова аудиторія та рі- вень підготовки (студенти, учні, вчені, інженери тощо). Проект орієнтований на наукові дослідження, тому розробники окремо виділяють презентації PowerPoint як об’єднання слайдів, тексту і анімації. Наведений вище огляд показує, що розповсюджені класифікації МО роз- роблялися для різних цілей і тому по- різному виділяють підкласи МО (табл.1). 3. Таксономія мультимедійних об’єктів Інтернету Враховуючи специфіку задачі, для якої проводився аналіз засобів подання мультимедіа – пошук інформації в Інтер- неті, та інтегруючи розглянуті вище під- ходи до класифікації мультимедійних об’єктів, пропонуємо наступну таксоно- мію МО (рис.3). Ця таксономія виділяє окремо по- токи даних, які потребують специфічного програмного забезпечення для їх інтер- претації, тому що формат подання таких даних невідомий і користувач не може їх описати (у тому випадку, коли в нього є така інформація, користувач може отри- мати доступ до цих даних значно прос- тішими шляхами). В окремі групи виді- лено презентації SMIL та Power Point, тому що наявна в них текстова інформа- ція дозволяє ідентифікувати МО, які вхо- дять до їх складу. Необхідно також відзначити розхо- дження між статичними (зображення, текст) і динамічними (відео, аудіо, аніма- ція, текстовий потік) МО. В безперерв- них МО слід враховувати ще й такий па- раметр, як часову послідовність окремих елементів (відеокадрів, символів стрічки Мультимедійний елемент Мультимедійний елемент ЗображенняЗображення JPG, GIF JPG, GIF Corel Draw Corel Draw Adobe PhotoShop Adobe PhotoShop ВідеоВідео АудіоАудіо Real MediaReal Media Streaaming RealVideo Streaaming RealVideo Quick Time Quick Time MP3MP3 MPEGMPEG Real VideoReal Video Real AudioReal Audio MP3MP3 WAVWAV MIDIMIDI Слайдова презентація Слайдова презентація Аудіо- відео Аудіо- відео Exe-файлExe-файл ShockWaveShockWave Дані для мультимедіа Дані для мультимедіа FlashFlash Рис.2. Онтологія МО в SERIF Інформаційні системи 88 новин тощо). Однак необхідно пам'ятати, що деякі графічні файли є анімованими і, хоча й представлені з використанням елемента <img>, можуть розглядатися як безперервні. Серед графічних об'єктів доцільно виділити векторні та растрові зображення, тому що користувачеві до- сить легко визначити, які саме зобра- ження він хоче знайти. 4. Пошук мультимедійних об’єктів в Інтернеті Розглянемо, за якими парамет- рами здійснюють пошук МО найбільш Таблиця 1. Стандарти подання мультимедіа MPEG MIME SMIL SERIF Статичні зображення, графіка * * (підтипи – JPEG, інші) * *, формати jpg, gif, CorelDraw, Adobe PhotoShop 3D моделі * - - - Аудіо * * * *, RealAudio, MP3, Wav, MIDI Мовлення * - - - Відео * * * *, QuickTime, MP3, MPEG, real Video Сценарії (композиційні типи) * *, 2 підтипи – multipart та message - - Прикладні дані - * - - Анімація - - * - Синхронізований текстовий потік - - * - Flash - - - * ShockWave - - - * RealMedia - - - * Слайдова презентація - - - * Аудіо-відео - - - * М ул ь ти м е д ій н і о б 'є кт и С та ти ч н і Д и н ам іч н і (п о то к ов і) В ід ео А у д іо З о б р аж ен н я К ом б ін о в ан і А н ім о ван і Н е зм ін н і П р е зе н тац і ї В ід еоф іл ьм и S M IL P o w e rP o in t JP G P N G B M P M P E G A V I Т ек ст о ва с тр о ка Р а ст р о в і В е кт ор н і Ін ф о рм а ц ія в ід W e b -кам е р Ін ф орм а ція в ід а уд іо д а тч и к ів M P E G A V I С тр у к ту р о ва н і д о к ум ен ти X M L H T M L A U M P 3 G IF Рис.3. Таксономія мультимедійних об’єктів Інтернету Інформаційні системи 89 поширені ІПС Інтернету. Не всі ІПС під- тримують пошук мультимедіа, а ті, які містять такі режими роботи, зазвичай до- зволяють знаходити тільки деякі підтипи мультимедіа (у більшості випадків – по- шук зображень). Крім того, розширений пошук у різних ІПС слабо стандартизо- ваний та дозволяє уточнювати різні па- раметри МО (табл.2). Пошукова система AltaVista (www.altavista.com) при індексації зобра- жень, крім ключових слів та метатегів, враховує текст, ім’я та шлях до файлу, які містяться в тегу посилання на зображення, а також абзац тексту, в межі якого це посилання попадає. Врахування RDF- та інших не вбудованих в текст сторінки мета-описів не здійснюється. Крім розміру та вирішення зображення, результати пошуку містять інформацію про розташування зображення та абзац тексту сторінки, до якого воно відноситься. Аналогічно здійснюється індексація аудіо та відео-файлів. В результатах пошуку видається тип файлу, його місцезнаходження (тобто адреса сторінки), розмір в байтах та тривалість відтворення. Найбільш незручний та некорект- ний пошук здійснює пошукова система українських ресурсів search.com.ua, яка використовує спрощений механізм Google для індексації мультимедіа. Індексації підлягає тільки текст, розміщений в тегах посилання на цей ресурс. Порівняння можливостей різних Таблиця 2. Порівняння можливостей найпоширеніших ІПС у пошуку мультимедіа Пошукові системи Параметр Google AltaVista Search. com.ua Aport.ru Зображення + + + +- (тільки листівки та фотографії – в окремих каталогах) Градація за розміром файлу невеликий, середній, малий, вирішення в точках великий перелік вибору розміру зображення - - Вибір кольорової палітри кольорові та чорно- білі, напівтонові та повнокольорові повнокольорові, кольорові та чорно-білі - - Тип - фото, графіка та кнопки- банери - - Область пошуку весь Web, окремі ресурси весь Web, новини, фільми тощо - - Розрізняє формати gif, jpg, png - - - Аудіо - + - + Уточнення типу файлу - MP3, WAV, WindowsMedia, Real тощо - - Формати - MP3, WAV, WindowsMedia MP3 та MID Тривалість звучання - більше або менше хвилини - - Відео + + + - Уточнення типу файлу - MPEG, AVI, Quicktime, WindowsMedia, Real тощо - - Формати - MPEG, AVI, Quicktime, WindowsMedia, Real, - - Тривалість - більше або менше хвилини - - Область пошуку спеціальний оператор movie - - - Інформаційні системи 90 ІПС у пошуку мультимедіа можна продо- вжити, аналізуючи такі системи, як Ly- cos, AllTheWeb, Rambler, Апорт тощо. В результаті проведеного огляду можливо- стей пошуку мультимедійної інформації існуючими пошуковими системами, мо- жна зробити наступний висновок: по- шуку усіх типів мультимедійних ресурсів жодна з пошукових систем не реалізує. Жодна з розглянутих ІПС не виокремлює такі важливі типи, як презентації PowerPoint (презентації індексуються ба- гатьма ІПС як текстові документи, однак вони не розглядаються як джерела муль- тимедійної інформації) та SMIL (най- більш перспективний напрямок розвитку публікації мультимедійної інформації в мережі), пошук векторних зображень, динамічної інформації. Слід відмітити, що сьогодні в Ін- тернеті представлена велика кількість спеціалізованих ІПС, призначених для знаходження окремих видів мультимедіа. Приміром, пошукова система SingingFish (search.singingfish.com) дозволяє шукати за ключовими словами відео- та аудіо- дані, вказуючи їх категорію (спорт, но- вини, фінанси тощо) та формат. Але бі- льшості користувачів вони не відомі і тому не використовуються Недоліком більшості систем є те, що градації оцінок параметрів МО або фіксовані (у зовсім незручному варіанті – наприклад, "менше хвилини", “більше 3 хвилин”), або зовсім нечіткі і тому незро- зумілі користувачеві (приміром, "невели- кий”, “середній”, “малий" розмір). Крім того, слід зауважити, що значна кількість користувачів цікавляться пошуком муль- тимедіа у більш прагматичному аспекті та прагнуть застосовувати зовсім інші параметри для опису своїх інформацій- них потреб. Приміром, у [10] стверджу- ється, що 71% користувачів WWW ціка- вляться об’єктами, а не розміткою, ко- льорами, текстурою та іншими абстракт- ними характеристиками мультимедійних об’єктів. Для опису об’єктів можна вико- ристовувати онтології, які задають, при- міром, відношення між базовими класами об’єктів, що не мають конкретних рис, та їх підкласами, які легше співвіднести з МО. Значно підвищити релевантність пошуку МО дозволяє урахування у про- цесі пошуку ПрО, до якої він відно- ситься, та її співвіднесення зі сферою ін- формаційних інтересів користувача. 5. Використання формалізованого по- дання знань у пошуку мультимедійних об’єктів Метаописи інформаційних ресур- сів Інтернету. Крім підходів, спрямова- них на обробку саме мультимедіа, необ- хідно враховувати універсальні засоби подання метаінформації, які дозволяють описувати семантику як текстових, так і мультимедійних ІР. Сьогодні найбільше поширення знайшов перспективний під- хід до проблеми семантичного розпізна- вання інформації – стандарт опису ІР RDF (Resource Description Framework) [11] Консорціуму W3C. Мета його ство- рення – стандартизувати визначення і використання метаданих, які описують ІР Інтернету. Практично реалізовувати цей підхід почали в 2002 р. на базі Open Directory [12] в рамках проекту автома- тичного створення репозиторію RDF- описів ресурсів Інтернету. RDF використовує базову модель даних «об'єкт — атрибут — значення» та має XML-синтаксис. Важливою особ- ливістю стандарту RDF є розширюва- ність: на RDF можна задати структуру опису джерела, використовуючи і розши- рюючи вбудовані поняття RDF-схем, такі як класи, властивості, типи, колекції. Стандарт RDF підтримують багато провідних виробників ПЗ і постачальни- ків контента. Розроблено ряд програмних продуктів, які дозволяють створювати RDF-описи для різного роду джерел (на- приклад, RDFPic [13] створений для до- давання RDF-опису до зображень). Пе- редбачаються можливості інтеграції іс- нуючих сховищ інформації в загальну базу семантичного опису та інтеграція концепції RDF-бази з форматом MPEG. Щоб спростити та уніфікувати створення метаописів ресурсів, користу- вачам потрібно надати певні шаблони та Інформаційні системи 91 стандарти опису типових ресурсів. З та- ких засобів найбільш ґрунтовно розроб- лено набір елементів для створення мета- даних "Dublin Core Metadata Elements", що складається з 15 базових елементів [14], які можна умовно розбити на три групи: • Content (контент) – елементи, які відносяться до контента ресурсу; • Intellectual Property (інтелектуаль- ної власності) – елементи, які відно- сяться інтелектуальної власності; • Instantiation (реалізація) – елеме- нти, які описують конкретний екзем- пляр ресурсу. Деякі елементи основного компле- кту опису потребують більш детального розкриття через можливість різних ін- терпретацій. Щоб зберегти сумісність з найпростішим описом з 15 елементів, але у той же час збільшити деталізацію і складність описів, різні організації роз- робляють розширення та додаткові ква- ліфікатори для базових елементів. При- міром, елемент Subject (Тема) визнача- ється за допомогою двох тезаурусів: предметного та функціонального. Пред- метний тезаурус містить поняття ПрО і відображає зміст документа, а функціо- нальний – його роль в людській діяльно- сті. Елемент Type (Тип) відображає жанр та категорію ресурсу. Можна об- рати один зі стандартних типів: text, image, sound, dataset, software, interactive, event або physical object. Цей список може бути розширений (кожен елемент поділяється на піделементи), наприклад, event (подія) може бути конкретизований як Конференція, Семінар, Круглий стіл, Виставка або Проект. Елемент Формат (Format) відобра- жає середовище, формат даних ресурсу, матеріал, з якого складається ресурс (якщо це фізичний об'єкт), і, можливо, його фізичні розміри. Якщо ресурс по- дано в електронному вигляді, тоді його формат рекомендується вибирати зі спи- ску вже вищевказаного стандарту MIME. Приклади електронних форматів: text/xml – текст у форматі XML; text/plain – текст без форматування; image/gif – малюнок у форматі GIF. Для інших ресурсів формат рекомендується вибирати зі списку фізи- чних об'єктів. Аналізуючи RDF-опис ІР, можна визначити, до якої ПрО він відноситься, хто є його автором, якою мовою та в якому форматі подано інформацію. Фізи- чні розміри ІР визначаються через кількі- сні показники і можуть порівнюватися з будь-якими вимогами користувача. Онтологічний опис ПрО, яка ціка- вить користувача. Традиційні механі- зми пошуку в Інтернеті, як правило, ви- конують запити користувача на пошук інформації тільки за переліком ключових слів. Значно підвищити ефективність пошуку дозволяє його персоніфікація, тобто використання відомостей про сферу інформаційних інтересів користу- вача. Враховуючи інформацію про кори- стувача та його інтереси, можна отриму- вати більш релевантні результати. Як показує аналіз публікацій, один з перспективних підходів до опису ПрО, що цікавить користувача, ґрунтується на онтологіях, які містять перелік основних термінів, зв'язки між ними і правила ви- ведення (так, у проекті Semantic Web, спрямованому на аналіз семантики ІР, саме онтологічний підхід є основою для подання знань про різні ПрО) [15]. Проблема інформаційного пошуку ускладнюється тим, що різні групи лю- дей, які займаються збором і пошуком інформації, застосовують для спілку- вання з ІПС як власні спеціальні терміни, так і терміни, широко використовувані іншими співтовариствами в іншому ро- зумінні. Поряд із глобальними онтологі- ями, що описують досить широкі ПрО і для створення яких необхідні значні зу- силля експертів ПрО та інженерів зі знань, існують онтології, що дозволяють формально представити знання конкрет- ного користувача щодо ПрО. Такі онто- логії можуть створюватися і модифікува- тися користувачами самостійно. Хоча, можливо, деякі подання користувача ПрО є помилковими, але така онтологія описує ПрО, яка відповідає його інфор- маційним інтересам (наприклад, якщо користувач помилково вважає дельфіна Інформаційні системи 92 рибою і, запросивши зображення якої- небудь риби, отримує зображення дель- фіна, тоді його інформаційна потреба буде задоволена). Створюючи інформаційний запит, користувач визначає через онтологію ПрО сферу своїх інформаційних інтересів. 6. Пошук МО з використанням їх кон- тексту та семантики ПрО При необхідності вичерпного по- шуку МО обов'язковою вимогою є звер- тання не тільки до спеціалізованих функ- цій "пошук зображень" у різних систе- мах, але і безпосередній перегляд сторі- нок, змістовно пов'язаних з ними. Прове- дені експерименти показують, що пошук МО за допомогою ІПС надає посилання на значно меншу кількість ресурсів порі- вняно з пошуком серед текстових ресур- сів, який дозволяє знайти документи, що містять посилання на МО. Це пов’язано з тим, що в багатьох спеціалізованих ви- даннях імена файлів ілюстрацій мають числове позначення, а підписи до ілюст- рацій взагалі не робляться, тому що елек- тронна версія конвертується з оригінал- макету друкованого видання, у якому ця інформація відсутня. Крім того, імена файлів найчастіше мають скорочену фо- рму, що також не дозволяє зробити їхній пошук з використанням спеціальних фу- нкцій. Інформаційний пошук являє собою процес зіставлення запиту користувача з відомостями про ІР, що відомі ІПС, до якої надійшов цей запит. Запит користу- вача – це опис інформації, доступ до якої він хоче одержати. У загальному випадку такий запит може, наприклад, містити ключові слова, пов'язані логічними опе- раторами; документ-зразок; тип доку- мента і його тему за класифікатором; списки рекомендованих чи заборонених користувачем інформаційних джерел; обмеження на час або обсяг пошуку тощо. Чим складніше форма подання за- питу, тим вище релевантність пошуку (релевантність пошуку – це співвідно- шення між кількістю знайдених докумен- тів, що задовольнили користувача, тобто відповідали його запиту, і загальною кі- лькістю знайдених документів). Проте ускладнення форми запиту призводить до ускладнення процедури його обробки, і, отже, до збільшення часу пошуку. Метод пошуку МО на основі по- рівняння їх контексту з онтологією ПрО, яка цікавить користувача. Спо- чатку потрібно за допомогою ІПС знайти множину ГІР, що містять відповідні клю- чові слова, а після цього – перевірити ці ГІР на наявність посилань на МО тих фо- рматів, що цікавлять користувача (з ура- хуванням фільтрації банерної реклами та МО менше заданого обсягу, що призна- чені для службових цілей – кнопки, сим- воли, роздільні елементи тощо). Наступ- ним етапом роботи є порівняння онтоло- гії користувача з контекстом МО. Кон- текст МО – це текстова інформація, яка міститься в ГІР (приміром, в html-або в sgml-документі), в якому зустрічається посилання на цей МО, та в його мета- описі. Пропонуємо метод пошуку МО, який складається з наступних етапів: • користувач створює запит { }lmn ttoozzQ ,...,,,...,,,..., 111= , який складається з таких елементів: � ключових слів kz – довільних слів або словосполучень природної мови; � термінів онтології Ook ∈ , що описує ПрО, до якої відносяться ін- формаційні інтереси користувача; � множини типів МО Ttk ∈ , потрібних користувачеві; • за типами МО визначається мно- жина форматів подання інформації, що відповідають цьому типу – { } { }pFl fftt ,...,,..., 11 → ; • до зовнішньої ІПС передається за- пит з ключових слів та форматів по- дання інформації )...()...(` 11 ln ffzzQ ∨∨∧∨∨= ; • від ІПС поступає перелік ГІР L, що містять вказані ключові слова та по- силання на МО у відповідних форма- тах, які супроводжуються додатко- вими описами, створеними ІПС (зви- чайно – фрагментами вмісту ГІР, у Інформаційні системи 93 яких зустрілися ключові слова, або анотаціями); • здійснюється фільтрація цього переліку ГІР, для чого описи ГІР по- рівнюються з переліком термінів он- тології ПрО Ook ∈ , створюється LLO ⊆ ; • ГІР з LLO ⊆ перевіряється на доступність і повтори, а потім отри- мується контекст МО – вміст та мета- описи відповідних ГІР, створюється OMO LL ⊆ ; • здійснюється фільтрація переліку МО, для чого контекст МО порівню- ються з переліком термінів онтології ПрО Ook ∈ , створюється MOOMO LL ⊆, ; • підраховується коефіцієнти релева- нтності запиту для кожного МО з MOOMO LL ⊆, ; • МО з MOOMO LL ⊆, впорядковуються за релевантністю, отриманий список разом з описами передається корис- тувачеві. Основна відмінність запропонова- ного методу від аналогічних – здійсню- вати за допомогою ІПС пошук не МО, а ГІР та потім виконувати фільтрацію його результатів з урахуванням онтології ПрО, що цікавить користувача (рис.4). Основні переваги запропонова- ного методу пошуку. Вони полягають у наступному: • для підвищення релевантності по- шуку використовується онтологічний опис ПрО, що цікавить конкретного користувача; • попередній пошук за допомогою зовнішніх ІПС здійснюється серед не МО, а ГІР, що забезпечує значно бі- льшу повноту пошуку; • використання метаописів ГІР та МО, на які вони посилаються, дозво- ляють точніше враховувати їх семан- тику; • проведення фільтрації інформації у два етапи дозволяє значно зменшити час пошуку, оскільки ІР, що відфільт- ровуються на першому етапі, не по- трібно копіювати на сервер для пода- льшої обробки. Пошук МО можна здійснювати по тексту html-сторінок, які містять мульти- ІПС Індекс гіпермедійних ІР Індекс гіпермедійних ІР Користувач МАІПС-м Фільтрація описів ГІР за онтологією ПрО користувача Фільтрація описів ГІР за онтологією ПрО користувача Отримання контексту МО Отримання контексту МО Фільтрація МО за відповідністю їх контексту онтології ПрО користувача Фільтрація МО за відповідністю їх контексту онтології ПрО користувача Впорядкуання результатів пошуку Впорядкуання результатів пошуку Запит (ключові слова, онтологія ПрО, тип МО Перелік МО з описами Обробка запиту Обробка запиту Ключові слова + формати МО Перелік ГІР з описами Перелік ГІР з описами Перелік МО та їх контекст Перелік МО з описами Рис.4. Пошук МО з використанням контексту та онтології ПрО, що цікавить користувача Інформаційні системи 94 медіа, по тексту метаописів цих сторінок та текстах метаописів МО. Для пошуку використовують ключові слова, які задає користувач у пошуковому запиті. Однак, з огляду на специфічність подання сема- нтичної інформації про мультимедіа, а також враховуючи сталі інтереси корис- тувача, для підвищення релевантності цей запит необхідно доповнити онтоло- гією користувача – описом ПрО, а також деякими іншими параметрами пошуку. Місцезнаходження інформації про мультимедійні об’єкти в ГІР. При ви- значенні коефіцієнту релевантності МО запиту доцільно враховувати вагу різних структурних одиниць ГІР (приміром, за- головки різних рівнів). В Інтернеті найчастіше викорис- товуються html-сторінки – текстові до- кументи у певному стандартному фор- маті. Семантична інтерпретація ІР Інтер- нету (розробки Semantic Web) потребує, щоб документ містив додаткову метаін- формацію (у форматах xml, rdf, owl тощо). Гіпертекстове подання дозволяє розміщувати на сторінках різні типи му- льтимедіа – рисунки, фонове звучання музики тощо. Стандарт HTML v.4.0 за допомогою механізму object розширює ці можливості, дозволяючи динамічно зава- нтажувати відео- та аудіоролики в окремі місця сторінки. Для того щоб підвищити релевантність пошуку, доцільно врахову- вати структуру html-сторінки, надаючи словам, що зустрічаються у різних струк- турних елементах, різну вагу, яка відо- бражає їх відносну важливість для запиту [16]. Для визначення коефіцієнта реле- вантності ГІР запиту ключові слова за- питу та терміни онтології порівнюються з множиною слів, використовуваних у ГІР та його метаописах. При цьому вага слів у ГІР визначається кількістю їх входжень та розташуванням [17], а також загаль- ним обсягом контексту. Так, наприклад, термін, який зустрічається як в RDF- описі мультимедіа, так і на html-сторінці, більш вагомий, ніж якщо він знаходиться тільки в тексті html-сторінки. Можна ви- ділити такі області розташування слів: • заголовки; • метатеги; • метаописи; • посилання на інші документи або домени; • параграфи, які містять посилання на МО потрібного типу. Рішення щодо релевантності ГІР приймається на підставі всієї наявної те- кстової інформації про них, наприклад підписів і анотацій. Коефіцієнт релевант- ності К ГІР І запиту Z визначається за формулою: ( ) ( ) ( ) )*,*,(, 11 1 k m i ik p k k n i ik qIonqIznZIK ∑∑ ∑ == = += , де ( )Izn ik , – кількість входжень ключового слова zi до k-го структурного елементу ГІР І (приміром, до заголовку першого або другого рівня, посилання тощо), ( )Ion ik , – кількість входжень терміна он- тології ПрО оi до k-го структурного еле- мента ГІР І, а qk – вага цього структур- ного елемента. Значення коефіцієнтів qk визначаються користувачем залежно від його потреб та специфіки ПрО. Принциповою відмінністю запро- понованого методу пошуку є те, що він дозволяє враховувати метаінформацію навіть у тих випадках, коли вона не під- тверджується вмістом сторінки. Примі- ром, пошукова система Google здатна об- робляти описи в форматі RDF, але якщо слова або словосполучення з цього опису не зустрічаються в тексті сторінки, до якої відноситься цей опис, то система ці слова ігнорує. На практиці досить часто така ситуація не є помилкою розробників ресурсу або прикладом некоректної PR- компанії. Наприклад, адреси розробників або власників ресурсу можуть не вказу- ватися на сторінці, а тема, до якої відно- ситься ресурс, взагалі майже ніколи ніде явно не вказується, окрім метаопису. Пропонується враховувати такі терміни, але давати їм відносно низьку вагу. В та- кому разі ці МО будуть запропоновані користувачеві тільки в тому разі, якщо ресурсів, що містять такі ж терміни і в метаописі і в контенті сторінки, не існує або вони не задовольняють його з яки- хось інших причин (наприклад, входять до списку небажаних джерел). Інформаційні системи 95 Проаналізувавши описи МО, що можна отримати шляхом обробки html- сторінки, яка містить посилання на цей МО, зведемо їх у наступні групи (рис.5): • RDF-опис ГІР, який містить поси- лання на МО – найбільш чіткий і кон- кретний короткий опис семантики ГІР, представлений в структурованій формі (наприклад, у форматі Dublin Core). Автори або власники ІР ство- рюють його вручну або автоматизо- вано, але в разі випадків викорис- тання для реклами (спам) RDF-опис може містити інформацію, яка не має ніякого відношення до контенту ГІР, тому враховувати його необхідно, але з низькою вагою. • RDF-опис МО (приміром, ідентифі- катори Dublin Core), створюваний ав- торами або власниками МО вручну чи автоматизовано. • Текстовий опис МО (longdescr, по- токовий текст) – зв'язний текст, що докладно описує ГІР та потребує се- мантичного розбору. Він створюється цілеспрямовано й осмислено автором, тому його істинність висока. Однак і в цьому випадку необхідно врахову- вати випадки некоректного викорис- тання. • Короткий опис МО, який знахо- диться в самому html-документі (ат- рибути title, alt тощо). Створені ав- томатично тексти можуть не відпові- дати семантиці МО. • Текстовий вміст ГІР. Припустимо вважати, що текст ГІР який містить посилання на МО, на семантичному рівні пов’язаний з цим МО (примі- ром, ГІР та МО відносяться до однієї ПрО, МО є прикладом того, що опи- сується в ГІР і т.д.), тобто між об’єктами, описаними на сторінці та відображеними у МО, існують зв’язки та відповідності. При цьому необ- хідно розділяти сам текст сторінки та його метаопис, який в свою чергу складається як з метатегів, так і з RDF-опису контента сторінки. Можна виділити наступні структу- рні елементи html-сторінки, у яких можна розміщувати посилання на МО: • гіперпосилання – <A …>; • зображення <IMG…>; • фонові зображення та звук <body…>, <table…>; • елемент об'єкта <OBJECT…> з по- силанням на тип МО; • аплет <applet…> (деякі аплети мо- жуть бути МО); • карти < Map…>; • кнопки вводу форм <input…>; • функції javascript <script …>; • елемент LINK з REV=MADE, який іноді використовується для ідентифі- кації автора документа, вказує адресу Html-сторінкаHtml-сторінка МетаописМетаопис RDF-описRDF-опис Текст сторінки Текст сторінки М ає RDF-описRDF-опис Мульти- медійний об`єкт Мульти- медійний об`єкт RDF-описRDF-опис Текстовий опис Текстовий опис Короткий опис Короткий опис М ає Має М ає Рис.5. Інформація про МО, яка міститься в html-сторінці Інформаційні системи 96 його електронної пошти або поси- лання на його домашню сторінку. Висновки Проаналізувавши поширені визна- чення мультимедійної інформації, під- ходи до її класифікації та можливості програмних засобів, що застосовуються для пошуку мультимедіа в Інтернеті, вважаємо доцільним використовувати контекст, у якому зустрічаються мульти- медійні об’єкти, їх метаописи та онтоло- гічне подання знань про сферу інтересів користувача для пошуку на семантич- ному рівні. Крім того, доцільно врахову- вати структуру ГІР, які містять поси- лання на МО та їх метаописів. 1. American National Standard for Telecommunications. Telecom Glossary 2000. - http://www.its.bldrdoc.gov/projects/ telecomglossary2000. 2. ACM SIGMM Retreat Report on Future Directions in Multimedia Research., 2004. – http://www.sigmm.org/Events/reports/retrea t03/. 3. Hoschka P. Synchronized Multimedia Integration Language (SMIL) 1.0 Spec., 1998. – http://www.w3.org/TR/REC-smil/. 4. Большой энциклопедический словарь. Современная энциклопедия. – http://dic.a- cademic.ru. 5. American National Standard for Telecommunications. Telecom Glossary 2000. - http://www.its.bldrdoc.gov/projects/ telecomglossary2000. 6. MPEG-7 Overview, ISO/IEC, July 2002. – http://mpeg.telecomitalialab.com/standards/ mpeg-7/mpeg-7.htm 7. Dublin Core – http://dublincore.org/. 8. Freed N., Borenstein N. Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types. – http://www.ietf.org/rfc/rfc2046.txt. 9. SERIF. – http://derpi.tuwien.ac.at/ ~ andrei/Metadata_Science.htm. 10. Schomaker L. Image Search and Annotation: From Lab to Web // Proc. of CIDE, ISBN 2- 909285-17-0, 2001. – P.373-375. 11. RDF/XML Syntax Specification (Revised), W3C Working Draft, 2002. – http:// www.w3.org/TR/rdf-syntax-grammar/, 12. Open Directory Project. – http://dmoz.org/. 13. Describing and retrieving photos using RDF. – http://www.w3.org/TR/photo-rdf/. 14. Dublin Core Metadata Elements. – http:// www.faqs.org/rfcs/rfc2413.html. 15. Овдій О.М., Проскудіна Г.Ю. Онтології у контексті інтеграції інформації: предста- влення, методи та інструменти побудови // Проблемы программирования. – №4, 2004. – С.353-366. 16. Интеллектуальный семантический поиск с привлечением средств метапоиска / Г.С.Осипов, О.С.Завьялова, И.В.Смир- нов, И.A.Тихомиров // 5 Международ. Конф. "Интеллектуальный анализ инфор- мации ИАИ-2005". – К.: Просвіта, 2005. – С.214-223. 17. Боровикова О.И., Загорулько Ю.А., Сидо- рова Е.А. Автоматизация сбора онтоло- гической информации в Интернет-пор- тале знаний // Там же. – К.: Просвіта, 2005. – С.82-91. Отримано 04.04.05 Про авторів: Рогушина Юлія Віталіївна, кандидат фіз.-мат. наук, старший науковий співробітник, Гришанова Ірина Юріївна, молодший науковий співробітник. Місце роботи авторів: Інститут програмних систем НАН України, Київ, пр.Акад.Глушкова, 40, тел. (044)526 5139, e-mail: _jjj_@ukr.net, i26031966@yahoo.com.