Структурно-функціональний рівень організації лінгвістичного процесора
The speech activity of a person is actualized by an individual speech system that (according to L. Scherba) is determined by the interaction of the linguistic processor, responsible for the structural level of the organization of speech activity, and the knowledge database, where all current cogniti...
Збережено в:
| Дата: | 2018 |
|---|---|
| Автори: | , |
| Формат: | Стаття |
| Мова: | Українська |
| Опубліковано: |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
2018
|
| Теми: | |
| Онлайн доступ: | https://journal.iasa.kpi.ua/article/view/110723 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | System research and information technologies |
| Завантажити файл: | |
Репозитарії
System research and information technologies| _version_ | 1867334323173064704 |
|---|---|
| author | Kyslenko, Yuri I. Khimich, Andriy V. |
| author_facet | Kyslenko, Yuri I. Khimich, Andriy V. |
| author_institution_txt_mv | [
{
"author": "Yuri I. Kyslenko",
"institution": "Національний технічний університет України \"Київський політехнічний інститут імені Ігоря Сікорського\", Київ"
},
{
"author": "Andriy V. Khimich",
"institution": "Національний технічний університет України \"Київський політехнічний інститут імені Ігоря Сікорського\", Київ"
}
] |
| author_sort | Kyslenko, Yuri I. |
| baseUrl_str | http://journal.iasa.kpi.ua/oai |
| collection | OJS |
| datestamp_date | 2018-04-12T11:42:34Z |
| description | The speech activity of a person is actualized by an individual speech system that (according to L. Scherba) is determined by the interaction of the linguistic processor, responsible for the structural level of the organization of speech activity, and the knowledge database, where all current cognitive potential is stored and represented on the symbolic and figurative levels. The structural and functional level of the organization of the linguistic processor for processing messages of mono/poly predicate levels is presented from the point of view of the integration approach to the analysis of a speech activity. This approach combines the features of the formation and interaction of the linguistic processor and knowledge database. It is a fruitful basis for modeling an individual speech system for solving important problems in the field of the information technology. |
| doi_str_mv | 10.20535/SRIT.2308-8893.2018.1.02 |
| first_indexed | 2025-07-17T10:23:11Z |
| format | Article |
| fulltext |
Ю. І. Кисленко, А.В. Хіміч, 2018
Системні дослідження та інформаційні технології, 2018, № 1 19
TIДC
ПРОГРЕСИВНІ ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ,
ВИСОКОПРОДУКТИВНІ КОМП’ЮТЕРНІ
СИСТЕМИ
УДК 004.82
DOI: 10.20535/SRIT.2308-8893.2018.1.02
СТРУКТУРНО-ФУНКЦІОНАЛЬНИЙ РІВЕНЬ ОРГАНІЗАЦІЇ
ЛІНГВІСТИЧНОГО ПРОЦЕСОРА
Ю.І. КИСЛЕНКО, А.В. ХІМІЧ
Анотація. Мовленнєва діяльність людини актуалізується індивідуальною мов-
ною системою, яка (за Л. Щербою) визначається взаємодією лінгвістичного
процесора, відповідального за структурний рівень організації мовленнєвої дія-
льності, та природно-мовної бази знань, де зберігається весь поточний когні-
тивний потенціал як символічного, так і образного рівня. Із позицій урахуван-
ня інтеграційного підходу до аналізу мовленнєвої діяльності презентовано
структурно-функціональний рівень організації лінгвістичного процесора для
опрацювання повідомлень моно/поліпредикатних рівнів. Такий підхід, що по-
єднує особливості формування та взаємодії лінгвістичного процесора з базою
знань, є плідною основою моделювання індивідуальної мовної системи для
вирішення важливих проблем інформаційних технологій
Ключові слова: лінгвістичний процесор, індивідуальна мовна система, базова
семантико-синтаксична структура, квант знань, ситуація, інформаційні при-
родно-мовні технології, інформаційна база лінгвістичного процесора.
ІНТЕГРАЦІЙНИЙ ПІДХІД ДО АНАЛІЗУ ТЕКСТОВОЇ ІНФОРМАЦІЇ
Моделювання мовленнєвої діяльності постає натепер однією з найбільш ак-
туальних і затребуваних у різних сферах наукових та прикладних дослі-
джень проблем сьогодення, починаючи від перспектив розвитку Інтернет
(семантичний Web і формування узагальненої моделі знань) і закінчуючи
аналізом складних проблем когнітивно-комунікативних процесів з виходом
на якісний переклад. Усі ці питання пов’язані з аналізом, розумінням та мо-
делюванням мовленнєвої діяльності людини, найбільш адекватним проявом
та відтворенням якої зрештою є її здатність до аналізу та синтезу текстової
інформації. Мовленнєва діяльність особистості актуалізується індивідуаль-
ною мовною системою (ІМС). У науковий обіг поняття ІМС уведено на-
шим співвітчизником Л. Щербою [1] ще в тридцятих роках минулого сто-
ліття як сукупності лінгвістичного процесора (ЛП), відповідального за
структурний рівень мовної організації та бази знань (БЗ), де постійно нагро-
маджується когнітивний потенціал людини. У загальному випадку структу-
ру ІМС, що охоплює не лише інформацію мовного, а й образного (сенсорно-
го) рівня, зображено на рис. 1.
Ю. І. Кисленко, А.В. Хіміч
ISSN 1681–6048 System Research & Information Technologies, 2018, № 1 20
Лінгвістичний процесор охоплює всі знання про структурний рівень
мовної організації, що забезпечують процедури синтезу/аналізу
повідомлення. База знань нагромаджує сукупні знання як символічного
(мовного), так і сенсорного рівня. Інтерфейс — схема взаємодії ЛП–БЗ.
Важливо враховувати, що складові ЛП і БЗ диференціюють знання про
структурне та змістовне навантаження БЗ, хоча обидві складові
актуалізовані в єдиній нейросубстанції.
У загальному випадку ІМС спирається як на знання про структурно-
функціональний рівень мовної організації, що акумульовані в сучасних під-
ручниках та академічних виданнях (рівень ЛП), так і на весь нагромаджений
натепер когнітивний потенціал окремого індивіда, отриманий через сприй-
няття інформації як образного (сенсорного), так і символічного рівня та збе-
режений в пам’яті людини.
Структурно-функціональний рівень організації ЛП визначається струк-
турним рівнем мовної організації. Ретельно ця проблема висвітлена автором
у праці «Back to Basics of Speech Activity» [2], де з позицій інтегрування різ-
нопланових напрямів сучасних досліджень мовленнєвої діяльності з боку
біологів, нейрофізіологів, психологів, філософів, кібернетиків і, звісно ж,
лінгвістів сформований узагальнений інтеграційний підхід до аналізу мов-
леннєвої діяльності.
У цій праці подано також аксіоматику мовленнєвої діяльності, до
висновків окремих положень якої будемо постійно звертатися. Одним з
найважливіших положень постає думка Б.Ю. Городецького, що «багато
недоречностей в мовознавстві пов’язані з фактом, що до цього часу мова
все ще вважається схемою відтворення думки, а не способом організації
та подання знань» [3]. Це важливий дороговказ на шляху вирішення
заявленої проблематики.
Фрагментарно головні висновки інтеграційного підходу зводяться до
такого: чітко визначено поняття ситуації як окремого кванта знань образно-
го рівня, що сприймається зоровим трактом. Ситуація — це фрагмент
Рис. 1. Індивідуальна мовна система: лінгвістичний процесор — відповідальний за
структурний рівень організації повідомлення; база знань — когнітивний потенціал
суб’єкта
Аналіз
та синтез
текстів
БЗ
Структурно-функціональний рівень організації лінгвістичного процесора
Системні дослідження та інформаційні технології, 2018, № 1 21
зорової складової довкілля, що потрапляє на центральну ямку сітківки
та опрацьовується за повною програмою. А що це за повна програма,
відповідь знаходимо у Семіра Зекі [4], який узагальнив результати
багаторічних досліджень зорового тракту нейрофізіологами. На третьому
рівні сітківки вирішується проблема «фон–фігура» — визначаються
об’єкти/суб’єкти, на четвертому/п’ятому — ідентифікується динаміка
рухомих об’єктів, а далі (в зоровій ділянці головного мозку) визначаються
всі ознаки знайдених складових та міра цих ознак. Ці функції власне і ви-
значають повну програму опрацювання конкретної ситуації, які надалі на
образному рівні передаються в глибинні структури мозку. Якщо окрема
ситуація довкілля визначається триєдністю категорій часу, простору та
дії (філософська концепція), то і її відбиток у нейромережі також
визначається пов’язаною множиною відповідних елементів нейросубстанції.
Коли ж у людини далі виникає комунікативна інтенція стосовно
трансляції цих знань з образного на мовний рівень, то для адекватного
відтворення окремої ситуації лишається тільки єдина можливість — «накле-
їти» на визначені складові окремої ситуації (Obj, Subj, Mov), їх ознаки
Attr(Obj), Attr(Subj), Attr(Mov) та ще й міри всіх ознак Attr (Attr) мовні яр-
лички — слова та пов’язати їх між собою відповідним чином для
відтворення триєдності їх множини у часі, просторі та дії. Саме
функціональне навантаження зорового аналізатора і визначає диференціацію
частин мови, що сформувалася на довгому еволюційному шляху розвитку
людини. Коли ж згадати ще й тезу лінгвістів, що будь-яка ситуація
зовнішнього світу може бути презентована лише чотирма частинами мови,
то чітко бачимо, що мовна презентація ситуації є похідною від струк-
турно-функціонального рівня нейроорганізації зорового тракту. Цей вис-
новок презентується табл. 1.
Т а б л и ц я 1 . Співвідношення між системами опрацювання образної та мовної
інформації
№
з/п
Функціональне навантаження
зорового аналізатора
Відповідні мовні категорії (час-
тини мови)
1 Obj / Subj Іменник
2 Attr(Obj/Subj) Прикметник
3 Attr(Attr) Прислівник
4 Mov Дієслово
5 Attr(Mov) Прислівник
6 Attr(Attr) Прислівник
Вербалізація (трансляція на мовний рівень) окремої ситуації актуалізу-
ється у вигляді окремої базової семантико-синтаксичної структури
(БССС), яка є основою формування будь-якого тексту. Базова семантико-
синтаксична структура — це двоскладова монопредикатна схема опису
довільної ситуації реального або віртуального світу, всі складові якої
актуалізовані на атрибутивному рівні. Структурний рівень організації
БССС зображено на рис. 2.
Важливо, що з посиланням на О.М. Гвоздєва [5] уже матимемо основні
етапи становлення мовленнєвого ладу дитини, що тривають близько трьох
Ю. І. Кисленко, А.В. Хіміч
ISSN 1681–6048 System Research & Information Technologies, 2018, № 1 22
(2,5 – 3) років. У цьому віці дитина вже опановує схему транслювання
окремої ситуації з образного рівня на символьний — мовний. Це головний
етап становлення мовленнєвої організації людини: з одного боку, дитина
вже опанувала загальну схему вербалізації довільної ситуації, а з другого —
вона вже може користуватися і проміжними (неповними) структурами, по-
чинаючи від одно-, дво-, трискладових конструкцій і закінчуючи
повідомленнями з обмеженням (сім плюс-мінус дві) складових, що
визначається структурно-функціональною організацією сітківки. Цей період
визначає можливість опанування структур монопредикатного рівня.
Наступний рівень опанування мовної організації характеризується здат-
ністю формування та використання повідомлень поліпредикатного рівня, де
в одному повідомленні поєднується множина структур монопредикатного
рівня. Це відкриває шлях до схем сурядного та підрядного поєднань бага-
тьох структур БССС, виходячи згодом на рівень рекурсивної організації по-
відомлення. Отже, у структурному сенсі організації текстової інформації (за
ідеологією ВІСА-14 [2]) виходимо на дослідження структурного рівня орга-
нізації повідомлення за дихотомією моно/поліпредикатної схеми організації
повідомлення.
Висновок інтеграційного підходу досить радикальний і настільки ж
продуктивний: всі ми володіємо мовою, не знаючи часто-густо як вона ор-
ганізована лише за однієї умови — будь-який текст, як і мовна організація
загалом визначаються лише однією стандартною структурою опису довіль-
ної ситуації, яку вона опановує у віці двох – трьох років.
У загальному випадку довільний текст виражається множиною одно-
типних структур, організованих на моно/поліпредикатному рівні. Коли ди-
тина/людина опанувала структурний рівень мовної організації, виходячи на
рекурсивний рівень організації повідомлення, це означає, що вона, сприй-
Рис. 2. Базова семантико-синтаксична структура. Subj — суб’єкт БССС; Pred —
предикат як узагальнена характеристика дії; Predicator — ядро предиката; r1, r2, r3,
…, rm — ситуаційні відношення; R1, R2 ,…, Rn — предикативні відношення, що
формують модель керування дієслова
R0
R1
R2 Rn
r1
r2 rm
Предикат
Суб’єкт
Предикат
Структурно-функціональний рівень організації лінгвістичного процесора
Системні дослідження та інформаційні технології, 2018, № 1 23
маючи довільне текстове/мовне повідомлення, абсолютно вільно (хоча може
і підсвідомо) виконує його декомпозицію за окремими квантами знань, ко-
жен з яких окреслюється стандартною структурою БССС. Завдання ж
лінгвістичного процесора — перевести на формалізований рівень процедуру
декомпозиції довільного повідомлення за стандартними однотипними
структурами БССС з ідентифікацією як усіх складових кожної структури,
так і відношень між ними .
Тож, коли намагаємось перекласти на комп’ютер функції лінгвістично-
го процесора як складової ІМС, маємо послідовно реалізувати дві функції:
по-перше, виконати декомпозицію повідомлення за окремими квантами
знань у вигляді структур БССС, по-друге, проаналізувати структурний
рівень організації кожного кванта знань з визначенням його складових
Obj, Subj, Mov з урахуванням їх атрибутивного оточення, а також іден-
тифікувати відношення ситуаційного та предикативного рівнів для
кожного предиката. Останнє зауваження визначається принциповим ета-
пом моделювання процесу розуміння повідомлення. Якщо знову звернутися
до структури БССС, презентованої рис. 2, то чітко вбачаємо цю відмінність
— людина, сприймаючи таке повідомлення, стикається виключно лише
з лексичною її презентацією, тоді як система відношень R0 , ситуаційні
відношення r1, r2, r3, …, rm та предикативні відношення R1, R2 ,…, Rn , що
формують модель керування дієслова, ідентифікуються лише за рахунок
мовної компетенції, сформованої людиною ще у процесі опанування мо-
ви, яка зберігається в пам’яті БЗ і не потребує словесної сатисфакції.
Результати аналізу кожного повідомлення потрібно запам’ятовувати,
імплементувавши їх до когнітивного потенціалу БЗ. Завдання, на перший
погляд, виглядає непідсильним або досить важким, проте матеріали
інтеграційного підходу відкривають певні орієнтири для його вирішення.
Проблема розбудови структурно-функціонального навантаження ЛП поді-
ляється на етапи опрацювання структур моно/поліпредикатних рівнів.
ФУНКЦІОНАЛЬНЕ НАВАНТАЖЕННЯ ЛІНГВІСТИЧНОГО ПРОЦЕСОРА
Функціональне навантаження ЛП визначається головними етапами станов-
лення мовленнєвої діяльності людини, презентованої матеріалами роботи
ВІСА-14 [2]. При цьому когнітивний потенціал ЛП (як здатність оп-
рацьовувати тексти довільної складності) повинен поступово нарощу-
ватися, починаючи від структур монопредикатного рівня (проходячи
послідовно етапи від односкладного повідомлення до повної структури
БССС) та виходячи згодом на рівень опрацювання рекурсивних схем
організації повідомлень довільної складності. Тож варто чітко
диференціювати, власне, і етапи проектування ЛП, орієнтованих спочатку
на опрацювання текстів монопредикатного рівня, а далі і поліпредикатного.
Важливо завжди пам’ятати, що ЛП індивідуальної мовної системи кожного
суб’єкта завжди спирається на когнітивний потенціал, презентований його
БЗ, і нова інформація завжди опрацьовується з урахуванням поточного от-
риманого досвіду. Як тільки нове повідомлення опрацьовано
лінгвістичним процесором і передано у БЗ, воно відразу ж презентується
вже як контекст до певного фрагмента нейромережі та поповнює
когнітивний потенціал суб’єкта.
Ю. І. Кисленко, А.В. Хіміч
ISSN 1681–6048 System Research & Information Technologies, 2018, № 1 24
Це принципова відмінність живої нейросубстанції від комп’ютерних
моделей, де поки що індивідуальна мовна система задекларована на концеп-
туальному рівні без реального наповнення складових ЛП та БЗ. Зауважимо,
що на кафедрі технічної кібернетики НТУУ «КПІ ім. Ігоря Сікорського» в
межах розвитку інформаційних природно-мовних технологій принципово
опрацьований структурно-функціональний рівень організації природно-
мовної бази знань [6]; тож актуальною постає вже проблема розроблення
лінгвістичного процесора як важливої іншої складової індивідуальної
мовної системи. На часі тепер завдання — наповнити обидві складові по-
тужним когнітивним потенціалом, здатним вирішувати нагальні проблеми
сучасних інформаційних природно-мовних технологій. Проект орієнтований
на опрацювання текстів флективних мов, складніших у структурному сенсі
відносно аналітичних.
Структурно-функціональне навантаження ЛП монопредикатного рівня
Лінгвістичний процесор у загальному випадку визначає мовну компетенцію
щодо структурно-функціонального рівня мовної організації, яка (згідно з
працею О.М. Гвоздєва [5]) формується поступово, починаючи від опануван-
ня структури БССС монопредикатного рівня (вік 2,5–3 роки) і закінчуючи у
віці близько 10–12 років опануванням повідомлень поліпредикатного рівня,
виходячи вже на рівень сприйняття рекурсивної організації повідомлення.
Звісно, ці межі дуже залежні від умов виховання та навчання дитини, проте
певним чином вони окреслюють інтервали становлення мовної компетенції
у повному обсязі.
Як монопредикатні, так і поліпредикатні рівні спираються на однакову
систему відношень — ситуаційних та предикативних, але, у першому ви-
падку вони поєднують між собою лише складові структури БССС, що
ідентифікуються окремими частинами мови, тоді як у другому — трансфор-
муючись певним чином, поєднують між собою вже окремі структури БССС.
Таке співвідношення моно/поліпредикатних структур і зумовлює
особливості формування організації ЛП: на першому етапі проектування
враховуються особливості презентації повідомлень монопредикатного
рівня, тоді як на другому — ідентифікуються вже залежності формування
структур поліпредикатного рівня.
Структура лінгвістичного процесора монопредикатного рівня (ЛП-
моно) визначається однозначно структурною організацією БССС (рис. 2).
Мабуть, розглядаючи це питання, потрібно певним чином враховувати
особливості нейроорганізації зорового тракту, що опрацьовує довкілля по-
етапно — з дискретою в одну ситуацію, яка визначається окремим квантом
знань образного рівня, з наступною її вербалізацією (коли виникає в цьому
потреба) у вигляді структури БССС, яку вважатимемо квантом знань
символічного (мовного) рівня.
Нагадаймо послідовність сприйняття довкілля зоровим трактом.
Довкілля квантується очима окремими ситуаціями обсягом сім плюс/мінус
дві складові Obj, Subj, що зумовлюється актуальним зоровим полем; серед
них визначаються динамічні характеристики Mov (усіх або одного об’єкта);
далі ця інформація надходить у зорову кору головного мозку, де визнача-
ються всі ознаки складових ситуації Attr(Obj/Subj), Attr(Mov) та ще й міра
Структурно-функціональний рівень організації лінгвістичного процесора
Системні дослідження та інформаційні технології, 2018, № 1 25
цих ознак у вигляді складових Attr(Attr). Для кожної ситуації визначаються
також просторово-часові характеристики, які порівнюються з попередніми
їх оцінками. За такою схемою опрацьовується кожна ситуація, бо цей про-
цес — отримання адекватної інформації про поточний стан довкілля — є
надважливим для виживання людини у швидкоплинному динамічному
середовищі.
Коли ж у людини виникає потреба транслювати отриману інформацію
на мовний рівень, вона її послідовно транслює у вигляді множини структур
БССС, пов’язаних відповідним чином. Мовне повідомлення аналізується
поетапно з дискретою в одну ситуацію. Проаналізуймо цю процедуру: зав-
данням для ЛП-моно постає процедура аналізу повідомлення, тобто одно-
значне визначення всіх складових (Subj, Obj1 ,….,Objn , Mov), включаючи їх
атрибутивне оточення Attr(Obj/Subj), Attr(Mov), та міру цих ознак Attr(Attr),
а також ситуаційних відношень r1, r2, r3, …, rm (час, простір, причина, умова,
наслідок тощо) та предикативнихі відношень (R1, R2 ,…, Rn ), що формують
модель керування дієслова.
Множина структур БССС, презентованих у межах окремого абзацу, є
зв’язною сукупністю цих структур, триєдиних у часі, просторі та динаміці.
Сучасні надбання класичної лінгвістики багато в чому дозволяють викону-
вати процедуру аналізу повідомлень монопредикатного рівня. Проте знову
доводиться озвучувати тезу, що індивідуальна мовна система завжди
функціонує за рахунок плідної взаємодії ЛП, відповідального за аналіз
структурного рівня мовної організації, і БЗ, де зберігається та нагрома-
джується весь когнітивний потенціал, на якому відбувається змістовна
(семантична) інтерпретація кожного кванта знань у вигляді БССС.
Можемо тепер окреслити поетапно окремі кроки на шляху сприйняття
ЛП повідомлення у вигляді множини стандартних структур БССС. Важливо
враховувати, що аналіз довільного повідомлення будь-якого рівня (мо-
но/полі) потрібно починати обов’язково з ідентифікації комунікативних
засобів, які принципово не входять до структури БССС. Перелік та
класифікацію таких засобів можна знайти в монографії [7], які визначають
окремі аспекти ставлення автора до конкретної інформації, презентованої
поточним квантом знань.
Отже, аналіз окремого повідомлення монопредикатного рівня, окресле-
ного окремою структурою БССС, поділяється на окремі етапи:
1. Ідентифікація комунікативних засобів повідомлення (звісно, коли
вони там є), що визначають певне ставлення автора як до окремих складо-
вих, так і загалом до повідомлення, презентованого структурою БССС.
2. Ідентифікація складових БССС з визначенням частин мови, їх ха-
рактеристик (множина, однина, відмінки, час тощо). На сучасному етапі
розвитку інформаційних технологій існують і використовуються досить
потужні словники, які багато в чому допомагають виконувати етапи визна-
чення частин мови, їх характеристик та особливості використання. Це
дозволяє успішно ідентифікувати усі складові з урахуванням їх атрибутив-
ного оточення.
3. Ідентифікація ситуаційних відношень кожної БССС вбачається
досить складним етапом. Дитина опановує їх у послідовності: дія, час,
простір, причина, умова, наслідок тощо (О.М. Гвоздєв [5]), постійно
Ю. І. Кисленко, А.В. Хіміч
ISSN 1681–6048 System Research & Information Technologies, 2018, № 1 26
аналізуючи співвідношення отриманої інформації з когнітивним її надбан-
ням. Натепер нагромаджено багато досліджень з цього напряму, що можуть
використовуватися для реалізації ЛП. Можемо подати перелік праць з
аналізу часових та просторових відношень (Д.О. Поспедов [8], Ю.І. Кислен-
ко [7], Ю.І. Кисленко, О.С. Черевко [9], Ю.І. Кисленко, А.В. Хіміч [10].
4. Ідентифікація предикативних відношень R1 ,R2 ,…, Rn (моделей
керування окремого дієслова) досі вбачається досить проблематичним, оскі-
льки натепер ще не формалізовані ці дані для комп’ютерних технологій.
Проте проглядається можливість їх формування та використання в процесі
нагромадження когнітивного потенціалу БЗ .
Структурно-функціональне навантаження ЛП поліпредикатного рівня
Згідно з матеріалами ВІСА-14 [2] після засвоєння дитиною (людиною) мо-
нопредикатного рівня організації повідомлення та якщо досить досконало
опрацьована система відношень окремої структури БССС (як ситуаційного,
так і предикативного рівня), то згодом мовець переходить уже до опрацю-
вання та використання повідомлень поліпредикатного рівня. Це означає, що
на «вакантне місце» кожної складової структури БССС ставиться вже не
слово, а окрема ситуація, тобто виникає можливість опанування
поліпредикатні схеми організації повідомлення, що, у свою чергу, уможлив-
лює опанування та використання (синтезу/аналізу) рекурсивних схем
організації повідомлення. При цьому дещо змінюється схема інкорпорації
однієї структури в іншу, і саме це — розуміння особливостей формування
поліпредикатного рівня організації повідомлення — дозволяє впевнено ко-
ристуватися рекурсивною схемою організації комунікативного процесу.
Аналізуючи такі схеми формування та опрацювання подібних повідомлень,
важливо диференціювати окремі схеми взаємодії множини структур БССС у
межах цілісного поліпредикатного повідомлення. Особливості формування
таких структур подамо у стислому вигляді, хоча частково їх презентовано у
праці [7].
Схеми ускладнення предикатора. Існує ряд об’єктивно-суб’єктивних
важелів відтворення ситуацій, коли неможливо адекватно ідентифікувати
окрему ситуацію, не враховуючи цілий спектр характеристик або відношень
самого суб’єкта до певної динамічної ситуації. Прикладом такої конструкції
може бути ситуація: «Хлопець бажає почати навчатись опановувати
професію пілота». У загальному випадку таку ситуацію можна подати схе-
мою, коли предикатор презентує не лише динамічні особливості складових
ситуації, але й охоплює значно ширший спектр динамічних характеристик
як власне суб’єкта, так і дії, включаючи кілька предикатів, кожен з яких
охоплює певні динамічні характеристики дії: модальність виконання дії,
стадійність процесу, можливість навчання, опанування фаху тощо. За-
уважимо, що такий ускладнений предикат підпорядкований лише одному
суб’єкту та ще й визначається певною послідовністю актуалізації. Річ у тім,
що в реальному середовищі та у складних схемах взаємодії людини з дина-
мічним довкіллям дуже часто майже неможливо адекватно окреслити дина-
мічну ситуацію лише одним конкретним предикатором, не враховуючи вза-
ємодію з іншими. Такий ускладнений предикат презентується ієрархічною
множиною окремих підпорядкованих предикатів, коли кожен з наступних
Структурно-функціональний рівень організації лінгвістичного процесора
Системні дослідження та інформаційні технології, 2018, № 1 27
уточнює попередній. Така схема формування поліпредикатного повідомлен-
ня часто подається в реальних текстах і має також опрацьовуватися ЛП.
Схеми трансформування предикаторів. Ця схема має широкі
можливості трансформування предикатора (дієслова) у різновиди атрибу-
тивного рівня у формах дієприкметника, дієприслівника або номінативної
функції субстантиву. Тоді маємо схему організації поліпредикатного по-
відомлення, де один предикатор у формі дієслова Mov трансформується за
зовнішніми флективними ознаками в дієприкметник, виконуючи функцію
атрибутивної складової (Attr (Obj/Subj) будь-якого елемента кореневої стру-
ктури, чи в дієприслівник, окреслюючи ознаки конкретного предикатора
(Attr (Mov), або в субстантив, актуалізований вже повним предикатом.
Особливість таких схем трансформування в тому, що у кожному випадку
трансформується лише предикатор Mov у ту чи іншу схему, тоді як
власне весь предикат (у сукупності множини ситуаційних та предика-
тивних складових) лишається майже у незмінному вигляді. Звісно,
лінгвістичний процесор повинен ідентифікувати такі різновиди взаємодії
двох структур, ураховуючи певні особливості їх актуалізації. Сфери викори-
стання схем трансформування структур БССС за вказаними напрямами мо-
жуть різнитися для різних мов. Особливо це потрібно враховувати
у перекладі з однієї мови на іншу.
Поліпредикатна інтерпретація повідомлень з однорідними членами
речень. До структур поліпредикатного рівня варто віднести і повідомлення
з однорідними членами. Таке повідомлення реципієнтом сприймається як
множина однотипних структур, що можуть відрізнятися одним елементом
або їх множиною. Проте, коли завданням лінгвістичного процессора є аналіз
структурно-функціонального рівня організації довільного повідомлення (що
особливо важливо як для адекватного сприйняття та «розуміння»
повідомлення людиною, так і не менш важливим визначається для адек-
ватного опрацювання повідомлень у сучасних системах інформаційних
технологій), то принципово важливим є питання врахування та опрацюван-
ня таких структур. Усі можливі схеми формування повідомлень з однорідними
членами можуть бути формально презентовані двома структурами БССС —
«хмаринками» структур БССС, що довільним чином «наповзають»
одна на одну.
Формування структур поліпредикатних повідомлень за функ-
ціональним навантаженням елементів БССС. Чітке розуміння можливих
схем організації повідомлення за схемами моно/поліпредикатних рівнів дає
змогу значним чином поліпшити процедуру автоматичного опрацювання
текстової інформації.
Якщо знову звернутися до витоків мовленнєвої діяльності та згадати,
що структура БССС є похідною від структурно-функціонального рівня
нейроорганізації зорового тракту з визначенням складових Obj/Subj на
множині ознак Attr (Obj/Subj) та їх міри Attr(Attr), а також з ідентифікацією
їх динамічних характеристик Mov в околі ознак Attr (Mov) та Attr(Attr) (див.
рис. 2), то можемо презентувати ще одну можливість формування
повідомлень поліпредикатного рівня.
Якщо звернутися знову до структури складових елементів БССС, то
виходимо ще на один рівень формування структур поліпредикатного рівня.
Ю. І. Кисленко, А.В. Хіміч
ISSN 1681–6048 System Research & Information Technologies, 2018, № 1 28
Приклад формування таких повідомлень знаходимо у «Лісовій пісні»
Л. Українки: «Той, що в скелі сидить», «Той, що греблю рве на волі». У за-
гальному випадку — це поліпредикатні структури, де головне речення пре-
зентоване лише вказівним займенником «той», а підрядне визначає власне
окрему ситуацію, презентовану предикатом «Той сидить в скелі». Це при-
клад використання поліпредикатної схеми, де підрядна конструкція
ідентифікує суб’єкт (об’єкт) головного речення, презентований окремою
структурою БССС.
Аналіз такої схеми організації повідомлення поліпредикатнного рівня
підштовхнув автора до цікавого узагальнення, пов’язаного з функціональ-
ним навантаженням займенників. Займенник — це однозначна частина мо-
ви, статус якої дуже розпорошений, невизначений та нечітко окреслений;
однак функціонально він може ідентифікувати (замінювати) будь-яку час-
тину мови. Подамо приблизну класифікацію займенників за їх функціональ-
ним навантаженням (табл. 2).
Таке розмаїте та багатофункціональне навантаження займенників від-
криває ще пласт можливих схем формування структур поліпредикатного
рівня, який покриває функціональне навантаження всіх складових БССС.
Варто зауважити, що людина однозначно та безпомилково фіксує їх семан-
тичне навантаження, тоді як для моделювання відповідних залежностей —
це досить складна проблема. На монопредикатному рівні ці засоби викону-
ють роль окремих складових БССС, тоді як на поліпредикатному рівні вони
постають у парному варіанті, поєднуючи вже окремі структури БССС, одна
з яких ідентифікується займенниками, а друга презентується вже цілою
структурою.
Т а б л и ц я 2 . Функціональне навантаження займенників відносно складо-
вих БССС (монопредикатний рівень)
Тип займенника Семантичне навантаження Функції БССС
Особові я, ти, він, вона, воно, ми, ви, вони Subj, Obj
Безособові себе (не має ні роду, ні числа) Subj
Присвійні мій, твій, його, її, наш, ваш, їх, їхній Attr(Obj/Subj)
Вказівні цей, сей, той, та, те Attr(Obj/Subj)
Означальні весь, всякий, кожний, інший Attr(Obj/Subj)
Питальні хто, що, який, котрий Attr(Obj/Subj), Obj
Заперечні ніхто, ніщо Subj, Obj
Неозначені дехто, дещо, хто-небудь,що-небудь Subj, Obj
Вказівні такий, який, котрий Attr(Attr)
Для формування структур поліпредикатного рівня найчастіше викорис-
товуються певні схеми, ідентифікаторами яких постають співвідношення
елементів: «той, хто . . . », «…того, кого …», «…тому, кому . . .» тощо. Ана-
логічна схема може використовуватися у випадку пояснення атрибутивного
оточення (Attr (Obj/Subj)) певного елемента головного речення з викорис-
танням відповідних елементів «…такий, який …», «…такому, що…», або
ще і зв’язок може формуватися на рівні міри атрибутивного елемента
Attr(Attr) — аналог системи «…так, як…». Як бачимо, маємо безмежну (але
добре структуровану за канонами БССС) схему формування повідомлень
поліпредикатного рівня. Варіанти таких схем взаємодії повідомлень полі-
предикатного рівня можуть бути подані досить широко у вигляді табл. 3.
Структурно-функціональний рівень організації лінгвістичного процесора
Системні дослідження та інформаційні технології, 2018, № 1 29
Т а б л и ц я 3 . Схеми формування повідомлень поліпредикатного рівня
Ситуаційні
відношення
Схеми формування структур
поліпредикатного рівня
Приклади реалізації
Часові Коли…БССС1…, то … БССС2… Коли …, то …
Просторові Там…БССС1…, де … БССС2… Там …, де….
Причини Через…БССС1… буде … БССС2 Через ... буде щось.
Умови За умови БССС1… буде … БССС2 За умови – буде щось
Наслідок У результаті БССС1 буде … БССС2 У результаті буде
Порівняння БССС1 …, оскільки БССС2… Зроблено так, як …
ПРИКЛАДНІ АСПЕКТИ ВИКОРИСТАННЯ ЛІНГВІСТИЧНОГО
ПРОЦЕПСОРА
Вище проаналізовано досить ретельно особливості організації та викори-
стання мовних засобів формування повідомлень як монопредикатного рівня,
що використовуються в засобах вербалізації окремої ситуації, так і
поліпредикатного, які визначають особливості вербалізації вже окремого
цілісного фрагмента дійсності, презентованого множиною окремих
ситуацій, триєдиних у часі, просторі та дії. Інтеграційний підхід до аналізу
мовленнєвої діяльності зумовлює чіткий системний погляд на структурний
рівень мовної організації, що спирається на поняття окремого кванта знань,
презентованого структурою БССС, і реалізується на моно/поліпредикатних
рівнях.
Перш ніж окреслити перспективи моделювання ІМС, важливо визначи-
ти те підґрунтя і підстави, які забезпечують такий оптимізм. Знакова
публікація автора у цьому напрямі — це праця «Back to basics of speech ac-
tivity» [2], де з позицій інтеграційного підходу (із залученням досліджень
нейрофізіологів, філософів, психологів, кібернетиків та ін.) чітко були
визначені поняття ситуації як окремого кванта знань образного рівня та
схема її вербалізації у вигляді структури БССС. Там чітко й аргументовано
показано, що людина впевнено володіє мовою лише тому, що їй на всі ви-
падки життя достатньо лише однієї стандартної структури. Професор Києво-
Могилянської академії, доктор філологічних наук О.М. Демська після ре-
тельного ознайомлення з цією працею чітко сформувала свій вердикт: «Ця
робота — вершина структуралізму», бо все розмаїття структурного рівня
мовної організації спирається лише на одну-єдину структуру, що постає
похідною від структурно-функціонального рівня нейроорганізації зорового
тракту та використовується на моно/поліпредикатному рівні.
Ця робота стала поштовхом до моделювання індивідуальної мовної
системи як пов’язаної сукупності ЛП та БЗ (див. рис. 1). Важливо, що такий
комплексний підхід до моделювання мовленнєвої діяльності відкриває шлях
до вирішення вузлових проблем інформаційних природно-мовних
технологій, визначених інтернет-спільнотою як «Семантичний Web» та
«Формування моделі світу», без вирішення яких не варто сподіватись на
принципове трансформування якості пошуку.
Ю. І. Кисленко, А.В. Хіміч
ISSN 1681–6048 System Research & Information Technologies, 2018, № 1 30
Натепер роботи з моделювання індивідуальної мовленнєвої системи
виконують аспіранти на кафедрі технічної кібернетики НТУУ «КПІ»
ім. Ігоря Сікорського за двома напрямами: «Проектування природно-мовної
бази знань» (Д.С. Сергеєв) та «Формування лінгвістичного процесора» (А.В.
Хіміч). Уже достатньо повно опрацьовано конструктивний підхід до струк-
турно-функціонального рівня організації природно-мовної бази знань, пре-
зентований працею «Cognitive architecture of speech activity and modeling
thereof» [6]; на часі також опрацювання структурно-функціонального рівня
організації ЛП.
Функціональне навантаження лінгвістичного процесора для синте-
зу тексту монопредикатного рівня. Лінгвістичний процесор як невід’ємна
складова ІМС може і повинен працювати в двох режимах — синтезу та
аналізу мовного повідомлення. Послідовно проаналізуймо ці режими.
У контексті моделювання ЛП, орієнтованого на виконання функцій
синтезу мовного матеріалу, цілком слушним буде посилання на попередню
працю автора, виконану у співпраці з Г.А. Амплєєвою [10] ще в 2000 р. Цей
програмний продукт може сприйматися тепер уже в дещо іншій площині, а
саме: у руслі моделювання роботи ЛП для синтезу тексту через
послідовність структур БССС монопредикатного рівня.
Вхідні дані. Об’єкт дослідження — процес автоматичного формування
опису сцени, синтезованої довільним чином на екрані монітора. У пам’яті
комп’ютера синтезовано дві невеликі БЗ, що моделювали фрагмент
візуального світу: перша — стосувалася візуалізації на сцені графічної
інтерпретації просторових відношень типу напряму та відстані (з
ідентифікацією відношень «попереду», «позаду», «ліворуч», «праворуч»,
«далеко», «недалеко» тощо та їх можливою комбінацією), а друга — пре-
зентувала алгоритм розпізнавання об’єктів (багатокутників, чи фігур з еле-
ментами сталої кривизни). На моніторі випадковим чином синтезувалася
сцена за рендомною реалізацією: об’єктів, їх розмірів, орієнтації, розташу-
вання, кольору тощо; знову випадковим чином на цій сцені розміщувався
автономний робот, ідентифікований своїми координатами, габаритами та
напрямом зору, а також своєю схемою семантичної інтерпретації просторо-
вих відношень.
Поставлено конкретне завдання: обстежити задану сцену, знайти всі
фігури, розпізнати їх, виконавши процедуру ідентифікації з визначенням
усіх параметрів кожного об’єкта (лінійні та кутові характеристики, площа,
центр мас, кривизна відповідних фрагментів, колір тощо), провести їх
класифікацію та визначити просторове положення кожної фігури відносно
робота. Після обстеження сцени отримані дані потрібно вербалізувати,
тобто подати звіт у символічному (текстовому) вигляді.
Звіт формується у двох варіантах: або в абсолютній системі відліку
просторових відношень (відносно положення робота та його напряму зору),
або у відносній системі (відносно окремо вибраного об’єкта — у цьому ви-
падку відносно об’єкта з мінімальною площею). Тут, власне, цікавитимуть
лише певні аспекти цієї процедури у зв’язку з деякими особливостями
процедури вербалізації, що реалізується ЛП. Текст формується у вигляді
послідовності речень — структур БССС.
Структурно-функціональний рівень організації лінгвістичного процесора
Системні дослідження та інформаційні технології, 2018, № 1 31
Програмний продукт моделює основні функції зорового тракту:
визначає всі об’єкти Obj, обстежує їх контур, визначає всі ознаки Attr(Obj)
кожного з них (лінійні та кутові розміри, площу, центр мас), фіксує також
ступінь знайдених ознак Attr (Attr ) (великий, малий, жовтий, рожевий то-
що); окрім того, фіксує своє просторове положення, постійно відслідковує
напрям зору. Процедура синтезу тексту визначається структурою БССС з
ідентифікацією ситуаційних відношень для кожної ситуації.
Звісно, це дуже спрощена модель аналізу сцени з наступною процеду-
рою презентації отриманих результатів у вигляді послідовності структур
БССС. Проте це найважливіший інформаційний аспект мовленнєвої
діяльності людини, пов’язаний з вербалізацією отриманої зоровим трактом
інформації. Доречно тут послатися також на відгук Г. Осіпова (голови
асоціації «Штучний інтелект» РАН) на конференції «Інтелектуальні системи
прийняття рішень» (2005 р.) щодо оцінки згаданого програмного продукту:
на практиці добре відомі праці напряму текст–рисунок, а роботи на-
пряму рисунок–текст ще не траплялися». Це, мабуть, одна з перших
спроб моделювання складної інтелектуальної функції людини у напрямі
моделювання співвідношення «дійсність–текст».
Перспективи використання лінгвістичного процесора в інформа-
ційних природно-мовних технологіях. Дійсно, проблема проектування ЛП
у повному обсязі (з функціями аналізу/синтезу текстової інформації) вида-
ється досить складною, але тут вже досліджені головні особливос-
ті структурної організації повідомлення на як монопредикатному, так і полі-
предикатному рівні, що притаманні всім мовам, бо окрема структура БССС
постає схемою вербалізації окремої ситуації, яка, у свою чергу, є похідною
від структурно-функціонального рівня нейроорганізації зорового тракту
людини (Семір Зекі [4]).
Можемо поки що презентувати потужність запропонованої ідеології
формування ЛП на засадах інтеграційного підходу на прикладі моделюван-
ня здатності такого ЛП стосовно можливості ідентифікації трансформуван-
ня дієслова за схемами дієприкметника, дієприслівника та субстантиву. У
праці Ю. Кисленка та А.В. Терентьєва [11] презентовані результати емуляції
пошуку в Інтернеті конкретного запиту за умови можливості трансформу-
вання предикатора запиту від дієслівної форми до дієприкметника, дієприс-
лівника та субстантиву. Результати експерименту підтверджують, що лише
врахування можливості ідентифікувати в запиті похідні форми дієслова (що
видається не надто складним) дозволяють значним чином підвищити
релевантність пошуку.
Проаналізуймо отримані результати у зв’язку з моделюванням ЛП на
інтеграційних засадах, головною функцію якого стає озвучена теза:
«довільний текст презентується множиною однотипних структур
БССС, організованих на моно/поліпредикатному рівні». Результати експе-
рименту та методика проведення пошуку презентується на рис. 3 за резуль-
татами праці [11]. Презентуватимемо суть такого експерименту за
матеріалами цієї праці.
Експеримент. Суть віртуального експерименту модифікації
інформаційного пошуку полягає у такому: вибирається довільний запит і
опрацьовується у п’яти провідних пошукових системах; двадцять перших
Ю. І. Кисленко, А.В. Хіміч
ISSN 1681–6048 System Research & Information Technologies, 2018, № 1 32
документів видачі (презумпція упорядкування за релевантністю для кожно-
го пошукача) вибираються як тестові масиви для реалізації «пошуку за
знаннями», коли під «квантом знань» визначено окрему структуру БССС.
Пошук на тестових масивах виконується вручну експертом, котрий для ви-
значення релевантності та трансформування структур користується своїми
знаннями. При цьому автори використовували для віртуального пошуку
лише три з усього спектра трансформацій: вхідний запит з дієслівною фор-
мою предикатора трансформувався послідовно в субстантивну, ад’єктивну
та адвербіальну форми. У тестових масивах для кожної пошукової системи
вручну проводився пошук одночасно за трьома трансформованими структу-
рами і за певним критерієм визначалася релевантність документів видачі.
Об’єктом дослідження, таким чином, постає інтернет-система, точні-
ше — технологія пошуку інформації. Мета віртуального експерименту —
порівняти ефективність існуючих схем пошуку (пошук за ключовими сло-
вами) відносно пропонованої схеми структурованого пошуку (пошук за
знаннями). Тестування проводилося для п’яти провідних систем: Google —
найпопулярнішої пошукової системи (http // www.google.com /); Yahoo —
однієї з провідних американських пошукових систем (http // yahoo.com /);
Bing — популярної системи корпорації Microsoft (http // www.bing.com /);
Yandex — найвідомішої російської пошукової системи (http //
www.yandex.ru /); Мета — української пошукової системи (http // meta.ua /).
Як запит обрано фразу: «Письменник, який отримав Пулітцерівську
премію в 2009 році». Для пошуку за ключовими словами ця інформаційна
потреба подається у вигляді послідовності: Q1 = (письменник^отримав^ Пу-
літцерівську^премію^«2009 рік», де^означає логічне «І». У такому вигляді
запит опрацьовується на всіх пошукових системах; при цьому для кожної з
них фіксується видача перших двадцяти документів, за якими надалі вручну
виконується пошук «за знаннями».
Тут маємо структуру природно-мовного повідомлення, реалізовану на
множині категорій «письменник», «отримав», «премію», «Пулітцерівську»,
«2009 рік», пов’язаних певними відношеннями R0, R1, ri. Саме сукупність
категорій та функцій, що їх пов’язують, однозначно визначають зміст (се-
мантику) повідомлення. Зазначена структура вже як повнотекстова на сми-
словому рівні вибирається як запит для віртуального пошуку на отриманих
вибірках з двадцяти документів для кожної пошукової системи.
Окрім того, виходячи з авторського бачення структурної організації
текстової інформації, семантично адекватними запитом будуть і повідомлен-
ня, фрагменти яких подано його трансформаціями. Таким чином, «пошук за
знаннями» одночасно включає в себе пошук за всіма різновидами запиту:
Q2 — Письменник, який отримав Пулітцерівську премію в 2009 році.
Q21 — Письменник, отримуючий Пулітцерівську премію в 2009 році.
Q22 — Отримання письменником Пулітцерівської премії в 2009 році.
Q23 — Письменник, отримуючи Пулітцерівську премію в 2009 році.
Важливо звернути увагу на крапки в кінці кожного різновиду запиту —
це означає, що релевантними будуть документи, повідомлення яких містять
щонайменше зазначені різновиди структур Q2, Q21, Q22, Q23.
Для порівняння ефективності пошуку за різними стратегіями
скористаємося оцінкою релевантності отриманих результатів. Для пошуку
Структурно-функціональний рівень організації лінгвістичного процесора
Системні дослідження та інформаційні технології, 2018, № 1 33
за ключовими словами – запит – Q1 – відповідність документа видачі інфор-
маційній потребі користувача (його релевантність) оцінювалася таким чи-
ном. Якщо в документі видачі в одному повідомленні збіглися п’ять ключо-
вих слів, то виставлялася оцінка «п’ять», якщо «чотири», то оцінка «чотири»
і т. д. до оцінки «одиниця». Отримані дані з фіксацією середніх значень у
вигляді графіків для кожної пошукової системи показано на рис. 3.
У іншому випадку Q2 — «пошук за знаннями» — порівнюються вже
фрагменти структур (як сукупність категорій, пов’язаних певними відно-
шеннями). Релевантна інформація потребує ідентифікації не тільки катего-
рій, а і функцій, що їх пов’язують. Таким чином, якщо в документі (окремих
його повідомленнях) є структура, що збігається цілком із структурою запиту
з п’яти елементів з урахуванням їх функціональних зв’язків, то виставляєть-
ся оцінка «п’ять», якщо збігаються чотири елементи спільно з їх функціона-
льними зв’язками, то виставляється оцінка «чотири» і т. д. Результати «по-
шуку за знаннями» для всіх тестованих пошуковиків (оцінка релевантності)
подано на рис. 3, б.
Під час порівняння результатів відразу стає очевидним значне підви-
щення релевантності видачі «пошуку за знаннями» для всіх пошукових сис-
тем: Google (+0,9), Yahoo (+1,55), Bing (+1,15), Yandex (+1,0) , Meta (+1,5).
Ці результати отримано на малих вибірках і, ймовірно, заздалегідь були
прогнозовані. Однак слід відзначити істотні обставини:
1) трансформації, використовувані для пошуку «за знаннями», цілком
доступні для реалізації в пошукових системах за формальними критеріями;
2) вирішується важливе принципове питання —отримується гарантія
того, що після проведення пошуку в подібному режимі не випускаються ці-
каві релевантні документи;
3) можна більш точно в запиті формулювати інформаційну потребу,
оскільки порівняння ведеться «за знаннями».
Таким чином, у результаті віртуального експерименту отримано
порівняння машинного пошуку з пошуком інформації людиною. Пріоритет,
звичайно ж, лишається за людиною, і такий результат можна було б передба-
чити заздалегідь, ураховуючи, що машина:
все ще не забезпечена знаннями про сферу пошуку;
не має достатнього досвіду спілкування із середовищем;
не володіє інтуїцією, передбаченням і багатьма іншими здібностями;
не має тієї мовної компетенції, яка «спресована» в незчисленних
лінгвістичних фоліантах і мало враховується в сучасних технологіях.
Можемо зробити певні висновки: досі маємо все ще приблизне уяв-
лення про сам об’єкт дослідження — індивідуальну мовну систему людини,
яка реалізовує мовленнєву діяльність у режимах синтезу / аналізу мовного
повідомлення, і в сучасні інформаційні технології вкладається лише дуже
незначна і несистемна дещиця знань про цю одну з найбільш складних інте-
лектуальних функцій людини. В експерименті враховано лише два складни-
ки мовної організації: окремі схеми трансформування повідомлення, допов-
нені ще й особливостями структурної організації мови, що розглядають
довільний текст як множину однотипних синтаксичних структур. І перше, і
друге потребують певних формалізованих процедур, що стосуються
трансформацій як запиту, так і текстів документів. Однак натепер за сучас-
Ю. І. Кисленко, А.В. Хіміч
ISSN 1681–6048 System Research & Information Technologies, 2018, № 1 34
ного розвитку інформаційних технологій — це рутинні стандартні про-
цедури, які без особливих зусиль можуть бути перекладені на комп’ютер.
2 4 6 8 10 12 14 16 18 20
5
4
3
2
1
0
2 4 6 8 10 12 14 16 18 20
5
4
3
2
1
0
Google
2,2
3,1
2 4 6 8 10 12 14 16 18 20
5
4
3
2
1
0
2 4 6 8 10 12 14 16 18 20
5
4
3
2
1
0
Yahoo
1,55
3,1
2 4 6 8 10 12 14 16 18 20
5
4
3
2
1
0
2 4 6 8 10 12 14 16 18 20
5
4
3
2
1
0
Bing
2,05
3,2
2 4 6 8 10 12 14 16 18 20
5
4
3
2
1
0
2 4 6 8 10 12 14 16 18 20
5
4
3
2
1
0
Yandex
2,35
3,35
2 4 6 8 10 12 14 16 18 20
5
4
3
2
1
0
2 4 6 8 10 12 14 16 18 20
5
4
3
2
1
0
Мета
1,45
2,95
а б
Рис. 3. Порівняльна характеристика оцінювання релевантності: а — оцінка реле-
вантності за допомогою пошуку за ключовими словами; б — оцінка релевантності
за допомогою пошуку за знаннями
Структурно-функціональний рівень організації лінгвістичного процесора
Системні дослідження та інформаційні технології, 2018, № 1 35
ВИСНОВОК
Презентована робота присвячена аналізу індивідуальної мовної системи (як
сукупності ЛП та БЗ), відповідальної у загальному випадку за актуалізацію
мовленнєвої діяльності людини. Зокрема розглядається структурно-
функціональний рівень організації ЛП, відповідального за структурний рі-
вень формування повідомлення у процесі синтезу/аналізу мовного повідом-
лення.
Основою дослідження постає інтеграційний підхід до аналізу структур-
ного рівня мовної організації, що охоплює результати сучаних досліджень
мовленнєвої діяльності у багатьох помежованих напрямах. Такий підхід іс-
тотно відрізняється від класичної лінгвістики з огляду на формальне визна-
чення базової семантико-синтаксичної структури як основи формування
довільного повідомлення. Спочатку розглядаються особливості формування
повідомлень на монопредикатному рівні, а потім і на поліпредикатному.
Заключна частина присвячена як прикладним питанням використання
підходу до синтезу мовного повідомлення (система автоматичного форму-
вання опису сцени), так і можливостям його застосування для пошукових
систем.
ЛІТЕРАТУРА
1. Щерба Л.В. О трояком аспекте языковых явлений и эксперименте в языкозна-
нии: избр. тр. / Л.В. Щерба // Языковая система и речевая деятельность. —
М.: Наука, 1974. — С. 24–39.
2. Kyslenko Yu.I. Back to basics of speech actiyity / Yu.I. Kyslenko // Biologically In-
spired Cognitive Architectures (2014) 8. — P. 47–69.
3. Городецкий Б.Ю. Компьютерная лингвистика: моделирование языкового об-
щения (вступ. статья) / Б.Ю. Городецкий // Сб. НЗЛ. — Вып. 24. — М.:
«Прогресс», 1989. — С. 5–31.
4. Зеки Семир. Зрительный образ в сознании и мозге / Семир Зеки // В мире нау-
ки. — 1992. — № 11–12. — С. 33–41.
5. Гвоздев А.Н. Формирование у ребенка грамматического строя русского языка /
А.Н. Гвоздев. — М.: Изд-во Академии пед. наук, 1949. — 192 с.
6. Kislenko Yuri. Cognitive architecture of speech activity and modeling thereof / Yuri
Kislenko, Danylo Sergeiev // Biologically Inspired Cognitive Architectures
(2015) 12. — P. 134–143.
7. Кисленко Ю.І. Архітектура мови (Лінгвістичне забезпечення інтелектуальних
інтегрованих систем) / Ю.І. Кисленко. — К.: ІЗМН, 1998 . — 344 с.
8. Кисленко Ю.И. Структурно-функциональный уровень организации лингвисти-
ческого процессора / Ю.И. Кисленко, О.С. Черевко // Искусственный ин-
теллект. — Донецк. — 2012. –– С. 143–150.
9. Кисленко Ю.І. Інформаційна база лінгвістичного процессора / Ю.І. Кисленко,
А.В. Хіміч // Адаптивні системи автоматичного управління. — 2016. —
№ 1 (28). — C. 42–48.
10. Кисленко Ю.И. О моделировании соотношения «Действительность – Текст» /
Ю.И. Кисленко, Г.А. Амплеева // Искусственный интеллект. — Донецк. —
2000. — № 3. –– С. 475–487.
11. Кисленко Ю.И. Проблемы и перспективы развития поисковых систем /
Ю.И. Кисленко, А.В. Терентьев // Искусственный интеллект. — 2011. — № 3.
Надійшла 19.11.2017
|
| id | journaliasakpiua-article-110723 |
| institution | System research and information technologies |
| keywords_txt_mv | keywords |
| language | Ukrainian |
| last_indexed | 2025-07-17T10:23:11Z |
| publishDate | 2018 |
| publisher | The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" |
| record_format | ojs |
| resource_txt_mv | journaliasakpiua/b2/3c43dc0bb6c13785b64352763506b9b2.pdf |
| spelling | journaliasakpiua-article-1107232018-04-12T11:42:34Z Structural and functional level of the organization of the linguistic processor Структурно-функциональный уровень организации лингвистического процессора Структурно-функціональний рівень організації лінгвістичного процесора Kyslenko, Yuri I. Khimich, Andriy V. linguistic processor individual language system basic semantic and syntactic structure quantum of knowledge situation natural-language technologies knowledge base лингвистический процессор индивидуальная речевая система базовая семантико-синтаксическая структура квант знаний ситуация информационные естественно-речевые технологии информационная база лингвистического процессора лінгвістичний процесор індивідуальна мовна система базова семантико-синтаксична структура квант знань ситуація інформаційні природно-мовні технології інформаційна база лінгвістичного процесора The speech activity of a person is actualized by an individual speech system that (according to L. Scherba) is determined by the interaction of the linguistic processor, responsible for the structural level of the organization of speech activity, and the knowledge database, where all current cognitive potential is stored and represented on the symbolic and figurative levels. The structural and functional level of the organization of the linguistic processor for processing messages of mono/poly predicate levels is presented from the point of view of the integration approach to the analysis of a speech activity. This approach combines the features of the formation and interaction of the linguistic processor and knowledge database. It is a fruitful basis for modeling an individual speech system for solving important problems in the field of the information technology. Речевая деятельность человека актуализируется индивидуальной речевой системой, которая (по Л. Щербе) определяется взаимодействием лингвистического процессора, ответственного за структурный уровень организации речевой деятельности, и естественно-речевой базы знаний, где хранится весь текущий когнитивный потенциал как символьного, так и образного уровня. С позиций учета интеграционного подхода к анализу речевой деятельности презентован структурно-функциональный уровень организации лингвистического процессора для обработки сообщений моно/полипредикатных уровней. Такой подход, сочетающий особенности формирования и взаимодействия лингвистического процессора и базы данных, является плодотворной основой моделирования индивидуальной речевой системы для решения важных проблем информационных технологий. Мовленнєва діяльність людини актуалізується індивідуальною мовною системою, яка (за Л. Щербою) визначається взаємодією лінгвістичного процесора, відповідального за структурний рівень організації мовленнєвої діяльності, та природно-мовної бази знань, де зберігається весь поточний когнітивний потенціал як символічного, так і образного рівня. Із позицій урахування інтеграційного підходу до аналізу мовленнєвої діяльності презентовано структурно-функціональний рівень організації лінгвістичного процесора для опрацювання повідомлень моно/поліпредикатних рівнів. Такий підхід, що поєднує особливості формування та взаємодії лінгвістичного процесора з базою знань, є плідною основою моделювання індивідуальної мовної системи для вирішення важливих проблем інформаційних технологій. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2018-03-20 Article Article application/pdf https://journal.iasa.kpi.ua/article/view/110723 10.20535/SRIT.2308-8893.2018.1.02 System research and information technologies; No. 1 (2018); 19-35 Системные исследования и информационные технологии; № 1 (2018); 19-35 Системні дослідження та інформаційні технології; № 1 (2018); 19-35 2308-8893 1681-6048 uk https://journal.iasa.kpi.ua/article/view/110723/123505 Copyright (c) 2021 System research and information technologies |
| spellingShingle | лінгвістичний процесор індивідуальна мовна система базова семантико-синтаксична структура квант знань ситуація інформаційні природно-мовні технології інформаційна база лінгвістичного процесора Kyslenko, Yuri I. Khimich, Andriy V. Структурно-функціональний рівень організації лінгвістичного процесора |
| title | Структурно-функціональний рівень організації лінгвістичного процесора |
| title_alt | Structural and functional level of the organization of the linguistic processor Структурно-функциональный уровень организации лингвистического процессора |
| title_full | Структурно-функціональний рівень організації лінгвістичного процесора |
| title_fullStr | Структурно-функціональний рівень організації лінгвістичного процесора |
| title_full_unstemmed | Структурно-функціональний рівень організації лінгвістичного процесора |
| title_short | Структурно-функціональний рівень організації лінгвістичного процесора |
| title_sort | структурно-функціональний рівень організації лінгвістичного процесора |
| topic | лінгвістичний процесор індивідуальна мовна система базова семантико-синтаксична структура квант знань ситуація інформаційні природно-мовні технології інформаційна база лінгвістичного процесора |
| topic_facet | linguistic processor individual language system basic semantic and syntactic structure quantum of knowledge situation natural-language technologies knowledge base лингвистический процессор индивидуальная речевая система базовая семантико-синтаксическая структура квант знаний ситуация информационные естественно-речевые технологии информационная база лингвистического процессора лінгвістичний процесор індивідуальна мовна система базова семантико-синтаксична структура квант знань ситуація інформаційні природно-мовні технології інформаційна база лінгвістичного процесора |
| url | https://journal.iasa.kpi.ua/article/view/110723 |
| work_keys_str_mv | AT kyslenkoyurii structuralandfunctionalleveloftheorganizationofthelinguisticprocessor AT khimichandriyv structuralandfunctionalleveloftheorganizationofthelinguisticprocessor AT kyslenkoyurii strukturnofunkcionalʹnyjurovenʹorganizaciilingvističeskogoprocessora AT khimichandriyv strukturnofunkcionalʹnyjurovenʹorganizaciilingvističeskogoprocessora AT kyslenkoyurii strukturnofunkcíonalʹnijrívenʹorganízacíílíngvístičnogoprocesora AT khimichandriyv strukturnofunkcíonalʹnijrívenʹorganízacíílíngvístičnogoprocesora |