Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову

У статті розглядається проблема побудови системи автоматизованого перекладу з української мови на українську жестову мову. Пропонується інформаційна технологія, що дозволяє побудувати таку систему. Основна ідея полягає у створенні механізму узагальнених граматичних конструкцій простих речень у...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Штучний інтелект
Дата:2011
Автори: Крак, Ю.В., Бармак, О.В., Романишин, С.О.
Формат: Стаття
Мова:Українська
Опубліковано: Інститут проблем штучного інтелекту МОН України та НАН України 2011
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/59837
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову / Ю.В. Крак, О.В. Бармак, С.О. Романишин // Штучний інтелект. — 2011. — № 3. — С. 136-146. — Бібліогр.: 8 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859654529183645696
author Крак, Ю.В.
Бармак, О.В.
Романишин, С.О.
author_facet Крак, Ю.В.
Бармак, О.В.
Романишин, С.О.
citation_txt Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову / Ю.В. Крак, О.В. Бармак, С.О. Романишин // Штучний інтелект. — 2011. — № 3. — С. 136-146. — Бібліогр.: 8 назв. — укр.
collection DSpace DC
container_title Штучний інтелект
description У статті розглядається проблема побудови системи автоматизованого перекладу з української мови на українську жестову мову. Пропонується інформаційна технологія, що дозволяє побудувати таку систему. Основна ідея полягає у створенні механізму узагальнених граматичних конструкцій простих речень української та жестової мов. Отримані узагальнені конструкції пов’язані між собою зв’язками, які дозволяють робити переклад, не гублячи при цьому сенс тексту. Проведено експериментальне дослідження на множині слів та жестів в об’ємі початкових класів спеціальних шкіл для дітей з вадами слуху. The article is devoted to the problem of construction of automated translation from Ukrainian into sign language. An information technology that allows to build such a system is proposed. The basic idea is to create a mechanism of generalized grammatical constructions of simple sentences of Ukrainian and sign language. These result generalized structures are linked with bonds which help to do the translation without dropping the essence of the text. The experimental research of set of words and gestures was made in the primary classes of special schools for children with hearing impairments.
first_indexed 2025-12-07T13:37:34Z
format Article
fulltext «Искусственный интеллект» 3’2011 136 3К УДК 004.89:004.93 Ю.В. Крак1, О.В. Бармак1, С.О. Романишин2 1 Інститут кібернетики ім. В.М. Глушкова НАН України, м. Київ, Україна 2 Хмельницький національний університет, Україна serg.romanyshyn@gmail.com Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову У статті розглядається проблема побудови системи автоматизованого перекладу з української мови на українську жестову мову. Пропонується інформаційна технологія, що дозволяє побудувати таку систему. Основна ідея полягає у створенні механізму узагальнених граматичних конструкцій простих речень української та жестової мов. Отримані узагальнені конструкції пов’язані між собою зв’язками, які дозволяють робити переклад, не гублячи при цьому сенс тексту. Проведено експериментальне дослідження на множині слів та жестів в об’ємі початкових класів спеціальних шкіл для дітей з вадами слуху. Вступ Створення нових сучасних комп’ютерних систем навчання та комунікації для людей з вадами слуху, за допомогою яких можна було б вирішити актуальні завдання сучасності, зокрема, реалізацію інклюзивної освіти та загальне вивчення жестової мови, є важливою і актуальною проблемою. Для вирішення цієї проблеми запропонована концепція інформа- ційної технології невербального спілкування людей з вадами слуху [1]. Комплексна ін- формаційна технологія включає в себе функціональність за синтезом: рухів жестової мови, дактильної абетки, міміки промовляння на просторовій моделі людини та ін. Одним з напрямків концепції є створення автоматизованої системи перекладу з української мови на українську жестову мову. Метою даної роботи є створення засобів аналізу й синтезу граматичних конструкцій речень цих мов для побудови такої системи. Система жестового спілкування глухих Система жестового спілкування глухих має два різновиди: розмовну жестову мову і калькуючу жестову мову. Різновиди відрізняються за лінгвістичною структурою, функціо- нальним призначенням та умовами їх опанування [2]. Калькуюча жестова мова – це жести, які супроводжують усне мовлення того, хто говорить. Жести, що виступають як еквіваленти слів (зазвичай промовлених глухими без голосу тільки губами), слідують в тому ж порядку, в якому розташовані слова звичайного речення. Не маючи власної граматики, калькуюча жестова мова будується на основі граматики словесної мови. Калькуюча жестова мова зазвичай використовується глухими нашої країни в офіційній обстановці – на зборах, конференціях тощо. Розмовна жестова мова – це спілкування за допомогою засобів розмовної жестової мови. У неї своєрідна граматика. Наприклад, якщо фраза «У лівому нижньому кутку кімнати стоїть стілець, за стільцем торшер» підкріплюється в калькуючій мові декількома жестами, що позначають окремі поняття (ЛІВИЙ, НИЗЬКО, КУТ, КІМНАТА, СТОЯТИ, Узагальнені граматичні конструкції для автоматизованого перекладу... «Штучний інтелект» 3’2011 137 3К стільці, торшер) і буквами алфавіту (ЗА СТІЛЕЦЬ-о-м), то в розмовній жестовій мові ця фраза демонструється таким чином: ліва рука показує жест, що означає поняття СТІЛЕЦЬ, права рука – торшер, причому обидва жести виконуються одночасно, але лівіше і ближче до розповідача – відображаючи тим самим задане просторове положення предметів. Надалі розглядатимемо розмовну жестову мову. Специфіка лексики у ній зумовлена тим, що розмовна жестова мова використовується в невимушеній, неофіційній обстанов- ці, коли ведуться розмови про події повсякденного життя. Тому деякі поняття у мові від- сутні, наприклад спеціальні позначення, що застосовуються тільки в процесі навчання. Коли виникає потреба у вираженні подібних понять, глухі люди, які досягли певного рівня освіти та розвитку, використовують калькуючу жестову мову або словесну мову. Однак це зовсім не говорить про неповноту або примітивність розмовної жестової мови, а тільки підкреслює специфіку її функціонального призначення. Ця специфіка зумовлює і відсутність у лексиці мови спеціалізованих позначень, завжди присутніх у ситуації розмови, наприклад, позначень голови, носа, руки тощо. Вони завжди виражаються вказуванням на голову, ніс, руку тощо. Треба зауважити, що вказівні жести широко використовуються в розмовному жестовому мовленні і мають досить широкий діапазон функцій. Наприклад, якщо глухий «розповідає» співрозмовнику, якого кольору його нове пальто, то він може просто вказати на перехожого, показавши тим самим, що колір його пальто такий же, як і колір пальто цього перехожого. Особливості лексики розмовної жестової мови можуть бути пов’язані і з кінетикою. Наприклад, жести, що виражають значення «підніматися» (в гору) і «спускатися» (з гори), різняться лише напрямом руху: знизу вгору і згори вниз, а значення «дивитися» і «оглядати» – тільки якістю руху: рівномірний рух і круговий рух. Лексика розмовної жестової мови ще недостатньо вивчена, особливо ідіоматика, фра- зеологія, морфологія. Автоматичне приписування жестовій мові усіх форм словесної та письмової мови є невірним, оскільки неможливо вставити розмовну жестову мову глухих у традиційні моделі лінгвістики. Для опису фактів морфології розмовної жестової мови найбільше підходить опис за принципом: від значення – до форми. Значення «множин- ності», «часу», «приналежності», «закінчення дії» передаються у жестовому мовленні своїми способами. Залежно від значення змінюється і спосіб виконання жесту (якість руху). Наприклад, жести у значенні «доручати», «купувати», «вирішувати» виконуються повільно і кожен жест повторюється кілька разів, а жести в значенні «доручити», «купити», «ви- рішити» – виконуються різко і одноразово. Зміна способу виконання жесту (інфлексія) – най- поширеніший спосіб подання суб’єктно-об’єктних відносин у розмовному жестовому мовленні. Рух від себе показує роль об’єкта (дивлюся, допомагаю), а рух до себе – роль суб’єкта (дивись на мене, допомагай мені). Отже, узагальнюючи вищевикладене, можна зробити висновок, що розмовна жестова мова – це самобутня мова, що дозволяє висловити будь-які смисли і відносини між смислами. Тому вона успішно вирішує проблему спілкування глухих у невимушеній, неофіційній обстановці. Відзначимо, що у звичайній мові основою є слово, тоді як у жестовій мові жест є основною семантичною одиницею зі складною структурою. Жест складається з таких компонентів, як конфігурація, місце жесту і характеристики руху руки. Жест у жестовій мові глухих є рухом руки (двох рук) і пальців. Руки, рухаючись, торкаються певним чином обличчя, голови, тулуба, які пасивно беруть участь у жесті. Міміка обличчя (рухи частин обличчя – брів, губ, роту) є важливою складовою у жестовій мові. У процесі жестового спілкування вона відіграє значно більшу роль, ніж в процесі усного мовлення. Крак Ю.В., Бармак О.В., Романишин С.О. «Искусственный интеллект» 3’2011 138 3К Для вираження певних відношень у жестовій мові використовуються два порядки побудови речень: лінійний та одночасний. При лінійному порядку жестові одиниці слідують одна за одною, а при одночасному – одна рука відтворює один жест, а інша – інший жест в один і той же відлік часу. Розглянемо синтаксичні особливості жестової мови для простих речень. Підмет і присудок у реченнях пов’язані предикативним зв’язком. Під простими реченнями розумі- тимемо речення з одним предикативним зв’язком. У жестовій мові прості речення поділяються на розповідні, питальні та спонукальні. Розповідне жестове речення містить у собі повідомлення про якийсь факт, роз- повідь про щось. Воно поділяється на стверджувальне та заперечне речення. Для побудови стверджувального розповідного речення застосовуються наступні правила: 1. При побудові розповідного речення лінійного порядку першою ставиться жестова одиниця, що позначає об’єкт, який відповідає на питання хто? що? (аналог в усній мові – підмет). Слідом відтворюється жест, який вказує дію (присудок). Наприклад: Я купила → Я / КУПИТИ / ВЖЕ 2. При розширенні жестового речення жестом, який означає якість предмета (прик- метник), першим відтворюється жест, що позначає об’єкт, а потім жест, який позначає якість. У випадку декількох жестів, які позначають об’єкт, жест, який позначає якість, від- творюється після відповідного жесту, який позначає об’єкт: Смачний пиріг на тарілці → ТАРІЛКА / ПИРІГ / СМАЧНИЙ 3. При побудові розповідного стверджувального речення із застосуванням жесту, що позначає час, місце, причину тощо (прислівник), першим відтворюється жест, який позначає об’єкт, наступним – жест, який уточнює обставину для зазначеного об’єкта. Наприклад: На тарілці мало пирогів → ТАРІЛКА / ПИРІГ / МАЛО 4. Якщо в усній мові логічним наголосом підкреслюється базове слово, то у жестовій мові базовий жест для чіткої візуалізації застосовується останнім. Наприклад, у жестовій конструкції: СЬОГОДНІ / БУДЕ / БАНКЕТ співрозмовник розуміє, що сьогодні відбу- деться не щось інше (екскурсія, конференція), а саме банкет. Якщо подане речення завершити жестом СЬОГОДНІ, то зміст буде наступним: банкет буде не завтра, а саме сьогодні. Побудова окличного речення в жестовій мові аналогічна до побудови простого роз- повідного речення. При візуальному сприйманні та відтворенні окличного жестового ре- чення підвищується його експресивність. Змінюється характеристика рухів рук, які стають швидшими у момент відтворення жестових одиниць, дещо різкими залежно від змісту, а також збільшується амплітуда рухів рук. Важливим є емоційний вираз обличчя, який в різних окличних реченнях містить спектр почуттів від гніву до радощів. Третім чинником є зміна верхньої частини тулуба: наприклад, нахил вперед голови і плечового пояса. У жестовій мові заперечні жести НІ, НЕ БУДЕ, НІКОЛИ, НЕ ХОЧУ тощо, які є основою розповідних жестових конструкцій, застосовуються лише після жестів, які вони заперечують. Наприклад, якщо треба передати сенс: «Я не хочу тебе бачити» послідов- ним відтворенням жестів: Я НЕ ХОЧУ ТЕБЕ БАЧИТИ, то нечуючі можуть зрозуміти це так: Я не хочу. ТИ це бачиш. А тому в даному реченні потрібно застосувати наступну послідовність: Я БАЧИТИ ТЕБЕ НЕ ХОЧУ. Це перше мовне правило побудови заперечних речень. Друге правило полягає у тому, що слова усного мовлення, які несуть в собі заперечен- ня, в жестовій мові, по можливості, замінюються не відповідними, а іншими жестами. Наприклад, не дорогий – ДЕШЕВИЙ, не весело – СУМНО або «не» ставиться після певного слова, наприклад, «Я не працюю» передається так: Я / ПРАЦЮЮ / НЕ. Узагальнені граматичні конструкції для автоматизованого перекладу... «Штучний інтелект» 3’2011 139 3К Питальні речення містять у собі якесь запитання, для отримання інформації. Вони поділяються на власне питальні (містять пряме питання, що вимагає обов’язкової відповіді) та риторичні (що не вимагають відповіді). В жестовій мові існує два правила для послідовної побудови питального речення: 1. Жест, який містить у собі запитання, завжди ставиться у кінці речення. Наприклад: Скільки буде двічі два? → ДВА МНОЖИТИ ДВА БУДЕ СКІЛЬКИ Чи пробувала ти цей салат? → ТИ САЛАТ ЦЕЙ ПРОБУВАТИ ВЖЕ Коли питальне речення містить декілька жестових одиниць, які позначають предмет, то питальні жести: ХТО, КОЛИ, ДЕ, КУДИ, ЗВІДКИ, ЯК, тощо – можуть повторю- ватись для підсилення питальної конструкції, наприклад: Як вони можуть перелізти паркан? → ЯК ВОНИ МОЖЕ ПАРКАН ПЕРЕЛІЗТИ ЯК 2. Вираз обличчя, «виразність» жестів, які несуть питальне навантаження, довші паузи. Спонукальне речення виражає волевиявлення мовця, яке потребує виконання: наказ, прохання, пораду, застереження, протест. Автоматизований переклад Автоматизований переклад (Computer-Aided Translation) - це переклад текстів на комп’ютері з використанням комп’ютерних технологій [3]. Це широке поняття, що може включати в себе різні засоби та інструменти: перевірку правопису та розділових знаків, пошук перекладу у раніше перекладених текстах, термінологічні бази даних, системи, що дозволяють користувачу вносити правки в сумнівних випадках. Від машинного перекладу він відрізняється тим, що процес перекладу виконується людиною, комп’ютер лише до- помагає їй виконати переклад або за менший час, або з кращою якістю. Автоматизований переклад передбачає такі форми взаємодії з користувачем: 1) част- ково автоматизований переклад (використання людиною-перекладачем комп’ютерних словників); 2) системи з розподілом праці, в яких комп’ютер навчений перекладати тільки фрази, структура яких жорстко задана (але робить це так, щоб виправляти за ним не було потреби), а фрази з іншою структурою віддає на переклад людині. Так званий «прямий» переклад, що застосовується у багатьох системах, передбачає перетворення тексту із однієї форми подання (вхідна мова) в іншу (вихідна мова) за сло- вами, не додаючи та не вилучаючи нічого із тексту. Тобто кожне слово перекладається окремо, таким чином, отриманий в такому випадку переклад є сумою перекладів окремих слів. Даний тип перекладу доволі простий, але має багато недоліків, оскільки в мовах дуже мало слів, що перекладаються однозначно. У більшості випадків одне слово має декілька значень і навпаки. Вибір кращого варіанта залежить від контексту, в якому використовуєть- ся слово, що перекладається. Тобто мова йде про передачу сенсу тексту. Деякі слова або словосполучення при цьому можуть перекладатися з адаптацією до мови перекладу або ж зовсім опускатися. Головне – точно передати сенс висловлювання іншою мовою. Такий тип перекладу має на увазі, що його здійснюють групи перекладачів з філологічною освітою на рідній мові. Виходячи зі сказаного вище, сформульована наступна постановка задачі: запропо- нувати комп’ютерну технологію, що реалізуватиме систему автоматизованого перекладу речень українською мовою на відповідні конструкції-речення української жестової мови. Пропонується розв’язок поставленої задачі з наступними обмеженнями: 1) до уваги беруться тільки прості речення; 2) сенс жестової мови обмежується фіксованим переліком тем і ситуацій; 3) система перекладає (без наступних виправлень) тільки навчені жорстко задані структури фраз та речень і не спотворює сенсу; 4) можливе постійне розширення (навчання) переліку структур перекладу. Крак Ю.В., Бармак О.В., Романишин С.О. «Искусственный интеллект» 3’2011 140 3К Система автоматизованого перекладу з української мови на українську жестову мову Система автоматизованого перекладу з української мови на жестову мову передбачає створення множинної моделі української мови [4-7] та реалізації її для можливості мо- делювання відповідних пов’язаних граматичних конструкцій української та жестової мов. В основі системи лежить граматична конструкція простих речень з відповідним групу- ванням їх за темами, що виникають у повсякденному житті. Під простим реченням роз- уміється речення, у якому є тільки одна граматична основа (предикативний центр). Для досягнення мети перекладу необхідно запропонувати граматичний словник української мови. Українська мова відноситься до флективної мови – мови синтетичного типу з домінуванням словозмін за допомогою флексій – формантів, що поєднують відразу декілька значень. Флективна будова мови протистоїть аглютинативній, у якій кожен формант несе тільки одне значення. За основу для розробки граматичного словника візь- мемо теорію лексикографічних систем [4-7]. Побудова граматичного словника флективної мови визначається наявністю нормаль- ної моделі словозміни, що означає встановлення та формалізацію лінгвістичних критеріїв, згідно з якими вся множина слів мови розбивається на певні підмножини, взаємний перетин яких є порожнім, а всередині кожної з них словозміна відбувається за однаковими прави- лами. Підмножини слів з такими властивостями називаються словозмінними парадигма- тичними типами. Під парадигматичним типом розумітимемо групу лексем, словозмінна парадиг- ма яких характеризується однаковою кількістю граматичних форм, усередині якої слово- зміна відбувається за тим самим (єдиним) правилом. Для української мови, яка є мовою аналітико-синтетичного типу, це означає, що, по-перше, слова, які належать до одного парадигматичного класу, мають однакові флексії у відповідних граматичних значен- нях та однаковий характер чергування в основі і, по-друге, відповідні аналітичні форми будуються за однаковими моделями їх утворення. Українській мові притаманні наступні граматичні категорії, що визначають слово- зміну: s – число (однина( 1s ), множина( 2s )), g – рід (чоловічий ( 1g ), жіночий ( 2g ), середній ( 3g ), вищий ступінь ( 4g ), чоловічий або середній рід для істоти ( 5g ), жіночий або середній рід для істоти ( 6g ), чоловічий або жіночий рід для істоти ( 7g ), незмінювана словникова одиниця ( 8g ), найвищий ступінь ( 9g ), i – узагальнена категорія, що включає відмінок, особу, час, стан, спосіб (називний ( 1i ), родовий ( 2i ), давальний ( 3i ), знахідний ( 4i ), орудний ( 5i ), місцевий ( 6i ), кличний ( 7i ), інфінітив ( 8i ), 1-а особа, наказовий спосіб ( 9i ), 2-а особа, наказовий спосіб ( 10i ), 3-я особа, наказовий спосіб ( 11i ), 1-а особа, май- бутній час ( 12i ), 2-а особа, майбутній час ( 13i ), 3-я особа, майбутній час ( 14i ), 1-а особа, теперішній (майбутній) час ( 15i ), 2-а особа, теперішній (майбутній) час ( 16i ), 3-я особа, те- перішній (майбутній) час ( 17i ), 1-а особа, теперішній час ( 18i ), 2-а особа, теперішній час ( 19i ), 3-я особа, теперішній час ( 20i ), активний дієприкметник, теперішній час ( 21i ), діє- прислівник, теперішній час ( 22i ), минулий час ( 23i ), активний дієприкметник, минулий час ( 24i ), пасивний дієприкметник, минулий час ( 25i ), безособова форма, минулий час ( 26i ), дієприслівник, минулий час ( 27i ), незмінювана одиниця ( 28i )). Узагальнені граматичні конструкції для автоматизованого перекладу... «Штучний інтелект» 3’2011 141 3К Кожне слово української мови віднесемо до наступних класів (частин мови) ( p ): іменники ( 1p ), числівники порядкові ( 2p ), числівники кількісні ( 3p ), числівники ( 4p ), числівники типу «два» ( 5p ), дієслова недоконаного і доконаного виду ( 6p ), дієслова до- конаного виду ( 7p ), дієслова недоконаного виду ( 8p ), дієприкметники ( 9p ), прикметники ( 10p ), займенники ( 11p ), займенники-прикметники ( 12p ), прислівники ( 13p ), вигуки ( 14p ), сполучники ( 15p ), частки ( 16p ), прийменники ( 17p ), присудкові слова ( 18p ), вставні слова ( 19p ), абревіатури ( 20p ), сполуки ( 21p ), дієприслівники ( 22p ), займенники з часткою ( 23p ), сполучники і частки ( 24p ), прислівники і частки ( 25p ), числівники з прийменником ( 26p ), іменники з прийменником ( 27p ), дієприслівники з часткою ( 28p ), займенники з приймен- ником ( 29p ), дієприслівники з часткою ( 30p ). Для української мови введемо наступні парадигматичні типи (табл. 1). Таблиця 1 – Парадигматичні типи української мови Парадиг- матичні типи Граматичні класи Граматичні категорії, що визначають словозміну Кількість граматичних значень 1T 1p  71 ,,* iis  14 2T 1210942 ppppp        7121321 ,,*,*,, iissggg  24 3T 113 pp  ,  61 ,, ii  6 4T 5p    6121 ,,*, iigg  12 5T 86 pp          27262524223 132123 22211712 112210291108 ,,,),*( ),*),,(* ,,),*),,(( *,*,*,*, iiiisi sgggi iisii sisisisii  26 6T 7p 27262524223 132123 141312 210291108 ,,,),*( ),*),,(*( ),*),,(( ),,(),,(),*(, iiiisi sgggi siii sisisii 18 0T j j p 30 13  28i 1 Виходячи з того, що українська мова є флективною мовою (тобто граматичні значення передаються флексіями), слова мови моделюються у вигляді комбінації не- змінної та змінної складових: ),(&)( xfxcx  (1) де )(xc – частина лексеми х, яка в процесі словозміни залишається незмінною (квазіоснова), )(xf – її змінна складова (квазіфлексія), & – конкатенація. Реалізація такої моделі зберігання слова прибирає надлишковість, маючи на увазі, що в українській мові більше мільйона слів (у всіх словозмінах) та тільки біля ста тисяч базових слів – інфінітивів. Тобто замість повного тексту слова у таблиці зберігається Крак Ю.В., Бармак О.В., Романишин С.О. «Искусственный интеллект» 3’2011 142 3К номер слова-інфінітива із відповідної множини інфінітивів, номер позиції у слові, до якої слово-інфінітив незмінне, та номер флексії (змінної частини слова) із відповідної множини. Тобто слова української мови подаються у вигляді:   IninSsGgkFFIIWWW iiii  ,,,,,: 21 , (2) де iW – параметри слова української мови ( 1,,0  Ni  , N – кількість слів у слов- нику); F – множина всіх можливих закінчень слів (флексій); k – номер позиції у слові- інфінітиві, з якої починає конкатенуватися флексія (можливі випадки, коли 0k – для словоформи, яка повністю відмінна від інфінітива);  91 ,, ggG  ;  21, ssS  ;  281 ,, iiIn  I – множина слів-інфінітивів української мови (для дієслів – інфініти- ви, для іменників – слова у називному відмінку, однині тощо):   PpwordIII ii  inf,: , (3) де  301 ,, ppP  ; infword – слово-інфінітив. Формування множин IFW ,, проходить наступним чином (для всіх слів-інфінітивів мови):  Вхід: слово-інфінітив та усі його словоформи (граматичні значення)  k Довжина(загальна частина для слова-інфінітива та всіх його словоформ)  Для всіх словоформ визначаємо закінчення (відмінна частина) та додаємо його до множини F (якщо такого закінчення там немає)  Додаємо слово-інфінітив до множини I  Формуємо множину W (2) Прямою задачею для такої моделі (2) є проста задача відтворення повного тексту слова за трьома параметрами kFI ii ,, 21 , яка реалізується відповідним оператором ( H ):          0,&0, 0,&1, 21 21 kFILeft kFkILeft H ii ii , (4) де  LengthWordLeft , – функція отримання перших Length символів із слова Word ; & – конкатенація. Деяка складність виникає для оберненої задачі ( 1H ): для існуючого слова знайти три параметри, які його однозначно визначають. Реалізація оператора (4) для бази даних у вигляді недетерміністської функції призводить до того, що неможливо ефективно про- індексувати. Пошук по неіндексованому полю – досить затратний за часом. Для вирішен- ня цієї проблеми запропонований алгоритм, сенс якого полягає у тому, що вхідне слово розбивається на можливі комбінації незмінної та змінної складових і пошук проводиться по проіндексованих полях таблиць-множин інфінітивів ( I ) та флексій ( F ): 1H i=0 l=Довжина(Word) Повторювати поки i<l Head=LEFT(Word,i) Tail=RIGHT(Word,l-i) Якщо існує інфінітив IIi 1 , що починається на Head та існує флексія FFi 2 , що дорівнює Tail, то визначаємо ( kFI ii ,, 21 ) Інакше i=i+1 Кінець циклу (5) Узагальнені граматичні конструкції для автоматизованого перекладу... «Штучний інтелект» 3’2011 143 3К Отже, до розгляду беремо тільки прості речення, тобто вважатимемо, що довільне складне речення можна подати як декомпозицію простих речень, причому обмежимося наступними типами простих речень: розповідні (стверджувальні, окличні та заперечні), питальні та спонукальні. Речення в моделі даних об’єднуватимуться у структури, отримані шляхом узагаль- нення. Структури речень міститимуть замість слів їх послідовності, кожна з яких може використовуватись при побудові речення. Послідовності можуть мати як окремі слова, так і різноманітні множини. Наприклад, речення «він йде», «вона йде», «час йде» об’єднують- ся в одну структуру «{він, вона, час, хто, …} йде». Дані послідовності можуть змінюватись та доповнюватись у процесі перекладу. Аналогічні структури будуватимуться і для же- стових речень. Формальну модель узагальнених граматичних конструкцій (маючи на увазі їх майбутню реалізацію у реляційній базі даних) подамо у вигляді наступних таблиць та зв’язків між ними. Для української мови матимемо: (6) Для української жестової мови матимемо: (7) Для автоматизованого перекладу тексту з української мови на українську жестову мову використовується наступна алгоритмічна схема: 1. Речення поступає на вхід, виконується пошук структури речення, в яку входять кожне зі слів. Йде запит до статистичної бази: чи було таке речення оброблене раніше. Статистична база містить інформацію про частоту повторів перекладу даного речення, структуру даного речення, тематику даного речення, наявність змін у перекладі при об- робленні його користувачем. 2. Якщо речення міститься у статистичній базі, воно обробляється і видається ре- зультат перекладу. В іншому випадку проводиться аналіз речення. Структура речення порівнюється з структурою оброблених раніше речень. Якщо структури речень частково збігаються, робиться спроба прогнозу на основі варіанта, який найчастіше використо- вувався. Наприклад, якщо на вхід отримано речення і таке речення раніше не обробля- лось, відбувається аналіз структури речень, в яких тематика збігається з вхідним. 3. Якщо аналогічної структури не знайдено, відбувається пошук у всіх інших тематичних розділах. Коли знайдено частину речення, що збігається з вхідним, відбувається спроба прогнозу перекладу. Наприклад, якщо на вхід дано речення Крак Ю.В., Бармак О.В., Романишин С.О. «Искусственный интеллект» 3’2011 144 3К «дайте мені їсти», а в статистичній базі знайдено речення «дайте мені хліб», то для перекладу «дайте мені» використовується вже існуюча структура з бази, а для «їсти» виконується переклад з використанням іншої структури. Під час аналізу структури речення враховується його вид (розповідне, окличне розповідне, заперечне, пи- тальне, спонукальне) та тематика. Отримавши результат, перекладач вибирає один з варіантів: 1. Результат задовільний. Речення позначається як вірне і добавляється у ста- тистичну базу. 2. Результат не задовільний і правиться вручну. Після цього у статистичну базу вноситься і виправлений варіант і запропонований варіант, для забезпечення прийняття рішень надалі. 3. Результат не задовільний і вважається недопустимим. Запропонований результат вноситься в статистичну базу як недопустимий. Перекладач може ввести правильний варіант перекладу, який буде збережений в базу даних та буде використовуватись при перекладі надалі. Реалізація системи автоматизованого перекладу Для тестування запропонованої технології перекладу було створене відповідне програмне забезпечення. Рисунок 1 – Модуль створення узагальнюючих граматичних конструкцій Процес створення узагальнюючих граматичних конструкцій виглядає наступним чином (рис. 1): 1) вибирається тема, для якої створюються граматичні конструкції, після чого завантажується список граматичних конструкцій, що відповідають вибраній темі; 2) після вибору граматичної конструкції з бази даних завантажуються конструкції української та української жестової мов. Кожній узагальненій граматичній конструкції української мови ставиться у від- повідність граматична конструкція жестової мови. Конструкції можуть містити як окремі слова, так і послідовності слів; Фільтр жестових конструкцій за тематикою Редагування граматичної конструкції української мови Редагування граматичної конструкції жестової мови Список жестових конструкцій за обраною тематикою Вибір жесту зі списку Узагальнені граматичні конструкції для автоматизованого перекладу... «Штучний інтелект» 3’2011 145 3К 3) при створенні або зміні граматичних конструкцій жестової мови з бази даних вибираються жести, що використовуються в конструкції. Якщо потрібного жесту в базі немає, то є можливість додати новий жест. Такі жести позначаються як додані ко- ристувачем. Автоматизований переклад у відповідному модулі здійснюється за описаною вище технологічною схемою (рис. 2). Рисунок 2 – Модуль автоматизованого перекладу тексту з української на українську жестову мову Висновки Для побудови граматичних конструкцій було взято множину речень з програми ви- вчення української жестової мови для спеціалізованих шкіл (для початкових класів) [8]. Було опрацьовано 2821 речень та отримано 259 узагальнених граматичних конструкцій (табл. 2). Отримані конструкції (табл. 3) покрили можливі варіанти речень по темах і з словниково-жестовим запасом для початкових класів. Навіть при такій обмеженій мно- жині слів та жестів вдалося виділити узагальнені конструкції, які використовують не фіксо- вані множини слів, а ознаки граматичних категорій для групування. Наприклад, виділені конструкції: – {цей}{( 1111 ,,, gisp ) (всі іменники у називному відмінку, однині, чоловічого роду)} {( 11110 ,,, gisp ) (всі прикметники у називному відмінку, однині, чоловічого роду)} – цей стіл мій; – {ця}{( 2111 ,,, gisp ) (всі іменники у називному відмінку, однині, жіночого ро- ду)}{( 22111 ,,, gisp ) (всі займенники у родовому відмінку, однині, жіночого роду)} – ця лампа моя. Таблиця 2 – Статистика отримання узагальнюючих граматичних конструкцій Теми Кількість речень Кількість граматичних конструкцій Школа 162 19 Здоров’я 159 12 Харчування 333 23 Спілкування 160 27 Природа 311 30 Знайомство 354 43 Дім 596 44 Анатомія 224 20 Побут 522 41 *** 2821 259 Подальші дослідження спрямовані на доповнення системи більшою кількістю ре- чень (за повний курс школи), що дозволить отримати переклад для множини типових речень, достатніх для звичайного спілкування. Крак Ю.В., Бармак О.В., Романишин С.О. «Искусственный интеллект» 3’2011 146 3К Таблиця 3 – Приклад граматичних конструкцій для перекладу На {тарілці, столі} {ложка, виделка, пиріг, лимон} {ТАРІЛКА, СТІЛ} {ЛОЖКА, ВИДЕЛКА, ПИРІГ, ЯБЛУКО, ЛИМОН} {Я, він, брат, батько} {мені, йому, їй} купив {штани, одяг, сорочку} {Я, ВІН, БРАТ, БАТЬКО} КУПИТИ {Я, ВІН, ВОНА} {ШТАНИ, ОДЯГ, СОРОЧКУ} ВЖЕ У {дівчини, тебе, неї} {гарне, модне} плаття {ДІВЧИНА, ТИ, ВОНА} ПЛАТТЯ {МОДНЕ, ГАРНЕ} Як {тебе, його, її, вас} звати? {ТИ, ЙОГО, ЇЇ, ВИ} ЗВАТИ *ПИТАЛЬН* Це {моя, твоя, його, її} {няня, вихователька, лялька, машина} {МОЯ, ТВОЯ, ЙОГО, ЇЇ} {НЯНЯ, ВИХОВАТЕЛЬКА, ЛЯЛЬКА, МАШИНА} Що {ти, він, брат, батько} робив {вранці, вчора}? ЩО {Я, ВІН, БРАТ, БАТЬКО} РОБИТИ {ВРАНЦІ, ВЧОРА} у кімнаті є { меблі, стіл, стілець, ліжко, диван, шафа, дзеркало, килим, полиця} У КІМНАТІ { МЕБЛІ, СТІЛ, СТІЛЕЦЬ, ЛІЖКО, ДИВАН, ШАФА, ДЗЕРКАЛО, КИЛИМ, ПОЛИЦЯ } {дай, принеси} {мені, йому, їй} {чайник, тарілку, чашку, склянку, ложку, виделку, ніж, ковдру, подушку, рушник } {ДАЙ, ПРИНЕСИ} {ЧАЙНИК, ТАРІЛКА, ЧАШКА, СКЛЯНКА, ЛОЖКА, ВИДЕЛКА, НІЖ, КОВДРА, ПОДУШКА, РУШНИК} {Я, ВІН, ВОНА} Література 1. Інформаційна технологія для моделювання української мови жестів / Ю.Г. Кривонос, Ю.В. Крак, О.В. Бармак [та ін.] // Штучний інтелект. – 2009. – № 3. – С. 186-197. 2. Адамюк Н.Б. Синтаксичні особливості УЖМ: на прикладі простого речення / Н.Б. Адамюк, І.І. Чеп- чина // Жестова мова і сучасність : збірник наукових праць. – 2009. – № 4. – С. 170-191. 3. Bowker L. Computer-aided translation technology: a practical introduction [Електронний ресурс] / Lynne Bowker. – University of Ottawa Press, 2002. – 185 p. – Режим доступу : http://www.google.com/ books?id=ly29-mc6dO0C&printsec=frontcover&hl=uk#v=onepage&q&f=false. 4. Широков В.А. Інформаційна теорія лексикографічних систем / Широков В.А. – К. : Довіра, 1998. – 331 с. 5. Широков В.А. Феноменологія лексикографічних систем / Широков В.А. – К. : Наук. думка, 2004. – 327 с. 6. Корпусна лінгвістика : монографія / [Широков В.А., Бугаков О.В., Грязнухіна Т.О. та ін.]. – К. : Довіра, 2005. – 472 с. 7. Любченко Т.П. Програмно-технологічні аспекти створення граматичних лексикографічних систем / Т.П. Любченко // Проблеми програмування. – 2007. – № 3. – С. 61-75. 8. Програма-комплекс «Українська жестова мова» [Електронний ресурс]. – Режим доступу : http://www.mon.gov.ua/education/average/programs_gluh. Lіteratura 1. Krivonos Ju.G. Shtuchnij іntelekt. № 3. 2009. S. 186-197 2. Adamjuk N. B. Zhestova mova і suchasnіst'. Zbіrnik naukovih prac'. №4. 2009. S 170-191 3. Bowker L. Computer-aided translation technology: a practical introduction. University of Ottawa Press, 2002. 185 p. http://www.google.com/books?id=ly29mc6dO0C&printsec=frontcover&hl=uk#v=onepage&q&f=false. 4. Shirokov V.A. Іnformacіjna teorіja leksykografіchnih system. K. : Dovіra. 1998. 331 s. 5. Shirokov V.A. Fenomenologіja leksikografіchnih sistem. K. : Nauk. Dumka. 2004. 327 s. 6. Shirokov V.A. Korpusna lіngvіstika: Monografіja. K. : Dovіra. 2005. 472 s. 7. T.P. Ljubchenko T.P. // Problemi programuvannja. № 3. 2007. S. 61-75 8. 8.Programa-kompleks “UKRAINS'KA ZHESTOVA MOVA” 9. http://www.mon.gov.ua/education/average/programs_gluh Y.V. Krak, O.V. Barmak, S.O. Romanyshyn The System of Automated Translation from Ukrainian into Sign Language The article is devoted to the problem of construction of automated translation from Ukrainian into sign language. An information technology that allows to build such a system is proposed. The basic idea is to create a mechanism of generalized grammatical constructions of simple sentences of Ukrainian and sign language. These result generalized structures are linked with bonds which help to do the translation without dropping the essence of the text. The experimental research of set of words and gestures was made in the primary classes of special schools for children with hearing impairments. Стаття надійшла до редакції 16.06.2011.
id nasplib_isofts_kiev_ua-123456789-59837
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Ukrainian
last_indexed 2025-12-07T13:37:34Z
publishDate 2011
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Крак, Ю.В.
Бармак, О.В.
Романишин, С.О.
2014-04-10T11:53:25Z
2014-04-10T11:53:25Z
2011
Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову / Ю.В. Крак, О.В. Бармак, С.О. Романишин // Штучний інтелект. — 2011. — № 3. — С. 136-146. — Бібліогр.: 8 назв. — укр.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/59837
004.89:004.93
У статті розглядається проблема побудови системи автоматизованого перекладу з української мови на українську жестову мову. Пропонується інформаційна технологія, що дозволяє побудувати таку систему. Основна ідея полягає у створенні механізму узагальнених граматичних конструкцій простих речень української та жестової мов. Отримані узагальнені конструкції пов’язані між собою зв’язками, які дозволяють робити переклад, не гублячи при цьому сенс тексту. Проведено експериментальне дослідження на множині слів та жестів в об’ємі початкових класів спеціальних шкіл для дітей з вадами слуху.
The article is devoted to the problem of construction of automated translation from Ukrainian into sign language. An information technology that allows to build such a system is proposed. The basic idea is to create a mechanism of generalized grammatical constructions of simple sentences of Ukrainian and sign language. These result generalized structures are linked with bonds which help to do the translation without dropping the essence of the text. The experimental research of set of words and gestures was made in the primary classes of special schools for children with hearing impairments.
uk
Інститут проблем штучного інтелекту МОН України та НАН України
Штучний інтелект
Интеллектуальные речевые технологии. Компьютерная обработка естественно-языковых текстов и семантический поиск
Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову
The System of Automated Translation from Ukrainian into Sign Language
Article
published earlier
spellingShingle Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову
Крак, Ю.В.
Бармак, О.В.
Романишин, С.О.
Интеллектуальные речевые технологии. Компьютерная обработка естественно-языковых текстов и семантический поиск
title Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову
title_alt The System of Automated Translation from Ukrainian into Sign Language
title_full Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову
title_fullStr Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову
title_full_unstemmed Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову
title_short Узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову
title_sort узагальнені граматичні конструкції для автоматизованого перекладу з української мови на українську жестову мову
topic Интеллектуальные речевые технологии. Компьютерная обработка естественно-языковых текстов и семантический поиск
topic_facet Интеллектуальные речевые технологии. Компьютерная обработка естественно-языковых текстов и семантический поиск
url https://nasplib.isofts.kiev.ua/handle/123456789/59837
work_keys_str_mv AT krakûv uzagalʹnenígramatičníkonstrukcíídlâavtomatizovanogoperekladuzukraínsʹkoímovinaukraínsʹkužestovumovu
AT barmakov uzagalʹnenígramatičníkonstrukcíídlâavtomatizovanogoperekladuzukraínsʹkoímovinaukraínsʹkužestovumovu
AT romanišinso uzagalʹnenígramatičníkonstrukcíídlâavtomatizovanogoperekladuzukraínsʹkoímovinaukraínsʹkužestovumovu
AT krakûv thesystemofautomatedtranslationfromukrainianintosignlanguage
AT barmakov thesystemofautomatedtranslationfromukrainianintosignlanguage
AT romanišinso thesystemofautomatedtranslationfromukrainianintosignlanguage