Граматичні лексикографічні системи з флективним і аглютинативнимм компонентом словозміни

У статті подано концептуальні моделі словозмінної системи мов із флективним компонентом словозміни, мов із флективним та аналітичним компонентами, а також мов з аглютинативним компонентом. Описано технологію побудови граматичних лексикографічних систем, їхню структуру та функції....

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2013
Автори: Любченко, Т.П., Шевченко, І.В., Широков, К.В.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут мовознавства ім. О.О. Потебні НАН України 2013
Назва видання:Мовознавство
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/183750
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Граматичні лексикографічні системи з флективним і аглютинативним компонентом словозміни / Т.П. Любченко, І.В. Шевченко, К.В. Широков // Мовознавство. — 2013. — № 2-3. — С. 209-220. — Бібліогр.: 5 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-183750
record_format dspace
spelling irk-123456789-1837502022-04-15T01:32:19Z Граматичні лексикографічні системи з флективним і аглютинативнимм компонентом словозміни Любченко, Т.П. Шевченко, І.В. Широков, К.В. У статті подано концептуальні моделі словозмінної системи мов із флективним компонентом словозміни, мов із флективним та аналітичним компонентами, а також мов з аглютинативним компонентом. Описано технологію побудови граматичних лексикографічних систем, їхню структуру та функції. Grammatical lexicographical systems (GLS) are being developed in the Ukrainian Lingua-Information Fund of the National Academy of Sciences of Ukraine for different languages within the framework of research works to create the National dictionary database of Ukraine. The article presents a conceptual model of inflectional systems of languages with the flectional component in inflection, those with the flectional and the analytical component, and those with the agglutinative component. The technology of construction of GLS, their structure and functions are described. In addition to its main purpose (use in the automatic text processing) the GLS are also used in the study of inflectional systems of respective languages. The article, in particular, deals with the results of research on the parameters of incompleteness and variability of the inflectional paradigm in Russian. The data obtained can be used in the typological studies of the inflectional systems of the inflected languages. 2013 Article Граматичні лексикографічні системи з флективним і аглютинативним компонентом словозміни / Т.П. Любченко, І.В. Шевченко, К.В. Широков // Мовознавство. — 2013. — № 2-3. — С. 209-220. — Бібліогр.: 5 назв. — укр. 0027-2833 http://dspace.nbuv.gov.ua/handle/123456789/183750 uk Мовознавство Інститут мовознавства ім. О.О. Потебні НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
description У статті подано концептуальні моделі словозмінної системи мов із флективним компонентом словозміни, мов із флективним та аналітичним компонентами, а також мов з аглютинативним компонентом. Описано технологію побудови граматичних лексикографічних систем, їхню структуру та функції.
format Article
author Любченко, Т.П.
Шевченко, І.В.
Широков, К.В.
spellingShingle Любченко, Т.П.
Шевченко, І.В.
Широков, К.В.
Граматичні лексикографічні системи з флективним і аглютинативнимм компонентом словозміни
Мовознавство
author_facet Любченко, Т.П.
Шевченко, І.В.
Широков, К.В.
author_sort Любченко, Т.П.
title Граматичні лексикографічні системи з флективним і аглютинативнимм компонентом словозміни
title_short Граматичні лексикографічні системи з флективним і аглютинативнимм компонентом словозміни
title_full Граматичні лексикографічні системи з флективним і аглютинативнимм компонентом словозміни
title_fullStr Граматичні лексикографічні системи з флективним і аглютинативнимм компонентом словозміни
title_full_unstemmed Граматичні лексикографічні системи з флективним і аглютинативнимм компонентом словозміни
title_sort граматичні лексикографічні системи з флективним і аглютинативнимм компонентом словозміни
publisher Інститут мовознавства ім. О.О. Потебні НАН України
publishDate 2013
url http://dspace.nbuv.gov.ua/handle/123456789/183750
citation_txt Граматичні лексикографічні системи з флективним і аглютинативним компонентом словозміни / Т.П. Любченко, І.В. Шевченко, К.В. Широков // Мовознавство. — 2013. — № 2-3. — С. 209-220. — Бібліогр.: 5 назв. — укр.
series Мовознавство
work_keys_str_mv AT lûbčenkotp gramatičníleksikografíčnísistemizflektivnimíaglûtinativnimmkomponentomslovozmíni
AT ševčenkoív gramatičníleksikografíčnísistemizflektivnimíaglûtinativnimmkomponentomslovozmíni
AT širokovkv gramatičníleksikografíčnísistemizflektivnimíaglûtinativnimmkomponentomslovozmíni
first_indexed 2025-07-16T03:45:32Z
last_indexed 2025-07-16T03:45:32Z
_version_ 1837773653939322880
fulltext Т. П. ЛЮБЧЕНКО, І. В. ШЕВЧЕНКО, К. В. ШИРОКОВ ГРАМАТИЧНІ ЛЕКСИКОГРАФІЧНІ СИСТЕМИ З ФЛЕКТИВНИМ І АГЛЮТИНАТИВНИМ КОМПОНЕНТОМ СЛОВОЗМ ІНИ______________ У статті подано концептуальні моделі словозмінної системи мов із флективним компо­ нентом словозміни, мов із флективним та аналітичним компонентами, а також мов з аглюти­ нативним компонентом. Описано технологію побудови граматичних лексикографічних сис­ тем, їхню структуру та функції. К л ю ч о в і слова: граматична лексикографічна система, граматичний словник, парадиг­ матичний тип, граматичний клас, парадигматичний клас, дефектність словозмінної пара­ дигми, варіативність словозмінної парадигми. Граматичні лексикографічні системи (ГЛС) спрямовані на використання їх у процесах автоматизованого опрацювання мовної інформації на етапах ви­ значення граматичного статусу слів, їхньої вихідної форми й синтезування словозмінних форм. Особливої актуальності це завдання набуває для мов із флективним компонентом у словозміні, зокрема для слов’янських, а також і для аглютинативних, які мають складну словозмінну систему. В Українському мовно-інформаційному фонді НАН України (УМІФ НАНУ) створено лексикографічні системи граматичного типу для української, росій­ ської, німецької, турецької, англійської мов, а також розробляються такі систе­ ми й для іспанської, французької, польської, білоруської мов. Концептуальну основу розробок становить теорія лексикографічних систем що дозволяє з єдиних позицій будувати граматичні лексикографічні системи для різних мов (не тільки флективних, а й флективних з елементами аналітизму, аглютинації). Концептуальні моделі, які покладено в основу ство­ рюваних систем, ураховують широкий спектр параметрів, що забезпечує гнуч­ кість цих систем і уможливлює виконання основних їхніх функцій, спрямованих на автоматичне опрацювання природної мови. Це дозволяє також здійснювати глибокі дослідження словозмінних систем флективних мов, зокрема щодо таких параметрів словозмінної парадигми, як її дефектність (неповнота) і варіатив­ ність, а також забезпечує визначення повного системного опису широко пред­ ставленого в цих мовах явища граматичної омонімії. Зокрема, отримані дані дослідження щодо неповноти й варіативності можуть бути використані в типо­ логічних дослідженнях словозмінних систем відповідних флективних мов. Для підтримки граматичних лексикографічних систем в УМІФ НАНУ ство­ рено інструментальні комплекси, що дозволяють у зручній формі виконувати 1 Широков В. А. Інформаційна теорія лексикографічних систем.— К., 1998.— 331 с. О Т. П. ЛЮБЧЕНКО, І. В. ШЕВЧЕНКО, К. В. ШИРОКОВ, 2013 ISSN 0027-2833. Мовознавство, 2013, № 2—3 209 Т. П. Любченко, I. В. Шевченко, К. В. Широков. лексикографічну роботу з супроводу лексикографічних баз даних відповідних мов. Для української, російської мов такі інструментальні комплекси працюють у режимі віртуальної лексикографічної лабораторії, що уможливлює ефективну взаємодію між користувачами та компонентами системи. Мова з флективним компонентом. Згідно з теорією лексикографічних сис­ тем, будова словозмінної лексикографічної системи (ЛС) для мови з флектив­ ним компонентом може бути представлена діаграмою (рис. 1): У{РАК) А (РАВ) = {*„} н _, = НІ£М ?(РАЩ = {[*]} Рис. 1. Структура морфологічної (парадигматичної) ЛС. У наведеній схемі елементи мають таку інтерпретацію: У(РАК) — множина словникових статей морфологічної (парадигматичної) ЛС; А(РАК) — множина лівих частин словникових статей: А (РАК) = ¥ракУ(РАК) = {х0}, де {х0} — множи­ на слів у вихідній формі; Р{РАК) — множина правих частин словникових статей: Р(РАК) = Срах¥(РАК) = {[*]}, де {[*]} — множина всіх словозмінних парадигм2; Н = ИРАЛ — оператор парадигматизації, який визначає відповідність між вихід­ ною формою слова х0 і множиною його словозмінних форм [х]: НР/Ілх0 = [х]; Н"і = \{ІШ— оператор лематизації: }\ІЕМ %(х) = х0, де %(х) — довільний елемент парадигми [х]. Власне, завдання побудови ЛС граматичного типу й полягає в побудові опе­ ратора парадигматизації, що в свою чергу вимагає формалізації словозмінної системи природної мови (тобто побудови формальної моделі словозміни). Моделювання словозміни мови флективного типу починається з визначення та формалізації лінгвістичних критеріїв, відповідно до яких уся множина слів мови розбивається на певні підмножини, що взаємно не перетинаються, усере­ дині кожної з яких словозміна підпорядковується єдиному правилу. Підмножи­ ни слів з такими властивостями називаються словозмінними (парадигматични­ ми) класами. Уведемо позначення: Ь — певна мова із флективним словозмінним компо­ нентом, — клас слів мови Ь. Моделювання розбиття сукупності слів певної фіксованої мови на парадигматичні класи здійснюється в кілька етапів. На першому етапі лексикон розбивається на класи слів за типом словозмінної парадигми. Такі класи слів у подальшому називатимемо парадигматичними ти­ пами (ПТ). Кожний парадигматичний тип характеризується набором ознак, що їх виражають граматичні категорії, граматичні значення і форми3. Позначимо парадигматичні типи символом Ть де і = 1,2 ,..., — кількість парадигматич­ них типів; (7̂ ) — множина слів мови Ь, що належить типу Г, (має тип Г;), а 2 Словоформи, що входять до складу словозмінної парадигми, називаємо парадигматич­ ними формами. 3 Виноградов В. В. Русский язык // Грамматическое учение о слове.— М., 1986.— 640 с.; Лингвистический энциклопедический словарь / Гл. ред. В. Н. Ярцева.— М., 1990.— 685 с. 210 0027-2833. Мовознавство, 2013, № 2-3 Граматичні лексикографічні системи.. К = {Кь К2, .., Кп} — множина граматичних категорій мови. Отже, формальне визначення парадигматичного типу Т можна записати так: <х \ Т \ К> = {<х, К]> 8(х, К і); .., <х, К > 8(х, Кп)}, де функція 8(х, К,) дорівнює 1, якщо х має влас­ тивість Кіг де Kj — словозмінна граматична категорія; дорівнює 0, якщо х не має властивості Кь або х має властивість Кь але Kt не є словозмінною граматичною категорією. Відповідно до словозмінних категорій, що визначають словозмінну парадиг­ му конкретних слів, парадигматичні типи вводяться таким чином, що w1 = ( J і И^(Т,) п И (̂Ту) = 0 ,ІФ j, І=1 тобто клас слів мови L складається з підкласів ^(7)), які взаємно не перети­ наються і містять слова, що мають той самий парадигматичний тип. Детальний опис парадигматичних типів кожної з розглядуваних нами мов можна знайти у відповідних публікаціях 4. Для російської мови, наприклад, ха­ рактерними є такі парадигматичні типи: субстантивний, ад’єктивний, дієслів­ ний, кількісних числівників і так званий нульовий парадигматичний тип (нез­ мінювані слова мови). За ознакою належності до певної частини мови (лексико-граматичного кла­ су) і за додатковими ознаками, які є класифікувальними в її межах, множина слів W£ розбивається на підмножини, що їх ми називаємо граматичними класами. У подальшому викладі позначатимемо їх Ppj = 1,2, де р — кількість грама­ тичних класів; WJ(Pj) — слова мови L, які належать до граматичного класу Р}. Розбиття на граматичні класи здійснюється таким чином, що r=ü trip}- а) j= 1 На цьому етапі розгляду вважатимемо омонімію знятою, а омоніми промар­ кованими. Тоді взаємний перетин слів з різних граматичних класів є пустою множиною при ff^(P,) П ^ (P j) = 0 при і Ф j, j = 1, 2, ...,р. Між парадигматичними типами і граматичними класами існує зв’язок, який реалізується відношенням вкладення: Р, с Т„ де Рр j =1,2, ...,р — граматичні класи, в яких словозміна має парадигматичний тип Tt,p — кількість відповідних граматичних класів. Принцип розподілу лексики флективної мови на парадигматичні типи, гра­ матичні і парадигматичні класи подано на рис. 2. Певний парадигматичний тип може бути властивий одному або кільком гра­ матичним класам, усередині кожного з яких виокремлюються парадигматичні класи. Як видно зі схеми, відповідно до принципу розподілу 4 Любченко Т. П. Моделирование морфологии естественного флективного язика // Био- ника интеллекта.— 2008.— № 1.— С. 52-64; Lyubchenko I Modelling of the Digital Grammar Dictionary of Russian // Organization and Developmemt of Digital Lexical Resources.— K., 2009. — P. 73-84; Шевченко І. В. Параметризація як основа граматичної ідентифікації словникових одиниць української мови // Прикладна лінгвістика та лінгвістичні технології : 36. наук, праць.— K., 2008.— С. 393-404; Shevchenko I. Towards Creation of the Polish Grammatical Dic­ tionary // Organization and Developmemt of Digital Lexical Resources.— K., 2009.— P. 61-65; Shevchenko I., Kotsyba N., KurshukK. Towards the Creation of a Belarusian Grammatical Dictio­ nary // Explorations Across Languages and Corpora. — Frankfurt am Main et al. — 2011. — Vol. 24.— P. 547-562; Шевченко І. В. Моделі та алгоритмічно-програмне забезпечення лекси­ кографічних систем : Дис. ... канд. техн. наук. — K., 2000.— 167 с.; ШироковК. В. Іменна словозміна в сучасній турецькій мові.— K., 2009.— 318 с.; Любченко Т. П. Лексикографічні системи граматичного типу та їх застосування в засобах автоматизованого опрацювання природної мови : Дис. ... канд. техн. наук.— K., 2011.— 294 с. ISSN 0027-2833. Мовознавство, 2013, № 2—3 211 Т. П. Любченко, І. В. Шевченко, К. В. Широков. Рис. 2. Загальний принцип розподілу лексики флективної мови Г(7;.) = у Г (Р Д (2) де Р] с Ті, Рі — кількість граматичних класів, у яких словозміна має парадигма­ тичний тип Т{\ а г ( р ,) = й (з) к= 1 де сР} с: Т(, гі] — кількість парадигматичних класів граматичного класу Рр у яких словозміна має парадигматичний тип 7’. Парадигматичний клас формально визначаємо таким чином: для мови із флективним компонентом словозміни довільну лексему х (з урахуванням її сло­ возмінних варіантів) можна розглядати як таку, що складається з незмінюваної та змінюваної частин: X = с(х) *Хх), (4) де с(х) — частина лексеми х, яка в усіх словозмінних формах залишається не­ змінюваною (квазіоснова), Дх) — її змінюваний складник (квазіфлексія), сим­ волом «*» позначено операцію конкатенації. Змінюваний та незмінюваний складники лексеми можуть мати як нульову довжину, так і повністю збігатися з лексемою. Наприклад, у російській мові в парадигмах іменників із суплетивни­ ми формами множини (человек, человека, ..., люди, людей, ...) квазіоснова має нульову довжину, а квазіфлексїї представлені всіма словоформами. У парадиг­ мах незмінюваних слів, навпаки, нульову довжину має квазіфлексія. Словозмінна парадигма лексеми х репрезентована як тс(х) = с(х) * Щх)}, (5) де Дх),у = 0,1,2,..., п(Т )̂— змінювані частини слова у відповідних граматичних формах, причому в деяких з них може існувати більше однієї словоформи, тобто: Ж*) = { / ' } , (6) де І = /(/') = 0, 1, 2,..., V — кратність граматичної форми. 212 /ЗХЛГ 0027-2833. Мовознавство, 2013, № 2-3 Граматичні лексикографічні системи.. Для розбиття множини слів певного граматичного класу на парадигматичні класи будуються відношення парадигматизації л„ що визначаються так: Ух1,*2 є Р, хЧ-х2 : = ф 1) */*> х2 = сіх1) * /* ,/* є [Е]к, (7) де [./<]*— набір квазіфлексій, який характерний для певної групи слів, що мають у відповідних граматичних значеннях певного парадигматичного типу однакові змінювані складники. Відношення парадигматизації є відношенням еквівален­ тності, оскільки воно має властивості рефлексивності, симетричності й транзи­ тивності. Фактор-множина Рх/щ становить множину парадигматичних класів {П;} граматичного класу Р, (парадигматичного типу Т,): Рі = й П Г І= 1До одного парадигматичного класу належать слова, що мають однакові набо­ ри квазіфлексій для відповідних граматичних форм і відрізняються один від одно­ го лише незмінюваним складником с(х). Слова з одного класу еквівалентності, який визначено в такий спосіб, мають відповідно й однакові правила словозміни. Для автоматичного отримання повної парадигми за її початковою формою будується оператор парадигматизації: Н : х0 —» [х] = с(х) * {/о(х),/і(х), ...,/п(х)} = {с(х) * /0(х), с(х),..., с(х) * /п(х)}, (8) дія якого визначається відношенням п (х1, х2). Оператор парадигматизації для кожного парадигматичного класу визна­ чається незалежно: Ух є ЯГ(Пк) с ЩР} с ЩТд, : х0 -> с(х) * *„ (9) ■к де Н; — оператор парадигматизації, що діє в межах парадигматичного класу П*; індекси і= 1,2, ...,.ДГ;у = 1,2, ...,р-,к= 1,2, використовуються відповідно для парадигматичних типів, граматичних класів та парадигматичних класів; N — кількість парадигматичних типів; Р] — кількість граматичних класів, які мають парадигматичний тип Т,\ л; — кількість парадигматичних класів у граматичному класі Р/, [Р] * — множина наборів квазіфлексій слів парадигматичного класу П*. Оператор парадигматизації, який діє на множині слів кожного граматичного класу, визначається через оператори парадигматизації Н{ , що функціонують у межах своїх конкретних парадигматичних класів П*: Н- = £ н Г • 5(х; П4), де функція 8(х; Ц ) = \ 1'Х Є , (10) к=\ [0,х£Ж (Пк) де &,у, і — індекси парадигматичного, граматичного класів і парадигматичного типу. Оператор парадигматизації Н визначає відповідність її повної парадигми [х] лексемі х. Алгоритмічна реалізація оператора Н 1 лематизує певну словоформу, тобто забезпечує побудову вихідної форми слова. Викладена формальна модель становить концептуальну основу для комп’ю­ терного моделювання та реалізації парадигматичних відношень у мові з флек­ тивним словозмінним компонентом. Мова з флективним та аналітичним компонентами. Поняття парадигма­ тичного класу, яке формально визначене формулами (4)-(10), узагальнимо що­ до флективної мови з елементами аналітизму (тобто такої, в якій певним грама­ тичним значенням відповідають аналітичні форми). Аналітична форма (АФ) може складатися з двох або більше компонентів, тобто х = хх+х2 + ... +хв. При цьому кожний з компонентів АФ_х?, де 1< q < 0 , може бути змінюваним або не­ змінюваним. У такому випадку аналітична форма має вигляд: ISSN 0027-2833. Мовознавство, 2013, № 2—3 213 Т. П. Любченко, І. В. Шевченко, К. В. Широков. (П) q=\ де <7=1,2,..., 2 — індекс компонента АФ, <2— кількість компонентів АФ. Якщо 6 = 1 , маємо один компонент, тобто х репрезентується за формулою (4). Складо­ ві елементи компонентів АФ такі: с(хд) — квазіоснова іДх,) — квазіфлексія ком­ понента АФ хд. Квазіоснова с(хд) може набувати таких значень: с(хд) = 0 (пустий рядок) у випадку суплетивних словозмінних форм; с(хд) = хд, якщо хд — не­ змінюване слово; с(хд) = хд -Д х?). КвазіфлексіяДх?) = 0, якщо компоненту є не­ змінюваним; Лхд) = хд, якщо всі словозмінні форми — суплетивні; в інших ви­ падках квазіфлексією є деяка послідовність літер, що збігається з кінцевою частиною слова хд. Словозмінна парадигма відповідно до репрезентації (11) така: де у = 0, 1, 2,..., и(Т̂ ) — квазіфлексії компонента хд у відповідних граматичних станах. При цьому будь-який граматичний стан може виражатися більш ніж од­ нією формою (аналітичною або синтетичною). Відношення парадигматизації я, за наявності аналітичних форм визнача­ ються у такий спосіб: два слова, що мають у словозмінній парадигмі аналітичні форми, належать до одного парадигматичного класу, якщо аналітичні форми бу­ дуються за однаковими схемами (мають ті самі допоміжні складники, а розріз­ няються лише смисловим компонентом), а відповідні компоненти АФ мають од­ накові набори квазіфлексій: де[Л* — набори квазіфлексій слів-компонентів АФ у відповідних граматичних значеннях. За відношенням парадигматизації отримуємо фактор-множину Рі / т іяка є множиною парадигматичних класів {ПД граматичного класу Р,. Таким чином, якщо словозмінна парадигма складається як із синтетичних, так і з аналітичних форм, до визначення парадигматичного класу додається ознака однаковості схем побудови аналітичних форм: АФ для відповідних гра­ матичних значень будуються з однакових допоміжних складників (які можуть бути змінюваними); усі словозмінні складники АФ мають однакові набори ква­ зіфлексій для відповідних граматичних форм. Мова з аглютинативним компонентом. При моделюванні словозміни аг­ лютинативних мов, зокрема турецької, ми виходимо з наявності у слова корене­ вого та афіксального складників: де [і?] — «коренева» частина лексеми W (тобто та, яка містить корінь, щодо якого здійснюються словозмінні операції), а [А] — його афіксальна частина; зірочкою позначено операцію конкатенації. У мові з аглютинативним словозмінним компо­ нентом найінтенсивніші словозмінні процеси відбуваються насамперед в афіксаль­ ній частині за рахунок нарощування в певній послідовності афіксів, згідно із зако­ ном сингармонізму, відповідно до процесів спрощення і морфосемантизації. Це, звичайно, не виключає й інших словозмінних процесів, зокрема зумовлених варіа­ ціями в кореневій частині [і?] при словозміні, особливо на межі між [і?] і [А]. Проте саме за рахунок афіксального нарощування та комбінування при словозміні реа­ лізується процес породження системи граматичних значень— як щодо конкретної (12), Цг= [Д] * [А], (14) 214 /ЗХЛГ 0027-2833. Мовознавство, 2013, № 2-3 Граматичні лексикографічні системи.. лексеми, так і щодо лексичної системи в цілому. У своїй логічній структурі афікса­ льна словозміна веде до породження класифікаційних словозмінних схем. Усю множину турецьких слів Ж, які належать до певного лексико-граматич- ного класу (наприклад, іменників), можна розбити на підмножини слів, які є ек­ вівалентними. Ця еквівалентність (у подальшому — А-еквівалентність) визна­ чається так: слова х та у, що належать до Ж, називатимемо А-еквівалентними, якщо вони при словозміні отримують тотожні набори афіксів та афіксальних комплексів (послідовностей). Факт А-еквівалентності слів х та у позначатимемо символом хАу. Формально факт А-еквівалентності можна подати таким чином. Візьмемо два слова х та. у з множини IV і побудуємо їхні репрезентації у фор­ мі (14): х = [іу * [Ах],у = [ /у * [Ау], де символами [ /у і [Ах] позначено відповід­ но кореневу та афіксальну частини лексеми х, а [ /у і [Ау] — відповідно кореневу та афіксальну частини лексеми у. Тоді з факту А-еквівалентності х та у, тобто з хАу, випливає тотожна рівність афіксальних частин х та у. хАу => [Ах] = [Ау]. Визначена у такий спосіб еквівалентність має такі формальні властивості: 1) рефлексивність: хАх (будь-яке слово є А-еквівалентним самому собі); 2) симетричність: хАу =>уАх (якщо слово х є А-еквівалентним слову у, то, оче­ видно, що у є А-еквівалентним слову х); 3) транзитивність: хАу та у Аг => хАг (якщо слово х — А-еквівалентне слову у, а у — А-еквівалентне г, то х — А-ек- вівалентне г). Позначимо символом К \х ) клас слів з Ж, які є А-еквівалентними слову х. Якщо взяти два класи — К \х ) та КА(у), тобто класи слів, А-еквівалентних сло­ вам л; та у відповідно, то можливими є тільки два взаємовиключні варіанти: 1) К \х ) = КА(у) або 2) КА(х) п КА(у) = 0 . (15) Це означає, що ці два класи або повністю збігаються, або не мають жодного спільного елемента (їх перетин є порожньою множиною). Отже, вся множина слів IV подається у вигляді об’єднання класів А-еквіва- лентності, взаємний перетин яких є порожнім: ЇГ = и К А(х);КА(х) п КА(х') = 0 п р и х * х ',х ,х ' є Г \ (16) де ИгА — певна підмножина А-нееквівалентних слів з W. Слід зазначити, що множини, виражені формулами (15)—(16), насправді за­ дають формальне визначення поняття класифікації безвідносно до того, які кон­ кретно об’єкти розглядаються. Якщо є множина IV об’єктів х (х є УГ) будь-якої природи і між ними встановлено яке-небудь рефлексивне, симетричне і транзи­ тивне відношення А, то воно породжує певну класифікацію елементів множини Характерною її ознакою є інваріантний поділ початкової множини об’єктів на підмножини, які не перетинаються, — класи еквівалентності відповідно до прин­ ципу А, що зумовлює такий поділ. До кожного класу еквівалентності потрап­ ляють елементи з подібними властивостями, у той час як властивості елементів з різних класів дещо різняться. У свою чергу, в кожному з класів КА(х) (або в певній їх сукупності) може бути встановлена своя, «дрібніша» класифікація шляхом ви­ значення нових відношень еквівалентності, і цей процес індукування більш тон­ ких класифікацій на підмножинах, у принципі, може продовжуватися. Графічно класифікаційну схему можна представити у вигляді ієрархічного графа: /5£ЛГ 0027-2833. Мовознавство, 2013, № 2—3 215 W Т. П. Любченко, I, В. Шевченко, К’. В. Широков_ (17) де W — певна вихідна множина об’єктів; К f становлять перпшй рівень класифікаційної ієрархії за принципом класифікації А; К ^ 1, К п1А1 — другий рівень класифікаційної ієрархії за принципом класифікації А1 і т. ін. Технологія побудови граматичних лексикографічних систем, їхня структура та функції. Розглянемо технологію створення ГЛС на прикладі ро­ сійської мови. Формування граматичної лексикографічної бази даних (ЛБД) російської мови здійснювалося на основі «Грамматического словаря русского языка» А. А. Залізняка (ГСЗ)5, який достатньо повно моделює словозмінну сис­ тему російської мови. На першому етапі було переведено книжковий варіант словника в електронну форму засобами сканування та розпізнавання тексту. Цифровий варіант тексту ГСЗ (880 сторінок) збережено в doc-форматі, після чо­ го було відкоректовано електронний текст. На наступному етапі здійснено кон­ версію з doc-формату в html-формат із системою кодування Unicode засобами текстового редактора Microsoft Word. Для автоматичної конверсії електронного тексту ГСЗ в ЛБД розроблено програмне забезпечення виділення елементів структури ГСЗ відповідно до будови лексикографічної системи і з використан­ ням поліграфічних ознак їх текстової ідентифікації. Струкіуру даних репрезентовано реляційною моделлю. На рис. З подано схему зв’язків між таблицями граматичної ЛБД російської мови: таблицею реєстрових слів (nom), граматичних класів (Parts), парадигматичних класів (indent), квазіфлексій (flex), словозмінних типів (gr) та акцентуаційних класів (accent). ! ■ Number of table Part of speech Field4 Fie!d5 Field* Fie!d7 Fields Field9 FieldlO Field 11 Fie!dl2 Fie!dl3 zi ID type indent Field3 Field4 comment intcomm Рис. 3. Схема зв’язків між таблицями граматичної ЛБД російської мови. 5 Зализняк А. А. Грамматический словарь русского языка. Словоизменение.—3-е изд.— М., 1987.— 880 с.; 4-е изд., испр. и доп.— М., 2003.— 800 с. 216 ISSN 0027-2833. Мовознавство, 2013, № 2-3 Граматичні лексикографічні системи.. Для супроводу граматичних ЛБД відповідних мов розроблено інструмента­ льні комплекси, які працюють під управлінням операційної системи Microsoft Windows ХР/2003/2008 або Windows Vista. Створені граматичні ЛБД функціо­ нують під СУБД Microsoft SQL Server 2008. Комплекси орієнтовано на роботу в мережевому середовищі. Розглянемо функціональні можливості інструментального комплексу, який розроблено для супроводу ЛБД російської мови. У розробленні програмного ін­ терфейсу було використано елементи управління операційного середовища Windows. Головне вікно програми розділено на три зони: функціональну, реєст­ рову та зону лексикографічної інформації. Функціональна зона складається з таких підзон: загальне меню, інструмента­ рій для редагування, інструментарій для виконання запитів на мові SQL, інтер­ фейс для пошуку слів. Загальне меню містить пункти «Файл», «Вид», «Словник», «Загальний ви­ бір», «Вибірка» і «Довідка». Кожний з цих пунктів складається з підпунктів, зав­ дяки яким реалізуються функції, що надаються користувачеві, а саме: перегляд реєстру; отримання повної словозмінної парадигми обраного з реєстру слова і його основних граматичних характеристик (ця інформація подається в зоні лек­ сикографічної інформації); виведення та перегляд частини реєстру (за певною ознакою або за комбінацією ознак, наприклад за лексико-граматичним класом, номером парадигматичного класу тощо); вибірка лексичних омонімів, власних назв, тощо; виведення кількісних характеристик щодо наповнення обраної гру­ пи слів (парадигматичних класів, частин мови, омонімів тощо); пошук слів у реєстрі; побудова прямого або інверсійного словника (встановлення прямого або інверсійного сортування в реєстрі); додавання нових слів, редагування ре­ єстрових слів, видалення слів з реєстру. Наступними важливими функціями системи є виконання операцій з парадиг­ матичними класами: додавання, редагування, видалення парадигматичних кла­ сів, додавання та редагування квазіфлексій синтетичних форм і типів процедур утворення аналітичних форм (для аналітичних або аналітико-синтетичних мов); побудова словника квазіоснов (для мов флективного типу; словник квазіоснов використовується програмами морфологічного та синтаксичного аналізу). Дефектність та варіативність словозмінної парадигми. Дослідження ти­ пів дефектності та варіативності словозмінних парадигм можливе завдяки роз­ робленим в УМІФ НАН України потужним лексикографічним ресурсам — гра­ матичним лексикографічним системам. Продемонструємо реалізацію можливості такого дослідження на прикладі російської мови на основі її елек­ тронного граматичного словника (ЕГС), який призначений насамперед для ав­ томатичного опрацювання текстів. Цей ресурс можна також використовувати й для дослідження властивостей словозмінних парадигм, таких як її дефектність (неповнота) і варіативність. В основу формування лексикографічної бази ЕГС покладено визначення па­ радигматичного класу (ПК), який об’єднує лексеми з однаковими правилами ут­ ворення їхньої словозмінної парадигми щодо кількості словозмінних форм у па­ радигмі, набору квазіфлексій, а також схеми наголосу. Сформована ЛБД містить 170 тис. словникових одиниць, з них 100 тис. — реєстр словника А. А. Залізняка, 70 тис.— уведені нами в автоматизованому ре­ жимі нові слова. ISSN 0027-2833. Мовознавство, 2013, № 2—3 217 Т. П. Любченко, I. В. Шевченко, К. В. Широков. Дослідження виконувалося на матеріалі 818 парадигматичних класів імен­ ників, 169 класів ад’єктивів та 966 дієслівних класів. Дефектну парадигму слова розуміємо як словозмінну парадигму з відсутні­ ми в ній словоформами для деяких граматичних значень. Як приклад можна на­ вести дефектну словозмінну парадигму російського іменника лёт з відсутнім у нього значенням множини: лёт, лёта, (с) лёту, лёту, лёт, лётом, лёте, (на) лету. Для опису типів дефектності словозмінних парадигм нами введено параметр дефектності, який є переліком словозмінних форм, не реалізованих у парадигмі. У наведеному прикладі параметр дефектності представлено множиною, яка складається з 6-ій елементів: сІе/= {7, 8, 9,10,11,12} 6. Параметри дефектності, що розрізняються, відповідають різним типам дефектності. Словозмінну парадигму, в якій хоча б одна граматична форма реалізується більш ніж однією словоформою, називаємо варіативною. Опис варіативних ти­ пів парадигм здійснюється за допомогою параметра варіативності, що його представляє множина пар чисел, у кожній з яких перше число— це номер грама­ тичного значення в парадигмі, а друге — кількість словоформ, що відповідають конкретному граматичному значенню. У нашому прикладі параметр варіатив­ ності уаг = {<2,2>, <6,2>} означає, що лексема лёт у родовому та місцевому відміках однини має дві форми. Типи дефектності та типи варіативності визначаються шляхом аналізу таблиць квазіфлексій, які в структурі бази даних описують парадигматичні класи конкрет­ них частин мови. Аналіз виконано в автоматичному режимі за допомогою спе­ ціально розроблених програмних модулів. У таблиці квазіфлексій описано 2015 ПК. Виявлено 1207 ПК з дефектністю певного типу, 808 парадигматичних класів мають словозмінну парадигму, що включає всі теоретично можливі форми, тоб­ то в цих класах слів дефектність відсутня: сіє/ = 0. (Дані про кількість дефектних парадигматичних класів у межах кожної частини мови див. у табл. 1). Т аблиця 1 Кількість дефектних парадигматичних класів Частини мови Кількість ПК Кількість ПК з дефектністю іменники 818 188 ад’єктиви 138 46 дієслова 966 966 заименники-іменники 37 5 займенники-прикметники 31 2 кількісні числівники 25 0 Разом 2015 1207 Найбільшу кількість типів дефектності парадигми виявлено в дієслів (69), а в кількісних числівників вона відсутня. Повна дієслівна парадигма за прийнятим у статті визначенням складається з 49 словозмінних форм. До них, крім особо­ вих форм дієслова, належать форми дієприкметників та дієприслівників, що по-різному реалізуються в дієслів доконаного та недоконаного виду. Крім того, майже в усіх дієсловах недоконаного виду відсутні синтетичні форми майбут­ нього часу. Саме комбінації номерів, які відповідають цим дієслівним формам, становлять більшу частину типів дефектності дієслова. Дефектність ад’єктивних парадигм стосується в більшості випадків можли­ вості (неможливості) прикметників утворювати короткі форми (всі або деякі). 6 Такий запис означає, що у словозмінній парадигмі не реалізуються множинні форми в усіх відмінках. 218 ІББN 0027-2833. Мовознавство, 2013, № 2-3 Граматичні лексикографічні системи.. Серед типів дефектності парадигм іменників найширше представлені два ти­ пи, які описують ситуації pluralia tantum (1110 слів) та singularia tantum (8865 слів). Інші 13 типів стосуються одиничних випадків неможливості утворювати певні відмінкові форми. Нижче наводимо результати аналізу типів дефектності словозмінних парадигм іменників та ад’єктивів (див. табл. 2 і табл. 3). Таблиця 2 Типи дефектності парадигм іменників Код ТД Тип дефектності (ТД) Кількість ПК з даним ТД Кількість слів з даним ТД Слово di {1,2, 3 ,4 , 5, 6} 66 1110 грабли <І2 {1,2, 3 ,4 , 5, 6, 7, 9 ,1 0 ,1 1 ,1 2 } 1 3 щец йз {1,2, 3 ,4 , 5, 6,8} 1 1 бразды d4 {1,2, 3 ,4 , 5, 6, 8, 9 ,1 0 ,1 1 ,1 2 } 1 2 тары-бары d5 {1,2, 3 ,4 , 5, 6, 8, 9, 11, 12} 1 1 полсуток d6 {2, 3, 5, 6, 7, 8, 9, 10, 11, 12} 34 пламень d7 {2, 3, 6, 7, 8, 9, 10, 11, 12} 1 1 полымя de {2, 5, 6, 7, 8, 9, 10, 11, 12} 1 1 теля de {3, 4, 5, 6, 7, 8, 9 ,1 0 ,1 1 ,1 2 } 1 1 ведомо dio {3, 4, 5, 7, 8, 9 ,1 0 ,1 1 ,1 2 } 1 1 полдороги du {3, 5, 7, 8, 9 ,1 0 ,1 1 ,1 2 } 2 2 полслова di2 {7, 8, 9 ,1 0 ,1 1 ,1 2 } 92 8865 богочеловек di3 {7, 9 ,1 0 ,1 1 ,1 2 } 1 1 зло di4 {8} 7 40 башка dis {8,10} 5 23 брюзга Т а б ли ц яЗ Типи дефектності парадигм прикметників Код ТД Тип дефектності Кількість ПК з даним ТД Кількість слів з даним ТД Слово di {1,2, 3 ,4 , 5, 6, 7, 8, 9, 10,11, 12, 13,14, 15,16, 17,18, 19, 20, 21 ,22 , 23,24} 3 47 рад, должен d2 {25} 2 24 полуболыюй d3 {25,26} 1 1 взрослый d4 {25,26,27} 1 187 поблёклый d5 {25, 26, 27, 28} 26 15143 меньшой d* {26} 5 22 сверхдолгий {26, 27} 1 23 навислый de {26, 27, 28} 1 2 полутяжёлый Повна парадигма ад’єктивів включає 28 словозмінних форм. Лінгвістична інтерпретація виявлених типів дефектності ад’єктивної парадигми така: (І! — словозмінна парадигма складається тільки з коротких форм, сі2 — у парадигмі відсутня коротка форма чоловічого роду, с і 3 — відсутні короткі форми чоловічо­ го та жіночого роду, (14 — немає коротких форм чоловічого, жіночого та серед­ нього роду, (і5 — у парадигмі відсутні короткі форми, (16 — відсутня коротка форма жіночого роду, А1 — немає коротких форм жіночого та середнього роду, с і 8 — у словозмінній парадигмі відсутні короткі форми жіночого та середнього роду, а також коротка форма множини. Результати аналізу типів варіативності (ТВ) словозмінних парадигм вноси­ лися в таблицю, яка містить код ТВ, код ТД, тип варіативності, що описується параметром уаг, кількість парадигматичних форм (ПФ), кількість ПК, які мають ISSN 0027-2833. Мовознавство, 2013, № 2—3 219 даний тип варіативності, приклад слова з даним ТВ. Нижче наводимо фрагмент таблиці ТВ прикметників (див. табл. 4). Т а б л и ц я 4 Т. П. Любченко, I. В. Шевченко, К. В. Широков_______________________________ Типи варіативності прикметників Код ТВ Код ТД Тип варіативності Кіл-ть ПФ Кіл-ть ПК Слово v2 do {<4,2>, <22,2>} 30 40 больной v3 do {<4,2>, <22,2>, <28,2>} 31 20 строгий Vl6 d5 {<2,2>, <3,2>, <4,3>, <14,2>, <15,2>, <22,2>} 31 1 дочерний V20 ^8 {<4,2>, <22,2>} 27 1 полутяжёлый Отримані результата дослідження варіативності дозволяють твердити, що в російських дієслів варіативність виявляється найчастіше в дієприслівникових формах {вымеривши II вымерив), у формах наказового способу (вымеряй И выме­ ри И вымеръ), в особових формах майбутнього часу дієслів доконаного виду {вымеряю И вымерю і т. д.), в особових формах теперішнього часу дієслів недо- конаного виду {щеплю II щепаю і т. д.), у дієприкметникових формах {щеплю­ щий II щепающий, щёплемый II щепаемый). У прикметників варіативність вияв­ ляється частіше у формах знахідного відмінка однини чоловічого роду {стро­ гий II строгого), знахідного відмінка множини (строгие II строгих), у коротких формах {строги II строги, шустёр, шустр). Рідше зустрічається варіативність в інших формах непрямих відмінків, наприклад родового та давального відмінка однини середнього роду {кукушкиного II кукушкина', кукушкиному И кукушкину). У іменників варіативність виявляється в усіх відмінкових формах. Усього для іменників визначено 59 різних ТВ. Найбільшою варіативністю відзначається іменник чоловічого роду мох, у парадигмі якого 26 форм, причому варіативність наявна в усіх відмінках, крім називного та знахідного в однині. А найбільшу кількість варіантів словозмінних форм мають родовий {мха, мху, моха, моху) та місцевий {мхе, мохе, мху, моху) відмінки однини. Дослідження типів дефектності та варіативності словозмінної парадигми дозволило здійснити додаткову параметризацію словникових одиниць, припи­ савши їм значення ТД і ТВ. Отримані дані можуть бути застосовані в типологіч­ них дослідженнях словозмінних систем флективних мов. Т. P. LYUBCHENKO, I. V. SHEVCHENKO, К. V. SHYROKOV GRAMMATICAL LEXICOGRAPHICAL SYSTEMS WITH THE FLECTIONAL AND AGGLUTINATIVE COMPONENT OF INFLECTION Grammatical lexicographical systems (GLS) are being developed in the Ukrainian Lingua-In- formation Fund of the National Academy of Sciences of Ukraine for different languages within the framework of research works to create the National dictionary database of Ukraine. The article presents a conceptual model of inflectional systems of languages with the flectional component in in­ flection, those with the flectional and the analytical component, and those with the agglutinative component. The technology of construction of GLS, their structure and functions are described. In addition to its main purpose (use in the automatic text processing) the GLS are also used in the study of inflectional systems of respective languages. The article, in particular, deals with the results of research on the parameters of incompleteness and variability of the inflectional paradigm in Rus­ sian. The data obtained can be used in the typological studies of the inflectional systems of the in­ flected languages. Key words: grammatical lexicographical system, grammar dictionary, paradigmatic type, in­ completeness of inflection paradigm, variability of inflection paradigm. 220 ISSN 0027-2833. Мовознавство, 2013, № 2-3