Деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем

Наводяться шляхи застосування програмних засобів, за допомогою яких проводиться відмінювання ідентифікаційних реквізитів осіб в базі даних за відмінками при формуванні відповідно до запиту, вихідного документа інформаційної системи залежно від потреби текстового змісту або при створенні всього набор...

Full description

Saved in:
Bibliographic Details
Date:2004
Main Authors: Алексєєв, В.А., Мостовий, В.В., Терещенко, В.С.
Format: Article
Language:Ukrainian
Published: Інститут програмних систем НАН України 2004
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/1357
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем/ В.А. Алексєєв, В.В. Мостовий, В.С. Терещенко // Проблеми програмування. — 2004. — N 4.— С. 25-40. — Бібліогр.: 5 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1860217329959305216
author Алексєєв, В.А.
Мостовий, В.В.
Терещенко, В.С.
author_facet Алексєєв, В.А.
Мостовий, В.В.
Терещенко, В.С.
citation_txt Деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем/ В.А. Алексєєв, В.В. Мостовий, В.С. Терещенко // Проблеми програмування. — 2004. — N 4.— С. 25-40. — Бібліогр.: 5 назв. — укр.
collection DSpace DC
description Наводяться шляхи застосування програмних засобів, за допомогою яких проводиться відмінювання ідентифікаційних реквізитів осіб в базі даних за відмінками при формуванні відповідно до запиту, вихідного документа інформаційної системи залежно від потреби текстового змісту або при створенні всього набору відмінків реквізитів для їх зберігання в БД. Приводятся пути использования программных средств, с помощью которых проводится склонение идентификационных реквизитов особ в базе данных по падежам при формировании в соответствии с запросом, выходного документа информационной системы в зависимости от потребностей текстового содержания или при создании всего набора падежей реквизитов для их хранения в БД. The paths of use of software are resulted, with which help the declination of the essential elements of the database on cases will be carried out at creation, according to inquiry, output document of the information system depending on necessities of a text content or at creation of all set of cases of the essential elements for their storage in the database
first_indexed 2025-12-07T18:16:26Z
format Article
fulltext Інформаційні системи © В.А. Алексєєв, В.В. Мостовий, В.С. Терещенко, 2004 ISSN 1727-4907. Проблеми програмування. 2004. № 4 25 УДК 681.3 В.А. Алексєєв, В.В. Мостовий, В.С. Терещенко ДЕЯКІ МОРФОЛОГІЧНІ АСПЕКТИ АВТОМАТИЗОВАНОГО ФОРМУВАННЯ ВІДМІНКОВИХ ФОРМ В ДОКУМЕНТАХ ІНФОРМАЦІЙНИХ СИСТЕМ Наводяться шляхи застосування програмних засобів, за допомогою яких проводиться відмінювання ідентифікаційних реквізитів осіб в ба- зі даних за відмінками при формуванні відповідно до запиту, вихідно- го документа інформаційної системи залежно від потреби текстового змісту або при створенні всього набору відмінків реквізитів для їх зберігання в БД. Вступ У зв’язку з широким викори- станням ідентифікаційних рекві- зитів осіб у деяких інформацій- них системах інколи виникають проблеми стосовно їх відмінюван- ня за відмінками за потребою те- ксту того чи іншого вихідного документа, в якому знаходяться ці реквізити. Це стосується сис- тем обліку працівників підпри- ємств та установ, пацієнтів лі- кувальних закладів, відпочиваючих в оздоровчих за- кладах, клієнтів банківських структур, туристів туристичних агентств, військово- службовців, членів політичних партій, мешканців будинків у жи- тлово-експлуатаційних конторах, виборців у виборчих округах або громадян держави під час перепи- су населення тощо. Одним словом, в тих системах, де у якості ат- рибутів використовуються іденти- фікаційні реквізити осіб (прі- звище, ім’я та по батькові). Особливо часто ці проблеми (не- обхідність застосування відмін- кових форм названих реквізитів) виникають в кадрових системах, наприклад при формуванні наказів у зв’язку із заохоченням праців- ника, присвоєнням йому чергового звання, нагородженням тощо. Для вирішення такої проблеми існують декілька шляхів. 1. Можливі шляхи створення відмінкових форм Перший шлях полягає в тому, що в багатьох інформаційних сис- темах у базі даних створюються надлишкові поля, де зберігаються реквізити у необхідних відмінках. Це, по-перше, збільшує обсяг бази даних з усіма випливаючими з то- го наслідками, а, по-друге, збі- льшує як навантаження на осіб, що збирають та вводять у БД не- обхідну інформацію, так і час на проведення цих операцій. А ще треба мати на увазі складність самої операції збору такої інфо- рмації. Уявіть собі вираз облич- чя людини, з якої “знімають” та- ку інформацію. “Скажіть, а як написати ваше прізвище у родово- му відмінку? А як — у давально- му…? А як ім’я…? А як…?”. І все це відбувається у черзі, скажі- мо, в стройовій частині або пун- кті пропуску через державний ко- рдон. Скільки для цього потрібно часу, емоційного та нервового напруження як працівників служб збору інформації, так і тих лю- дей, що стоять у чергах та від- повідають на такі запитання. Є ще третій недолік такого підхо- ду: збільшується інформаційний потік між клієнтською та сервер- ною сторонами, якщо інформаційна система побудована за архітекту- рою “клієнт–сервер” та ще й є територіально розподіленою, кор- поративною. Інформаційні системи 26 Відповідно до другого шляху подолання цієї проблеми БД також повинна мати надлишкові поля, як і в попередньому випадку, але реквізити у відмінках вносяться у БД оператором у людино- машинному режимі тільки при її модифікації, що впорядковує ро- боту служби збору інформації та значно знижує емоційне наванта- ження на неї. Відмінки ж класи- фікаційних реквізитів (напри- клад: військові звання, посади, вчені ступені та звання тощо) можуть вводитись у БД як при створенні, так і при модифікації класифікатора. Згідно третього шляху, най- більш цікавого з точки зору про- грамістських уподобань, відбува- ється створення відмінкових форм реквізитів програмно, у повній відповідності до граматичних правил відмінювання слів по від- мінках, під час формування вихі- дного документа, а не в людино- машинному режимі, як це відбува- лось у попередніх шляхах. При цьому зменшуються обсяги бази даних, робіт при зборі інформа- ції та обслуговуванні БД, а та- кож інформаційних потоків між клієнтською та серверною сторо- нами, але виникає потреба у спе- ціальному програмному забезпе- ченні — програмному додатку з відмінювання по відмінках слів- реквізитів відповідно до морфо- логії (розділу мовознавства, що вивчає будову слова залежно від морфем, з яких воно складається, форми словозміни — відмінювання слів за числами, відмінками, ро- дами, особами та ін. [1]) украї- нської мови. Вказаний програмний додаток за трудомісткістю його розробки може бути (на наш погляд) двох видів залежно від підходу: • “табличний” (третій шлях), що дозволяє проводити відміню- вання за відмінками за допомогою спеціальних таблиць відмінкових закінчень (три таблиці для прі- звища, імені та по батькові для чоловічих реквізитів і три від- повідні таблиці для жіночих рек- візитів); • “граматичний” (четвертий шлях), який у повній мірі врахо- вує всі морфологічні правила української граматики з відміню- вання прізвищ, імен та по бать- кові за відмінками разом з існу- ючими виключеннями з тих правил. На рис. 1 наведено компози- ційну граф-схему можливих шляхів та процедур створення відмінко- вих форм ідентифікаційних рекві- зитів для формування вихідних документів інформаційної систе- ми. Розглянемо детальніше два шляхи (за прийнятою в цій статті нумерацією — третій і четвер- тий), що потребують розробки програмних засобів створення відмінкових форм ідентифікацій- них реквізитів для формування вихідних документів інформацій- ної системи. 2. “Табличний” підхід до ство- рення відмінкових форм Реалізація і впровадження “табличного” (третього) шляху потребує мінімального часу — 2–3 людино-дні для програміста сере- дньої кваліфікації. Для цього потрібні лише вказані таблиці (таблиці групи “ч” — табл. 1, 2, 3 і таблиці групи “ж” — табл. 4, 5, 6) та досвід розробок систем такого класу. Таблиці наведені як приклад, на якому розгляда- ються підходи до шляхів розв’язання поставленої проблеми для апробації їх на широкому за- галі. Тому їхні обсяги можуть бути збільшені за рахунок прове- дення додаткових досліджень у разі виникнення такої потреби. Вирішення задачі побудови відмінкових форм ідентифікацій- них реквізитів потребує структу- рування закінчень слів на зага- льному полі відмінкових Інформаційні системи 27 закінчень (ВЗ) відповідно до граматичних правил в так званий чотиривимірний простір відмінко- вих закінчень (ПВЗ) у вигляді таблиць БД. Вони, на перший по- гляд, нагадують таблиці, що на- водяться у підручниках українсь- кої мови [2], але разом з тим суттєво відрізняються. Відомо, що відмінкові закінчення рекві- зиту у тому чи іншому відмінку залежать від його закінчення у називному відмінку, відміни, групи та роду. Але при цьому мі- німізованому підході відміни та групи визначатися не будуть для зменшення працевкладень: це більш притаманне четвертому під- ходу. Тому головними таблицями у БД з цього питання будуть табли- ці відповідності відмінкових за- кінчень для чоловічих та жіночих (тут мається на увазі не рід, а стать) реквізитів (перший вимір ПВЗ) для прізвищ, імен та по ба- тькові (другий вимір ПВЗ) таким закінченням реквізиту у називно- му відмінку (РНВ). Треба ще за- уважити, що в нашому випадку за- кінчення по відмінках визначатиметься дещо інакше, ніж у підручниках. На те є суто про- грамно-технічні причини. Будемо вважати, що відмінковим закін- ченням для РНВ є три останні лі- тери. Саме ці останні три літери РНВ (третій вимір ПВЗ) і аналі- зуватимуться: спочатку остання, потім — передостання, потім передпередостання і по результа- тах такого аналізу визначати- меться (з вище згаданих таблиць) 1-й шлях 2-й шлях 3-й шлях 4-й шлях Шляхи створення відмінкових форм ідентифікаційних реквізитів Зберігання рекві- зитів у відмінках в спеціальних по- лях БД Програмне створення відмінкових форм реквізитів Ввід реквізи- тів у відмін- ках в БД під час збору інформації Ввід реквізи- тів у відмін- ках в БД під час її моди- фікації В чоловічих ідентифікацій- них реквізитах В жіночих ідентифікацій- них реквізитах Прізвища (додаткові поля) Ім’я (додаткові поля) По батькові (додаткові поля) Прізвища (табл. 1) Ім’я (табл. 2) По батькові (табл. 3) Прізвища (табл. 4) Ім’я (табл. 5) По батькові (табл. 6) За допомогою таблиць від- мінкових за- кінчень За допомогою спеціальних алгоритмів, файлів, таб- лиць Рис. 1. Композиційна граф-схема можливих шляхів побудови відмін- кових форм Інформаційні системи 28 дійсне відмінкове закінчення для цього реквізиту у будь-якому ін- шому заданому відмінку (четвер- тий вимір ПВЗ). Тут свідомо ми відійшли від поділу РНВ на мор- феми (мовознавча значеннєва час- тина слова — корінь, префікс, суфікс, закінчення [1]), щоб не виникло необхідності в їхньому аналізуванні, що, зрозуміло, по- тягне за собою низку непростих у вирішенні проблем граматичного характеру (визначення кореню че- рез пошук однокорінних слів, су- фіксів, закінчень, для чого не- обхідні відповідні БД та програмні засоби, не кажучи вже про алгоритми процесів аналізу), як це буде видно при розгляданні іншого (“граматичного”) підходу. Позначимо останню літеру реквізиту у називному відмінку через 1b , де b — означає наяв- ність літери, а індекс — місце її у реквізиті починаючи з останнього — перша від кінця, 2b — друга, 3b — третя від кінця і т.д. Тоді у загальному випадку будь-який n-літерний реквізит у називному відмінку формально мо- жна записати як множину 1,nB або як впорядковану сукупність n лі- тер: )...,,...,,( 11, bbbB inn ⇔ , де }1,2,...,{ni ∈ . (1) Визначення індексів — місць літер у впорядкованій сукупнос- ті — відбувається тільки для РНВ. Вказана множина літер для РНВ складається з двох не пере- різаючих одна одну підмножин: підмножини inB , літер незмінної основи (індекс і визна- чає місце останньої її літери) РНВ і підмножини 1,1−iB літер від- мінкового закінчення для РНВ. Зважаючи на домовленість про трилітерний розмір ВЗ для РНВ можна записати 1,3B ⇔( 3b , 2b , 1b ). Тобто для ана- лізування РНВ треба розглядати його як теоретико-множинне об’єднання двох підмножин Інформаційні системи 29 ),,( 1234,1, bbbBB nn +⇔ . (2) Для інших відмінків такого запису зробити не можна тому, що розміри відмінкових закінчень у цьому разі можуть бути будь- якими — від нуля до чотирьох. Тому тут буде справедливим інший формальний запис: )...,,( 1,1, bbBB xinn +⇔ , (3) де inB , — підмножина літер незмінної основи, яка визнача- ється на множині літер для РНВ; ( xb ,..., 1b ) — підмножина лі- тер відмінкового закінчення ( },...,0{ mx ∈ , а m на практиці не перевищує 4). Зрозуміло, якщо x = 0, то підмножина ( xb ,..., 1b ) вироджується — закінчення немає і, значить, відмінкова форма ре- квізиту у цьому відмінку склада- ється тільки з незмінної основи. Ці підмножини вказані в таблицях у графах всіх інших відмінків у вигляді запису через знак “+” теоретико-множинного об’єднання двох підмножин, при- чому перша підмножина вказана у формальному вигляді, а друга — у вигляді впорядкованої сукупнос- ті. Треба зауважити, що так зва- на незмінна основа для одного й того ж значення реквізиту у різ- них відмінках може бути різна, тобто значення індексу і у під- множині inB , для різних відмінків може не співпадати. Термін “від- мінкове закінчення”, що викорис- товується в цій статті, не є морфемою, а є певною впорядкова- ною сукупністю літер, яка може Таблиця 1. Відмінкові закінчення для чоловічого ідентифікаційного реквізиту — прізвище Останні літери реквізиту у називному відмінку Формальний запис реквізиту по відмінках № [ 3b ] [ 2b ] [ 1b ] Р Д З О М К 1 Будь- яка Приг. (крім ж, ч, ш, щ) а 2,nB +и 2,nB +і 2,nB +у 2,nB +ою 2,nB +і 2 Будь- яка г а 2,nB +и 3,nB +зі 2,nB +у 2,nB +ою 3,nB +зі 3 Будь- яка к а 2,nB +и 3,nB +ці 2,nB +у 2,nB +ою 3,nB +ці 4 Будь- яка х а 2,nB +и 3,nB +сі 2,nB +у 2,nB +ою 3,nB +сі 5 Будь- яка ж, ч, ш, щ а 2,nB +и 2,nB +і 2,nB +у 2,nB +ею 2,nB +і 6 Будь- яка Голосна (крім и) й 2,nB +ю 2,nB +ю 1,nB 2,nB +єм 2,nB +ї 7 Будь- яка и й 3,nB +ого 3,nB +ому 3,nB +ого 3,nB +им 3,nB +ому 8 Будь- яка Приголос- на е 2,nB +я 2,nB +ю 2,nB +е 2,nB +ем 2,nB +і 9 Будь- яка ж, ч, ш, щ е 2,nB +а 2,nB +у 2,nB +е 2,nB +ем 2,nB +і 10 Будь- яка Приголос- на о 2,nB +а 2,nB +у 2,nB +а 2,nB +ом 2,nB +ові 11 Будь- яка Приголос- на я 2,nB +і 2,nB +і 2,nB +ю 2,nB +єю 2,nB +і 12 Будь- яка Будь-яка Приголос- на 1,nB +а 1,nB +у 1,nB 1,nB +ом 1,nB +і 13 Будь- яка Будь-яка ж, ч, ш, щ 1,nB +а 1,nB +еві 1,nB +а 1,nB +ем 1,nB +еві 14 Будь- яка Приголос- на ь 2,nB +я 2,nB +еві 2,nB +я 2,nB +ем 2,nB +еві Інформаційні системи 30 співпадати з морфемою “закінчен- ня”. Крім того, кличний відмінок у цих таблицях застосовується лише для імен та по батькові, а перед прізвищем в такому разі у кличному відмінку ставиться лише звернення (наприклад, пане, то- варишу, громадянине або пані, панно, товаришко, громадянко то- що). В таблицях прийняті такі умовні позначення: Р, Д, З, О, М, К — відпові- дно родовий, давальний, знахід- ний, орудний, місцевий, кличний відмінки. Все поле відмінкових закін- чень (множина М), наведених в цих таблицях, складається з під- множин ВЗ rM ( }2,1{∈r ) чоловічих та жіночих ідентифікаційних рек- візитів, які складаються з під- множин ВЗ rvM ( }3,2,1{∈v ) іденти- фікаційних реквізитів по їх видах, які в свою чергу склада- ються з підмножин ВЗ rvzM ( },...,1{ rvZz ∈ ) з однаковими закін- ченнями РНВ, складених з підмно- жин ВЗ rvzwM ( }6,...,1{∈w ) всього набору конкретних відмінків для даного закінчення РНВ. Такий ве- рбальний опис співвідношення на- Таблиця 3. Відмінкові закінчення для чоловічого ідентифікаційного реквізиту — по батькові Останні літери реквізиту у називному відмінку Формальний запис реквізиту по відмінках № [ 3b ] [ 2b ] [ 1b ] Р Д З О М К 1 Будь- яка Голосна ч 1,nB +а 1,nB +у 1,nB +а 1,nB +ем 1,nB +і 1,nB +у Таблиця 2. Відмінкові закінчення для чоловічого ідентифікаційно- го реквізиту — ім’я Останні літери реквізиту у називному відмінку Формальний запис реквізиту по відмінках № [ 3b ] [ 2b ] [ 1b ] Р Д З О М К 1 Будь- яка Приг.(крі м ж, ч, ш, щ) а 2,nB +и 2,nB +і 2,nB +у 2,nB +ою 2,nB +і 2,nB +о 2 Будь- яка г а 2,nB +и 3,nB +зі 2,nB +у 2,nB +ою 3,nB +зі 2,nB +о 3 Будь- яка к а 2,nB +и 3,nB +ці 2,nB +у 2,nB +ою 3,nB +ці 2,nB +о 4 Будь- яка х а 2,nB +и 3,nB +сі 2,nB +у 2,nB +ою 3,nB +сі 2,nB +о 5 Будь- яка ж, ч, ш, щ а 2,nB +и 2,nB +і 2,nB +у 2,nB +ею 2,nB +і 2,nB +е 6 Будь- яка ж, ч, ш, щ е 2,nB +а 2,nB +у 2,nB +е 2,nB +ем 2,nB +і 2,nB +е 7 Будь- яка Голосна й 2,nB +я 2,nB +ю 1,nB 2,nB +єм 2,nB +ї 2,nB +ю 8 Будь- яка Приголос- на о 2,nB +а 2,nB +у 2,nB +а 2,nB +ом 2,nB +ові 2,nB +е 9 Будь- яка Приголос- на я 2,nB +і 2,nB +і 2,nB +ю 2,nB +єю 2,nB +і 2,nB +ю 10 Будь- яка Будь-яка Приголос- на 1,nB +а 1,nB +у 1,nB 1,nB +ом 1,nB +і 1,nB +е Інформаційні системи 31 званих підмножин формально можна записати у вигляді M = ∑ r rM = ∑∑ r v rvM = ∑∑∑ r v z rvzM = = ∑∑∑∑ r v z w rvzwM , (4) де r — індекс роду (статі володаря) реквізиту; v — індекс виду реквізи- ту; z — індекс номера рядка в таблиці; w — індекс необхідного від- мінку. Ці взаємно вкладені підмно- жини ВЗ і створюють вже визначе- ний раніше простір відмінкових закінчень — ПВЗ, який має чотири виміри і схематично зображений на рис. 2. Для отримання відмінкової форми реквізиту необхідно у цьо- му чотиривимірному просторі від- мінкових закінчень визначити: • підмножину ВЗ — групу таблиць (табл.1, 2, 3 або табл.4, 5, 6) — залежно від пер- шого виміру ПВЗ — роду r рекві- зиту: чоловічий (r =1), жіночий (r =2):    = = = ;2)6,5,4.( ,1)3,2,1.( rпритабл rпритабл M r • підмножину ВЗ — номер таблиці (табл. 1, 4 або табл. 2, 5, або табл. 3, 6) — залежно від друго- Таблиця 4. Відмінкові закінчення для жіночого ідентифікаційного реквізиту — прізвище Останні літери реквізиту у називному відмінку Формальний запис реквізиту по відмінках № [ 3b ] [ 2b ] [ 1b ] Р Д З О М К 1 Будь- яка Приг. (крім ж, ч, ш, щ) а 2,nB +ої 2,nB +ій 2,nB +у 2,nB +ою 2,nB +ій 2 Будь- яка г а 2,nB +и 3,nB +зі 2,nB +у 2,nB +ою 3,nB +зі 3 Будь- яка к а 2,nB +и 3,nB +ці 2,nB +у 2,nB +ою 3,nB +ці 4 Будь- яка х а 2,nB +и 3,nB +сі 2,nB +у 2,nB +ою 3,nB +сі 5 Будь- яка ж, ч, ш, щ а 2,nB +і 2,nB +і 2,nB +у 2,nB +ею 2,nB +і 6 Будь- яка Приголос- на е 2,nB +и 2,nB +і 2,nB +е 2,nB +ею 2,nB +і 7 Будь- яка ж, ч, ш, щ е 2,nB +е 2,nB +е 2,nB +е 2,nB +е 2,nB +е 8 Будь- яка Голосна (крім и) й 2,nB +ї 2,nB +ї 2,nB +ю 2,nB +єю 2,nB +ї 9 Будь- яка и й 3,nB +ий 3,nB +ий 3,nB +ий 3,nB +ий 3,nB +ий 10 Будь- яка Приголос- на о 2,nB +о 2,nB +о 2,nB +о 2,nB +о 2,nB +о 11 Будь- яка Приголос- на я 2,nB +і 2,nB +і 2,nB +ю 2,nB +єю 2,nB +і 12 Будь- яка Будь-яка Приголос- на 1,nB 1,nB 1,nB 1,nB 1,nB 13 Будь- яка Приголос- на (крім ц) ь 2,nB +і 2,nB +і 2,nB +ю 2,nB +єю 2,nB +і Інформаційні системи 32 го виміру ПВЗ — виду v реквізи- ту: прізвище (v =1), ім’я (v = 2), по батько- ві (v =3):      = = = == ;33. ;22. ;11. ,1 vпритабл vпритабл vпритабл M vr      = = = == ;36. ;25. ;14. ,2 vпритабл vпритабл vпритабл M vr • підмножину ВЗ — ВЗ рядка z в таблиці — залежно від тре- тього виміру ПВЗ — результату аналізу трьох останніх літер РНВ ( 3b , 2b , 1b ): ),,( 123 bbbfM rvz = при фіксованих r, v ; • ВЗ в графі (Р, Д, З, О, М, К) в таблиці залежно від чет- вертого виміру ПВЗ — необхідного відмінку w: родовий (w = 1), да- вальний (w = 2), знахідний (w = 3), орудний (w = 4), місцевий (w = 5), кличний (w = 6) відмінки: )(wfM rvzw = при фіксованих r, v, w. Значення rvZ — кількість ря- дків ВЗ в таблицях — може бути неоднаковим для різних таблиць. До того ж воно не фіксоване, то- му що обсяги таблиць, як вже бу- ло сказано, можуть бути збільше- ні за рахунок проведення додаткових досліджень. Таблиця 5. Відмінкові закінчення для жіночого ідентифікаційного реквізиту — ім’я Останні літери реквізиту у називному відмінку Формальний запис реквізиту по відмінках № [ 3b ] [ 2b ] [ 1b ] Р Д З О М К 1 Будь- яка Приг. (крім ж, ч, ш, щ) а 2,nB +и 2,nB +і 2,nB +у 2,nB +ою 2,nB +і 2,nB +о 2 Будь- яка г а 2,nB +и 3,nB 3+з і 2,nB +у 2,nB +ою 3,nB +зі 2,nB +о 3 Будь- яка к а 2,nB +и 3,nB +ці 2,nB +у 2,nB +ою 3,nB +ці 2,nB +о 4 Будь- яка х а 2,nB +и 3,nB +сі 2,nB +у 2,nB +ою 3,nB +сі 2,nB +о 5 Будь- яка ж, ч, ш, щ а 2,nB +и 2,nB +і 2,nB +у 2,nB +ею 2,nB +і 2,nB +е 6 Будь- яка Голосна (крім и) й 2,nB +ю 2,nB +ю 1,nB 2,nB +єм 2,nB +ї 2,nB +ю 7 Будь- яка Приголосна е 2,nB +я 2,nB +ю 2,nB +е 2,nB +ем 2,nB +і 2,nB +е 8 Будь- яка Приголосна я 2,nB +і 2,nB +і 2,nB +ю 2,nB +єю 2,nB +і 2,nB +ю 9 Будь- яка Будь-яка Приголосна 1,nB +и 1,nB +і 1,nB 1,nB +ою 1,nB +і 1,nB +е Будь- B B B B B B Інформаційні системи 33 Результатом такого визна- чення стане формальний запис відмінка заданого реквізиту — [ inB , +ВЗ], який у свою чергу ви- значає незмінну основу (підст- року строкової перемінної — РНВ, починаючі з n-ї і закінчу- ючи і-ю літерою) та відмінкове закінчення. Ґрунтуючись на цих даних, за допомогою конкатенації будується пошуку- вана відмінкова форма реквізиту відповідно до алгоритму, наве- деному у табличній формі (табл. 7). Приклад: побудувати форму родового відмінку від чоловічого прізвища Таратута відповідно до наведеного вище алгоритму (табл. 8). Більш наглядно послідов- ність операцій при виконанні за- вдання видно на схемі, наведеній на рис. 3. Блок-схему алгоритму при цьому підході визначення закін- чень у тому чи іншому відмінку реквізиту залежно від його за- кінчення у називному відмінку та роду тут не наводимо через його тривіальність: кожний про- граміст-початківець може його створити, що теж є однією з по- зитивних рис такого підходу. А блок-схемним методом користують- ся при побудові складних алгори- тмів, у якості попередньої пере- вірки і наглядного представлення логіки розв’язання задачі [3, с. 63]. Таблиця 6. Відмінкові закінчення для жіночого ідентифікаційного реквізиту — по батькові Останні літери реквізиту у називному відмінку Формальний запис реквізиту по відмінках № [ 3b ] [ 2b ] [ 1b ] Р Д З О М К 1 Будь- яка Приголос- на а 2,nB +и 2,nB +і 2,nB +у 2,nB +ою 2,nB +і 2,nB +о Рис. 2. Чотиривимірний простір відмінкових закінчень Таблиця 7. Алгоритм побудови відмінкових форм реквізитів № Операції Умови проведення операцій Результати операцій Знайти для заданого рек- Вид реквізиту Інформаційні системи 34 3. “Граматичний” підхід до ство- рення відмінкових форм Застосування “граматичного” (четвертого) підходу до розробки програмних засобів створення відмінкових форм ідентифікацій- них реквізитів для формування вихідних документів інформацій- ної системи значно більш трудо- місткий. Для його реалізації і впровадження розробленого для цього програмного засобу потріб- но витратити набагато більше ча- су кваліфікованих програмістів, системних аналітиків та фахівців з української морфології. При виборі такого підходу до подо- лання проблеми відмінювання іде- нтифікаційних реквізитів виникає потреба в проведенні додаткових досліджень, пов’язаних зі ство- ренням спеціальних файлів вжива- них іменників, які могли б при словотворенні прізвищ лягти в їх основу, наприклад перелік імен- ників (і не тільки), пов’язаних з професією, з народним побутом, вуличними прізвиськами, іменами, національністю тощо, всім тим, чим займається ономастика (оно- матологія) як розділ загальної лексикології [4]. Крім того, не- обхідно ретельно врахувати вимо- ги морфологічних правил. При цьому виникає ряд ускладнень: • прізвища, як іменники, можуть бути тільки чоловічого або жіночого роду відповідно до статі володаря, але зустрічають- ся вони і з усіма ознаками імен- ника середнього роду другої від- міни, тому що мають закінчення - о, -е (наприклад: Терещенко, Со- бко, Власе), а ще зустрічаються — подвійного роду (той же при- клад); • є такі прізвища, що мають властивості прикметників і, бу- дучи субстивованими назвами, відмінюються як прикметники тве- Таблиця 8. Приклад побудови форми родового відмінка від чоловічого прізвища Таратута відповідно до наведеного вище алгоритму № Операції Умови проведення операцій Результати операцій 1 Визначення умов за- вдання Знайти родовий відмінок чоловічого прізвища “Та- ратута” Реквізит — Таратута Вид реквізиту — прізвище Рід реквізиту — чоловічий Необхідний відмінок — ро- довий 2 Визначення групи таб- лиць Рід реквізиту — чолові- чий Група таблиць “ч” (1, 2, 3) 3 Визначення номеру таб- лиці в групі Вид реквізиту — прізвище Таблиця 1 4 Визначення рядка таб- лиці по останніх трьох літерах 3b ⇔ будь-яка 2b ⇔ приголосна, 1b ⇔ а Рядок 1 5 Визначення графи таб- лиці для заданого від- мінка Родовий відмінок Графа “Р” 6 Визначення формального запису реквізиту у по- трібному відмінку Табл.1, рядок 1, графа “Р” 2,nB +и 7 Побудова для потрібно- го відмінка незмінної основи реквізиту (на- приклад, функція SUBSTR для VFP 3.0) Незмінна основа від РНВ для родового відмінка — 2,nB Таратут Побудова відмінкової Інформаційні системи 35 рдої чи м’якої групи, але якщо ж в їх основі є суфікси -ів, -їв, -ов, -ова, -ев, -ева, -ин, -ін, -їн, -ськ, то вони відміню- ються як іменники (наприклад: Мостовий, Коцюбинсь- кий); • велика кількість чолові- чих та жіночих прізвищ співпада- ють (приклад першого пункту) а закінчення в однакових відмінках — різні; • на відміну від РНВ в ко- ренях прізвищ у давальному та місцевому відмінках має місце чергування приголосних літер к– ц, г–з, х–с (наприклад: Притика — Притиці, Кочерга — Кочерзі, Макуха — Макусі); • прізвища, що мають форму іменників ІІ відміни чоловічого роду з кінцевими -ир, -ар можуть належати і до твердої групи і до м’якої, у зв’язку з чим мають різні закінчення в однакових, крім називного, відмінках залеж- но від місця знаходження наголо- су (наприклад: Волонт 'ир — Волон- тира, Р 'oтар — Ротаря); • прізвища, що мають форму іменників ІІ відміни чоловічого роду з кінцевими -яр (наприклад: Котляр) можуть належати і до твердої групи і до мішаної, у зв’язку з чим мають різні закін- чення в однакових, крім називно- го, відмінках залежно від місця знаходження наголосу: на основі чи на закінченні; • у подвійних прізвищах (наприклад: Гулак-Артемовський, Миклухо-Маклай) треба відмінюва- ти по відмінках обидві частини прізвища; • іншомовні прізвища біль- шістю є незмінними, а саме з за- кінченнями на -их, -ово, -аго, - е, -є, -і, -ї, -о, -у, та -а з попереднім голосним; • треба враховувати випа- діння літер в основі прізвищ при їх відмінюванні (наприклад: Ве- ресень — Вересня); • відбувається зміна літер в основі прізвищ при їх відміню- Зона завдання Зона пошуку ВЗ Зона базової інформації Зона Зона визначення визначення дій дій Зона дій Задано РНВ: Чоловічого роду Прізвище Таратута Знайти: Родовий відмі- Таратута Табл. 1, 2, 3 Табл. 1 Рядок 1 Графа “Р” 2,nB + и Визначити 2,nB від РНВ Таратут Таратути Додати и до 2,nB від Таблиці в БД 1, 2, 3, 4, 5, 6 Рис. 3. Схема операцій виконання завдання з находження родового відмін- ка реквізиту Інформаційні системи 36 ванні (наприклад: Тхір — Тхора); • при зовні однакових фор- мах РНВ мають місце різні закін- чення та зміни в основі реквізи- ту в однакових, крім називного, відмінках (наприклад: Звір — Звіра, Тхір — Тхора, Твір — Тво- ру, Горобець — Горобця, Стрілець — Стрільця). Далеко не всі ці зауваження можна зняти за допомогою наведе- них вище таблиць. Навіть при по- верхневому знайомстві з цими за- уваженнями вимушені зробити висновок про необхідність засто- сування цілої низки відповідних алгоритмів та спеціально створе- них файлів: o алгоритм розпізнавання частини мови, до яких належить прізвище (з ім’ям та по батькові проблем менше); o алгоритм розпізнавання роду, до якого належить те чи інше прізвище, тому що відмінко- ві закінчення в них можуть бути різними залежно від статі влас- ника цього прізвища; o алгоритм визначення групи іменників, до яких відноситься реквізит; o алгоритм визначення від- міни іменників, до яких відно- ситься реквізит; o алгоритм розпізнавання основ в прізвищах та відрізнення їх від закінчень; o алгоритм розпізнавання морфем (коренів, словотворчих та формотворчих суфіксів, закін- чень); o алгоритм визначення місця знаходження наголосу — на основі чи на закінченні в прізвищах; o файли з іменниками з кін- цевими -ир, -ар для твердої і м’якої груп окремо; o файли з іменниками з кін- цевими -яр для твердої і мішаної груп окремо або алгоритм розпі- знавання прізвищ, які визначають осіб за фахом або родом діяльно- сті; o файли з двома полями для подвійних прізвищ, тому що кожну з їх частин треба відмінювати окремо тощо. Інформаційні системи 37 Мабуть, нема потреби ще раз наголошувати, що цей шлях дуже трудомісткий. І навряд чи він є оптимальним при створенні всього лише кадрової системи, де обсяг БД не буде перевищувати кілька тисяч записів. У зв’язку з цим виникає запитання: “так який шлях вибрати?” Може, дійсно вве- дення необхідних даних у людино- машинному режимі є оптимальним варіантом. А, може, краще ство- рити файл-довідник прізвищ, що зустрічаються в Україні, пере- йнявши їх з телефонних книг ве- ликих міст нашої держави та створивши їхні відмінкові форми за допомогою фахівців з україн- ської морфології. Але, на наш погляд, найбільш прийнятний шлях, як завжди, лежить посере- дині. 4. Інтегральна технологія ство- рення відмінкових форм Треба реалізувати інтегра- льну технологію, в якій будуть застосовані і програмні засоби і людино-машинний режим. Ця техно- логія найбільш прийнятна для ка- дрової системи і передбачає реа- лізацію її у три етапи: 1) завантаження у людино-ма- шинному режимі бази даних відпо- відними реквізитами у називному відмінку на всіх осіб; 2) створення за допомогою програмних засобів (“табличного” підходу) у відповідних полях БД всіх необхідних відмінкових форм реквізитів; 3) контролювання у людино- машинному режимі результатів створення відмінкових форм рек- візитів та, в разі необхідності, редагування помилково створених відмінкових форм іден- тифікаційних реквізитів у БД. Перший етап цієї технології притаманний для всіх шляхів. Другий етап запозичено з другого шляху (див. рис.1), тому цей Рис. 4. Екранна форма для відмінювання ідентифікаційних реквізитів ПІБ Інформаційні системи 38 етап технології зберігає деякі його недоліки: наприклад, існу- вання в БД надлишкових полів, але значно заощаджує час на за- вантаженні БД всіма відмінковими формами за рахунок їх автоматич- ного створення за допомогою про- грамних засобів під час модифі- кації БД. Контролювання (третій етап) та редагування вже заван- таженої БД, на наш погляд, буде вимагати не більше 5–10 % від за- гального обсягу БД у межах тієї її частини, що призначена для реквізитів. Саме ця інтегральна техно- логія використана при розробці проектних рішень і побудові від- повідного програмного модуля “Корпоративної автоматизованої інформаційної системи кадрового забезпечення”, метою створення якої є підвищення: • ефективності обліку і об- робки даних, що є в персональних облікових картах службовців; • повноти накопичення, ві- рогідності та аналізу даних про переміщення осіб по "дереву" ор- ганізаційно-штатної структури установи з розрахунку періоду праці; • якості формування звітів і довідок як по регламентованих, так і по довільних формах; • оперативності та надійно- сті інформаційного обміну між структурними підрозділами уста- нови з питань кадрового забезпе- чення, а також з підрозділами міністерств, інших органів центральної виконавчої влади при вирішенні задач кадрового забез- печення. Для досягнення цієї мети необхідно вирішити велике коло задач, пов’язаних з видачею ви- хідних документів, що часто міс- тять реквізити осіб у будь-якому відмінку. Саме це й допомагає реалізувати запропонована інтег- ральна технологія. Вона ґрунту- ється на використанні програмних засобів створення відмінкових форм ідентифікаційних реквізитів та людино-машинного режиму реда- гування. Сенс підходу міститься у тому, що в базі даних крім по- лів для називного відмінку резе- рвуються поля для інших відмін- ків (у даному разі — родового, давального) для прізвищ, імен та по батькові. Для заповнення та редагування цих додаткових полів в режимі завантаження БД системи створено спеціальну екранну фор- му відмінювання ідентифікаційних реквізитів (рис.4) для спілку- вання з цим програмним модулем, який є достатньо автономним, щоб його можна було б легко замінити на іншу більш якісну версію, як- що виникне така потреба, у по- вній відповідності до відомих моделей життєвого циклу програм- них продуктів [5]. На екранній формі передба- чена спеціальна клавіша < Відмі- нювати >, при активізації якої програмний засіб, реалізований за алгоритмом “табличного” під- ходу, створює потрібні відмінки та заповнює відповідні поля. Пі- сля цього адміністратор БД пере- глядає результати відпрацювання програмного засобу і позначає вірні записи, а невірні виправ- ляє в режимі ручного вводу і теж позначає, за допомогою перемика- ча < Згоден > про те, що запис перевірено і виправлено. Це ро- биться для того, щоб позначені записи при наступних запусках автоматичного відмінювання не змінювалися. Таким чином, при вводі нових реквізитів після ав- томатичного відмінювання необ- хідно буде перевіряти, а при по- требі й редагувати, тільки нові реквізити. Формування довідок з вико- ристанням реквізитів у різних відмінках зводиться до витягу з полів БД вже готових ПІБ у необ- хідному відмінку. Перевага цього Інформаційні системи 39 підходу полягає в тому, що при формуванні довідок використову- ються вже перевірені записи рек- візитів у відмінках, а якби від- мінювати ПІБ у процесі формування довідок, то могли б бути невірними результати, на- приклад, для іноземних прізвищ та імен, які неможливо було б виправити. Для цього треба було б ввести ще один режим — режим редагування довідок, а це внесло б додаткові складнощі. До того ж, у людино-машинному режимі пе- ревірку правильності проведеного відмінювання може проконтролюва- ти фахівець з української мови один раз (при створенні, модифі- кації БД або при проведенні рег- ламентних робіт) і не треба його залучати для перевірки кожної довідки. Оскільки програмні засоби відмінювання працюють на конкре- тній вже завантаженій БД, де вже відомі рід (стать власника рек- візитів), конкретні ПІБ, то від- падає необхідність в алгоритмах розпізнавання цих даних. Спроще- ний таким чином алгоритм звівся до створення бібліотеки DLL з множиною точок входу по дванад- цяти функціях (дві для чоловічо- го та жіночого роду, три для ПІБ та дві для родового та давально- го відмінків), на вхід яких пе- редається реквізит ПІБ у назив- ному відмінку. Код функції й визначає операцію, яку необхідно реалізувати програмному засобу. Наприклад, M_Name_r говорить, що ця функція поверне чоловіче ім’я у родовому відмінку (див. табл. 9). Результати цих функцій за- носяться у додаткові поля БД: три для ПІБ у родовому відмінку (Fam_r, Name_r, Otch_r) та три для ПІБ у давальному відмінку (Fam_d, Name_d, Otch_d). Для внесення спеціальної позначки, яка свідчитиме, що запис пере- глянуто і він вірний, створюєть- ся ще одне логічне поле (Isfile). Бібліотека DLL з переліче- ними вище функціями написана у Delphi та підключена як зовнішня бібліотека до системи, реалізо- ваної у середовищі Power Builder. Таблиця 9. Функції відмінювання реквізи- тів ПІБ Розшифровка параметрів коду фун- кцій № Код функ- ції Параметр 1 (рід) Параметр 2 (ПІБ) Параметр 3 (відмінок) 1 M_Fam_r Чоловічий Прізвище Родовий 2 M_Fam_d Чоловічий Прізвище Давальний 3 M_Name_r Чоловічий Ім’я Родовий 4 M_Name_d Чоловічий Ім’я Давальний 5 M_Otch_r Чоловічий По батько- ві Родовий 6 M_Otch_d Чоловічий По батько- ві Давальний 7 F_Fam_r Жіночий Прізвище Родовий 8 F_Fam_d Жіночий Прізвище Давальний 9 F_Name_r Жіночий Ім’я Родовий 10 F_Name_d Жіночий Ім’я Давальний Інформаційні системи 40 Висновки Запропонована інтегральна технологія побудови відмінкових закінчень ідентифікаційних рек- візитів в інформаційних систе- мах. Відповідно до цієї техноло- гії застосовуються нескладні (для їх розробки не треба великих працевкладень) програмні засоби для автоматичного створення від- мінкових форм реквізитів при мо- дифікації БД і людино-машинний режим для всебічного контролю та, за необхідністю, редагування помилково створених відмінкових форм ідентифікаційних реквізитів у БД інформаційної системи. Така технологія не потребує великих працевитрат та втрат часу ані при створенні програмних засо- бів, ані при зборі інформаційних даних, ані при веденні і модифі- кації БД, ані при формуванні ви- хідних документів з ідентифіка- ційними реквізитами у потрібних відмінках. 1. Словник іншомовних слів. — К.: Го- ловна редакція Української радянсь- кої енциклопедії АН УРСР, 1974. — 776 с. 2. Пентилюк М.І., Іващенко О.В. Украї- нська мова: Підручник-комплект. — К.: Ленвіт, 2001. — 352 с. 3. Алферова З.В. Теория алгоритмов. — М.: Статистика, 1973. — 164 с. 4. Советский энциклопедический сло- варь. — М.: Изд. "СЭ", 1989. — 1632 с. 5. Алексєєв В.А., Терещенко В.С. Розви- ток спіральної моделі життєвого цик- лу програмних систем // Пробл. про- граммирования. — 2003. — №4. — С. 34–42. Отримано 24.02.04 Про авторів Алексєєв Віктор Анатолійович, канд. техн. наук, завідувач від- ділу Місце роботи автора: Інститут програмних систем НАН України м. Київ, пр-т Академіка Глушкова, 40 Тел. (044) 266 4228 Е-mail: alecseev@isofts.kiev.ua Мостовий Валентин Васильович, канд. техн. наук, ст. наук. співробітник Місце роботи автора: Інститут кібернетики НАН України м. Київ, пр-т Академіка Глушкова, 42 Тел. (044) 266 6321 Е-mail: most@isofts.kiev.ua Терещенко Валерій Савелійович, канд. техн. наук, ст. наук. співробітник Місце роботи автора: Інститут програмних систем НАН України м. Київ, пр-т Академіка Глушкова, 40 Тел. (044) 266 6321 Е-mail: terek@isofts.kiev.ua
id nasplib_isofts_kiev_ua-123456789-1357
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1727-4907
language Ukrainian
last_indexed 2025-12-07T18:16:26Z
publishDate 2004
publisher Інститут програмних систем НАН України
record_format dspace
spelling Алексєєв, В.А.
Мостовий, В.В.
Терещенко, В.С.
2008-07-28T18:42:05Z
2008-07-28T18:42:05Z
2004
Деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем/ В.А. Алексєєв, В.В. Мостовий, В.С. Терещенко // Проблеми програмування. — 2004. — N 4.— С. 25-40. — Бібліогр.: 5 назв. — укр.
1727-4907
https://nasplib.isofts.kiev.ua/handle/123456789/1357
681.3
Наводяться шляхи застосування програмних засобів, за допомогою яких проводиться відмінювання ідентифікаційних реквізитів осіб в базі даних за відмінками при формуванні відповідно до запиту, вихідного документа інформаційної системи залежно від потреби текстового змісту або при створенні всього набору відмінків реквізитів для їх зберігання в БД.
Приводятся пути использования программных средств, с помощью которых проводится склонение идентификационных реквизитов особ в базе данных по падежам при формировании в соответствии с запросом, выходного документа информационной системы в зависимости от потребностей текстового содержания или при создании всего набора падежей реквизитов для их хранения в БД.
The paths of use of software are resulted, with which help the declination of the essential elements of the database on cases will be carried out at creation, according to inquiry, output document of the information system depending on necessities of a text content or at creation of all set of cases of the essential elements for their storage in the database
uk
Інститут програмних систем НАН України
Інформаційні системи
Деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем
Некоторые морфологические аспекты автоматизированного формирования падежных форм в документах информационных систем
Some Morphologic Aspects of Use of the Essential Elements in Documents of Information Systems
Article
published earlier
spellingShingle Деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем
Алексєєв, В.А.
Мостовий, В.В.
Терещенко, В.С.
Інформаційні системи
title Деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем
title_alt Некоторые морфологические аспекты автоматизированного формирования падежных форм в документах информационных систем
Some Morphologic Aspects of Use of the Essential Elements in Documents of Information Systems
title_full Деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем
title_fullStr Деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем
title_full_unstemmed Деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем
title_short Деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем
title_sort деякі морфологічні аспекти автоматизованого формування відмінкових форм в документах інформаційних систем
topic Інформаційні системи
topic_facet Інформаційні системи
url https://nasplib.isofts.kiev.ua/handle/123456789/1357
work_keys_str_mv AT aleksêêvva deâkímorfologíčníaspektiavtomatizovanogoformuvannâvídmínkovihformvdokumentahínformacíinihsistem
AT mostoviivv deâkímorfologíčníaspektiavtomatizovanogoformuvannâvídmínkovihformvdokumentahínformacíinihsistem
AT tereŝenkovs deâkímorfologíčníaspektiavtomatizovanogoformuvannâvídmínkovihformvdokumentahínformacíinihsistem
AT aleksêêvva nekotoryemorfologičeskieaspektyavtomatizirovannogoformirovaniâpadežnyhformvdokumentahinformacionnyhsistem
AT mostoviivv nekotoryemorfologičeskieaspektyavtomatizirovannogoformirovaniâpadežnyhformvdokumentahinformacionnyhsistem
AT tereŝenkovs nekotoryemorfologičeskieaspektyavtomatizirovannogoformirovaniâpadežnyhformvdokumentahinformacionnyhsistem
AT aleksêêvva somemorphologicaspectsofuseoftheessentialelementsindocumentsofinformationsystems
AT mostoviivv somemorphologicaspectsofuseoftheessentialelementsindocumentsofinformationsystems
AT tereŝenkovs somemorphologicaspectsofuseoftheessentialelementsindocumentsofinformationsystems