Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І

Разработаны методологические основы построения быстродействующих аппаратных лингвистических процессоров с использованием метода многоуровневых проекций разработки структурной организации упомянутых процессоров с учетом онтологического подхода. Предложена функциональная схема процессора в целом и его...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Управляющие системы и машины
Datum:2014
Hauptverfasser: Палагин, А.В., Петренко, Н.Г.
Format: Artikel
Sprache:Russisch
Veröffentlicht: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України 2014
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/83321
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І / А.В. Палагин, Н.Г. Петренко // Управляющие системы и машины. — 2014. — № 2. — С. 44-57, 76. — Бібліогр.: 5 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859711524927438848
author Палагин, А.В.
Петренко, Н.Г.
author_facet Палагин, А.В.
Петренко, Н.Г.
citation_txt Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І / А.В. Палагин, Н.Г. Петренко // Управляющие системы и машины. — 2014. — № 2. — С. 44-57, 76. — Бібліогр.: 5 назв. — рос.
collection DSpace DC
container_title Управляющие системы и машины
description Разработаны методологические основы построения быстродействующих аппаратных лингвистических процессоров с использованием метода многоуровневых проекций разработки структурной организации упомянутых процессоров с учетом онтологического подхода. Предложена функциональная схема процессора в целом и его подсистем. Рассмотрена задача оптимизации процессора. The methodological bases of high-speed hardware linguistic processors construction, using the method of multi-level projections development of the structural organization of the mention above processors with ontological approach are elaborated. The processor functional diagram as a whole its subsystems is proposed. The task of processor optimization is considered. Розроблено методологічні основи побудови швидкодіючих апаратних лінгвістичних процесорів з використанням методу багаторівневих проекцій розробки структурної організації згаданих процесів з урахуванням онтологічного підходу. Запропоновано функціональну схему процесора в цілому та його підсистеми. Розглянуто задачу оптимізації процесора.
first_indexed 2025-12-01T06:10:16Z
format Article
fulltext 44 УСиМ, 2014, № 2 Технические средства информатики УДК 004.318 А.В. Палагин, Н.Г. Петренко Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І Разработаны методологические основы построения быстродействующих аппаратных лингвистических процессоров с использовани- ем метода многоуровневых проекций разработки структурной организации упомянутых процессоров с учетом онтологического под- хода. Предложена функциональная схема процессора в целом и его подсистем. Рассмотрена задача оптимизации процессора. The methodological bases of high-speed hardware linguistic processors construction, using the method of multi-level projections development of the structural organization of the mention above processors with ontological approach are elaborated. The processor functional diagram as a whole its subsystems is proposed. The task of processor optimization is considered. Розроблено методологічні основи побудови швидкодіючих апаратних лінгвістичних процесорів з використанням методу бага- торівневих проекцій розробки структурної організації згаданих процесів з урахуванням онтологічного підходу. Запропоновано функціональну схему процесора в цілому та його підсистеми. Розглянуто задачу оптимізації процесора. Введение. Обработка речевой или текстовой ин- формации обеспечивается лингвистическим про- цессором или на уровне «языкового» сознания человека, или в компьютерной системе (КС). В КС он – основная компонента, реализующая рас- познавание и понимание входной естественно- языковой информации, извлечение из нее пер- вичных знаний в виде простых онтологических концептов с их последующим формально-логи- ческим представлением. Полученной информа- ционной структуры достаточно для реализации (знание-ориентированных) процедур для реше- ния прикладных задач, принятия решений и др. Постановка задачи Одной из важных задач на пути разработки общей теории компьютерной обработки пред- метных знаний, представленных в естествен- но-языковой форме, есть построение эффек- тивных лингвистических процессоров. Эта за- дача особенно актуальна для приложений об- работки лингвистических корпусов текстов (ЛКТ) сверхбольших объемов (и в реальном времени). Это связано с тем, что современные персональные компьютеры программным спо- собом выполняют лингвистический анализ од- ного слова входного текста средней длины примерно за одну миллисекунду (диаграмма зависимости времени обработки входного сло- ва от его длины приведена на рис. 1), а такой анализ занимает значительную часть компью- терного времени в общей лингвистической об- работке. При этом время обработки входного текста даже относительно небольшого объема занимает от нескольких до десятков минут. В итоге для приложений, работающих в реальном времени, часть информации будет потеряна. 0,949 1,336 1,573 0,8150,827 0,7600,778 0,668 0,625 0,567 0,626 0,581 0,663 0,908 0,792 0,614 1,134 0,224 0,450 0,000 13 32 64 66 91 98 73 58 60 28 22 16 5 5 5 2 2 2 2 00,000000 0,200000 0,400000 0,600000 0,800000 1,000000 1,200000 1,400000 1,600000 1,800000 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 19 24 (msec) 0 Среднее время поиска Количество слов Рис. 1 Поэтому задача существенного (на два по- рядка и более) повышения быстродействия лин- гвистического анализа актуальна. Отметим, что такое повышение быстродей- ствия может быть достигнуто путем дополни- тельных аппаратурных затрат как стандартной, так и специализированной разработки. Аппарат- ные средства (АС) первого типа – это продукт известных фирм, доступный на рынке, к кото- УСиМ, 2014, № 2 45 рым прилагается система автоматизированного проектирования (САПР). Несомненный лидер таких АС на рынке – платы с установленными на них программируемыми логическими инте- гральными схемами (ПЛИС) (в которых есть сверхбыстродействующая память) и быстродей- ствующая память большого объема [1]. АС вто- рого типа – специализированная разработка, для них необходимо спроектировать архитектурно- структурную организацию процессора, электри- ческую схему или граф-схемы алгоритмов, спе- циальное программное обеспечение управления ими и драйверы совмещения с операционной системой компьютера. Для реализации лингвис- тического процессора оба эти варианта АС име- ют свои преимущества и недостатки. Для АС первого типа преимуществом служит их доступ- ность на рынке, их вычислительная мощность постоянно повышается разработчиками, к ним уже прилагается программное обеспечение, а проект аппаратного лингвистического процессо- ра (АЛП) может быть разработан за время от двух месяцев. Недостаток этих АС – низкий процент использования установленного на плате оборудования. К преимуществам АС второго типа следует отнести повышение быстродействия на один– два порядка в сравнении с АС первого типа, что есть главным критерием при разработке АЛП. А к недостаткам – необходимость коллектива раз- работчиков (системотехников и программистов), и время разработки проекта оценивается от од- ного года. Повышение быстродействия реализации ал- горитма лингвистического анализа для обоих типов АС достигается путем перевода опера- торов алгоритмического и программного уров- ней (реализация лингвистического анализа программным способом) на нижние уровни интерпретации [2]: для АС первого типа – на микропрограммный уровень, для АС второго типа – на микропрограммный и частично на физический уровни. В [2] приведены дополнительные доводы це- лесообразности реализации лингвистического процессора (ЛП) в целом и морфологического – в частности, аппаратными средствами. Напри- мер, аппаратная реализация дает возможность параллельной обработки всех слов одного пред- ложения одновременно. При этом упрощаются алгоритмы синтаксического и семантического анализа. В статье рассмотрены следующие компонен- ты методологических основ разработки АЛП1:  онтологический подход к построению ап- паратных средств лингвистического анализа естественно-языковых объектов (ЕЯО);  разработка функциональной схемы АЛП;  разработка подсистем АЛП;  задача оптимального синтеза АЛП;  структурная организация и проектирование аппаратного морфологического процессора (АМП);  структурная организация АМП для обра- ботки ЛКТ разного объема;  оценки сложности структурной реализации АМП. Онтологический подход к построению ап- паратных средств лингвистического анали- за естественно-языковых объектов Метод многоуровневых проекций проекти- рования АЛП. Метод многоуровневых проекций (ММП) построения аппаратных лингвистичес- ких процессоров основан на применении онто- логического подхода к проектированию архитек- турной и информационной компонент онтолого- управляемой информационной системы (ОУИС). При этом схема логико-информационной моде- ли [2] преобразуется в схему онтологической модели АЛП (рис. 2), где 0 – физический уро- вень; 1 – микропрограммный уровень; 2 – про- граммный уровень; 3 – алгоритмический уро- вень; 4 – предметный уровень. В модели (1) операторы алгоритмического уровня посредством отображения Н переводятся на нулевой, или физический уровень интерпрета- ции, чем реализуются свойства онтологического управления и реконфигурируемости. 1 Из перечисленных семи компонент методологических основ в данной статье будут рассмотрены первые четы- ре компоненты, а остальные – в следующей публикации. 46 УСиМ, 2014, № 2 3 3 3A      4 4 40, 4 :i A       0 0 0A    2 2 2A    1 1 1A    (1) Рис. 2 Модель (1) можно описать сетью конечных автоматов:     , , , , , ,n iM X M S Y    , где X – входной алфавит сети автоматов; {Mn} – множество структурных автоматов; S – множе- ство связей между автоматами Mn; Y – выходной алфавит сети автоматов; {i} – множество функ- ций переходов в {Mn};  – начальное состояние сети;  – конечное состояние сети. Учитывая современные технические характе- ристики микроэлектронной базы, можно реали- зовать все четыре этапа лингвистического ана- лиза на аппаратно-микропрограммном уровне в виде сети комбинационных автоматов с памятью. При этом выполняется анализ входной естест- венно-языковой (ЕЯ) информации не пословно, а по предложениям. Предложение – минималь- ная предикативная синтаксическая единица, для которой может быть выполнен полный синтак- сический и поверхностно-семантический анализ. Суть МПП состоит в следующем. На рис. 3 представлена структурная модель АЛП. Входные данные модели – это множество тек- стов {Tk}, выходные в общем случае – это смысл обработанного текста или, по крайней мере, его семантическая структура. Внутри модели реали- зуется отображение YX  : ~ , которое поэтап- но переводит текстовое представление входной информации (текст  графематическая структура текста  морфологическая  синтаксическая   семантическая структура) в соответствующие структуры сети операционных автоматов. При этом микропрограммные автоматы естественным образом настраиваются на управление функцио- нированием соответствующих операционных ав- томатов. : ~ Рис. 3 Следует отметить существенную особен- ность реализации АЛП с применением ПЛИС- технологии, для которой существует возмож- ность реконфигурации структуры АЛП на фи- зическом уровне как инструменте настройки (перестройки) на обработку ЛКТ заданной пред- метной области (ПдО) или решение задачи предметно-проблемной ориентации аппарат- ных средств. При этом на логических схемах ПЛИС построены так называемые адаптивные логические сети (АЛС) с памятью [1]. Модель аппаратных средств реализации АЛП. Адаптивная логическая сеть – это дис- кретный преобразователь кодов типа асинхрон- ного комбинационного автомата, заданный на- правленным графом, вершины которого – логи- ческие функции, а ребра – связи между ними ти- па выход–вход. АЛС предназначена для решения многопараметрических задач, исходная инфор- мация для которых представляется полями дан- ных (алфавитными символами ЕЯ), сгруппиро- ванными по функциональным признакам. В ос- нову организации АЛС положены требования динамической реконфигурируемости, иерархич- ности, многоуровневости и параллельной обра- ботки данных. Адаптация структуры АЛС на класс задач с учетом производительности, регу- лярности структуры, организации синхронных и асинхронных процессов обработки информации основывается на многоуровневом представлении внешних и внутренних процессов. Относительно топологии системы АЛС представляют собой матрицу универсальных логических элементов (ЛЭ), которые группируются в функциональные узлы и блоки (ФБ), местоположение которых закреплено, при этом изменение их функциони- рования происходит в зависимости от класса за- дач и от их назначения. В институте кибернети- ки НАН Украины накоплен опыт разработки АЛС на основе ПЛИС-технологий 1. УСиМ, 2014, № 2 47 Далее рассмотрим синтез дискретного преоб- разователя без памяти, представляющего много- уровневую комбинационную схему в элемент- ном базисе ПЛИС – АЛС [1]. Пусть задано полное множество n-мерных двоичных векторов G = {g} (Card{G} = 2 n ). За- дано множество n-мерных двоичных векторов D  G, которое есть обучающей выборкой для алгоритма классификации. Для произвольного входного множества n-мерных двоичных век- торов X = {x}, (X  G) необходимо реализовать следующую математическую модель: 1, 0, впротивномслучае. x D Y      Данная математическая модель может быть описана булевой сетью в виде треугольной матрицы. Структурно булева сеть представля- ется многоуровневой комбинационной схемой, а вершинам сети соответствуют ЛЭ. Под уровнем понимаем линейку ЛЭ, каждый из которых настраивается на реализацию про- извольной булевой функции и реализует ото- бражение h-размерных двоичных векторов в (h – 1)-размерные двоичные векторы. В преде- лах одного уровня (i = const) тип логической функции задается для любого i-го ЛЭ незави- симо. Таким образом, j-й уровень треугольной матрицы (ТМ) представляется комбинацион- ной схемой, имеющей l-разрядный вход и (l – 1)-разрядный выход  2,l n . Трапецие- дальная матрица (ТМ) реализует отображение : X  Y, которое предполагает корректное отображение множества F. В общем случае задача синтеза структуры ТМ сводится к опре- делению типов логических функций fij для всех элементов сети. Для определения множества логических функций F = { fij} используем по- линомы для описания булевой сети [1]. При кодировании значений булевой функции и ее аргументов перейдем к другому кодирова- нию, используя значения единица и минус еди- ница. Таким образом, множество переменных X = {x1, x2, , xn} для булевой функции f от n переменных будет представлено множеством  1 2, ,..., nE e e e , где  1 ix ie   , а множество значений Y  1 2 2 1 , ,..., ny y y   , где  0,1jy  множеством  0 1 2 1 , ,..., nV v v v   , где  1 jy jv   . Для любой булевой функции f от n пере- менных, принимающих значения из множества {1, –1}, существует эквивалентный полином Pf (n) с коэффициентами из множества действи- тельных чисел f (X) = Pf (n)(X). Коэффициенты полинома для функции f можно записать посредством матрицы Адамара: 1 , 2 n nn A H V где  0 1 2 1 , ,..., nA a a a   – множество коэффици- ентов полинома; Hn – матрица Адамара раз- мерности 2n; Vn – множество значений булевой функции. Матрица Адамара n-го порядка Hn пред- ставляет собой квадратную матрицу размерно- сти n, содержащую два типа элементов {1, –1}. Матрицу Адамара можно построить для любо- го значения n: 1 1 1 2 1 1 1 1 1 ; 1 1 n n n n n H H H H H H H               . Полином от одной переменной представля- ется выражением Pf (1) = a0 + a1e1. Соответственно, полином от n переменных: Pf (n) = af (n-1) + anenPf (n-1). Функциональные ограничения на алгорит- мы адаптации. Класс устройств с реконфигу- рируемой структурой (УРС) предполагает воз- можность настройки структуры на реализацию заданной функции. УРС, представленный мно- гоуровневой комбинационной логической схе- мой и реализующий полный набор булевых функций Fw от n переменных   2 Card 2 n WF  , называется универсальным. Если же УРС реа- лизует только подмножество Fu булевых функ- ций (Fu  Fw), то говорят о многофункциональном устройстве, так как появляется подмножество Fr логических функций (Fr = Fw \ Fu), которое не мо- жет быть реализовано данной структурой. Мощ- ность подмножества Fu зависит от структурной организации УРС. Подобная проблема «XOR» 48 УСиМ, 2014, № 2 существует для однослойных персептронов в ви- де подмножества линейно-разделимых функций. Рассмотрим подход к определению функ- циональных ограничений, т.е. возможности настройки УРС на реализацию подмножества логических функций Fu. В качестве УРС рас- сматривается реконфигурируемая структура типа треугольная матрица с сотовой структу- рой связи, содержащая множество L = {Lij} универсальных логических элементов, каждый из которых реализует логическую функцию       , 1 1 , 1,ij ij i j i jY f Y Y   , где fij – тип булевой функции (fij  Fw); j = 1 + + (n – 1) – номер уровня ТМ; i = 1 + (n – j) – по- рядковый номер ЛЭ на j-м уровне ТМ. Функциональные ограничения определяют возможность настройки ТМ на реализацию подмножества логических функций Fu. Для определения функциональных ограни- чений воспользуемся полиномиальным пред- ставлением булевых функций:      1 1n nf n f n f nP P a x P   , где Pf (n), Pf (n-1) – полиномы, описывающие бу- леву функцию от n и (n – 1) переменных соответ- ственно;  1 ,ie ix   где ei – значение i-й булевой переменной; ai – коэффициент полинома. Исходя из структуры ТМ с сотовой структу- рой связи, произвольный ЛЭ описывается поли- номом: 1 1 ,0 ,1 1 ,2 1 ,3 1 1 i i i i i i i i i j j j j j j j j jP a a P a P a P P         , (2) где 1 1 1 i i j jP P    – полиномы, представляющие со- бой переменные, поступающие на входы ЛЭ; ,0 ,1 ,2 ,3, , ,i i i i j j j ja a a a – коэффициенты полинома i jP . В обобщенном виде система уравнений для произвольного значения n определяется сле- дующими принципами. Произвольный входной вектор x в общем виде может быть представлен как x = 2d + , где d = 1 + s – индекс номера группы (s = 2 – количество групп, на которые разбивается полное множество значений аргументов j-го уровня); ; 2 Int     j x d  0 1s    – индекс элемента в группе,  = smod(2 j). Любой ЛЭ описывается полиномом i jP  1 1 1,i i j jf P P       , а с учетом указанных параметров       2 1 2 1 1 2 ; Int 2 / 2 . i j j i i j j j P d f P P d               Выражение (2) примет вид             2 1 ,0 ,1 1 2 ,2 1 2 1 2 ,3 1 1 2 Int 2 / 2 Int 2 / 2 . i i i i j j j j i i j j j i i i j j j j P d a a P a P d a P P d                           Тогда    – множество натуральных чисел 2 , 0 2 2 / 2 0 2 2 , , j j p p N p N                получим общие соотношения:             1 1 1 ,1 ,3 1 1 1 1 ,1 ,3 1 1 2 2 1 / 2 ; 2 / 2 i i j j i j i j j j i j j j i j j j j P P P P a a P a a P                                    1 ,2 ,3 1 1 ,2 ,3 1 2 11 2 1 i i j i i i j j j j j i i ii i j j j jj j P P a a P a a PP P                    . Поскольку полиномы представляют булевы функции, принимающие значения –1 и +1, то эти функции могут быть равны или противо- положны по знаку. Полученные функциональные выражения по- зволяют без предварительного определения ти- пов логических функций для всех составляющих структуру элементов определить возможность настройки структуры ТМ с сотовой структурой связи на реализацию заданной системы булевых функций. Оценка сложности реализации алгорит- ма лингвистического анализа. Далее предло- жен формализованный подход к оценке слож- ности иерархической системы обработки ин- формации, основанный на понятиях абсолют- ной и относительной оценок сложности опера- торов, составляющих языки различных уров- ней иерархии. УСиМ, 2014, № 2 49 Определение 1. Словом оператора назовем конечную строку букв из заданного алфавита, отмечающего данный оператор при представ- лении его в памяти компьютерной системы. Определение 2. Длина слова – число букв в нем. Определение 3. Длину описания алгоритма определим как сумму длин слов операторов языка, в котором представлен алгоритм. Если множеству операторов языка  ={1, 2, , q} поставить в соответствие множество их информационно-кодовых представлений U = {u1, u2, , uq}, где  1,iu U i q  – кодовое слово, отмечающее оператор λ ( 1, )i i q  , то сложность алгоритма А в соответствии с опре- делением 3 равна 1 q A i i i Q r u    , (3) где  ui – разрядность кодового слова ui, ri – число операторов i-го типа в алгоритме А, 1 q i A i r N   – длина алгоритма, т.е. число шагов, на каждом из которых реализуется один из операторов λ ( 1, )i i q  . Если аналогично представлять операторы каждого уровня иерархической системы, то выражение (3) примет вид ` 1 0 1 iqh h A j ij ij j j i Q Q r u       , (4) где ( 0, )jQ j h – сложность алгоритма, пред- ставленного на j-м уровне; j = 0 соответствует уровню микроопераций; 1, 1 iq ij j j h i r N     – длина алгоритма j-го уровня. Такой подход всегда подразумевает оценку относительной сложности алгоритмов и опе- раторов. Действительно, один и тот же объект (процесс, функция) может быть определен ал- горитмически в терминах операторов любой сложности. При этом очевидно, чем выше сложность операторов языка, тем меньше дли- на описания данного алгоритма в терминах языка этого уровня. Отсюда Утверждение 1. С увеличением сложности операторов языка сложность алгоритма, пред- ставленного в этом языке, уменьшается. Определение 4. Относительной сложностью алгоритма  AQ будет отношение сложности алгоритма (QA) к сложности операторов (Q) языка, в котором он представлен: A A Q Q Q  . (5) В терминах теории информации выражение (5) можно интерпретировать так: количество информации, необходимое для задания описания какого-либо процесса, обратно пропорциональ- но мощности его алфавита. Воспользовавшись выражением (5), для ие- рархической системы можно записать сле- дующее отношение, определяющее относи- тельную сложность алгоритма, представленно- го в операторах l-го языкового уровня:   1 1 0 1 , 1, . l i q il il i A ql ij ij j i r u Q l l h r u          (6) Знаменатель в выражении (6) характеризует сложность реализации операторов l-го уровня и, таким образом, есть ничем иным, как мерой сложности вычислений. Итак, выражение (6) устанавливает взаимосвязь между сложностью алгоритма и сложностью вычислений. Наряду с понятием относительной сложности можно определить понятие абсолютной слож- ности. Его целесообразно применять в первую очередь для элементарных операторов, которые, в силу их определения, нельзя представить через какие-либо другие операторы. При этом слож- ность элементарного оператора может быть сколь угодно велика. Примером может служить таблично реализованный элементарный опера- тор вычисления функций одной и более пере- менных. Абсолютную сложность элементарного оператора можно оценивать с помощью энтро- пийной меры, которую можно трактовать как емкость памяти (в битах), необходимую для хранения гипотетической таблицы, с помощью 50 УСиМ, 2014, № 2 которой данный элементарный оператор реали- зуется как оператор отображения: :F X Y , где X и Y – множества значений аргумента и функции соответственно. Если под элементарным оператором пони- мать микрооперацию, то абсолютная сложность микрокоманды будет     l i il FQ 1 , где l – мощность микрокоманды; Zi(F) – абсолютная сложность i-й микрооперации. В общем случае абсолютная сложность опе- ратора определяется числом операндов, раз- рядностью операндов и основанием системы счисления. Отметим, что, в соответствии с принятой концепцией, иерархическая система программируемых автоматов позволяет пред- ставлять алгоритмы на любом уровне иерар- хии. В связи с этим для данного класса автома- тов понятия сложности алгоритмов и сложно- сти вычислений взаимосвязаны. Задача оценки сложности алгоритма, таким образом, сводится к задаче оценки сложности языковых операторов и их оптимальной ие- рархии в системе. Разработка функциональной схемы аппа- ратно-лингвистического процессора. Лин- гвистический процессор (аппаратный или про- грамммный) интерпретирует текстовую ин- формацию (некоторый ЕЯО – документ, ста- тья, монография или ЛКТ) в соответствии с этапами лингвистического анализа: графема- тического, морфологического, синтаксическо- го и семантического (точнее, поверхностно- семантического). Результат работы АЛП – ин- формационная структура, предназначенная для проведения глубинно-семантического анализа в подсистеме экстралингвистической обработ- ки, задача которого – извлечение и формиро- вание структуры понятий, т.е. автоматическое извлечение из ЕЯО знаний, реализация их прагматической интерпретации в терминах прикладной задачи или соответствующая ре- акция, присущая человеку. На рис. 4 представлена функциональная схе- ма такого АЛП, которая включает в себя соот- ветствующие подсистемы реализации этапов лингвистического анализа и языково-онтологи- ческую картину мира (ЯОКМ), использование которой – одно из основных отличий АЛП от классического лингвистического процессора, а ее ЯОКМ-проектирование рассмотрено в [2]. Приняты следующие сокращения: АСС – общепринятые аббревиатуры, сокра- щения и специальные символы; БСОС – блок сравнения основы; БСОК – блок сравнения окончания; ЛЕ – лексема; О –объект; Д – дей- ствие; ХО – характеристика объекта; ХД – ха- рактеристика действия. Исходная информация для АЛП – это ЛКТ заданной ПдО. Лингвистический корпус тек- стов включает в себя конечное множество тек- стов  , 1, ,kT k K K – количество текстов в ЛКТ, последовательно поступающее на вход подсистемы графематического анализа.  кТ  l кP Т m l S 1 l S M l S m l S  1 l S M l Sm l S   l k i P l k P        , , , , l l l l ХО О Д ХД  ,m m l lЛ М Х  ,m l S m M   1 1,l lЛ М Х  ,m m l lЛ МХ   ,M M l lЛ М Х l P kT l k P l k P l k P  l кP Т m l S  m l S  Рис. 4 УСиМ, 2014, № 2 51 В процессе выполнения общего алгоритма лингвистического анализа текст {Tk} поэтапно преобразуется в графематическую, морфоло- гическую, синтаксическую и семантическую структуры, каждая из которых имеет свою мо- дель представления и свои средства обработки. Рассмотрим процесс лингвистического анализа в подсистемах АЛП. Разработка подсистем АЛП Подсистема графематического анализа На рис. 5 представлена блок-схема графема- тического анализа (где Ψ – процедура отобра- жения граф-схемы алгоритма реализации соот- ветствующей подсистемы лингвистического анализа в соответствующую сеть комбинаци- онных автоматов с памятью (ТпМ) в терминах САПР ПЛИС, ГфА – графематический анализ, а на рис. 6 показана диаграмма состояний (или граф-схема алгоритма) с описанием исполняе- мых процедур и анализируемыми условиями: р11 – начало работы АЛП. Запись в буфер- формирователь предложения принятой слово- формы; р12 – передача из буфера-формирователя предложения сформированного предложения на вход процедуры р2; р21 – индексация словоформ m lS и предло- жения l kP в целом;  кТ 1 1 1 ГфАТпМ  lkP 2 ГфАТпМ  l k mP S l  2 1  mS l 3 1 3 ГфАТпМ  mS l   mS l   mS l  4 ГфАТпМ 4 1 5 ГФАТпМ 5 1 Рис. 5 0y 0 11y p     1 12y p     1y 42p     2 23; 31y p p     2 24y p     3 41y p     4y 3 51 y p      52p    4y 4y 4y 21; 22p p     кТ Рис. 6 р22 – запись предложения l kP в базу данных индексированных текстов; р23 – передача из буфера-формирователя предложения l kP на вход процедуры р31; р24 – индексация Tk и его запись в базу дан- ных индексированных текстов; р31 – сравнение m lS со словарем АСС; р41 – формирование последовательности словоформ m lS  ; р42 – передача сформированной последова- тельности словоформ m lS  на Выход 1 (рис. 5); р51 – формирование последовательности словоформ m lS  ; р52 – передача сформированной последова- тельности словоформ m lS  на «Выход 2» (рис. 6). у0 – условие начала приема словоформы; у1 – условие окончания приема словоформы; у2 – условие окончания приема текста Tk; у3 – условие сравнения анализируемой сло- воформы с АСС; у4 – условие окончания сравнения слово- формы m lS с АСС. Поступивший на обработку текст {Tk} в блоке разбиения текста на графематические структуры разбивается и структурируется на множество разделов, абзацев, предложений и словоформ. Далее структурные единицы текста индексиру- ются и сохраняются в базе данных индексиро- ванных текстов, информация в которой исполь- зуется в процессе выполнения алгоритма всего лингвистического анализа, а также при экстра- лингвистической обработке. Затем для каждого предложения текста в блоке сравнения слов тек- ста со словарными единицами выделяются АСС естественного языка. Другими словами, каждое предложение разбивается на две части, причем для первой из них необходимо вычислить мор- фологические характеристики (и она поступает на обработку в блок формирования последова- тельностей предложений и слов текста), а для второй они извлекаются из соответствующего словаря (и она поступает в блок формирования АСС). На последнем этапе графематического анализа формируются две параллельные после- довательности фрагментов предложений, посту- 52 УСиМ, 2014, № 2 пающих в подсистему морфологического ана- лиза (МА), первая из них – в блок формирова- ния морфологических характеристик (БФМХ) для АСС, а вторая – в блок формирования раз- вернутого представления предложения l kP . Собственно вторая последовательность есть входной информацией, требующей обработки в подсистеме МА. Подсистема морфологического анализа На рис. 7 и 8 представлена блок-схема под- системы МА – диаграмма состояний с описа- нием исполняемых процедур и анализируемы- ми условиями. l k P 0 2 0 МАТпМ mS l  MS l 1S l mS l  1S l 1 МАТпМ 1 2 m МАТпМ 2 m M МАТпМ  mS l  mS l  mS l  mS l  4m МАТпМ  3 3m ОСМАТпМ  3 3m ОКМАТпМ   l k mP S l  6 2 6 МАТпМ 5m МАТпМ   1 1;l lLE МХ  ;m m l lLE МХ  ;M M l lLE МХ l k P  l k i P M lS m ОС  2Ψ m ОК  2Ψ m ОКОС  ,2Ψ m 2 M 2 Рис. 7 l k P Рис. 8 р61 – первая процедура для словоформ l kP , не являющихся АСС, формирует развернутое представление предложения l kP ; р71 – совместно с процедурами Р8 и Р9 фор- мирует раздельное представление основы и окончания словоформы m lS  . Выполняет предва- рительные установки информационных и управ- ляющих регистров; р81 – выполняет сравнение основы слово- формы m lS  с содержимым памяти основ; р82 – формирует список основ–омонимов; р91 – выполняет сравнение окончания сло- воформы m lS  с содержимым памяти окончаний; р101 – формирует лексемы и морфологиче- ские характеристики m lS  , в том числе и омо- нимов; р111 – формирует морфологические харак- теристики m lS  ; р121 – формирует морфологически связан- ные предложения l kP , раздельные для всех не- однозначных словоформ; у5 – условие начала приема последователь- ности словоформ предложения l kP ; у6 – условие сравнения окончания слово- формы m lS  ; у7 – условие сравнения основы словоформы m lS  ; у8 – условие составления полного списка основ–омонимов. В аппаратном морфологическом процессоре (АМП) для обработки каждой словоформы m lS  предложения l kP выделен отдельный аппарат- ный блок (его структура и функционирование рассмотрены далее), в котором из словоформы выделяются основа и окончание, причем прин- ципы такого выделения отличаются от тради- ционных [3] и описаны в [4]. Совокупность таких блоков, параллельно обрабатывающих все словоформы предложения l kP , составляют одну из основных компонент подсистемы мор- фологического анализа. Максимальное коли- чество блоков определяется на основе стати- стических характеристик заданного ЛКТ, в ча- стности, параметра максимального количества вхождений словоформ в предложения. Выделенные основа и окончание словофор- мы m lS  поступают соответственно в БСОС и БСОК, в которых по ассоциативному принци- пу формируется адрес фрагмента ячеек памяти основ и окончаний, в котором хранится мор- фологическая структура словоформы m lS  . По- дробный алгоритм морфологической обработ- ки одной словоформы и его аппаратная реали- зация описаны далее. УСиМ, 2014, № 2 53 Аналогично формируются морфологические характеристики для всех словоформ  m lS  предложения l kP . Отметим, что указанные мор- фологические характеристики учитывают осо- бенности только текстов научно-технического и делового стилей. В подсистеме МА выполняется параллельный анализ словоформ  m lS  , принадлежащих пред- ложению , где 1, ,l k kP T m M M  – количество словоформ в предложении ,l kP 1, ,l L L – ко- личество предложений в тексте Tk. На выходе подсистемы в блоках формирования морфоло- гических характеристик формируется выходная информация  ЛЕ ,m m l lМХ  , к которой присоеди- няется морфологическая информация о присут- ствующих в анализируемом предложении АСС ,m lS  m M . Причем, последнее множество мо- жет быть и пустым. На выходе подсистемы МА формируется морфологическая структура вида       1 1ЛЕ , , , ЛЕ , , , ЛЕ ,m m M M l l l l l lMX MX MX  –входная информация для подсистемы синтак- сического анализа. Подсистема синтаксического анализа. На рис. 9 показанна блок-схема синтаксического анализа (где СнА – синтаксический анализ), а на рис. 10 – диаграмма состояний с описанием исполняемых про- цедур и анализируемыми условиями. р131 – прием от подсистемы МА последова- тельности предложений ( )l k iP , где 1,i I , I – максимальное количество неоднозначных предложений; р132 – предсинтаксический анализ предло- жения l kP (разрешение грамматической и лек- сической омонимии, связывание слов в пред- ложении синтаксическими связями); р133 – сегментация предложения на синтак- сические группы и подгруппы; р141 – поочередное связывание групп в предложении. При этом выполняется пооче- редная обработка неоднозначных предложе- ний. По окончании обработки i-го предложе- ния на Выход 2 подсистемы выдается сообще- ние о загрузке (i + 1)-го предложения;  ;m m l l i LE МХ 2 3  l k i P 2 СнАТпМ 3 3 3 СнАТпМ 4 3 l k P  l Сн kG P 1 3 1 СнАТпМ l k i P 5 3  mS l  4 СнАTnM 5 СнАTnM Рис. 9  ;m m l l i LE МХ Рис. 10 р151 – формирование узлов графов групп и подгрупп; р152 – построение ориентированных графов групп и подгрупп; р153 – преобразование графов в синтакси- ческие деревья зависимостей (конструкции ви- да: подлежащее ↔ сказуемое, подлежащее ↔ дополнение, сказуемое ↔ дополнение и др.). р161 – построение общего синтаксического дерева предложения l kP ; у9 – условие отсутствия неоднозначных сло- воформ в предложении ( )l k iP ; у10 – условие перебора всех неоднозначных предложений. На вход подсистемы СнА поступает морфо- логическая структура предложения l kP , которая есть линейным объектом, на выходе формирует- ся синтаксическое дерево зависимостей – нели- нейный объект, сложность которого существен- но выше в сравнении с морфологической струк- турой. Под синтаксической структурой предложения l kP понимается размеченное дерево зависимо- 54 УСиМ, 2014, № 2 стей, такое, что: множество его узлов образуют имена лексем, входящих в l kP ; каждая дуга обо- значена именем соответствующего синтаксиче- ского отношения, специфичного для заданного ЕЯ. Например, для русского и украинского язы- ков выделяют более 50 синтаксических отноше- ний. В свою очередь все синтаксические отно- шения делятся на типы – актантные, атрибутив- ные, сочинительные и служебные. Их полный список приведен в [3]. Алгоритм синтаксического анализа разби- вается на два блока: предсинтаксический ана- лиз и собственно синтаксический анализ. Основное назначение блока предсинтакси- ческого анализа состоит в разрешении лекси- ческой и грамматической омонимии слово- форм по линейному контексту. Кроме того, этот блок для некоторых предложений устанавли- вает конкретные синтаксические связи между теми словами, лексические и синтаксические свойства и относительное линейное располо- жение которых позволяют однозначно сделать вывод о наличии между ними таких связей. Исходное предложение разбивается на син- таксические группы, которые, в свою очередь, могут состоять из подгрупп. Выделяют группы подлежащего, сказуемого и др. Далее алгоритм выполняет связывание построенных групп в один граф синтаксических отношений. Таким образом, в результате применения пра- вил предсинтаксического анализа морфологиче- ская структура предложения преобразуется в некоторый промежуточный объект, в котором, сравнительно с исходной структурой, существен- но сокращена лексико-грамматическая омонимия и проведены некоторые синтаксические связи. В подсистеме СнА одними из основных ком- понент служат словари синтаксических правил и конструкций ЕЯ. Посредством правил СнА фор- мируется набор гипотез о возможных синтакси- ческих связях между составляющими элемента- ми l kP . Основным критерием, положенным в основу правил, формирующих синтаксические гипотезы, есть критерий максимальной согласо- ванности связанных лексем по всем типам при- писанной им комбинаторной информации – как морфологической, так и лексикографической. Информация первого типа извлекается из мор- фологической структуры, в которой она была выработана в процессе морфологического ана- лиза; лексикографическая информация (включая синтаксическую, семантическую, сочетаемост- ную) извлекается из соответствующих статей комбинаторного словаря синтаксических правил и конструкций ЕЯ. После окончания формирования множества синтаксических гипотез, алгоритм синтаксиче- ского анализа приступает к его оптимизации, устраняя из этого множества ложные гипотезы на основе некоторых универсальных и локаль- ных требований к правильной синтаксической структуре предложения. Синтаксические правила – сложные фор- мальные объекты, состоящие из двух основных зон – зоны условий и зоны действий. Условия в правилах представляют собой ло- гические выражения, в записи которых могут быть использованы как элементарные, так и составные предикаты, с помощью которых мож- но описать наличие (или отсутствие) у слова определенных характеристик, всевозможные согласования между выделенными словами фразы, необходимый (или невозможный) ли- нейный или древесный контекст выделенных слов фразы и т.д. Зона действий в правилах – это перечень инструкций, последовательное исполнение ко- торых осуществляет требуемое правилом пре- образование рассматриваемого объекта. В по- давляющем большинстве правил синтаксиче- ского анализа объектом преобразования вы- ступает морфологическая структура. Далее описан алгоритм синтаксического анализа [3]. Построение набора гипотетических синтак- сических отношений для предложения l kP . В ре- зультате получим ориентированный граф гипо- тетических синтаксических отношений между словами предложения, состоящий из N узлов, где N – число слов анализируемого предложе- ния. Определение вершины синтаксической струк- туры. УСиМ, 2014, № 2 55 Необходимо из графа выделить дерево – син- таксическую структуру исходного предложения. Этот процесс происходит значительно быстрее, если сразу удается определить вершину дерева зависимостей. Поэтому после построения графа начинает работать блок, задача которого – вы- явление слов – кандидатов на роль вершины дерева. Описание свойств слов, которые могут быть вершинами в синтаксической структуре ис- ходного предложения, задано в виде специаль- ного правила. Правило просматривает все омо- нимы всех слов предложения и помечает те из них, которые по своим характеристикам могут быть вершиной. Кроме того, с помощью при- писывания некоторого веса кандидаты на роль вершины подаются в порядке убывания веро- ятности того, что это слово будет выбрано вер- шиной синтаксической структуры. Применение шаблонов синтаксических кон- струкций и проверка содержимого построенного дерева. Применение правил предпочтения. Если граф, оставаясь связным, деревом не считает- ся, то происходит обращение к правилам пред- почтения, позволяющим в отдельных случаях путем сравнения гипотетических синтаксиче- ских хозяев и слуг каждого слова оказать пред- почтение одним гипотетическим связям, унич- тожив другие. Просмотр альтернативных деревьев. Опи- санный алгоритм приводит к построению по крайней мере одной правильной синтаксической структуры для обрабатываемого предложения. Используя информацию, хранящуюся в сло- варе, блок формирования синтаксически свя- занных конструкций интерпретирует постро- енную синтаксическую структуру и формирует связки типа подлежащее ↔ сказуемое, подле- жащее ↔ дополнение (как правило, это прила- гательное, согласованное с существительным в роде, числе и падеже), сказуемое ↔ дополне- ние и др. Подсистема семантического анализа. стро- ит последовательно семантические структуры для каждого предложения входного текста. Семантиче- ская структура состоит из семантических узлов и семантических отношений. Семантический узел – это такой объект текстовой семантики, у которого заполнены все валентности как эксплицитно выра- женные в тексте, так и имплицитные – те, которые извлекаются из ЯОКМ. Применение ЯОКМ в под- системе семантического анализа есть основным от- личием от классических реализаций семантическо- го анализа. Оно содержит кроме традиционной се- мантической информации (содержащейся в слова- рях и тезаурусах заданного ЕЯ) многоуровневые проекции как обобщенных, так и конкретизиро- ванных шаблонов представлений семантических конструкций простых предложений. Из определения семантического узла также следует, что в процессе семантического анали- за выделяются семантические узлы и их атри- буты, входящие в эти узлы. Как и на всех эта- пах анализа, семантические узлы образуются из слов исходного предложения. Главный ис- точник гипотез о составе семантического узла дает синтаксический анализ. Многие синтакси- ческие группы могут перейти в семантические узлы, другие должны превратиться в атрибуты узлов. Другим источником формирования се- мантических узлов служит ЯОКМ. Кроме слов, семантические узлы могут вклю- чать в себя: знаки препинания, устойчивые обо- роты, устойчивые словосочетания, жесткие син- таксические группы и др. Каждому узлу приписано множество атри- бутов, таких, как набор графематических слов, из которых состоит данный узел; номер семан- тически главного слова в узле; грамматическая интерпретация узла (внешняя синтаксическая характеристика); номер фрагмента, которому принадлежит узел; предлог, который в синтак- сисе управлял этим узлом; ссылка на словар- ную статью в ЯОКМ и др. (www.aot.ru). Общая схема работы алгоритма может быть представлена следующей последовательностью шагов. 1. Инициализация семантических узлов. 2. Построение множества словарных интерпретаций узлов. 3. Построение групп времени. 4. Построение узлов из словосочетаний в кавычках. 5. Построение узлов типа «друг друга». 6. Построение устойчивых словосочетаний. 7. Построение лексических функций–параметров. 56 УСиМ, 2014, № 2 8. Установление отношений между локативными уз- лами. 9. Построение графа гипотетических связей. 10. Построение множественных актантов. 11. Проверка семантических узлов по семантическим характеристикам. 12. Проверка проективности построенной семанти- ческой конструкции. 13. Построение отношений по умолчанию. 14. Построение межфразных связей. 15. Построение анафорических связей. На рис. 11 представлена блок-схема семан- тического анализа, а на рис. 12 – диаграмма состояний с описанием исполняемых процедур и анализируемыми условиями. р171 – выполняет преобразование синтакси- ческого дерева зависимостей предложения l kP в синтактико-семантическую структуру. При этом выполняются пп. 1 и 2 общего алгоритма семан- тического анализа, приведенного выше; l k P 1 4 1 САТпМ  l Сн kG P l k P 2 4 2 САТпМ 3 4 3 САТпМ l kP T k         , , , ,l l l lХО О Д ХД k k k k 4 4 4 САТпМ k T Рис. 11  l Сн kG P Рис. 12 р181 – формирует шаблон–конструкцию для навигации по ЯОКМ и итерационно находит наиболее подходящий вариант. При этом про- цедура может обратиться за информацией, по- лученной на любой стадии обработки. Выпол- няются пп. 3–8 общего алгоритма; р191 – выполняет построение семантического дерева предложения l kP . При этом к сформиро- ванному предыдущей процедурой шаблону до- бавляются смысловые оттенки. Выполняются пп. 9–12 общего алгоритма; р201 – к сформированному шаблону пред- ложения добавляются недостающие связи. Вы- полняет окончательное формирование таблицы шаблонов текста Tk; р202 – процедура завершения работы АЛП. По запросу блока экстралингвистической об- работки передает содержимое таблицы шабло- нов предложений текста Tk в целом. Условия на диаграммах состояний интер- претируются так: у11 – условие поиска подходящего варианта шаблона–конструкции для предложения ( )l k iP ; у12 – условие завершения работы АПЛ. Как было показано, на вход подсистемы се- мантического анализа поступает синтаксиче- ское дерево зависимостей предложения l kP . Ее первые два блока, взаимодействуя с ЯОКМ, осуществляют перевод синтаксических конст- рукций предложения l kP в семантические в соот- ветствии с обобщенным шаблоном: Характери- стика объекта ↔ Объект ↔ Действие ↔ Ха- рактеристика действия, описанном ранее. Далее, в блоке формирования семантичес- кого дерева выполняется разрешение синтак- сической омонимии и устранение анафориче- ских связей. Алгоритм устранения анафорических связей выполняет замещение анафор соответствую- щими лексемами [5]. Такая конкретизация обобщенного шаблона уже достаточна для построения семантическо- го графа предложения l kP . В таком графе вер- шины представляют собой сущности (объек- ты), а дуги – отношения (связи) между ними. Имена вершин и дуг обычно совпадают с име- нами соответствующих сущностей и отноше- ний, используемых в естественном языке. Дуга и две связанные с ней вершины представляют минимальную значимую информацию – факт наличия связи определенного типа между со- ответствующими объектами. В заключение работы АЛП будет сформи- рована таблица шаблонов предложений текста {Tk}, в которой хранится информационная структура для всего текста в целом, и которая УСиМ, 2014, № 2 57 есть входной информацией для подсистемы экстралингвистической обработки текста {Tk}. В ней выполняется формально-логическое представление (перевод) предложений и текста в целом в подходящей формальной теории первого порядка, например, сначала в моди- фицированные концептуальные графы и затем в логику предикатов первого порядка. Задача оптимального синтеза АЛП. Вве- дение дополнительных аппаратных затрат с целью существенного выигрыша в быстродействии реа- лизации алгоритмов лингвистического анализа требует рассмотрения вопроса оптимизации соот- ношения Аппаратные затраты (Q) ↔ Время вы- полнения (T ). Такую оптимизацию можно выпол- нить на основе известного метода Парето. Целевая функция в аналитическом виде на- ходится одним из приближенных методов, на- пример, линейной или нелинейной интерполя- ции или экстраполяции, по нескольким опор- ным точкам (структурные реализации алго- ритма), которые получают путем предвари- тельного формирования вариантов реализаций алгоритма. Из множества этих точек, где каж- дой r-й точке (r = 1m) соответствует реализа- ция с параметрами <Tr, Qr>, формируется мно- жество Парето на плоскости T – Q с учетом упорядочения: ....... ;...... 21 21 mr mr QQQQ TTTT   В общем случае задача выбора (квази) оп- тимального варианта реализации алгоритма сводится к выбору некоторых граничных зна- чений 00 ,QT (предельных параметров Tr, Qr) и минимизации функционала: 0 0 min ,r r r r r r c Q b T F c Q b Tr    (7) где    1 2 1 2, ,..., , , ,...,r m r mc c c c b b b b  – норма- тивные коэффициенты (которые могут быть оп- ределены, например методом экспертных оце- нок), такие, что 1 1 m r r c   , 1 1 m r r b   и r rc b k  , где k – коэффициент обратной пропорцио- нальности. Суть этого коэффициента состоит в том, что чем меньше время Tr реализации ал- горитма, тем больше необходимо затрат обо- рудования rQ и наоборот. Если функционал (7) найден и найдено мини- мальное значение 0 0 min ,r r r r r r c Q b T c c Q b Tr    то 'c c  получим неравенство  0 0r r r r r rc c Q b T c Q b T    . Последнее неравенство означает, что какой бы ни был параметр c , реализация не будет превосходить значения нормативной суммы 0 0r rc Q b T . Заключение. Анализ особенностей компь- ютерной обработки ЛКТ сверхбольших объе- мов показал, что для приложений, используе- мых в режиме реального времени, програм- мной реализации лингвистического (и особен- но морфологического) анализа недостаточно, так как часть информации может быть не об- работана. Поэтому задача построения аппарат- ных лингвистических процессоров актуальна, и ее решение позволит: во-первых – сократить сроки предоставления пользователю оператив- ной информации (без потери части ее и сни- жения ее актуальности) для принятия реше- ний; во-вторых – качественно повысить уро- вень лингвистических исследований с учетом большего количества параметров обработки. Предложен метод многоуровневых проекций разработки структурной организации АЛП с учетом онтологического подхода, суть которого состоит в поэтапном отображении алгоритмов обработки информации в сети операционных автоматов АЛП и позволяет повысить в два и более раз производительность лингвистического анализа текстов больших объемов. Предложен- ная модель АС реализации АЛП в виде асин- хронных комбинационных автоматов с памятью позволяет выполнять параллельную обработку словоформ предложения и допускает реконфи- гурацию структуры АЛП на физическом уровне как инструменте настройки (перестройки) на об- работку ЛКТ заданной ПдО или решение задачи предметно-проблемной ориентации аппаратных средств. Выполнена оценка сложности реализа- ции алгоритма лингвистического анализа. Окончание на стр. 76 76 УСиМ, 2014, № 2 Окончание статьи А.В. Палагина и др. Разработана функциональная схема парал- лельного АЛП, включающая в себя подсистемы графематического, морфологического, синтак- сического и поверхностно-семантического ана- лиза. Для каждой из них созданы граф-схемы алгоритмов и соответствующие процедуры. От- личительные особенности АЛП – активное взаимодействие с информационной структурой языково-онтологической картины мира, что по- вышает степень точности распознавания семан- тических конструкций предложений текста, и средства реконфигурации, позволяющие реали- зовать механизмы настройки на обработку ЛКТ различных ПдО и разного объема и есть инстру- ментом предметно-проблемной ориентации лин- гвистического процессора. 1. Палагин А.В., Опанасенко В.Н. Реконфигурируемые вычислительные системы. – К.: Просвіта, 2006. – 280 с. 2. Палагин А.В., Крывый С.Л., Петренко Н.Г. Онто- логические методы и средства обработки предмет- ных знаний. – Луганск: Изд-во ВНУ им. В. Даля, 2012. – 324 с. 3. Лингвистический процессор для сложных информаци- онных систем / Ю.Д. Апресян, И.М. Богуславский, Л.Л. Иомдин и др. – М.: Наука, 1992. – 256 с. 4. Розробка методів та засобів онтолого-лінгвістичного аналізу природномовних об'єктів / М.Г. Петренко, О.В. Палагін, В.Ю. Величко та ін. – К., 2009. – 38 с. – (Препр. / НАН України, Ін-т кібернетики ім. В.М. Глушкова; 2009-2). 5. Про один підхід до аналізу та розуміння природно- мовних об’єктів / О.В. Палагін, С.Ю. Світла, М.Г. Пет- ренко та ін. // Комп’ютерні засоби, мережі та сис- теми. – 2008. – № 7. – С. 128–137. Поступила 17.06.2013 Тел. для справок: +38 044 526-3348 (Киев) © А.В. Палагин, Н.Г. Петренко, 2014  Palagin.pdf 76.pdf << /ASCII85EncodePages false /AllowTransparency false /AutoPositionEPSFiles true /AutoRotatePages /None /Binding /Left /CalGrayProfile (Dot Gain 20%) /CalRGBProfile (sRGB IEC61966-2.1) /CalCMYKProfile (U.S. Web Coated \050SWOP\051 v2) /sRGBProfile (sRGB IEC61966-2.1) /CannotEmbedFontPolicy /Error /CompatibilityLevel 1.4 /CompressObjects /Tags /CompressPages true /ConvertImagesToIndexed true /PassThroughJPEGImages true /CreateJobTicket false /DefaultRenderingIntent /Default /DetectBlends true /DetectCurves 0.0000 /ColorConversionStrategy /CMYK /DoThumbnails false /EmbedAllFonts true /EmbedOpenType false /ParseICCProfilesInComments true /EmbedJobOptions true /DSCReportingLevel 0 /EmitDSCWarnings false /EndPage -1 /ImageMemory 1048576 /LockDistillerParams false /MaxSubsetPct 100 /Optimize true /OPM 1 /ParseDSCComments true /ParseDSCCommentsForDocInfo true /PreserveCopyPage true /PreserveDICMYKValues true /PreserveEPSInfo true /PreserveFlatness true /PreserveHalftoneInfo false /PreserveOPIComments true /PreserveOverprintSettings true /StartPage 1 /SubsetFonts true /TransferFunctionInfo /Apply /UCRandBGInfo /Preserve /UsePrologue false /ColorSettingsFile () /AlwaysEmbed [ true ] /NeverEmbed [ true ] /AntiAliasColorImages false /CropColorImages true /ColorImageMinResolution 300 /ColorImageMinResolutionPolicy /OK /DownsampleColorImages true /ColorImageDownsampleType /Bicubic /ColorImageResolution 300 /ColorImageDepth -1 /ColorImageMinDownsampleDepth 1 /ColorImageDownsampleThreshold 1.50000 /EncodeColorImages true /ColorImageFilter /DCTEncode /AutoFilterColorImages true /ColorImageAutoFilterStrategy /JPEG /ColorACSImageDict << /QFactor 0.15 /HSamples [1 1 1 1] /VSamples [1 1 1 1] >> /ColorImageDict << /QFactor 0.15 /HSamples [1 1 1 1] /VSamples [1 1 1 1] >> /JPEG2000ColorACSImageDict << /TileWidth 256 /TileHeight 256 /Quality 30 >> /JPEG2000ColorImageDict << /TileWidth 256 /TileHeight 256 /Quality 30 >> /AntiAliasGrayImages false /CropGrayImages true /GrayImageMinResolution 300 /GrayImageMinResolutionPolicy /OK /DownsampleGrayImages true /GrayImageDownsampleType /Bicubic /GrayImageResolution 300 /GrayImageDepth -1 /GrayImageMinDownsampleDepth 2 /GrayImageDownsampleThreshold 1.50000 /EncodeGrayImages true /GrayImageFilter /DCTEncode /AutoFilterGrayImages true /GrayImageAutoFilterStrategy /JPEG /GrayACSImageDict << /QFactor 0.15 /HSamples [1 1 1 1] /VSamples [1 1 1 1] >> /GrayImageDict << /QFactor 0.15 /HSamples [1 1 1 1] /VSamples [1 1 1 1] >> /JPEG2000GrayACSImageDict << /TileWidth 256 /TileHeight 256 /Quality 30 >> /JPEG2000GrayImageDict << /TileWidth 256 /TileHeight 256 /Quality 30 >> /AntiAliasMonoImages false /CropMonoImages true /MonoImageMinResolution 1200 /MonoImageMinResolutionPolicy /OK /DownsampleMonoImages true /MonoImageDownsampleType /Bicubic /MonoImageResolution 1200 /MonoImageDepth -1 /MonoImageDownsampleThreshold 1.50000 /EncodeMonoImages true /MonoImageFilter /CCITTFaxEncode /MonoImageDict << /K -1 >> /AllowPSXObjects false /CheckCompliance [ /None ] /PDFX1aCheck false /PDFX3Check false /PDFXCompliantPDFOnly false /PDFXNoTrimBoxError true /PDFXTrimBoxToMediaBoxOffset [ 0.00000 0.00000 0.00000 0.00000 ] /PDFXSetBleedBoxToMediaBox true /PDFXBleedBoxToTrimBoxOffset [ 0.00000 0.00000 0.00000 0.00000 ] /PDFXOutputIntentProfile () /PDFXOutputConditionIdentifier () /PDFXOutputCondition () /PDFXRegistryName () /PDFXTrapped /False /CreateJDFFile false /Description << /ARA <FEFF06270633062A062E062F0645002006470630064700200627064406250639062F0627062F0627062A002006440625064606340627062100200648062B062706260642002000410064006F00620065002000500044004600200645062A064806270641064206290020064406440637062806270639062900200641064A00200627064406450637062706280639002006300627062A0020062F0631062C0627062A002006270644062C0648062F0629002006270644063906270644064A0629061B0020064A06450643064600200641062A062D00200648062B0627062606420020005000440046002006270644064506460634062306290020062806270633062A062E062F062706450020004100630072006F0062006100740020064800410064006F006200650020005200650061006400650072002006250635062F0627063100200035002E0030002006480627064406250635062F062706310627062A0020062706440623062D062F062B002E0635062F0627063100200035002E0030002006480627064406250635062F062706310627062A0020062706440623062D062F062B002E> /BGR <FEFF04180437043f043e043b043704320430043904420435002004420435043704380020043d0430044104420440043e0439043a0438002c00200437043000200434043000200441044a0437043404300432043004420435002000410064006f00620065002000500044004600200434043e043a0443043c0435043d04420438002c0020043c0430043a04410438043c0430043b043d043e0020043f044004380433043e04340435043d04380020043704300020043204380441043e043a043e043a0430044704350441044204320435043d0020043f04350447043004420020043704300020043f044004350434043f0435044704300442043d04300020043f043e04340433043e0442043e0432043a0430002e002000200421044a04370434043004340435043d043804420435002000500044004600200434043e043a0443043c0435043d044204380020043c043e0433043004420020043404300020044104350020043e0442043204300440044f0442002004410020004100630072006f00620061007400200438002000410064006f00620065002000520065006100640065007200200035002e00300020043800200441043b0435043404320430044904380020043204350440044104380438002e> /CHS <FEFF4f7f75288fd94e9b8bbe5b9a521b5efa7684002000410064006f006200650020005000440046002065876863900275284e8e9ad88d2891cf76845370524d53705237300260a853ef4ee54f7f75280020004100630072006f0062006100740020548c002000410064006f00620065002000520065006100640065007200200035002e003000204ee553ca66f49ad87248672c676562535f00521b5efa768400200050004400460020658768633002> /CHT <FEFF4f7f752890194e9b8a2d7f6e5efa7acb7684002000410064006f006200650020005000440046002065874ef69069752865bc9ad854c18cea76845370524d5370523786557406300260a853ef4ee54f7f75280020004100630072006f0062006100740020548c002000410064006f00620065002000520065006100640065007200200035002e003000204ee553ca66f49ad87248672c4f86958b555f5df25efa7acb76840020005000440046002065874ef63002> /CZE <FEFF005400610074006f0020006e006100730074006100760065006e00ed00200070006f0075017e0069006a007400650020006b0020007600790074007600e101590065006e00ed00200064006f006b0075006d0065006e0074016f002000410064006f006200650020005000440046002c0020006b00740065007200e90020007300650020006e0065006a006c00e90070006500200068006f006400ed002000700072006f0020006b00760061006c00690074006e00ed0020007400690073006b00200061002000700072006500700072006500730073002e002000200056007900740076006f01590065006e00e900200064006f006b0075006d0065006e007400790020005000440046002000620075006400650020006d006f017e006e00e90020006f007400650076015900ed007400200076002000700072006f006700720061006d0065006300680020004100630072006f00620061007400200061002000410064006f00620065002000520065006100640065007200200035002e0030002000610020006e006f0076011b006a016100ed00630068002e> /DAN <FEFF004200720075006700200069006e0064007300740069006c006c0069006e006700650072006e0065002000740069006c0020006100740020006f007000720065007400740065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e007400650072002c0020006400650072002000620065006400730074002000650067006e006500720020007300690067002000740069006c002000700072006500700072006500730073002d007500640073006b007200690076006e0069006e00670020006100660020006800f8006a0020006b00760061006c0069007400650074002e0020004400650020006f007000720065007400740065006400650020005000440046002d0064006f006b0075006d0065006e0074006500720020006b0061006e002000e50062006e00650073002000690020004100630072006f00620061007400200065006c006c006500720020004100630072006f006200610074002000520065006100640065007200200035002e00300020006f00670020006e0079006500720065002e> /DEU <FEFF00560065007200770065006e00640065006e0020005300690065002000640069006500730065002000450069006e007300740065006c006c0075006e00670065006e0020007a0075006d002000450072007300740065006c006c0065006e00200076006f006e002000410064006f006200650020005000440046002d0044006f006b0075006d0065006e00740065006e002c00200076006f006e002000640065006e0065006e002000530069006500200068006f006300680077006500720074006900670065002000500072006500700072006500730073002d0044007200750063006b0065002000650072007a0065007500670065006e0020006d00f60063006800740065006e002e002000450072007300740065006c006c007400650020005000440046002d0044006f006b0075006d0065006e007400650020006b00f6006e006e0065006e0020006d006900740020004100630072006f00620061007400200075006e0064002000410064006f00620065002000520065006100640065007200200035002e00300020006f0064006500720020006800f600680065007200200067006500f600660066006e00650074002000770065007200640065006e002e> /ESP <FEFF005500740069006c0069006300650020006500730074006100200063006f006e0066006900670075007200610063006900f3006e0020007000610072006100200063007200650061007200200064006f00630075006d0065006e0074006f00730020005000440046002000640065002000410064006f0062006500200061006400650063007500610064006f00730020007000610072006100200069006d0070007200650073006900f3006e0020007000720065002d0065006400690074006f007200690061006c00200064006500200061006c00740061002000630061006c0069006400610064002e002000530065002000700075006500640065006e00200061006200720069007200200064006f00630075006d0065006e0074006f00730020005000440046002000630072006500610064006f007300200063006f006e0020004100630072006f006200610074002c002000410064006f00620065002000520065006100640065007200200035002e003000200079002000760065007200730069006f006e0065007300200070006f00730074006500720069006f007200650073002e> /ETI <FEFF004b00610073007500740061006700650020006e0065006900640020007300e4007400740065006900640020006b00760061006c006900740065006500740073006500200074007200fc006b006900650065006c007300650020007000720069006e00740069006d0069007300650020006a0061006f006b007300200073006f00620069006c0069006b0065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e00740069006400650020006c006f006f006d006900730065006b0073002e00200020004c006f006f0064007500640020005000440046002d0064006f006b0075006d0065006e00740065002000730061006100740065002000610076006100640061002000700072006f006700720061006d006d006900640065006700610020004100630072006f0062006100740020006e0069006e0067002000410064006f00620065002000520065006100640065007200200035002e00300020006a00610020007500750065006d006100740065002000760065007200730069006f006f006e00690064006500670061002e000d000a> /FRA <FEFF005500740069006c006900730065007a00200063006500730020006f007000740069006f006e00730020006100660069006e00200064006500200063007200e900650072002000640065007300200064006f00630075006d0065006e00740073002000410064006f00620065002000500044004600200070006f0075007200200075006e00650020007100750061006c0069007400e90020006400270069006d007000720065007300730069006f006e00200070007200e9007000720065007300730065002e0020004c0065007300200064006f00630075006d0065006e00740073002000500044004600200063007200e900e90073002000700065007500760065006e0074002000ea0074007200650020006f007500760065007200740073002000640061006e00730020004100630072006f006200610074002c002000610069006e00730069002000710075002700410064006f00620065002000520065006100640065007200200035002e0030002000650074002000760065007200730069006f006e007300200075006c007400e90072006900650075007200650073002e> /GRE <FEFF03a703c103b703c303b903bc03bf03c003bf03b903ae03c303c403b5002003b103c503c403ad03c2002003c403b903c2002003c103c503b803bc03af03c303b503b903c2002003b303b903b1002003bd03b1002003b403b703bc03b903bf03c503c103b303ae03c303b503c403b5002003ad03b303b303c103b103c603b1002000410064006f006200650020005000440046002003c003bf03c5002003b503af03bd03b103b9002003ba03b103c42019002003b503be03bf03c703ae03bd002003ba03b103c403ac03bb03bb03b703bb03b1002003b303b903b1002003c003c103bf002d03b503ba03c403c503c003c903c403b903ba03ad03c2002003b503c103b303b103c303af03b503c2002003c503c803b703bb03ae03c2002003c003bf03b903cc03c403b703c403b103c2002e0020002003a403b10020005000440046002003ad03b303b303c103b103c603b1002003c003bf03c5002003ad03c703b503c403b5002003b403b703bc03b903bf03c503c103b303ae03c303b503b9002003bc03c003bf03c103bf03cd03bd002003bd03b1002003b103bd03bf03b903c703c403bf03cd03bd002003bc03b5002003c403bf0020004100630072006f006200610074002c002003c403bf002000410064006f00620065002000520065006100640065007200200035002e0030002003ba03b103b9002003bc03b503c403b103b303b503bd03ad03c303c403b503c103b503c2002003b503ba03b403cc03c303b503b903c2002e> /HEB <FEFF05D405E905EA05DE05E905D5002005D105D405D205D305E805D505EA002005D005DC05D4002005DB05D305D9002005DC05D905E605D505E8002005DE05E105DE05DB05D9002000410064006F006200650020005000440046002005D405DE05D505EA05D005DE05D905DD002005DC05D405D305E405E105EA002005E705D305DD002D05D305E405D505E1002005D005D905DB05D505EA05D905EA002E002005DE05E105DE05DB05D90020005000440046002005E905E005D505E605E805D5002005E005D905EA05E005D905DD002005DC05E405EA05D905D705D4002005D105D005DE05E605E205D505EA0020004100630072006F006200610074002005D5002D00410064006F00620065002000520065006100640065007200200035002E0030002005D505D205E805E105D005D505EA002005DE05EA05E705D305DE05D505EA002005D905D505EA05E8002E05D005DE05D905DD002005DC002D005000440046002F0058002D0033002C002005E205D905D905E005D5002005D105DE05D305E805D905DA002005DC05DE05E905EA05DE05E9002005E905DC0020004100630072006F006200610074002E002005DE05E105DE05DB05D90020005000440046002005E905E005D505E605E805D5002005E005D905EA05E005D905DD002005DC05E405EA05D905D705D4002005D105D005DE05E605E205D505EA0020004100630072006F006200610074002005D5002D00410064006F00620065002000520065006100640065007200200035002E0030002005D505D205E805E105D005D505EA002005DE05EA05E705D305DE05D505EA002005D905D505EA05E8002E> /HRV (Za stvaranje Adobe PDF dokumenata najpogodnijih za visokokvalitetni ispis prije tiskanja koristite ove postavke. Stvoreni PDF dokumenti mogu se otvoriti Acrobat i Adobe Reader 5.0 i kasnijim verzijama.) /HUN <FEFF004b0069007600e1006c00f30020006d0069006e0151007300e9006701710020006e0079006f006d00640061006900200065006c0151006b00e90073007a00ed007401510020006e0079006f006d00740061007400e100730068006f007a0020006c006500670069006e006b00e1006200620020006d0065006700660065006c0065006c0151002000410064006f00620065002000500044004600200064006f006b0075006d0065006e00740075006d006f006b0061007400200065007a0065006b006b0065006c0020006100200062006500e1006c006c00ed007400e10073006f006b006b0061006c0020006b00e90073007a00ed0074006800650074002e0020002000410020006c00e90074007200650068006f007a006f00740074002000500044004600200064006f006b0075006d0065006e00740075006d006f006b00200061007a0020004100630072006f006200610074002000e9007300200061007a002000410064006f00620065002000520065006100640065007200200035002e0030002c0020007600610067007900200061007a002000610074007400f3006c0020006b00e9007301510062006200690020007600650072007a006900f3006b006b0061006c0020006e00790069007400680061007400f3006b0020006d00650067002e> /ITA <FEFF005500740069006c0069007a007a006100720065002000710075006500730074006500200069006d0070006f007300740061007a0069006f006e00690020007000650072002000630072006500610072006500200064006f00630075006d0065006e00740069002000410064006f00620065002000500044004600200070006900f900200061006400610074007400690020006100200075006e00610020007000720065007300740061006d0070006100200064006900200061006c007400610020007100750061006c0069007400e0002e0020004900200064006f00630075006d0065006e007400690020005000440046002000630072006500610074006900200070006f00730073006f006e006f0020006500730073006500720065002000610070006500720074006900200063006f006e0020004100630072006f00620061007400200065002000410064006f00620065002000520065006100640065007200200035002e003000200065002000760065007200730069006f006e006900200073007500630063006500730073006900760065002e> /JPN <FEFF9ad854c18cea306a30d730ea30d730ec30b951fa529b7528002000410064006f0062006500200050004400460020658766f8306e4f5c6210306b4f7f75283057307e305930023053306e8a2d5b9a30674f5c62103055308c305f0020005000440046002030d530a130a430eb306f3001004100630072006f0062006100740020304a30883073002000410064006f00620065002000520065006100640065007200200035002e003000204ee5964d3067958b304f30533068304c3067304d307e305930023053306e8a2d5b9a306b306f30d530a930f330c8306e57cb30818fbc307f304c5fc59808306730593002> /KOR <FEFFc7740020c124c815c7440020c0acc6a9d558c5ec0020ace0d488c9c80020c2dcd5d80020c778c1c4c5d00020ac00c7a50020c801d569d55c002000410064006f0062006500200050004400460020bb38c11cb97c0020c791c131d569b2c8b2e4002e0020c774b807ac8c0020c791c131b41c00200050004400460020bb38c11cb2940020004100630072006f0062006100740020bc0f002000410064006f00620065002000520065006100640065007200200035002e00300020c774c0c1c5d0c11c0020c5f40020c2180020c788c2b5b2c8b2e4002e> /LTH <FEFF004e006100750064006f006b0069007400650020016100690075006f007300200070006100720061006d006500740072007500730020006e006f0072011700640061006d00690020006b0075007200740069002000410064006f00620065002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b00750072006900650020006c0061006200690061007500730069006100690020007000720069007400610069006b007900740069002000610075006b01610074006f00730020006b006f006b007900620117007300200070006100720065006e006700740069006e00690061006d00200073007000610075007300640069006e0069006d00750069002e0020002000530075006b0075007200740069002000500044004600200064006f006b0075006d0065006e007400610069002000670061006c006900200062016b007400690020006100740069006400610072006f006d00690020004100630072006f006200610074002000690072002000410064006f00620065002000520065006100640065007200200035002e0030002000610072002000760117006c00650073006e0117006d00690073002000760065007200730069006a006f006d00690073002e> /LVI <FEFF0049007a006d0061006e0074006f006a00690065007400200161006f00730020006900650073007400610074012b006a0075006d00750073002c0020006c0061006900200076006500690064006f00740075002000410064006f00620065002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b006100730020006900720020012b00700061016100690020007000690065006d01130072006f00740069002000610075006700730074006100730020006b00760061006c0069007401010074006500730020007000690072006d007300690065007300700069006501610061006e006100730020006400720075006b00610069002e00200049007a0076006500690064006f006a006900650074002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b006f002000760061007200200061007400760113007200740020006100720020004100630072006f00620061007400200075006e002000410064006f00620065002000520065006100640065007200200035002e0030002c0020006b0101002000610072012b00200074006f0020006a00610075006e0101006b0101006d002000760065007200730069006a0101006d002e> /NLD (Gebruik deze instellingen om Adobe PDF-documenten te maken die zijn geoptimaliseerd voor prepress-afdrukken van hoge kwaliteit. De gemaakte PDF-documenten kunnen worden geopend met Acrobat en Adobe Reader 5.0 en hoger.) /NOR <FEFF004200720075006b00200064006900730073006500200069006e006e007300740069006c006c0069006e00670065006e0065002000740069006c002000e50020006f0070007000720065007400740065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e00740065007200200073006f006d00200065007200200062006500730074002000650067006e0065007400200066006f00720020006600f80072007400720079006b006b0073007500740073006b00720069006600740020006100760020006800f800790020006b00760061006c0069007400650074002e0020005000440046002d0064006f006b0075006d0065006e00740065006e00650020006b0061006e002000e50070006e00650073002000690020004100630072006f00620061007400200065006c006c00650072002000410064006f00620065002000520065006100640065007200200035002e003000200065006c006c00650072002000730065006e006500720065002e> /POL <FEFF0055007300740061007700690065006e0069006100200064006f002000740077006f0072007a0065006e0069006100200064006f006b0075006d0065006e007400f300770020005000440046002000700072007a0065007a006e00610063007a006f006e00790063006800200064006f002000770079006400720075006b00f30077002000770020007700790073006f006b00690065006a0020006a0061006b006f015b00630069002e002000200044006f006b0075006d0065006e0074007900200050004400460020006d006f017c006e00610020006f007400770069006500720061010700200077002000700072006f006700720061006d006900650020004100630072006f00620061007400200069002000410064006f00620065002000520065006100640065007200200035002e0030002000690020006e006f00770073007a0079006d002e> /PTB <FEFF005500740069006c0069007a006500200065007300730061007300200063006f006e00660069006700750072006100e700f50065007300200064006500200066006f0072006d00610020006100200063007200690061007200200064006f00630075006d0065006e0074006f0073002000410064006f0062006500200050004400460020006d00610069007300200061006400650071007500610064006f00730020007000610072006100200070007200e9002d0069006d0070007200650073007300f50065007300200064006500200061006c007400610020007100750061006c00690064006100640065002e0020004f007300200064006f00630075006d0065006e0074006f00730020005000440046002000630072006900610064006f007300200070006f00640065006d0020007300650072002000610062006500720074006f007300200063006f006d0020006f0020004100630072006f006200610074002000650020006f002000410064006f00620065002000520065006100640065007200200035002e0030002000650020007600650072007300f50065007300200070006f00730074006500720069006f007200650073002e> /RUM <FEFF005500740069006c0069007a00610163006900200061006300650073007400650020007300650074010300720069002000700065006e007400720075002000610020006300720065006100200064006f00630075006d0065006e00740065002000410064006f006200650020005000440046002000610064006500630076006100740065002000700065006e0074007200750020007400690070010300720069007200650061002000700072006500700072006500730073002000640065002000630061006c006900740061007400650020007300750070006500720069006f006100720103002e002000200044006f00630075006d0065006e00740065006c00650020005000440046002000630072006500610074006500200070006f00740020006600690020006400650073006300680069007300650020006300750020004100630072006f006200610074002c002000410064006f00620065002000520065006100640065007200200035002e00300020015f00690020007600650072007300690075006e0069006c006500200075006c0074006500720069006f006100720065002e> /RUS <FEFF04180441043f043e043b044c04370443043904420435002004340430043d043d044b04350020043d0430044104420440043e0439043a043800200434043b044f00200441043e043704340430043d0438044f00200434043e043a0443043c0435043d0442043e0432002000410064006f006200650020005000440046002c0020043c0430043a04410438043c0430043b044c043d043e0020043f043e04340445043e0434044f04490438044500200434043b044f00200432044b0441043e043a043e043a0430044704350441044204320435043d043d043e0433043e00200434043e043f0435044704300442043d043e0433043e00200432044b0432043e04340430002e002000200421043e043704340430043d043d044b04350020005000440046002d0434043e043a0443043c0435043d0442044b0020043c043e0436043d043e0020043e0442043a0440044b043204300442044c002004410020043f043e043c043e0449044c044e0020004100630072006f00620061007400200438002000410064006f00620065002000520065006100640065007200200035002e00300020043800200431043e043b043504350020043f043e04370434043d043804450020043204350440044104380439002e> /SKY <FEFF0054006900650074006f0020006e006100730074006100760065006e0069006100200070006f0075017e0069007400650020006e00610020007600790074007600e100720061006e0069006500200064006f006b0075006d0065006e0074006f0076002000410064006f006200650020005000440046002c0020006b0074006f007200e90020007300610020006e0061006a006c0065007001610069006500200068006f0064006900610020006e00610020006b00760061006c00690074006e00fa00200074006c0061010d00200061002000700072006500700072006500730073002e00200056007900740076006f00720065006e00e900200064006f006b0075006d0065006e007400790020005000440046002000620075006400650020006d006f017e006e00e90020006f00740076006f00720069016500200076002000700072006f006700720061006d006f006300680020004100630072006f00620061007400200061002000410064006f00620065002000520065006100640065007200200035002e0030002000610020006e006f0076016100ed00630068002e> /SLV <FEFF005400650020006e006100730074006100760069007400760065002000750070006f0072006100620069007400650020007a00610020007500730074007600610072006a0061006e006a006500200064006f006b0075006d0065006e0074006f0076002000410064006f006200650020005000440046002c0020006b006900200073006f0020006e0061006a007000720069006d00650072006e0065006a016100690020007a00610020006b0061006b006f0076006f00730074006e006f0020007400690073006b0061006e006a00650020007300200070007200690070007200610076006f0020006e00610020007400690073006b002e00200020005500730074007600610072006a0065006e006500200064006f006b0075006d0065006e0074006500200050004400460020006a00650020006d006f0067006f010d00650020006f0064007000720065007400690020007a0020004100630072006f00620061007400200069006e002000410064006f00620065002000520065006100640065007200200035002e003000200069006e0020006e006f00760065006a01610069006d002e> /SUO <FEFF004b00e40079007400e40020006e00e40069007400e4002000610073006500740075006b007300690061002c0020006b0075006e0020006c0075006f00740020006c00e400680069006e006e00e4002000760061006100740069007600610061006e0020007000610069006e006100740075006b00730065006e002000760061006c006d0069007300740065006c00750074007900f6006800f6006e00200073006f00700069007600690061002000410064006f0062006500200050004400460020002d0064006f006b0075006d0065006e007400740065006a0061002e0020004c0075006f0064007500740020005000440046002d0064006f006b0075006d0065006e00740069007400200076006f0069006400610061006e0020006100760061007400610020004100630072006f0062006100740069006c006c00610020006a0061002000410064006f00620065002000520065006100640065007200200035002e0030003a006c006c00610020006a006100200075007500640065006d006d0069006c006c0061002e> /SVE <FEFF0041006e007600e4006e00640020006400650020006800e4007200200069006e0073007400e4006c006c006e0069006e006700610072006e00610020006f006d002000640075002000760069006c006c00200073006b006100700061002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e007400200073006f006d002000e400720020006c00e4006d0070006c0069006700610020006600f60072002000700072006500700072006500730073002d007500740073006b00720069006600740020006d006500640020006800f600670020006b00760061006c0069007400650074002e002000200053006b006100700061006400650020005000440046002d0064006f006b0075006d0065006e00740020006b0061006e002000f600700070006e00610073002000690020004100630072006f0062006100740020006f00630068002000410064006f00620065002000520065006100640065007200200035002e00300020006f00630068002000730065006e006100720065002e> /TUR <FEFF005900fc006b00730065006b0020006b0061006c006900740065006c0069002000f6006e002000790061007a006401310072006d00610020006200610073006b013100730131006e006100200065006e0020006900790069002000750079006100620069006c006500630065006b002000410064006f006200650020005000440046002000620065006c00670065006c0065007200690020006f006c0075015f007400750072006d0061006b0020006900e70069006e00200062007500200061007900610072006c0061007201310020006b0075006c006c0061006e0131006e002e00200020004f006c0075015f0074007500720075006c0061006e0020005000440046002000620065006c00670065006c0065007200690020004100630072006f006200610074002000760065002000410064006f00620065002000520065006100640065007200200035002e003000200076006500200073006f006e0072006100730131006e00640061006b00690020007300fc007200fc006d006c00650072006c00650020006100e70131006c006100620069006c00690072002e> /UKR <FEFF04120438043a043e0440043804410442043e043204430439044204350020044604560020043f043004400430043c043504420440043800200434043b044f0020044104420432043e04400435043d043d044f00200434043e043a0443043c0435043d044204560432002000410064006f006200650020005000440046002c0020044f043a04560020043d04300439043a04400430044904350020043f045604340445043e0434044f0442044c00200434043b044f0020043204380441043e043a043e044f043a04560441043d043e0433043e0020043f0435044004350434043404400443043a043e0432043e0433043e0020043404400443043a0443002e00200020042104420432043e04400435043d045600200434043e043a0443043c0435043d0442043800200050004400460020043c043e0436043d04300020043204560434043a0440043804420438002004430020004100630072006f006200610074002004420430002000410064006f00620065002000520065006100640065007200200035002e0030002004300431043e0020043f04560437043d04560448043e04570020043204350440044104560457002e> /ENU (Use these settings to create Adobe PDF documents best suited for high-quality prepress printing. Created PDF documents can be opened with Acrobat and Adobe Reader 5.0 and later.) >> /Namespace [ (Adobe) (Common) (1.0) ] /OtherNamespaces [ << /AsReaderSpreads false /CropImagesToFrames true /ErrorControl /WarnAndContinue /FlattenerIgnoreSpreadOverrides false /IncludeGuidesGrids false /IncludeNonPrinting false /IncludeSlug false /Namespace [ (Adobe) (InDesign) (4.0) ] /OmitPlacedBitmaps false /OmitPlacedEPS false /OmitPlacedPDF false /SimulateOverprint /Legacy >> << /AddBleedMarks false /AddColorBars false /AddCropMarks false /AddPageInfo false /AddRegMarks false /ConvertColors /ConvertToCMYK /DestinationProfileName () /DestinationProfileSelector /DocumentCMYK /Downsample16BitImages true /FlattenerPreset << /PresetSelector /MediumResolution >> /FormElements false /GenerateStructure false /IncludeBookmarks false /IncludeHyperlinks false /IncludeInteractive false /IncludeLayers false /IncludeProfiles false /MultimediaHandling /UseObjectSettings /Namespace [ (Adobe) (CreativeSuite) (2.0) ] /PDFXOutputIntentProfileSelector /DocumentCMYK /PreserveEditing true /UntaggedCMYKHandling /LeaveUntagged /UntaggedRGBHandling /UseDocumentProfile /UseDocumentBleed false >> ] >> setdistillerparams << /HWResolution [2400 2400] /PageSize [612.000 792.000] >> setpagedevice
id nasplib_isofts_kiev_ua-123456789-83321
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 0130-5395
language Russian
last_indexed 2025-12-01T06:10:16Z
publishDate 2014
publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
record_format dspace
spelling Палагин, А.В.
Петренко, Н.Г.
2015-06-18T10:15:37Z
2015-06-18T10:15:37Z
2014
Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І / А.В. Палагин, Н.Г. Петренко // Управляющие системы и машины. — 2014. — № 2. — С. 44-57, 76. — Бібліогр.: 5 назв. — рос.
0130-5395
https://nasplib.isofts.kiev.ua/handle/123456789/83321
004.318
Разработаны методологические основы построения быстродействующих аппаратных лингвистических процессоров с использованием метода многоуровневых проекций разработки структурной организации упомянутых процессоров с учетом онтологического подхода. Предложена функциональная схема процессора в целом и его подсистем. Рассмотрена задача оптимизации процессора.
The methodological bases of high-speed hardware linguistic processors construction, using the method of multi-level projections development of the structural organization of the mention above processors with ontological approach are elaborated. The processor functional diagram as a whole its subsystems is proposed. The task of processor optimization is considered.
Розроблено методологічні основи побудови швидкодіючих апаратних лінгвістичних процесорів з використанням методу багаторівневих проекцій розробки структурної організації згаданих процесів з урахуванням онтологічного підходу. Запропоновано функціональну схему процесора в цілому та його підсистеми. Розглянуто задачу оптимізації процесора.
ru
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
Управляющие системы и машины
Технические средства информатики
Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І
The Methodological Basis of the Development of the Language Processor for Processing Very Large Volumes of LKT. І
Методологічні основи розробки лінгвістичного процесора для обробки лінгвістичних корпусів текстів надвеликих об’ємів. І
Article
published earlier
spellingShingle Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І
Палагин, А.В.
Петренко, Н.Г.
Технические средства информатики
title Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І
title_alt The Methodological Basis of the Development of the Language Processor for Processing Very Large Volumes of LKT. І
Методологічні основи розробки лінгвістичного процесора для обробки лінгвістичних корпусів текстів надвеликих об’ємів. І
title_full Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І
title_fullStr Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І
title_full_unstemmed Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І
title_short Методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. І
title_sort методологические основы разработки лингвистического процессора для обработки лингвистических корпусов текстов сверхбольших объемов. і
topic Технические средства информатики
topic_facet Технические средства информатики
url https://nasplib.isofts.kiev.ua/handle/123456789/83321
work_keys_str_mv AT palaginav metodologičeskieosnovyrazrabotkilingvističeskogoprocessoradlâobrabotkilingvističeskihkorpusovtekstovsverhbolʹšihobʺemoví
AT petrenkong metodologičeskieosnovyrazrabotkilingvističeskogoprocessoradlâobrabotkilingvističeskihkorpusovtekstovsverhbolʹšihobʺemoví
AT palaginav themethodologicalbasisofthedevelopmentofthelanguageprocessorforprocessingverylargevolumesoflktí
AT petrenkong themethodologicalbasisofthedevelopmentofthelanguageprocessorforprocessingverylargevolumesoflktí
AT palaginav metodologíčníosnovirozrobkilíngvístičnogoprocesoradlâobrobkilíngvístičnihkorpusívtekstívnadvelikihobêmíví
AT petrenkong metodologíčníosnovirozrobkilíngvístičnogoprocesoradlâobrobkilíngvístičnihkorpusívtekstívnadvelikihobêmíví