Методы и модели для анализа корпуса документов нормативных актов в задачах электронного управления

Описаны подходы, используемые для классификации корпуса текстовых документов. Предлагаются новые модели и методы позволяющие осуществлять тематическую классификацию и вычислять степень тематической принадлежности текста к образцу. Описано підходи, які використовуються для класифікації корпусу тексто...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Кибернетика и вычислительная техника
Дата:2012
Автори: Помилуйко, П.А., Тимашова, Л.А.
Формат: Стаття
Мова:Russian
Опубліковано: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України 2012
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/45882
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Методы и модели для анализа корпуса документов нормативных актов в задачах электронного управления / П.А. Помилуйко, Л.А. Тимашова // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 67-75. — Бібліогр.: 3 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Опис
Резюме:Описаны подходы, используемые для классификации корпуса текстовых документов. Предлагаются новые модели и методы позволяющие осуществлять тематическую классификацию и вычислять степень тематической принадлежности текста к образцу. Описано підходи, які використовуються для класифікації корпусу текстових документів. Запропоновано нові моделі і методи, які дозволяють реалізувати тематичну класифікацію та обчислювати ступінь тематичної приналежності тексту до зразка. The result of this work is a new solution to the problem of finding documents in the sample. Developed: a model of structural representation of textual information, the method and algorithms of its thematic analysis that would allow the thematic classification and calculation of the degree of thematic text belonging to the sample.
ISSN:0452-9910