E-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання
Розглядається архітектура віртуальної самокерованої редакційної колегії фахового періодичного видання як системи штучного інтелекту, яка містить методи і засоби автоматичної підготовки до електронного друку поданих статей. Запропоновано для знаходження найближчого за тематикою рецензента використову...
Gespeichert in:
| Datum: | 2010 |
|---|---|
| Hauptverfasser: | , , , , |
| Format: | Artikel |
| Sprache: | Ukrainisch |
| Veröffentlicht: |
Інститут програмних систем НАН України
2010
|
| Schlagworte: | |
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/14666 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | E-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання/ Р.Р. Даревич, Д.Г. Досин, В.В. Литвин, O.І. Мриглод, Н.В. Шкутяк // Пробл. програмув. — 2010. — № 2-3. — С. 457-464. — Бібліогр.: 10 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1860058913987100672 |
|---|---|
| author | Даревич, Р.Р. Досин, Д.Г. Литвин, В.В. Мриглод, O.І. Шкутяк, Н.В. |
| author_facet | Даревич, Р.Р. Досин, Д.Г. Литвин, В.В. Мриглод, O.І. Шкутяк, Н.В. |
| citation_txt | E-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання/ Р.Р. Даревич, Д.Г. Досин, В.В. Литвин, O.І. Мриглод, Н.В. Шкутяк // Пробл. програмув. — 2010. — № 2-3. — С. 457-464. — Бібліогр.: 10 назв. — укр. |
| collection | DSpace DC |
| description | Розглядається архітектура віртуальної самокерованої редакційної колегії фахового періодичного видання як системи штучного інтелекту, яка містить методи і засоби автоматичної підготовки до електронного друку поданих статей. Запропоновано для знаходження найближчого за тематикою рецензента використовувати метрику між концептуальними графами – моделями поданих до друку статей. Для цього вводиться поняття центру семантичної ваги концептуального графа, а відстань від сфери компетентності рецензента до статті визначається як відстань між їх центрами семантичної ваги відповідних концептуальних графів.
This article considers architecture of virtual self-controlled journal editorial board as AI system with means and methods of automated preparation of scientific articles for electronic publication. It is proposed to use metrics between conceptual graphs – models of submitted articles to estimate nearest scientist, which field of scientific interests allow to ask him for making article review. The idea of “article center of semantic weight” is used for solving this task.
|
| first_indexed | 2025-12-07T17:02:48Z |
| format | Article |
| fulltext |
Освітні та навчальні аспекти програмування
© Р.Р. Даревич, Д.Г. Досин, В.В. Литвин, O.І. Мриглод, Н.В. Шкутяк, 2010
ISSN 1727-4907. Проблеми програмування. 2010. № 2–3. Спеціальний випуск 457
УДК 004.89
E-DITORIAL – ВІРТУАЛІЗАЦІЯ РОБОТИ РЕДАКЦІЙНОЇ КОЛЕГІЇ
ФАХОВОГО ПЕРІОДИЧНОГО ВИДАННЯ
Р.Р. Даревич1, Д.Г. Досин1, В.В. Литвин1, 2, O.І. Мриглод2, 3, Н.В. Шкутяк1
1
Фізико-механічний інститут ім. Г.В. Карпенка НАН України,
79601, Львів, вул. Наукова, 5, тел. 263 3088, pminasu@ipm.lviv.ua;
2
Національний університет «Львівська політехніка»,
3
Інститут фізики конденсованих систем НАН України
Розглядається архітектура віртуальної самокерованої редакційної колегії фахового періодичного видання як системи штучного
інтелекту, яка містить методи і засоби автоматичної підготовки до електронного друку поданих статей. Запропоновано для
знаходження найближчого за тематикою рецензента використовувати метрику між концептуальними графами – моделями поданих
до друку статей. Для цього вводиться поняття центру семантичної ваги концептуального графа, а відстань від сфери
компетентності рецензента до статті визначається як відстань між їх центрами семантичної ваги відповідних концептуальних
графів.
This article considers architecture of virtual self-controlled journal editorial board as AI system with means and methods of automated
preparation of scientific articles for electronic publication. It is proposed to use metrics between conceptual graphs – models of submitted
articles to estimate nearest scientist, which field of scientific interests allow to ask him for making article review. The idea of “article center
of semantic weight” is used for solving this task.
Вступ
Наукознавство або «наука про науку» [1] нині стало сферою зосередження особливої уваги, адже розвиток
інформаційних технологій надає нові можливості для того, щоб по-новому підійти до вирішення проблем у науковій
сфері. Проблема аналізу наукової продуктивності та обліку праці наукового працівника є однією з найдавніших,
проте й нині найактуальніших проблем наукознавства. Досі одним із найуживаніших підходів до вирішення згаданої
проблеми є аналіз сукупності опублікованих наукових праць як основної форми вираження та фіксації наукових
результатів. Саме цим визначається актуальність досліджень із оцінювання та рейтингування окремих наукових
статей та наукових видань загалом.
Поруч із задачами обліку та оцінювання вже опублікованих наукових видань, не менш важливою задачею є
сам процес їх підготовки. Адже саме на проміжку між поступленням рукописів у редакцію та опублікуванням
прийнятих статей відбувається важливий процес відбору якісних матеріалів, їх вичитування та рецензування, а
отже – забезпечення якісного рівня поширюваної наукової інформації. В основі процесу редакційного опрацювання
рукописів лежить, в основному, робота експертів, у ролі яких виступають члени редакційної колегії. Серед
основних функцій редколегії є призначення рецензентів, прийняття рішень про відповідність надісланих матеріалів
профілю видання, тематична класифікація рукописів, тощо. Такого роду завдання можуть виконувати фахові
спеціалісти, тобто досвідчені науковці, що є активними членами наукової спільноти та добре ознайомлені з
множиною публікацій у тій чи іншій тематичній області. Такий спосіб організації роботи з підготовки наукових
періодичних видань є класичним та перевіреним часом, проте він має ряд недоліків. З одного боку, участь
науковців у роботі редакційної колегії з часом стає рутинним виконанням ряду функцій та забирає час, необхідний
для творчої роботи. З іншого – при роботі експертів у будь-якій галузі завжди існує проблема фактора
суб’єктивності, тобто впливу емоцій, настрою чи особистих упереджень на прийняття рішень.
Нині існують достатні інформаційні потужності для того, щоб ставити задачу інформатизації та
автоматизації процесів підготовки наукових періодичних видань, зокрема – задачу віртуалізації роботи
редакційної колегії за допомогою програмних засобів із застосуванням мережевих технологій та досягнень в
області штучного інтелекту. При цьому розроблення подібної системи має враховувати акумульований досвід
наукознавства, існуючі стандарти в галузі наукової періодики, міжнародні вимоги. Головна мета інформаційної
системи для автоматизації редакційного опрацювання наукових статей залишається співзвучною з головним
призначенням будь-якого наукового періодичного видання – поширювати нову та актуальну наукову
інформацію в тій чи іншій області.
Постановка проблеми у загальному вигляді
Для того, щоб краще зрозуміти множину функцій, які виконуються на рівні редакційної колегії,
необхідно розглянути систему керування науковим періодичним видання та ієрархію цілей, що покладені в її
основу. З точки зору керування наукове періодичне видання є системою, яку можна розглядати на різних рівнях
[2]: стратегічне планування здійснюється на рівні видавця, тактичні завдання вирішуються органом редакційної
колегії, а оперативні технічні задачі виконуються працівниками редакції (рис. 1) [3]. Щоб наукове періодичне
видання могло досягнути конкурентоспроможного якісного рівня та ефективно функціонувати в перспективі,
Освітні та навчальні аспекти програмування
458
потрібно поступово реалізовувати ті чи інші стратегічні проекти. Наприклад, стратегічним завданням може
бути включення до міжнародного списку авторитетних наукових видань Thomson Scientific, що визначає низку
тактичних задач: забезпечення чіткої періодичності виходу, організацію та підтримку веб-сторінки журналу,
наявність певних елементів статей англійською мовою тощо. Кожна тактична задача передбачає ряд
оперативних дій на технічному рівні, наприклад, щоб забезпечити вчасність виходу журналу, необхідно
контролювати в часі процес прийняття статей до друку, їх рецензування та технічну підготовку, забезпечувати
вчасну наповненість «портфеля» тощо.
Рис. 1. Ієрархія компонентів адміністративної системи наукового видання з точки зору задач керування
Безумовно, найважливішою функцією редакційної колегії наукового періодичного видання є
забезпечення видання матеріалами, що містять нову та актуальну наукову інформацію, тобто відбір статей, що
найкраще відображають фахову спрямованість видання та відповідають його профілю.
Процес редакційного опрацювання надісланих рукописів є багатоетапним. На першому етапі
відбувається відсіювання матеріалів, що не відповідають поставленим технічним вимогам, а тому не можуть
далі опрацьовуватись редакцією. Це є невідповідність формату, мови, відсутність важливих елементів статті,
технічні проблеми при роботі з електронними версіями тощо. Наступний етап передбачає розгляд рукопису
редакційною колегією або її окремими членами на предмет відповідності профілю та спрямованості даного
періодичного видання (наприклад, відхилення експериментальних робіт поданих до видання, що публікує
теоретичні результати). Подальша робота з надісланими матеріалами пов’язана безпосередньо з організацією
процесу рецензування, що є, безумовно, найбільш складним та відповідальним етапом. Процес визначення
рецензентів враховує цілий ряд факторів, виходячи як із особливостей надісланого матеріалу, так і з інтересів
самого видання:
1) тематика надісланої статті (при цьому необхідно визначити якомога вужчу область, до якої
належить дана робота та визначити рецензентів, що працюють найближче до цієї області);
2) належність авторів та потенційних рецензентів до певної наукової школи або робочої групи
(буває, що різні групи авторів, працюючи в одній і тій же науковій тематиці, стоять на
конкуруючих позиціях);
3) соціальні аспекти (часом такі фактори, як, наприклад, національність авторів та рецензентів
мають важливе значення);
4) попередній досвід рецензування (аналіз історії рецензування часто дозволяє передбачити перебіг
майбутньої роботи: швидкість виконання, детальність відгуку та інші особливості);
5) сукупність процитованих у рукописі авторів (позитивним досвідом є призначення рецензентів із
авторів робіт, що цитуються);
6) міцність взаємозв’язків редакції з потенційними рецензентами (наявність контактної інформації,
можливість контролю над часовими рамками процесу рецензування, тощо).
Наступні кроки процесу «проходження» статей у редакції наукового періодичного видання є вже
технічнішими – це комунікація з авторами та рецензентами, надсилання відгуків і перероблених версій та
безпосередньо технічна підготовка статей до друку.
Таким чином, при розробці архітектури інтелектуальної інформаційної системи, що реалізує функції
віртуальної редакційної колегії, основними її компонентами можна визначити такі:
підсистема попереднього аналізу («технічне відсіювання»);
підсистема співставлення профілю видання (визначення типу статті та відповідності тематиці
видання);
Освітні та навчальні аспекти програмування
459
підсистема організації процесу рецензування (визначення вузької тематики статті, виділення кола
потенційних рецензентів та їх призначення, технічний супровід процесу рецензування);
підсистема технічної підготовки (додрукарські процеси для друкованого видання або ж підготовка
електронних публікацій для розміщення в інформаційній мережі).
З огляду на те, що перша та остання з наведених компонент вимагають технічної реалізації відомими
методами, на них не будемо зупинятись. Друга та третя підсистеми вже потребують інтеграції певних функцій
інтелектуального аналізу, тому будуть розглянуті більш детально у наступних підрозділах.
Огляд підходів до проблеми формалізації аналізу змісту текстових документів
Формалізація аналізу та представлення змісту текстового документа залишається актуальною науково-
технічною проблемою, пов’язаною, з одного боку, зі створенням (вибором) адекватних проблемній області та
природній мові документів формально-логічних виразних засобів [4], а з другого – розробленням методів та
процедур розпізнавання (зокрема, класифікації та кластеризації) змісту текстових документів, що аналізуються
та опрацьовуються з певною метою. У роботі [5] представлено огляд стану досліджень у цій галузі,
розглядаються проблеми організації просторів знань з використанням Інтернет-технологій, методи та засоби
видобування знань з текстів на природних мовах, а також питання використання просторів знань при створенні
прикладних інтелектуальних систем, що функціонують в мережі Інтернет. Стверджується, що стандартом
de facto, запровадженим W3C на специфікацію онтологій, стала мова OWL. Натомість мова SPARQL поступово
стає стандартом de facto, як мова запитів до баз знань.
В області моделей і методів аналізу природомовних текстів на даний час отримані теоретично й
практично значущі морфологічні моделі аналізу/синтезу лексем; розроблені моделі синтаксичного аналізу
основних ПМ-конструкцій; запропоновано ряд методів реалізації основних моделей аналізу ПМ-конструкцій,
які можуть використовуватися на практиці; виділені основні прийоми евристичної реалізації окремих моделей
інтерпретації ПМ-висловлювань; опрацьовані окремі моделі концептуального синтезу ПМ-текстів;
запропоновані і практично перевірені моделі та методи лінгвістичного синтезу. В області моделей розуміння
розроблені багаторівневі моделі, що враховують не тільки лінгвістичні, а й когнітивні складові цього процесу.
В області реалізації розроблені прототипи інтелектуальних ПМ-систем; є промислові реалізації ПМ-систем
різного класу (див. таблицю), які в більшості випадків лише «імітують» повномасштабне розуміння природної
мови.
Таблиця. Розробники практично реалізованих ПМ-засобів
1 BASIS Tech http://www.basistech.com
2 ClearForest Corporation http://www.clearforest.com
3 CognIT http://www.cognit.no
4 Compris Intelligence GmbH http://www.kompass.com
5 Convera (formerly Excalibur) http://www.convera.com
6 Delphes http://www.delphes.com
7 Megaputer Intelligence Inc. http://www.megaputer.com
8 Insightful Corporation & InFact http://www.insightful.com
9 Inxight Software Inc. http://www.inxight.com/
10 MITRE http://www.mitre.org
11 Ontotext http://www.ontotext.com
12 SRA International Inc. http://www.sra.com
13 TEMIS http://www.temis.com
14 Teragram Corporation http://www.teragram.com
На думку авторів, комп'ютерна лінгвістика, штучний інтелект і, тим більше, інформаційні технології досі
не мають ефективних моделей обробки текстів на природних мовах, а завдання автоматичного опрацювання
довільних ПМ текстів далі не має рішення, яке могло б мати якесь практичне значення. Ряд діючих проектів
застосовують евристичні алгоритми статистичного опрацювання текстів, обмежені онтології, зорієнтовані на
вузьку конкретну наперед задану проблемну область. Наприклад, у конфігурації NameTag продукту NetOwl
фірми SRA International Inc. обробляються 7 основних і близько 70 підтипів важливих сутностей, зокрема,
people, organizations, places, artifacts, phone, social security numbers, dollar amounts, dates, addresses.
У конфігурації Link and Event виділяються більше 150 типів зв'язків і подій на основі вбудованої онтології.
Модель текстового документа та введення на її основі метрики
Пропонується підхід до побудови моделі текстового документа (наукової статті), що базується на спеці-
альних процедурах його формалізації. Для цього використано результати досліджень природної мови
дистрибутивним методом та концептуальні графи (КГ). Якщо на отриманий таким чином КГ накласти ваги
понять, взяті з адаптивної онтології ПО, то отримаємо зважений концептуальний граф (ЗКГ), який
використовуватимо для подальшого опрацювання.
Для знаходження різного роду необхідних семантичних відстаней, як віддаленості змісту окремих понять
чи тематики повідомлень (текстових документів), знайдемо центр ваг ЗКГ, який є моделлю деякого текстового
документа. Для цього виконаємо такі кроки:
Освітні та навчальні аспекти програмування
460
1) порівнювані тексти подаємо у вигляді їх концептуальних графів;
2) графи доповнюємо відповідним контекстом та коефіцієнтами важливості з адаптивної онтології.
Детально про процедури адаптації онтології описано в [6];
3) відстань між двома вершинами графа Сі та Сj, якщо ці вершини з’єднані дугою, визначаємо як:
ij
ij i j
Q
d
L W W
, (1)
де Wi та Wj – коефіцієнти важливості вершин Сі та Сj відповідно; Lij – коефіцієнт важливості зв’язку між
вершинами; Q – константа, яка залежить від конкретної онтології. Приймемо, що Liі = ∞, тоді diі = 0.
4) Знаходимо центр ваг концептуального графа. Це вершина
*iC , для якої середня відстань id
найменша:
* mini i
i
d d . (2)
Середня відстань d для вершини Сі обчислюється згідно формули:
*
1,
1
n
ij
j j i
i
d
d
n
, (3)
де n – кількість вершин графа, *
ijd – найкоротший шлях між вершинами Сі та Сj, який обчислюється за
допомогою відомих алгоритмів, наприклад, Форда, Дейкстри, Флойда-Уоршалла [6]. Визначена таким чином
відстань задовольняє аксіомам метрики [7].
Визначення відповідності статті профілю наукового періодичного видання
Фахова спрямованість видання задається адаптивною онтологією предметної області (ПО) для яких
спрямоване це видання. Так деякі видання є фаховими в галузі комп’ютерних наук, деякі в хімічних і т.д.
Адаптивну онтологію визначимо як п’ятірку [7]:
О=<X, R, F, W, L>,
де X – скінченна множина концептів (понять, термінів) предметної області, яку задає онтологія О; R – скінченна
множина відношення між концептами (поняттями, термінами) заданої предметної області; F – скінченна
множина функцій інтерпретації (аксіоматизація), заданих на концептах або відношеннях онтології О,
де W – важливість понять Х, L – важливість відношень R.
За отриманою відстанню визначається найближча тематична група, якій відповідає дана стаття. Блок-
схема алгоритма показана на рис. 2.
Початок
Тематичні
групи
Перетворення
у концептуальний граф
Стаття
Доповнення
підграфами контексту
Пошук центру
семантичної ваги
Обчислення
відстані до центрів КГ
різних тематичних груп
Вибір найближчої
тематичної групи
Онтологія
ПО
Кінець
Рис. 2. Блок-схема алгоритма пошуку найближчої за змістом тематичної групи текстових документів
з використанням онтології
Виділення кола потенційних рецензентів
База потенційних рецензентів наукового періодичного видання, в основному, складається із сукупності її
авторів. На відміну від реальної редакційної колегії, що має можливість залучати нових рецензентів на основі
особистого досвіду експертів, віртуальна редакційна колегія володіє лише тими даними, що є зафіксованими у
її базі. З іншого боку, згадана база даних може поповнюватись новими прізвищами шляхом пошуку в
глобальній мережі Інтернет.
Освітні та навчальні аспекти програмування
461
Перед тим як використати методики більш точного оцінювання спорідненості тематики надісланої статті
та потенційних рецензентів, необхідно визначити скінченний перелік прізвищ учених, що працюють в околі
даної предметної області. Для більш загального групування авторів за їх тематикою, можна застосувати різні
підходи, зокрема на основі інформації про наукове співавторство. Використання саме даних про співавторство
виправдане тим, що їх легко можна одержати з мережі Інтернет. З іншого боку, відомості про співавторство
у конкретному науковому періодичному виданні переважно вже у готовому вигляді містяться в базі даних
цього видання.
Нехай 1 2, ..., nSt St St St – множина статей направлених для опублікування в фаховому виданні. Кожна
стаття представляється у вигляді моделі зваженого концептуального графа (ЗКГ). У свою чергу кожний ЗКГ
містить центр семантичної ваги (об’єкт досліджень статті). Множину таких об’єктів позначимо
1 2, ..., mOb Ob Ob Ob . Нехай є множина рецензентів 1 2, ..., lZ z z z , яких використовує фахове видання для
рецензування статей. Очевидно, що результат рецензування тим кращий, чим компетентніший рецензент у
відповідній проблематиці досліджень. Проблематику досліджень фахового видання задамо у вигляді онтології.
Очевидно, що така онтологія має включати об’єкти досліджень. А моделлю онтології є свій ЗКГ.
Компетентність рецензента щодо об’єкта досліджень задамо у вигляді нечіткого відношення
, i j ijF Z Ob z Ob . Чим більше значення
ij , тим компетентніший рецензент. Таке нечітке відношення
може бути побудоване на основі аналізу наукових праць рецензентів і / або шляхом їх опитування.
Якщо об’єктом досліджень статті
iSt є
kOb , то рецензувати цю статтю має рецензент
jz ,
де arg max jk
k
j .
Зручні засоби та методи для аналізу даних про авторів видання надає теорія складних мереж [8, 9], що
дає можливість представити великий масив взаємопов’язаних даних у вигляді складної математичної мережі –
набору вузлів, пов’язаних зв’язками. Різноманітні алгоритми на мережах дають можливість згрупувати дані за
ступенем їх близькості або ж навпаки – виявити, наскільки вони віддалені. Математичні мережі є також
чудовим засобом візуалізації даних у вигляді, що є зручним для сприйняття людиною. Зобразивши ті чи інші
дані у вигляді складної мережі, можна розраховувати ряд типових величин, що її характеризують, а саме:
розподіл ступенів вузлів, найдовший та середній шлях із множини найкоротших шляхів між двома довільними
вузлами, посередництво, коефіцієнт кластерності мережі та інші [8, 9].
На рис. 3 показано фрагмент мережі співавторства вибраного українського наукового періодичного
видання. Вузли позначають його авторів, а зв’язок між двома вузлами виникає тоді, коли пара авторів має
спільну опубліковану роботу в даному виданні.
Рис. 3. Фрагмент мережі співавторства українського наукового журналу з теоретичної фізики
«Condensed Matter Physics»
1
Представлення даних у вигляді складної мережі дає можливість використовувати ряд алгоритмів на
мережах, зокрема, алгоритм Гірвана–Ньюмена [10] для знаходження «природної структури мережі» (без
попереднього задання кількості кластерів). При цьому мається на увазі виявлення зв’язаних груп вузлів, що
мають більшу концентрацію зв’язків між собою, проте не представлені ізольованими кластерами (для
знаходження ізольованих компонент мережі співавторства можна використовувати будь-які з відомих методів
обходу графів). У випадку аналізу даних про публікації в науковому виданні знаходження структури мережі
статей чи авторів, поєднаних певними зв’язками, забезпечує групування їх за спільною науковою тематикою.
1 Візуалізація цієї та частини інших мереж здійснена за допомогою програмного пакету Pajek (Vlado A. Pajek: Program for large
network analysis; Borgatti, S.P. 2002.)
Освітні та навчальні аспекти програмування
462
Узагальнений алгоритм методу знаходження тематичних груп авторів видання на основі мережі
співавторства передбачає виконання таких кроків:
1) побудова мережі співавторства;
2) знаходження зв’язаних компонент побудованої мережі;
3) аналіз кожної із знайдених компонент та виявлення їх структури методом Гірвана–Ньюмена
(в рамках алгоритма автоматично відбувається перевірка того, чи мережа має виражену
структуру);
4) виявлення домінуючих тематик для кожної із знайдених груп авторів на основі аналізу
тематичних індексів.
Описаний метод був випробуваний на основі реальних даних про співавторство у виданні «Condensed
Matter Physics». На основі даних про публікації в журналі, за 10 років, було побудовано мережу співавторства
(838 вузлів) та виділено її зв’язані компоненти. 116 вузлів мережі увійшли в найбільшу зв’язану компоненту,
тоді як наступні за розміром містять, відповідно, 74 та 15 вузлів. На рис. 4 показано результат застосування
методу виділення тематичних груп авторів у найбільшій зв’язаній компоненті, що вже має достатньо виражену
структуру. Для визначення домінуючих тематик для знайдених груп авторів використовувались дані про
вказані в публікаціях тематичні номери PACS (запропонованована Американським інститутом фізики
класифікаційна схема для окреслення тематики наукових публікацій з фізики та астрономії, акронім від
«Physics and Astronomy Classification Scheme»), які, подібно до УДК, мають ієрархічну структуру. Наприклад,
домінуючою тематикою однієї із визначених груп авторів (група із 6 авторів, розміщена справа вгорі на рис. 4:
V.G. Morozov, G. Ropke, N.V. Davydov, V.A. Davydov, M.N. Stolyarov та T.Yamaguchi) є статистична фізика,
термодинаміка та нелінійні динамічні системи.
Рис. 4. Найбільша зв’язана компонента мережі співавторства видання «Condensed Matter Physics»
із виділеною її природною структурою.
Архітектура інтелектуальної системи E-ditorial
Розроблені методи покладені в основу пакета E-ditorial – інтелектуальної системи аналізу наукових праць
з метою включення їх до електронного збірника за певним профілем наукових досліджень, як однієї із служб
віртуального автоматизованого робочого місця наукового працівника, що розробляється у Фізико-механічному
інституті НАН України.
Взаємозв’язок основних елементів системи E-ditorial здійснюється через реляційну базу даних, в якій
зберігається вся інформація про опубліковані, відхилені та подані до друку статті, дані про авторів, їх
публікації, спів- та взаємоцитування, про рецензентів (рис. 5).
Освітні та навчальні аспекти програмування
463
База даних
статей,
авторів та
рецензентів
E-ditorial
ПО автора та рецензента
База знань
онтологія
Портфель
поданих статей
Рис. 5. Взаємозв’язок основних елементів системи E-ditorial через реляційну базу даних статей,
авторів та рецензентів
Служба автоматично приймає до «портфелю» подану до публікації наукову статтю, здійснює первинний
аналіз її відповідності вимогам до форми представлення, будує концептуальний граф анотації цієї статті
у форматі RDF-OWL як онтологію її автора, доповнює підграфами раніше побудованої онтології автора, якщо
він раніше публікувався в цьому виданні, доповнює підграфами контексту з онтології проблемної області
видання, шукає центр семантичної ваги понять концептуального графа, визначає близькість тематики статті до
видання в цілому та кожного з його розділів зокрема, як семантичну відстань між центрами відповідних
суміщених ЗКГ, таким чином приймає рішення про віднесення до певного розділу, виділяє з мережі рецензентів
тематичної групи вибраного розділу найбільш відповідних кандидатів за раніше встановленими критеріями, які
забезпечують компетентність та об’єктивність рецензування та надсилає обраному рецензенту подану до друку
статтю з анкетою її оцінювання. За результатами оцінювання рецензентом приймає рішення про повторне
рецензування іншим рецензентом, відправлення автору на доопрацювання, включення до найближчого
випуску, залишення в резерві публікацій, чи відхилення статті (рис. 6).
Інтерфейс зв'язку
Механізм
міркування
Семантичний
аналізатор
База даних
Онтологія
База знань
Система
прийняття
рішення
Система навчання
Рис. 6. Архітектура підсистеми залучення компонентів служби до процесу аналізу статті
Основними компонентами системи E-ditorial (рис. 7) є:
інтелектуальний агент, реалізований на базі Wget, який працює під управлінням ОС Linux і забезпечує
видобування публікацій з мережі Інтернет;
супровідна база даних під управлінням СУБД MySQL, в якій зберігається інформація про користувачів,
відповідні предметні області, запити користувачів а також прийняті рішення щодо статей;
програмний пакет синтаксично-семантичного аналізу на базі LinkParser, який забезпечує побудову
семантичних образів статей для їх подальшого опрацювання, а також для автоматичного поповнення
онтології системи;
онтологія, реалізована мовою OWL засобами Protégé API, структура та зміст якої оптимізовані у
відповідності до інформаційного профілю фахового видання;
підсистема класифікації/прийняття рішень щодо статті, доповненоної контекстом з онтології.
Система здійснює семантичний аналіз наукової публікації, внаслідок якого будується ЗКГ статті у
форматі OWL. Отриманий ЗКГ використовуємо для розв’язування вище описаних задач, та для прийняття
відповідних рішень редакційною колегією.
Освітні та навчальні аспекти програмування
464
Онтологія
База
даних
Класифікація
Інтернет
Інтерфейс
Попереднє
опрацювання
LinkParser
Механізм доповнення
контекстом
Механізм
доповнення
Механізм доповнення
запиту
Wget
стаття релевантні статті
формалі-
зація
тексту
лексика
статей
шаблони
нові
знання
визначення
ваг КГ
доповнення
котекстом
налашту-
вання ПО
ключові
слова
рішення
редакційної
колегії
доповнення
контекстом
модель
статті
CG
розширені CG
Рис. 7. Архітектура підсистеми семантичного аналізу статті
Висновки
У роботі розглянуто архітектуру віртуальної самокерованої редакційної колегії фахового періодичного
видання E-ditorial. В основі функціонування такої системи лежить інтелектуальний агент, який містить методи
та засоби автоматичної підготовки до електронного друку поданих статей і знаходить найближчого за
тематикою рецензента. Для реалізації цих функцій побудовано метрику між концептуальними графами, які є
моделями поданих до друку статей. Вводиться поняття центру семантичної ваги концептуального графа, а
відстань від сфери компетентності рецензента до статті визначається як відстань між центрами семантичних ваг
відповідних концептуальних графів. Для кластеризації статей фахового видання використано теорію складних
мереж. Побудована система E-ditorial дозволяє автоматизувати діяльність редакційної колегії фахового
періодичного видання та приймати релевантні рішення редакційною колегією.
1. Добров Г.М. Наука о науке. – К. : Наук. думка, 1989. – 304 с..
2. Граничин О.Н. Информационные технологии в управлении. – Киев. – БИНОМ. Лаборатория знаний. : ИНТУИТ, 2008. – 336 с.
3. Мриглод О. І. Компоненти інформаційної системи підтримки рішень для наукових періодичних видань. Автореф. дис. ... зступеня
кандидата наук. / НУ «Львівська політехніка», 2009.
4. Leitner F. A text-mining perspective on the requirements for electronically annotated abstracts. – FEBS. – Madrid, Spain. – 2008. –
Р. 1178–1181.
5. Хорошевский В.Ф. Пространства знаний в сети Интернет и Semantic Web // Искусственный интеллект и принятие решений. – Институт
системного анализа РАН, № 1, 2008. – С. 80–97.
6. Седжвик Р. Фундаментальные алгоритмы на С++. Алгоритмы на графах: Пер. с англ./Роберт Седжвик. – СПб: ООО "ДиаСофтЮП",
2002. – 496 с.
7. Досин Д.Г. Інтелектуальні системи, базовані на онтологіях / Д.Г.Досин, В.В.Литвин, Ю.В.Нікольський, В.В.Пасічник / Львів:
Цивілізація, 2009. – 414 с.
8. Newman M. E. J. The Structure and Function of Complex Networks. SIAM Review. – 2003. – Vol. 45. – P. 167–256.
9. Головач Ю. Складні мережі. / Головач Ю., фон Фербер К., Олємськой О., Головач Т., Мриглод О., Олємской І., Пальчиков В. / Журнал
фізичних досліджень. – 2006. – Том 10. – С. 247–291.
10. Girvan M. Community structure in social and biological networks. / Girvan M., Newman M.E.J. / Proc. Natl. Acad. Sci. USA. – 2002. – Vol. 99.
– Р. 7821–7826.
|
| id | nasplib_isofts_kiev_ua-123456789-14666 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1727-4907 |
| language | Ukrainian |
| last_indexed | 2025-12-07T17:02:48Z |
| publishDate | 2010 |
| publisher | Інститут програмних систем НАН України |
| record_format | dspace |
| spelling | Даревич, Р.Р. Досин, Д.Г. Литвин, В.В. Мриглод, O.І. Шкутяк, Н.В. 2010-12-27T14:06:47Z 2010-12-27T14:06:47Z 2010 E-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання/ Р.Р. Даревич, Д.Г. Досин, В.В. Литвин, O.І. Мриглод, Н.В. Шкутяк // Пробл. програмув. — 2010. — № 2-3. — С. 457-464. — Бібліогр.: 10 назв. — укр. 1727-4907 https://nasplib.isofts.kiev.ua/handle/123456789/14666 004.89 Розглядається архітектура віртуальної самокерованої редакційної колегії фахового періодичного видання як системи штучного інтелекту, яка містить методи і засоби автоматичної підготовки до електронного друку поданих статей. Запропоновано для знаходження найближчого за тематикою рецензента використовувати метрику між концептуальними графами – моделями поданих до друку статей. Для цього вводиться поняття центру семантичної ваги концептуального графа, а відстань від сфери компетентності рецензента до статті визначається як відстань між їх центрами семантичної ваги відповідних концептуальних графів. This article considers architecture of virtual self-controlled journal editorial board as AI system with means and methods of automated preparation of scientific articles for electronic publication. It is proposed to use metrics between conceptual graphs – models of submitted articles to estimate nearest scientist, which field of scientific interests allow to ask him for making article review. The idea of “article center of semantic weight” is used for solving this task. uk Інститут програмних систем НАН України Освітні та навчальні аспекти програмування E-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання E-ditorial: virtualization of work of scientific journal editorial board Article published earlier |
| spellingShingle | E-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання Даревич, Р.Р. Досин, Д.Г. Литвин, В.В. Мриглод, O.І. Шкутяк, Н.В. Освітні та навчальні аспекти програмування |
| title | E-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання |
| title_alt | E-ditorial: virtualization of work of scientific journal editorial board |
| title_full | E-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання |
| title_fullStr | E-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання |
| title_full_unstemmed | E-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання |
| title_short | E-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання |
| title_sort | e-ditorial – віртуалізація роботи редакційної колегії фахового періодичного видання |
| topic | Освітні та навчальні аспекти програмування |
| topic_facet | Освітні та навчальні аспекти програмування |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/14666 |
| work_keys_str_mv | AT darevičrr editorialvírtualízacíârobotiredakcíinoíkolegíífahovogoperíodičnogovidannâ AT dosindg editorialvírtualízacíârobotiredakcíinoíkolegíífahovogoperíodičnogovidannâ AT litvinvv editorialvírtualízacíârobotiredakcíinoíkolegíífahovogoperíodičnogovidannâ AT mriglodoí editorialvírtualízacíârobotiredakcíinoíkolegíífahovogoperíodičnogovidannâ AT škutâknv editorialvírtualízacíârobotiredakcíinoíkolegíífahovogoperíodičnogovidannâ AT darevičrr editorialvirtualizationofworkofscientificjournaleditorialboard AT dosindg editorialvirtualizationofworkofscientificjournaleditorialboard AT litvinvv editorialvirtualizationofworkofscientificjournaleditorialboard AT mriglodoí editorialvirtualizationofworkofscientificjournaleditorialboard AT škutâknv editorialvirtualizationofworkofscientificjournaleditorialboard |