Підвищення достовірності перевірки унікальності текстів з використанням комбінованих систем розпізнавання образів

Besides explicit advantages regarding the search and usage of information from the Internet, the negative tendency recently came to being that some users tried to pass the information found on the Internet as their original work. To enhance substantially the percentage of the texts' uniqueness...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2017
Hauptverfasser: Menyaylenko, Oleksandr S., Zakhozhai, Oleh I., Bidyuk, Petro I.
Format: Artikel
Sprache:Ukrainisch
Veröffentlicht: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2017
Schlagworte:
Online Zugang:https://journal.iasa.kpi.ua/article/view/119432
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:System research and information technologies
Завантажити файл: Pdf

Institution

System research and information technologies
_version_ 1867334327060135936
author Menyaylenko, Oleksandr S.
Zakhozhai, Oleh I.
Bidyuk, Petro I.
author_facet Menyaylenko, Oleksandr S.
Zakhozhai, Oleh I.
Bidyuk, Petro I.
author_institution_txt_mv [ { "author": "Oleksandr S. Menyaylenko", "institution": "Луганський національний університет ім. Тараса Шевченка, м. Старобельськ" }, { "author": "Oleh I. Zakhozhai", "institution": "Донбаський державний технічний університет, Лисичанськ" }, { "author": "Petro I. Bidyuk", "institution": "Кафедра математичних методів системного аналізу Навчально-наукового комплекса \"Інститут прикладного системного аналізу\" Національного технічного університету України \"Київський політехнічний інститут імені Ігоря Сікорського\", Київ" } ]
author_sort Menyaylenko, Oleksandr S.
baseUrl_str http://journal.iasa.kpi.ua/oai
collection OJS
datestamp_date 2018-04-04T16:37:16Z
description Besides explicit advantages regarding the search and usage of information from the Internet, the negative tendency recently came to being that some users tried to pass the information found on the Internet as their original work. To enhance substantially the percentage of the texts' uniqueness identification it is proposed to construct the database of the texts' fragments based on a combined image recognition system. The proposed technical solutions provided a possibility for enhancing the percentage of identification of the text uniqueness by approximately 54%.
doi_str_mv 10.20535/SRIT.2308-8893.2017.4.03
first_indexed 2025-07-17T10:23:21Z
format Article
fulltext  О.С. Меняйленко, О.І. Захожай, П.І. Бідюк, 2017 Системні дослідження та інформаційні технології, 2017, № 4 29 TIДC ПРОБЛЕМИ ПРИЙНЯТТЯ РІШЕНЬ І УПРАВЛІННЯ В ЕКОНОМІЧНИХ, ТЕХНІЧНИХ, ЕКОЛОГІЧНИХ ТА СОЦІАЛЬНИХ СИСТЕМАХ УДК 004.931 DOI: 10.20535/SRIT.2308-8893.2017.4.03 ПІДВИЩЕННЯ ДОСТОВІРНОСТІ ПЕРЕВІРКИ УНІКАЛЬНОСТІ ТЕКСТІВ З ВИКОРИСТАННЯМ КОМБІНОВАНИХ СИСТЕМ РОЗПІЗНАВАННЯ ОБРАЗІВ О.С. МЕНЯЙЛЕНКО, О.І. ЗАХОЖАЙ, П.І. БІДЮК Анотація. Крім очевидних переваг пошуку та використання інформації з ме- режі Інтернет, останнім часом почала проявлятися негативна тенденція — на- магання користувачів мережі розпоряджатись нагромадженою інформацією та подавати її як продукт власної творчої праці. Для підвищення достовірності визначення унікальності тексту в роботі запропоновано побудову бази даних текстових фрагментів на основі комбінованої системи розпізнавання образів. Використання запропонованих технічних рішень дало змогу підвищити досто- вірність визначення частки унікальності тексту в середньому на 54%. Ключові слова: інформаційні технології, мережа Інтернет, плагіат, достовір- ність розпізнавання тексту, система для розпізнавання образів. ВСТУП Інтенсивний розвиток інформаційних технологій, інструментів і засобів ав- томатизованого оброблення та зберігання надвеликих масивів інформації створює сприятливі умови для формування глобальних, централізованих і розподілених сховищ даних для численних користувачів. В останні десяти- річчя глобальна мережа Інтернет об’єднала ці сховища і разом із сучасними пошуковими сервісами дозволила створити майже необмежений для пода- льшого розширення та удосконалення ресурс доступу до різноманітної ін- формації з можливостями розгорнутого пошуку та упорядкування даних. Окрім очевидних переваг такого прогресу, проявляється також і негативна тенденція — намагання використовувати та розпоряджатися нагромадже- ною інформацію та подавати її як продукт власної творчої праці. На жаль, термін «плагіат» стає дедалі поширенішим і «нормою» для будь-яких сфер людської діяльності. Така ситуація спостерігається, зокрема, у галузі освіти, де під час підготовки студентських робіт, доповідей, рефератів, курсових і дипломних робіт, а іноді й дисертацій суб’єктами освітнього процесу реалі- зуються спроби запозичення результатів чужої інтелектуальної праці. Натепер у сучасній науці й освіті стає дедалі популярнішим підхід до написання робіт, який полягає у звичайному копіюванні інформації з одного О.С. Меняйленко, О.І. Захожай, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2017, № 4 30 або декількох джерел, подальшому редакторському обробленні та поданні отриманих матеріалів як результату особистої інтелектуальної праці [1]. Одним зі способів протидії негативним аспектам є використання спеці- альних засобів перевірки текстів на унікальність, які дозволяють за резуль- татами аналізу поданих продуктів інтелектуальної праці виявляти запозиче- ні матеріали, визначати їх обсяг, а також ідентифікувати джерела запозичення [2–9]. Такі засоби отримали назву систем антиплагіату [3, 5, 7]. Принцип функціонування систем перевірки текстів на унікальність по- лягає у порівнянні поданих текстів з наявними у базі даних. У процесі робо- ти системи збирається і фільтрується інформація про наявні продукти інте- лектуальної праці [5]. Після попереднього оброблення тексти індексуються і вносяться до бази даних. Надалі цю базу даних можна використовувати для порівняння з поданими для аналізу текстами. Кожний документ, завантаже- ний для перевірки, ставиться в чергу для оброблення. Після перевірки необ- хідного документа система формує звіт, у якому детально подаються усі ре- зультати пошуку та рівень унікальності перевіреного матеріалу. Зазвичай ті фрагменти, що не є унікальними, для наочності виділяються в тексті [8]. Існує велике розмаїття програмних продуктів, які дозволяють перевіри- ти текст на унікальність та ідентифікувати ознаки плагіату. Кожний з них може мати специфічні особливості, а також переваги та недоліки [2–6, 9]. Аналіз таких систем дав змогу виявити основні функції, властиві більшості з них, а саме:  визначення частки унікальності поданого тексту;  пошук фрагментів тексту, що були запозичені, а також ідентифікація джерел інформації, що були використані у плагіаті;  маркування запозичених фрагментів тексту кольором для наочності, а також використання різних кольорів для фрагментів, запозичених з різних джерел;  формування детальних звітів після перевірки тексту на унікальність. Програмне забезпечення, як правило, має можливість гнучкого нала- годження алгоритмів та інструментарію пошуку подібності (наприклад, ви- значення кількості слів у шинглі, кількість вибірок з тексту і т. ін.). Додаткові функції програмного забезпечення перевірки текстів на уні- кальність:  перевірка контенту різноманітних web-ресурсів на унікальність з формуванням докладного звіту, що містить зафіксовані джерела плагіату;  робота зі списком проксі;  пакетна перевірка поданих текстових файлів;  можливість повторної перевірки текстів після видалення неунікаль- них фрагментів;  збереження історії перевірок та ведення журналу подій під час фун- кціонування алгоритму. Незважаючи на існуючу достатньо велику розмаїтість систем перевірки унікальності текстів, їх поєднує один негативний аспект — неоднозначність отриманих результатів аналізу, рівень достовірності яких істотно залежить від умов перевірки і більшою мірою від організації бази даних текстів, за якими виконується перевірка. Можливість отримання достовірного резуль- Підвищення достовірності перевірки унікальності текстів шляхом використання … Системні дослідження та інформаційні технології, 2017, № 4 31 тату аналізу тексту ускладняється застосуванням методів трансформування тексту, які штучно підвищують унікальність тексту, що не дозволяє системі подавати адекватний результат перевірки. Отже, можна зробити висновок, що удосконалення систем перевірки текстів на унікальність, особливо в частині логічної організації бази даних текстів та алгоритмів перевірки, є актуальним науково-технічним завдан- ням, розв’язання якого надасть можливість ефективно протидіяти незакон- ному використанню запозичених продуктів інтелектуальної праці. ПОСТАНОВКА ЗАВДАННЯ Для визначення основних аспектів завдання, що значною мірою впливають на достовірність результатів перевірки унікальності текстів, було заплано- вано та проведено експеримент, у якому різним програмам перевірки на плагіат подавались на вхід повністю запозичені текстові фрагменти, їх част- ка унікальності становила 0%. В експерименті використано чотири найбільш відомі та поширені сис- теми перевірки на антиплагіат, назви яких з метою недопущення реклами або антиреклами, не будуть розкриватися. Назвемо досліджувані системи: «система 1», «система 2», «система 3», «система 4». Для перевірки достовір- ності експериментального дослідження на вхід кожної з чотирьох систем подавалися для аналізу повністю запозичених 20 фрагментів тексту (відпо- відно до планування експерименту це 20 груп дослідів). Дисперсію середнього значення розрахункової частки унікальності тек- сту визначали так [10, 11]: 1 )( 1 2 2      m yy s m j iji i , (1) де m — кількість рівнобіжних дослідів; jiy — відгук j-го рівнобіжного до- сліду; iy — середній відгук у досліді. Відтворюваність середнього значення частки унікальності тексту оці- нювалась за критерієм Кохрена [10, 11]:    n i i i s s G 1 2 2 макс , де n — кількість груп дослідів; 2 is — дисперсія i-го досліду, яка визнача- ється за формулою (1); 2 максis — максимальне значення дисперсії в групі дослідів. Результати виконаного експерименту з аналізу текстових фрагментів, поданих мовою оригіналу, зведено у табл. 1. Проаналізувавши результати дослідів, поданих в табл. 1, можна зроби- ти висновок, що всі системи майже однаково визначили поданий плагіат. Значення коефіцієнта Кохрена не перевищувало табличного значення відпо- О.С. Меняйленко, О.І. Захожай, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2017, № 4 32 відно до методики [10]. Такі результати можна назвати очікуваними, оскіль- ки тексти бралися із загально доступних джерел і в базах даних досліджува- них систем містився однаковий обсяг відомостей про наявний плагіат. Т а б л и ц я 1 . Результати аналізу текстових фрагментів, поданих мовою оригіналу з очікуваною часткою унікальності 0% Параметр Система 1 Система 2 Система 3 Система 4 Середнє значення частки унікальності тексту iy 4,65 5,60 10,35 8,65 Середня дисперсія значення частки унікальності тексту 2 is 2,33 4,36 2,72 1,74 Значення коефіцієнта Кохрена (за довірчого інтервалу 0,95) 0,37 0,39 0,32 0,31 Оскільки системи перевірки можуть аналізувати тексти за умови їх мож- ливого перекладання іншими мовами, на наступному етапі досліджень ви- конувалося автоматизоване перекладання текстів загальновідомими систе- мами перекладу з української мови оригіналу на англійську та з української мови оригіналу на російську. Для збереження чистоти експерименту ручне редагування перекладених текстів не проводилося. Результати аналізу на унікальність текстів, перекладених з української мови на англійську та з української мови на російську, наведено в табл. 2 і 3 відповідно. Т а б л и ц я 2 . Результати аналізу текстових фрагментів, перекладених з української мови на англійську з очікуваною часткою унікальності 0% Параметр Система 1 Система 2 Система 3 Система 4 Середнє значення частки унікальності тексту iy 65,95 62,85 56,18 67,34 Середня дисперсія значення частки унікальності тексту 2 is 6,38 8,03 7,64 5,12 Значення коефіцієнта Кохрена (за довірчого інтервалу 0,95) 0,35 0,36 0,34 0,30 Т а б л и ц я 3 . Результати аналізу текстових фрагментів, перекладених з української мови на російську з очікуваною часткою унікальності 0% Параметр Система 1 Система 2 Система 3 Система 4 Середнє значення частки унікальності тексту iy 40,30 38,74 44,57 41,05 Середня дисперсія значення частки унікальності тексту 2 is 7,32 8,94 7,42 5,04 Значення коефіцієнта Кохрена (за довірчого інтервалу 0,95) 0,36 0,38 0,36 0,32 Підвищення достовірності перевірки унікальності текстів шляхом використання … Системні дослідження та інформаційні технології, 2017, № 4 33 Аналіз результатів дослідів, поданий в табл. 2 і 3, показав достатньо високу відтворюваність усіма чотирма системами, і переклад тексту з част- кою плагіату 100% дає можливість значно підвищити розрахункову частку унікальності. При цьому переклад англійською мовою дає вищий результат унікальності. Отримані результати пояснюються тим, що всі системи пере- вірки текстів на унікальність фактично здійснюють пошук послідовності символів, що збігаються з фрагментами, наявними в базі даних, повністю на кшталт пошуковим системам. Таким чином, синтаксично текст російською мовою буде мати більшу кількість збігів з текстом українською мо- вою завдяки більшій кількості однакових символів. Цей аспект може бути використаний плагіаторами для підвищення унікальності тексту через авто- матичну підміну на латинські символи, наприклад, в українському тексті букв, що мають однакове написання (тобто підміна «а», «Н», «К», «p» та інших символів кирилиці на відповідні символи латиниці). Візуально це не помітно, але під час аналізу буде отримано вищу частку унікальності. Очевидно, що найбільш ефективним і універсальним способом підви- щення достовірності визначення унікальності тексту може бути повна від- мова від синтаксичного аналізу текстів на користь логічного (смислового) аналізу. Утім велике розмаїття текстів, їх тематики та спрямованості, а та- кож достатньо велика розбіжність специфічних понять з різних галузей знань не дозволить у сучасних умовах створити систему штучного інтелекту з такою високорозвинутою семантикою та забезпечити її ефективне функці- онування. На сучасному етапі розвитку інформаційних технологій має науково- практичну значущість розв’язання задачі з удосконалення існуючих систем синтаксичного аналізу текстів на унікальність з метою підвищення достові- рності результатів, що отримуються особливо за умови достовірності по- дання перекладеного або трансформованого тексту. РОЗВ’ЯЗАННЯ ЗАДАЧІ На основі виконаного аналізу встановлено, що достовірність визначення ча- стки унікальності текстових фрагментів істотно залежить від форми подання матеріалу на аналіз, а також форми та вмісту бази даних текстових фрагмен- тів, з якими ведеться порівняння. Якщо для порівняння текстових фрагмен- тів система має його трансформувати (наприклад, під час порівняння фраг- ментів різними мовами), достовірність результату значно зменшується. Отже, можна зробити висновок, що підвищення достовірності аналізу мож- ливе у випадку усунення необхідності попередньої трансформації текстових фрагментів та забезпечення прямого порівняння наданих фрагментів з уміс- том бази даних системи перевірки на плагіат. Такий варіант стає можливим у випадку спеціальної організації бази даних систем перевірки текстів на унікальність. Для підвищення достовірності визначення частки унікальності текстів пропонується використовувати апарат комбінованих систем розпі- знавання образів [10–14]. У комбінованих системах розпізнавання об’єкт подається сукупністю образів, ознаки яких однозначно характеризують об’єкт розпізнавання [10, 11]. За кожним з цих образів (або за довільною їх сукупністю) мож- О.С. Меняйленко, О.І. Захожай, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2017, № 4 34 на віднести об’єкт до одного з наперед визначених класів. У цьому випадку стає можливим отримання коректного рішення щодо класифікації за різних умов спостереження об’єкта розпізнавання, оскільки окремі образи за різних умов спостереження мають різний ступінь інформативності. Відповідно до цього комбінована система для визначених умов спостереження об’єкта розпізнавання здійснює селекцію найбільш інформативних образів для отримання якомога достовірнішого результату класифікації. Таким чином, відповідно до теорії розпізнавання образів об’єктом роз- пізнавання є текстовий фрагмент, що надається для аналізу, а фрагменти з якими він порівнюється, є апріорно визначеними класами, ступінь подіб- ності до яких визначатиме частку унікальності тексту, що перевіряється. Кожен з цих класів nCC 1 характеризується відповідними образами nPP 1 . Узагальнену схему порівняння тексту з наявними в базі даних фрагментами з погляду теорії розпізнавання образів показано на рис. 1. Cхема, показана на рис. 1, повністю відповідає традиційному підходу до побудови систем перевірки на унікальність текстової інформації. Відпо- відно до неї для врахування можливих трансформацій тексту, що подається для аналізу, в систему вводяться функції перетворення nFF 1 , які дають змогу порівняти різноманітні форми подання інформації з наявними у базі (з класами nCC 1 , що характеризуються образами nPP 1 відповідно). На- приклад, таке трансформування використовується для порівняння тексту з урахуванням можливих варіантів його перекладу іншими мовами. Для уникнення трансформування тексту узагальнена схема, показана на рис. 1, перетворюється до варіанта використання комбінованої системи роз- пізнавання образів (рис. 2). У комбінованій системі розпізнавання класи nCC 1 характеризуються множиною репрезентативних образів {РR}, причому за кожним образом з цієї множини можна визначити для наданого для аналізу тексту відповід- ний клас. Відмінність між традиційною та запропонованою схемами органі- зації бази даних систем перевірки тексту на унікальність проілюстровано на рис. 2. Відмінності схеми організації порівняння тексту з використанням теорії комбінованих систем розпізнавання образів полягають у тому, що в базі да- них кожний клас подається сукупністю репрезентативних образів, які відпо- відають можливим, апріорно заданим формам подання текстової інформації. Текст (об’єкт розпізнавання) C1 (P1) C2 (P2) Cn (Pn) F1 F2 Fn Рис. 1. Узагальнена схема порівняння тексту з наявними в базі даних фрагментами з погляду теорії розпізнавання образів Підвищення достовірності перевірки унікальності текстів шляхом використання … Системні дослідження та інформаційні технології, 2017, № 4 35 У процесі аналізу фрагмент тексту, що аналізується, порівнюється з кожним репрезентативним образом. Частка унікальності тексту визначається відпо- відно до міри відстані поданого для аналізу образу від репрезентативних образів. Міра відстані до i-го репрезентативного образу визначається як )()( R i R i R ii PPPPPPD  , де iD — характеристика відстані до i-го репрезентативного образу; iP — образ, що надається для аналізу; RP — репрезентативний образ. Частка унікальності текстового фрагмента визначається пропорційно значенню відстані, тобто 00  ii yD , де yi — частка унікальності текстового фрагмента, %. Перевірка запропонованого технічного рішення щодо підвищення до- стовірності визначення частки унікальності текстової інформації проводи- лася на прикладі двох з чотирьох раніше досліджених систем. На двох сис- темах розробниками не передбачена можливість довільного формування бази даних за запропонованою схемою. Тому довелося повторно виконати досліди з аналізу тексту з очікуваною часткою унікальності 0% за умови його перекладу англійською і російською мовами. Результати дослідів зве- дено у табл. 4. Аналіз даних, поданих у табл. 4, вказав на істотне збільшення достовір- ності визначення частки унікальності тексту. Порівняно з результатами до- слідів, поданих у табл. 2 і 3, достовірність збільшилась у середньому на 54%. Це вказує на більш коректне порівняння та наявність позитивного ефе- кту від усунення попередньої трансформації текстових фрагментів, а також їх аналізу не мовою оригіналу. Текст (об’єкт розпізнавання) })({ 11 RPC P11 P12 P1k })({ 22 RPC P21 P22 P2l })({ R nn PC Pn1 Pn2 Pnm Рис. 2. Узагальнена схема порівняння тексту за наявними в базі даних фрагментами з погляду теорії комбінованих систем розпізнавання образів О.С. Меняйленко, О.І. Захожай, П.І. Бідюк ISSN 1681–6048 System Research & Information Technologies, 2017, № 4 36 Т а б л и ц я 4 . Результати аналізу текстових фрагментів, перекладених з української мови на англійську і російську та з очікуваною часткою уні- кальності 0% Система 1 Система 2 Система 1 Система 2 Параметр Англійська мова Російська мова Середнє значення частки унікальності тексту iy 6,84 7,12 5,21 6,84 Середня дисперсія значення частки унікальності тексту 2 is 5,16 3,07 4,18 2,72 Значення коефіцієнта Кохрена (за довірчого інтервалу 0,95) 0,35 0,31 0,33 0,30 ВИСНОВКИ У результаті виконаних досліджень отримано такі науково-технічні резуль- тати. 1. Установлено, що в системах пошуку плагіату на достовірність ви- значення частки унікальності тексту істотно впливає форма подання ма- теріалу. 2. Для підвищення достовірності визначення частки унікальності текс- ту запропоновано побудову бази даних текстових фрагментів на основі ком- бінованої системи розпізнавання образів. 3. Використання запропонованих технічних рішень дало змогу підви- щити достовірність визначення частки унікальності тексту в середньому на 54%. 4. Незважаючи на запропоновану можливість підвищення достовірнос- ті визначення частки унікальності текстів, існує безліч способів штучного збільшення цього показника, а спроби врахувати можливі варіанти трансфор- мування текстів значно ускладнюють базу даних текстових фрагментів. То- му за напрям подальших досліджень можна вибрати створення систем не синтаксичної, а смислової перевірки та експертної оцінки наявності запози- ченої інформації. Але це потребує створення високорозвиненої системи штучного інтелекту. ЛІТЕРАТУРА 1. Сичивиця О. Авторство і псевдоавторство в науці. Стаття друга. Плагіат і плагіатори / О. Сичивиця, В.К. Жданкин // Соціогуманітарні проблеми людини. — 2008. — № 3. — С. 39–47. 2. Ліннік І. Програмне забезпечення для виявлення плагіату: практичний ас- пект / І. Ліннік // Науковий блоґ НаУ «Острозька Академія». — 2013. — Режим доступу: http://naub.oa.edu.ua/2013/prohramne-zabezpechennya-dlya- vyyavlennya-plahiatu-praktychnyj-aspekt 3. Михайловський Ю.Б. Система Аnti-Рlagiarism як інструмент запобігання плагіату в навчальній та науковій діяльності / Ю.Б. Михайловський, Підвищення достовірності перевірки унікальності текстів шляхом використання … Системні дослідження та інформаційні технології, 2017, № 4 37 Н.А. Длугунович // Вісн. Хмельн. нац. ун-ту. Технічні науки. — 2013. — № 3. — С. 162–168. 4. Шарапова Е.В. Универсальная система проверки текстов на плагиат «Автор.net» / Е.В. Шарапова, Р.В. Шарапов // Информатика и её применения — 2012. — № 3 (6). — С. 52–58. 5. Hariharan Sh. Automatic Plagiarism Detection Using Similarity Analysis / Sh. Hari- haran // The International Arab Journal of Information Technology. — 2012. — N 4 (9). — P. 322–326. — Available at: http://www.ccis2k.org/iajit/PDF/ vol.9,no.4/2796-4.pdf. 6. Kharat R. Semantically Detecting Plagiarism for Research Papers / R. Kharat, P.M. Chavan, V. Jadhav, K. Rakibe // International Journal of Engineering Re- search and Applications (IJERA). — 2013. — N 3 (3). — P. 077–080. — Avail- able at: http://www.ijera.com/papers/Vol3_issue3/P33077080.pdf 7. Shenoy M. Automatic Plagiarism Detection Using Similarity Analysis [online] / M. Shenoy, K.C. Shet, U.D. Acharya // Advanced Computing: An International Journal (ACIJ). — 2012. — N 3 (3). — P. 59–62. — Available at: http://airccse.org/journal/acij/papers /0512acij06.pdf 8. Singh R. Duplicity Detection System for Digital Documents / R. Singh, C. Dutta// In- ternational Journal of Soft Computing and Engineering (IJSCE). — 2012. — N 5 (2). — P. 24–28. — Available at: http://www.iaeng.org/publication/IMECS2011 /IMECS2011_pp272-277.pdf 9. Tschuggnall M. Detecting Plagiarism in Text Documents through Grammar-Analysis of Authors / M. Tschuggnall, G. Specht // 15th GI-Symposium Database Systems for Business, Technology and Web, 11th March-15th March, 2013. — P. 241–259. — Available at: http://www.btw-2013.de/proceedings/Detecting% 20Plagiarism%20in%20Text%20Documents%20through%20GrammarAnalysis %20of% 20Authors.pdf 10. Румшиский Л.З. Математическая обработка результатов эксперимента: cправочное руководство. — М.: Изд-во «Наука». — 1971. — 192 с. 11. Довгий С.О. Системи підтримки прийняття рішень на основі статистично- ймовірнісних методів / П.І. Бідюк, О.М. Трофимчук. — К.: Логос, 2014. — 419 с. 12. Рябенький В.М. Комбіновані системи розпізнавання образів / В.М. Рябенький, О.І. Захожай // Проблеми інформаційних технологій. — Херсон: ХНТУ. — 2011. — № 01 (009). — С. 156–160. 13. Захожай О.І. Екстенсіонально-інтенсіональний підхід до синтезу інформаційних технологій автоматизованої обробки інформації і управління на базі багатопараметричних комбінованих систем розпізнавання образів / О.І. Захожай // Проблеми інформаційних технологій. — Херсон: ХНТУ, 2015. — № 02 (018). — С.106–111. 14. Меняйленко О.С. Комбіновані системи розпізнавання образів при аналізі просторового розподілу температури коксового пирога / О.С. Меняйленко, О.І. Захожай // Електротехнічні та комп’ютерні системи. — 2013. — № 12(88). — С. 147–154. Надійшла 18.07.2017
id journaliasakpiua-article-119432
institution System research and information technologies
keywords_txt_mv keywords
language Ukrainian
last_indexed 2025-07-17T10:23:21Z
publishDate 2017
publisher The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
record_format ojs
resource_txt_mv journaliasakpiua/2a/743eec08e463e6d39f8b6071c56a0e2a.pdf
spelling journaliasakpiua-article-1194322018-04-04T16:37:16Z Quality enhancement of testing texts uniqueness using combined image recognition system Повышение достоверности проверки уникальности текстов с использованием комбинированных систем распознавания образов Підвищення достовірності перевірки унікальності текстів з використанням комбінованих систем розпізнавання образів Menyaylenko, Oleksandr S. Zakhozhai, Oleh I. Bidyuk, Petro I. information technologies Internet plagiarism quality of text identification system for image recognition информационные технологии сеть Интернет плагиат достоверность распознавания текста система для распознавания образов інформаційні технології мережа Інтернет плагіат достовірність розпізнавання тексту система для розпізнавання образів Besides explicit advantages regarding the search and usage of information from the Internet, the negative tendency recently came to being that some users tried to pass the information found on the Internet as their original work. To enhance substantially the percentage of the texts' uniqueness identification it is proposed to construct the database of the texts' fragments based on a combined image recognition system. The proposed technical solutions provided a possibility for enhancing the percentage of identification of the text uniqueness by approximately 54%. Кроме очевидных преимуществ поиска и использования информации с сети Интернет, в последнее время начала проявляться негативная тенденция – попытки пользователей сети распоряжаться накопленной информацией и представлять ее как продукт собственного творческого труда. Для повышения достоверности определения доли уникальности текста в работе предложено строить базу данных текстовых фрагментов на основе комбинированной системы распознавания образов. Использование предложенных технических решений дало возможность повысить достоверность определения доли уникальности текста в среднем на 54%. Крім очевидних переваг пошуку та використання інформації з мережі Інтернет, останнім часом почала проявлятися негативна тенденція — намагання користувачів мережі розпоряджатись нагромадженою інформацією та подавати її як продукт власної творчої праці. Для підвищення достовірності визначення унікальності тексту в роботі запропоновано побудову бази даних текстових фрагментів на основі комбінованої системи розпізнавання образів. Використання запропонованих технічних рішень дало змогу підвищити достовірність визначення частки унікальності тексту в середньому на 54%. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2017-12-15 Article Article application/pdf https://journal.iasa.kpi.ua/article/view/119432 10.20535/SRIT.2308-8893.2017.4.03 System research and information technologies; No. 4 (2017); 29-37 Системные исследования и информационные технологии; № 4 (2017); 29-37 Системні дослідження та інформаційні технології; № 4 (2017); 29-37 2308-8893 1681-6048 uk https://journal.iasa.kpi.ua/article/view/119432/114230 Copyright (c) 2021 System research and information technologies
spellingShingle інформаційні технології
мережа Інтернет
плагіат
достовірність розпізнавання тексту
система для розпізнавання образів
Menyaylenko, Oleksandr S.
Zakhozhai, Oleh I.
Bidyuk, Petro I.
Підвищення достовірності перевірки унікальності текстів з використанням комбінованих систем розпізнавання образів
title Підвищення достовірності перевірки унікальності текстів з використанням комбінованих систем розпізнавання образів
title_alt Quality enhancement of testing texts uniqueness using combined image recognition system
Повышение достоверности проверки уникальности текстов с использованием комбинированных систем распознавания образов
title_full Підвищення достовірності перевірки унікальності текстів з використанням комбінованих систем розпізнавання образів
title_fullStr Підвищення достовірності перевірки унікальності текстів з використанням комбінованих систем розпізнавання образів
title_full_unstemmed Підвищення достовірності перевірки унікальності текстів з використанням комбінованих систем розпізнавання образів
title_short Підвищення достовірності перевірки унікальності текстів з використанням комбінованих систем розпізнавання образів
title_sort підвищення достовірності перевірки унікальності текстів з використанням комбінованих систем розпізнавання образів
topic інформаційні технології
мережа Інтернет
плагіат
достовірність розпізнавання тексту
система для розпізнавання образів
topic_facet information technologies
Internet
plagiarism
quality of text identification
system for image recognition
информационные технологии
сеть Интернет
плагиат
достоверность распознавания текста
система для распознавания образов
інформаційні технології
мережа Інтернет
плагіат
достовірність розпізнавання тексту
система для розпізнавання образів
url https://journal.iasa.kpi.ua/article/view/119432
work_keys_str_mv AT menyaylenkooleksandrs qualityenhancementoftestingtextsuniquenessusingcombinedimagerecognitionsystem
AT zakhozhaiolehi qualityenhancementoftestingtextsuniquenessusingcombinedimagerecognitionsystem
AT bidyukpetroi qualityenhancementoftestingtextsuniquenessusingcombinedimagerecognitionsystem
AT menyaylenkooleksandrs povyšeniedostovernostiproverkiunikalʹnostitekstovsispolʹzovaniemkombinirovannyhsistemraspoznavaniâobrazov
AT zakhozhaiolehi povyšeniedostovernostiproverkiunikalʹnostitekstovsispolʹzovaniemkombinirovannyhsistemraspoznavaniâobrazov
AT bidyukpetroi povyšeniedostovernostiproverkiunikalʹnostitekstovsispolʹzovaniemkombinirovannyhsistemraspoznavaniâobrazov
AT menyaylenkooleksandrs pídviŝennâdostovírnostíperevírkiuníkalʹnostítekstívzvikoristannâmkombínovanihsistemrozpíznavannâobrazív
AT zakhozhaiolehi pídviŝennâdostovírnostíperevírkiuníkalʹnostítekstívzvikoristannâmkombínovanihsistemrozpíznavannâobrazív
AT bidyukpetroi pídviŝennâdostovírnostíperevírkiuníkalʹnostítekstívzvikoristannâmkombínovanihsistemrozpíznavannâobrazív