Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень

З метою підвищення ефективності передачі даних в безпровідних мережах, включаючи сигнали, зображення та відеокадри, в статті запропоноване нове просте цілочисельне косинусне перетворення розмірності 16, ефективне за швидкодією (2,2-3,2 рази). Перетворення орієнтоване на реалізацію об’єктними та бо...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2014
Автор: Луц, В.К.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут проблем штучного інтелекту МОН України та НАН України 2014
Назва видання:Искусственный интеллект
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/85309
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень / В.К. Луц // Искусственный интеллект. — 2014. — № 4. — С. 31–43. — Бібліогр.: 5 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-85309
record_format dspace
spelling nasplib_isofts_kiev_ua-123456789-853092025-02-09T11:07:11Z Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень Простое целочисленное косинусное преобразование порядка 16 для кодирования сигналов и изображений Simple integer cosine transform order 16 for coding signals and images Луц, В.К. Анализ и синтез коммуникационной информации З метою підвищення ефективності передачі даних в безпровідних мережах, включаючи сигнали, зображення та відеокадри, в статті запропоноване нове просте цілочисельне косинусне перетворення розмірності 16, ефективне за швидкодією (2,2-3,2 рази). Перетворення орієнтоване на реалізацію об’єктними та бортовими засобами, які входять до складу абонентських систем безпровідних мереж. Крім того, в статті пропонується використовувати перетворення, які мають підсилені властивості фільтрації даних для зменшення шумів та виділення найбільш інформативних даних. С целью повышения эффективности передачи данных в беспроводных сетях, включая сигналы, изображения и видеокадры, в статье предложено новое целочисленное косинусное преобразование размерности 16, эффективное по быстродействию (2,2 – 3,2 раза). Преобразование ориентировано на быструю реализацию объектными и бортовыми средствами, которые входят в состав абонентских систем беспроводных сетей. Кроме того, в статье предлагается использовать преобразования, которые имеют усиленные свойства фильтрации данных для уменьшения шумов и выделения наиболее информативных данных. To improve the efficiency of data transmission in wireless networks, including signals, images and videos, the article proposes a new integer cosine transform dimension 16, effective for speed (2.2-3.2 times). Transform focuses on rapid implementation object and on-board equipment, which are part of subscriber systems wireless networks. In addition, the article proposes to use transforms that have strengthened properties of data filtering to reduce noise and highlight the most informative data. Стаття написана і опублікована при підтримці Державного фонду фундаментальних досліджень України, проект № Ф54.2/004-2014 «Розробка методів оперативної обробки і передачі інформації для ефективного управління мобільними роботами і рухомими системами». 2014 Article Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень / В.К. Луц // Искусственный интеллект. — 2014. — № 4. — С. 31–43. — Бібліогр.: 5 назв. — укр. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/85309 681.391, 681.3, 621.372 uk Искусственный интеллект application/pdf Інститут проблем штучного інтелекту МОН України та НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
topic Анализ и синтез коммуникационной информации
Анализ и синтез коммуникационной информации
spellingShingle Анализ и синтез коммуникационной информации
Анализ и синтез коммуникационной информации
Луц, В.К.
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень
Искусственный интеллект
description З метою підвищення ефективності передачі даних в безпровідних мережах, включаючи сигнали, зображення та відеокадри, в статті запропоноване нове просте цілочисельне косинусне перетворення розмірності 16, ефективне за швидкодією (2,2-3,2 рази). Перетворення орієнтоване на реалізацію об’єктними та бортовими засобами, які входять до складу абонентських систем безпровідних мереж. Крім того, в статті пропонується використовувати перетворення, які мають підсилені властивості фільтрації даних для зменшення шумів та виділення найбільш інформативних даних.
format Article
author Луц, В.К.
author_facet Луц, В.К.
author_sort Луц, В.К.
title Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень
title_short Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень
title_full Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень
title_fullStr Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень
title_full_unstemmed Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень
title_sort просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень
publisher Інститут проблем штучного інтелекту МОН України та НАН України
publishDate 2014
topic_facet Анализ и синтез коммуникационной информации
url https://nasplib.isofts.kiev.ua/handle/123456789/85309
citation_txt Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень / В.К. Луц // Искусственный интеллект. — 2014. — № 4. — С. 31–43. — Бібліогр.: 5 назв. — укр.
series Искусственный интеллект
work_keys_str_mv AT lucvk prostecíločiselʹnekosinusneperetvorennâporâdku16dlâkoduvannâsignalívízobraženʹ
AT lucvk prostoeceločislennoekosinusnoepreobrazovanieporâdka16dlâkodirovaniâsignaloviizobraženij
AT lucvk simpleintegercosinetransformorder16forcodingsignalsandimages
first_indexed 2025-11-25T21:02:07Z
last_indexed 2025-11-25T21:02:07Z
_version_ 1849797673527279616
fulltext ISSN 1561-5359 «Штучний інтелект» 2014 № 4 31 2Л УДК 681.391, 681.3, 621.372 В.К. Луц Інститут кібернетики ім. В.М. Глушкова НАН України, м. Київ Україна, 03680 МПС, м. Київ, пр. академіка Глушкова, 40, vkluts@gmail.com Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень* V.K. Luts V.M. Glushkov Institute of Cybernetics of National Academy of Sciences of Ukraine, c. Kyiv, Ukraine, 03680 MSP, c. Kyiv, Glushkova av., 40, vkluts@gmail.com Simple Integer Cosine Transform Order 16 for Coding Signals and Images В.К. Луц Институт кибернетики им. В.М. Глушкова НАН Украины, г. Киев Украина, 03680 МПС, г. Киев, пр. академика Глушкова, 40, vkluts@gmail.com Простое целочисленное косинусное преобразование порядка 16 для кодирования сигналов и изображений З метою підвищення ефективності передачі даних в безпровідних мережах, включаючи сигнали, зображення та відеокадри, в статті запропоноване нове просте цілочисельне косинусне перетворення розмірності 16, ефективне за швидкодією (2,2-3,2 рази). Перетворення орієнтоване на реалізацію об’єктними та бортовими засобами, які входять до складу абонентських систем безпровідних мереж. Крім того, в статті пропонується використовувати перетворення, які мають підсилені властивості фільтрації даних для зменшення шумів та виділення найбільш інформативних даних. Ключові слова: дискретне косинусне перетворення, ДКП, цілочисельне косинусне перетворення, ЦКП, цілочисельне ступінчасте перетворення, ЦСП, швидкі алгоритми, H.265, бездротові мережі. To improve the efficiency of data transmission in wireless networks, including signals, images and videos, the article proposes a new integer cosine transform dimension 16, effective for speed (2.2-3.2 times). Transform focuses on rapid implementation object and on-board equipment, which are part of subscriber systems wireless networks. In addition, the article proposes to use transforms that have strengthened properties of data filtering to reduce noise and highlight the most informative data. Keywords: discrete cosine transforms, DCT, integer cosine transforms, ICT, integer step transforms, IST, fast algorithms, H.265, wireless networks. С целью повышения эффективности передачи данных в беспроводных сетях, включая сигналы, изображения и видеокадры, в статье предложено новое целочисленное косинусное преобразование размерности 16, эффективное по быстродействию (2,2 – 3,2 раза). Преобразование ориентировано на быструю реализацию объектными и бортовыми средствами, которые входят в состав абонентских систем беспроводных сетей. Кроме того, в статье предлагается использовать преобразования, которые имеют усиленные свойства фильтрации данных для уменьшения шумов и выделения наиболее информативных данных. Ключевые слова: дискретное косинусное преобразование, ГКП, целочисленное косинусное преобразование, ЦКП, целочисленное ступенчатое преобразование, ЦСП, быстрые алгоритмы, H.265, беспроводные сети. * Стаття написана і опублікована при підтримці Державного фонду фундаментальних досліджень України, проект № Ф54.2/004-2014 «Розробка методів оперативної обробки і передачі інформації для ефективного управління мобільними роботами і рухомими системами». Луц В.К. «Искусственный интеллект» 2014 № 4 32 2Л Вступ Як відомо, підвищення ефективності функціонування безпровідних та сенсор- них мереж ґрунтується на реалізації комплексу алгоритмів обробки, кодування та шифрування вхідних потоків даних, формування компактних, захищених (крипто- стійких та завадостійких) пакетів достовірної і точної інформації, що підлягають передачі по радіоканалам безпровідних мереж (БМ) та ретрансляції по каналам зв’язку міжмережної взаємодії [1]. Вхідними потоками даних можуть бути вихідні сигнали аналогових датчиків, масиви даних інтелектуальних сенсорів та відеосенсорів, різноманітні масиви двійкових даних. Особливо актуальною проблемою є підвищення ефективності передачі пакетів даних (вимірювальних сигналів, відеоданих, масивів даних) мобільними роботами, рухомими системами, включаючи безпілотні апарати, мікросупутники. Можна виділити два напрямки підвищення ефективності передачі інформації: зменшення об’ємів необхідних обчислень та зменшення об’ємів безпосередніх даних. Хоча в цілому ці напрямки призводять до протилежних результатів (зазвичай змен- шення об’ємів даних пов’язано з додатковими обчисленнями, з метою збільшити степінь стиску, і навпаки, зменшення об’ємів обчислень часто призводить до необхідності збільшення об’ємів даних, що передаються), існують підходи, що мало впливають на ці зв’язані характеристики, наприклад, розробка швидких алгоритмів перетворень, що тільки збільшує швидкодію, не впливаючи на об’єми даних, або прості та ефективні методи виділення найбільш інформативних кластерів інформації, які мало збіль- шують загальну кількість необхідних обчислень. Постановка задачі. З урахуванням обмежених обчислювальних ресурсів об’єктних і бортових систем БМ актуальною проблемою є розробка нових пере- творень зі швидкими алгоритмами, в першу чергу цілочисельних, які мають перевагу перед використанням дискретних перетворень, наприклад, загальновідомого ДКП. Крім того, необхідно швидко та адаптивно, з урахуванням багатьох умов та пара- метрів, визначати найбільш інформативний об’єм даних, який підлягає першочерго- вій передачі по каналам зв’язку БМ [2]. Метою статті є розробка нового простого цілочисельного косинусного пере- творення розмірності 16 та його швидкого алгоритму, а також визначення доціль- ності його використання замість прийнятого в новому стандарті відеокодування Н.265 адаптивного застосування декількох перетворень різної розмірності: 4, 8, 16, 32. Крім того, в статті обґрунтовується використання перетворень, які мають підсилені властивості фільтрації даних для зменшення шумів і виділення найбільш інформа- тивних даних, та наводяться результати тестування подібного однонормового пере- творення-фільтра, яке виявилось кращим за аналогічне перетворення розмірності 16, прийняте в стандарті відеокодування Н.265. Розробка нового простого ЦКП порядку 16 В роботі [3] запропоновано методи побудови простих цілочисельних косинусних перетворень (ЦКП) двох типів порядку 16 на основі ступінчастих функцій. За допо- могою зазначеного методу побудуємо просте ЦКП порядку 16 низької складності, в якого перші чотири непарні функції представляють собою 8-ми ступінчасті прості косинусні базисні функції, а решта непарних функцій є 4-х ступінчастими функціями цілочисельного ступінчастого перетворення (ЦСП). Парні функції представляють собою 4-х і 8-ми ступінчасті функції ЦСП. Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів... «Штучний інтелект» 2014 № 4 33 2Л На рис. 1 представлені 16 базисних функцій простого ЦКП (ПЦКП). Рисунок 1 – Шістнадцять базисних функцій простого ЦКП Матриця 16 ICT може бути представлена через матрицю ядра ПЦКП: 161616 CBICT = , (1) де 16 ICT – матриця 16×16 ПЦКП, 16 C – матриця ядра ПЦКП, 16 B – діагональна матриця 16×16 коефіцієнтів нормування. Тоді матриця * 16 C може бути представлена рекурентно на основі методу, запропонованого в [3]: [ ] * 168 * 8 * 16 , HQSdiagC = (2) 888 * 8 SPGS = , де * 16 C – матриця 16×16 ядра ПЦКП з переставленими рядками, 8 S – матриця 8 ×8 ядра ЦСП, яке вперше було введено Л.О. Гнатівим в [3], і являється узагальненням цілочисельного похилого перетворення в базисі ступінчастих функ- Луц В.К. «Искусственный интеллект» 2014 № 4 34 2Л цій [1], * 8 S – матриця 8×8 ядра ЦСП з переставленими рядками на основі двійково- інверсних перестановок (ДІП) і перестановок по коду Грея (ПКГ), 8 Q – матриця 8х8, яка містить цілі елементи a± , b± , c± , d± , e± і f± , 8 P , 8 S – матриці 8х8 ДІП і ПКГ відповідно. Матриця 8 Q може бути представлена рекурентно як добуток трьох матриць: [ ] TPHTQdiagQ 88448 , ′= , 428 IHH ⊗′=′ ,       − =′ 11 11 2 H , (3) де 8 H ′ – фактор-матриця 8×8 з ненульовими елементами 1± , T P 8 – матриця 8×8 обернених досконалих перестановок [1], 4 Q – матриця 4×4 , яка містить цілі елементи a± , b± , c± , d± ; 4 T – матриця 4×4, яка містить цілі елементи e± і f± , ⊗ – операція кронекерівського добутку матриць, 4 I – одинична діагональна матриця 4×4. Матриця 4 T може бути представлена через матрицю цілочисельного ступінчастого перетворення типу IV (ЦСП-IV) : IV SIT 4 * 44 ~ = , 44444 ~ SPGIS IV = , (4) [ ] 224 , IIdiagG = , [ ]1,,1 24 IdiagP = , [ ] 22 * 4 , IIdiagI −= , де IV S 4 ~ – матриця 4×4 ядра ЦСП-IV (аналог ядра ЦКП-IV) з переставленими рядками, 4 P , 4 G – матриці 4×4 ДІП і ПКГ відповідно, 4 I – одинична антидіагональ- на матриця 4х4, 2 I – одинична діагональна матриця 2×2. Матриця 4 Q може бути представлена через матрицю ядра ЦКП-IV: 444 ICQ IV = , (5) де IVC 4 – матриця 4х4 ядра ЦКП-IV. Матриці IV S 4 ~ , 8 H ′ , 8 S і 4 Q мають вигляд:             −− −− − = ffee ffee eeff eeff S IV 4 ~ ,       − =′ 44 44 8 II II H , 8 g g g g g g g g e e f f f f e e e f f e e f f e f f e e e e f f S g g g g g g g g e e f f f f e e f e e f f e e f f f e e e e f f   − − − −  − − − −  − − − − = − − − −  − − − −  − − − −  − − − −   ,             −− − −−− = dcba cadb bdac abcd Q 4 , (6) Матриця 4 Q може бути представлена як добуток двох матриць: 444 MRQ = , де 4 R – фактор-матриця 4×4, яка містить на головній діагоналі елементи r , а на протилежній – елементи s± , 4 M – фактор-матриця 4×4 з елементами q,1,0 ± . Тоді матриця 8 Q згідно (3) і на основі (4) та (5) може бути представлена на- ступним чином: [ ] TIVIV PHSIICdiagQ 884 * 4448 ~ , ′= . (7) Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів... «Штучний інтелект» 2014 № 4 35 2Л Блок-схема швидкого простого ЦКП порядку 16 на основі методу згідно (2) та враховуючи (7), представлена на рис. 2. Рисунок 2 – Блок-схема швидкого простого ЦКП порядку 16 Алгоритм швидкого прямого ЦСП порядку 8 Матриця * 8 S може бути представлена як добуток трьох матриць: 123 * 8 SSSS = , (8) де i S – i-ті ( 3,2,1=i ) фактор-матриці 8х8 алгоритму швидкого прямого ЦСП: * 81 HS = , [ ] 4 * 42 ,SHdiagS ′= , [ ] 22223 ,,, HHSTdiagS ′= 11 11 11 11 * 4 − − =H ,             − − =′ ef ef fe fe S 4 ,       = gg gg T 2 ,      − =′ ef fe S 2 ,       − − = 11 11 2 H . На рис. 3 представлений граф алгоритму згідно (8) швидкого прямого ЦСП порядку 8. Луц В.К. «Искусственный интеллект» 2014 № 4 36 2Л Рисунок 3 – Граф алгоритму швидкого прямого ЦСП порядку 8 Алгоритм швидкого оберненого ЦСП порядку 8. Обернене ЦСП можна отримати шляхом транспонування матриці: T i SS * 88 = , (9) де i S 8 – матриця оберненого ЦСП. Матриця i S 8 на основі (9) і алгоритму швидкого прямого ЦСП згідно (8) та враховуючи симетричність фактор-матриць ( 11 SS =′ , 22 SS T ′=′ , 22 HH T = , * 8 * 8 HH T = ), може бути представлена як добуток трьох матриць 3218 SSSS i = (10) де i S – i-ті ( 3,2,1=i ) фактор-матриці 8×8 алгоритму швидкого оберненого ЦСП. Граф алгоритму швидкого оберненого ЦСП порядку 8 згідно (10) представлений на рис. 4. Рисунок 4 – Граф алгоритму швидкого оберненого ЦСП порядку 8 Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів... «Штучний інтелект» 2014 № 4 37 2Л На основі ядра ЦКП розмірності 8, що задано як [ ]gfedcbaC ;,;,,, 8 із цілими елементами, які для прямого перетворення приймають значення [ ]4;2,4;1,2,3,5 8 C , а для оберненого – [ ] 4/4;2,4;1,2,3,5 8 C , за наведеною схемою можна побудувати нове просте неоднонормове ЦКП порядку 16, матриця ядра якого буде мати вигляд: − −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− −−−−−−−− = 2222444444442222 2244442222444422 4444222222224444 2442244224422442 2222444444442222 4422224444222244 4444222222224444 4444444444444444 1122335555332211 2244442222444422 2255113333115522 4224422442244224 3311552222551133 4422224444222244 5533221111223355 4444444444444444 1 T Загальновідомо, що неоднонормове перетворення потребує додаткового норм- вання, що ускладнює алгоритм та потребує додаткову пам'ять для коефіцієнтів нор- мування (квантування), тому більш оптимальними є перетворення з єдиною нормою (однонормові), які розробити значно складніше. Ще одним критерієм для оцінки перетворень є динамічний діапазон чисел для представлення елементів матриці перетворення. Для наведеної матриці простого ЦКП достатньо лише 3 бітів, в той час як для елементів матриць перетворень, застосованих в стандарті Н.265, необхідно вже 7 біт. Нескладно побудувати й просте ЦКП розмірності 16, використовуючи числа із стандарту Н.265, тобто використавши за основу ядро ЦКП розмірності 8 з елементами [ ]64;36,83;18,50,75,89 8 C . Але при тестуванні на реальних зображеннях обидва пере- творення дають результати, дуже близькі між собою, тому ми наведемо результати тестування лише першого з цих перетворень, більш швидкодіючого, а отже, кращого. Обчислювальна складність. Запропоновані перетворення можуть використовуватись в трьох формах: матричне множення, часткова факторизація («partial butterfly», PB) и повна факторизація («full- factorization form», FF). Луц В.К. «Искусственный интеллект» 2014 № 4 38 2Л У табл. 1. наведена обчислювальна складність двох вищезгаданих перетворень та нового однонормового простого ЦКП (Т2). Також для порівняння наведена обчислювальна складність косинусного пере- творення розмірності 16, яке використовується у стандарті Н.265. Таблиця 1 Кількість операцій Т1 Т2 TН.265 Н.265 множення – – 36 86 додавання 72 74 68 100 зсуву 18 20 16 16 Всього: 90 94 156 288 Кількість ітерацій 4 4 4 4 нормування + – – – Кількість біт елемента матриці 3 4 7 7 При обчисленні загальної кількості операцій заміняємо 1 множення на 2 додавання, по мінімуму (хоча в цілому одне множення зазвичай заміняється та виконується більшою кількістю додавань й зсувів). Але навіть без врахування типу операцій, загальна кількість операцій для запропонованого простого ЦКП буде в 2,2 рази меншою, ніж для Н.265, а з урахуванням – в 3,2 рази меншою. І хоча якість запропонованого перетворення за критерієм PSNR буде при цьому на 2 – 3% меншою, ніж в стандарті Н.265, але проведене тестування на реальних зображеннях показало, що це незначне погіршення людським оком мало сприймається, тому є обґрунтованим застосування саме більш швидкодіючого перетворення, особливо в умовах значних обмежень на час обробки та на обчислювальні ресурси. Крім того, ще одною можливістю для збільшення швидкодії є застосування єдиного запропонованого перетворення розмірності 16 замість адаптивного використання перетворень розмірності від 4 до 32, як зараз прийнято в стандарті Н. 265 [4], яке вимагає додаткових обчислень для вибору того чи іншого перетворення. Розглянемо детальніше обґрунтування даного підходу. Оцінка доцільності використання одного перетворення розмірності 16 замість прийнятого в новому стандарті відеокодування Н.265 адаптивного застосування декількох перетворень різної розмірності: 4, 8, 16, 32. Використання адаптивного вибору розмірності перетворення базується на тому, що для різних областей зображення (або, відповідно, для різних ділянок сигналу) спостерігається значні коливання похибки при застосуванні перетворень. Таким чином, для областей з найбільшою кореляцією (які, як відомо, найкраще стискаються перетвореннями) використовують перетворення розмірності 32, яке дає найбільший стиск, а для областей з найменшою кореляцією – перетворення розмір- ності 4 або 8, які дають найвищу точність. Іншими словами, кожен коефіцієнт перетворення більшої розмірності акумулює в собі більше інформації (тому що стосується більшої кількості даних, більшого розміру області), але має меншу точність щодо відтворення конкретних значень (оскільки їх кількість зростає). При цьому для вибору того чи іншого перетворення застосовується досить складний алгоритм обчислення похибок для перетворень різної розмірності – і не Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів... «Штучний інтелект» 2014 № 4 39 2Л просто для поступового зменшення розмірності перетворення (тобто, якщо не під- ходить на 32 – обчислюють похибку для перетворення розмірності 16, якщо вона знов перевищує задане порогове значення – обчислюють похибку для перетворення розмірності 8 та 4), а й для оптимального розбиття області зображення на блоки відповідних розмірів. Звичайно, деякий виграш в якості (стиску) при цьому спостерігається, але в першу чергу для крайніх випадків, тобто для найбільшого стиску або для найкращої якості (при цьому переваги перетворень різної розмірності найбільш помітні). Якщо ж узяти середні значення стиску, які використовуються найчастіше, не- обхідність застосування адаптивного вибору перетворень різної розмірності можна взяти під сумнів, оскільки, з одного боку, виграш при цьому буде незначний, а з іншого боку – суттєво збільшується кількість обчислювальних ресурсів. Хоча в разі використання стандарту Н.265, де значно ускладнилось як обчислення компенсації руху, так і відеокодек в цілому, обчислювальні затрати для цього будуть не дуже великими, але для створення нового швидкодіючого кодека краще викори- стовувати лише одне перетворення середньої розмірності, тобто 8 або 16 (згідно статистики застосування перетворень різної розмірності в стандарті Н.265, найбільш часто використовуються саме перетворення на 8 та 16). Для більш точного визначення розмірності єдиного перетворення скористаємось результатами тестування на реальних зображеннях, при середньому стиску, тобто для QP = 27, 32 та 37 (при цьому параметр Qstep, на який ділять коефіцієнти пере- творення, дорівнює відповідно 14, 24 та 44). Протестуємо відомі перетворення [5], які прийняті в стандарті Н.265, розмірності 8, 16 та 32. Результати тестування перетворень зі стандарту Н.265 на тестових зображеннях класів А,В і С за критерієм PSNR (db.) для QP = 27 наведені в табл. 2, для QP = 32 в табл. 3, та для QP= 37 в табл. 4. Таблиця 2 QP = 27 Test images Т8 Т16 T32 А3 32,971 33,043 33,022 A4 32,704 32,778 32,729 B1 30,360 31,015 30,953 B6 36,115 35,272 34,971 C3 35,249 34,056 33,669 C10 36,990 36,121 35,628 Таблиця 3 QP =32 Test images Т8 Т16 T32 А3 30,840 30,887 30,840 A4 29,147 29,174 29,105 B1 26,844 27,123 27,072 B6 32,124 32,061 31,735 C3 31,511 30,296 30,111 C10 34,027 32,845 32,434 Луц В.К. «Искусственный интеллект» 2014 № 4 40 2Л Таблиця 4 QP =37 Test images Т8 Т16 T32 А3 28,513 28,756 28,733 A4 25,587 25,623 25,562 B1 23,174 23,346 23,332 B6 28,710 28,720 28,456 C3 26,664 26,693 26,678 C10 29,595 29,497 29,347 Як бачимо, на зображеннях класу А з роздільною здатністю 2560×1600 для QP= = 27, 32 найкращі результати демонструє перетворення Т16, на зображеннях класу В з роздільною здатністю 1920×1072 спостерігається розбіжність: на зображенні В1 знову кращим є перетворення розмірності 16, а на зображенні В6 – перетворення Т8 (що свідчить про більшу кількість блоків з малою кореляцією). На зображеннях ще меншої розмірності, класу С, з роздільною здатністю 1280×720, спостерігаємо перевагу пере- творення розмірності 8. Таким чином, при QP = 27, 32 для зображень класу А краще підходить пере- творення Т16, для зображень класу С – перетворення Т8, для зображень класу В – обидва перетворення. Для більшого стиску, при QP=37, різниця між всіма перетво- реннями є мінімальною, і нею можна нехтувати, тобто можна використовувати будь- яке перетворення. З іншого боку, враховуючи значно більшу швидкодію запропонованого пере- творення на 16 порівняно з перетворенням на 8, та незначне й малопомітне для людського ока (1 – 3%) збільшення якості для перетворення на 8 для класу зображень С при QP = 27, 32, найбільш оптимальним для стиску зображень всіх класів при всіх QP виглядає перетворення розмірності 16. Крім того, оскільки спостерігається тенденція використання більшої роздільної здатності, клас С з часом буде використовуватись все менше, а доля зображень великої роздільної здатності, 4К та 8К, буде збільшуватись. Новий підхід до виявлення найбільш інформативних фрагментів сигналів та контурів об’єктів зображень. Необхідною складовою обробки, стиску та відновлення сигналів і зображень є фільтрація. Розрізняють фільтрацію з метою зменшення шумів та фільтрацію для зменшення блочних артефактів. Існують різні фільтри для зменшення шумів, але представляє цікавість задача поєднати два в одному: фільтр та перетворення, тобто розробити таке перетворення, яке, крім стиску даних, також помітно зменшує рівень шумів. Звичайно, будь-яке перетворення має певні фільтруючі властивості, оскільки зменшує кількість хаотичних флуктуацій, упорядковуючи початкові дані, але виникає задача розробити перетворення зі значно підсиленими фільтруючими властивостями (які найкраще будуть помітні при Qstep=1, при яких звичайні перетворення будуть мати мінімальну похибку та велике значення PSNR, біля 48-50 db, а перетворення- фільтр – досить значну похибку і PSNR біля 35 db, саме за рахунок фільтруючих властивостей, які приводять до підсилення ключових даних). Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів... «Штучний інтелект» 2014 № 4 41 2Л Поставлена задача була успішно розв’язана, причому модифіковане перетворення- фільтр (однонормове Т2) показало помітно кращу якість, ніж інші перетворення того ж самого класу, в деяких випадках обійшовши аналогічне перетворення стандарту Н.265, як це видно з тестувань на тестових зображеннях, що можна пояснити лише здатністю посилення ключових даних. Результати тестування розроблених та відомих перетворень на зображеннях Оскільки нас цікавить в першу чергу середній стиск, наведемо лише результати тестування для QP=32, при цьому параметр Qstep, на який діляться коефіцієнти перетворення, дорівнює 24. Візуальна оцінка якості зображень для Qstep з меншими (14) або більшими (44) значеннями дозволяє стверджувати, що в першому випадку похибки майже непомітні для людського ока, а стиск замалий, а в останньому випад- ку, навпаки, відхилення від оригіналу занадто великі, добре помітні, і не можуть бути повністю ліквідовані фільтрацією (на жаль, розміри статті не дозволяють при- вести наглядні ілюстрації зображень для різних QP). Крім того, перевірено, що схожа тенденція спостерігається при будь-яких QP, тому для оцінки перетворень достатньо наведених результатів тестування, але при цьому можемо використати більше реальних зображень, ніж звичайно. Результати тестування за критерієм PSNR для зображень класу В наведені в табл. 4, класу С – в табл. 5. Таблиця 4 В1 В2 В3 В4 В5 В6 В7 В8 В9 Т1 26,80 33,19 32,42 32,56 33,09 31,73 32,32 34,27 27,86 Т2 27,94 33,95 33,10 33,54 33,73 32,73 32,89 35,08 28,74 Н.265 27,12 33,92 33,14 33,17 33,84 32,06 32,94 34,91 28,41 Таблиця 5 С1 С2 С3 С4 С5 С6 С7 С8 С9 Т1 28,42 29,80 29,80 29,19 28,72 31,46 32,15 32,56 31,65 Т2 29,44 30,59 30,91 30,08 29,62 32,15 32,81 33,23 32,86 Н.265 29,61 30,56 30,29 30,33 30,18 32,60 32,80 33,36 31,91 Як бачимо, перетворення Т1 відстає приблизно на 1 db від аналогічного коси- нусного перетворення розмірності 16 із стандарту Н.265, тобто близько 3%, але при візуальній оцінці стиснутих зображень різниці практично не помітно. З іншого боку, перетворення Т2, яке для більшості зображень демонструє кращу якість, ніж перетворення зі стандарту Н.265, і при візуальній оцінці має кращу якість, тобто меншу розмитість та кращу передачу відтінків. При менших QP перетворення Т2 має гірші результати за критерієм PSNR, ніж аналогічне перетворення зі стандарту Н.265, причому різниця може досягати 10 db, але при візуальному порівнянні ця похибка або не помічається, або, навпаки, є додатньою, тобто має позитивний ефект – зображення видається більш чітким. Луц В.К. «Искусственный интеллект» 2014 № 4 42 2Л Таким чином, якщо традиційні перетворення розробляються з метою якнайкраще відтворити оригінальне зображення, то перетворення-фільтр візуально його покращує, що особливо актуально для зображень з наявністю шумів, яких є переважна більшість, внаслідок технічної недосконалості процесу їх отримання. Висновки Для зменшення надлишковості сигналів, зображень та відеокадрів широко викори- стовують ортогональні перетворення, серед яких в першу чергу застосовуються ціло- чисельні перетворення, особливо ті, які мають швидкий алгоритм реалізації. Запропоноване нове просте цілочисельне косинусне перетворення зі швидким алгоритмом виконання є оптимальним для оперативної обробки та кодування сигналів, зображень та відеоданих засобами об’єктних систем безпровідних мереж, оскільки суттєво (в 2,2 – 3,2 рази) зменшує необхідні обчислювальні ресурси, при незначному (2 – 3%) погіршенні якості, що малопомітно для людського ока. Окрім того, доведено, що запропоноване перетворення може бути використано без необхідності застосування додаткових перетворень, розмірності 4, 8 та 32, як це прийнято в стандарті Н.265, оскільки обчислювальні витрати при цьому значно зменшуються без суттєвого погіршення якості, особливо для середніх ступенів стиску, які зазвичай найширше використовуються. В статті пропонується неоднонормове цілочисельне перетворення, яке потребує додаткового нормування при використанні, та наведені результати тестування значно кращого, однонормового перетворення-фільтру цього класу. Стаття написана і опублікована при підтримці Державного фонду фундамен- тальних досліджень України, проект № Ф54.2/004-2014 «Розробка методів оператив- ної обробки і передачі інформації для ефективного управління мобільними роботами і рухомими системами». Список літератури 1. Технологія багатофункціональної обробки і передачі інформації в моніторингових мережах / Б.М. Шевчук, В.К. Задірака, Л.О. Гнатів, С.В. Фраєр. – К. : Наук. думка, 2010. – 370 с. 2. Оперативне розпізнавання фрагментів і комплексів сигналів та виділення об’єктів відеоданих засобами об’єктних систем безпровідних мереж / Б.М. Шевчук, В.К. Задірака, С.В. Фраєр, В.К. Луц//Штучний інтелект. – 2013.– № 3.– С. 275-283. 3. Л.А. Гнатив. Целочисленные косинусные преобразования: методы построения новых быстрых преобразований порядка 8,16 и их применение // Кибернетика и системный анализ. – 2014. – №6. 4. Wien M. ABT coding for higher resolution video // Doc. JVT-B053, JVT of ISO/IEC MPEG and ITU-T VCEG, Geneva, Switzerland, Jan. 2002. 5. CE10: Core transform design for HEVC / A. Fuldseth, G. Bjøntegaard (Cisco Systems), M. Budagavi, V. Sze (Texas Instruments) // Doc. JCTVC-G495, Geneva, CH, November, 2011. References 1. Shevchuk B.M. Technology multi-processing and data transmission in monitoring networks / B.M. Shevchuk, V.K. Zadiraka, L.A. Gnativ, S. Fraer. // - K. Naukova dumka, 2010. – 370 P. 2. B.M. Shevchuk, V.K. Zadiraka, S.V. Fraer, V.K. Luts. Rapid detection of fragments and complex signals and selection of objects by means of video object of wireless// Artificial Intelligence.– 2013.– №3.– S. 275-283. 3. L.A. Hnativ. Іnteger cosine transforms: methods for building new fast transforms order 8,16 and their applications // Cybernetics and Systems Analysis. - 2014. - №6. 4. Wien M. Variable block-size transforms for H.264/AVC// IEEE Trans. On Circuits and Systems for Video Technology, 2003, v. 13, N 7, P. 604-613. 5. A. Fuldseth, G. Bjøntegaard (Cisco Systems), M. Budagavi, V. Sze (Texas Instruments). CE10: Core transform design for HEVC // Doc. JCTVC-G495, Geneva, CH, November, 2011. Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів... «Штучний інтелект» 2014 № 4 43 2Л RESUME V.K. Luts Simple Integer Cosine-Step Transform Order 16 for Coding Signals And Images Background: To reduce the redundancy of signals, images and video frames are widely used orthogonal transforms, among which are primarily used integer transforms, especially those who have a fast implementation algorithm. Results: Proposed new simple integer cosine transform with fast algorithm implementation is optimal for operative processing and coding of signals, images and video facilities of object systems for wireless networks as significantly reduces the required computational resources (2,2-3,2 time faster). Moreover, we prove that the proposed transform can be used without the need for additional transforms, order 4, 8 and 32, as is customary in standard H.265 as computational costs while greatly reduced without significant deterioration, especially for the average compression that typically are most frequently used. Conclusion: The article discusses integer transform with varying norm, which requires the additional normalization in use, and the results of testing the best transform with equal norm of this class are presented. Additionally, transform has enhanced filtering abilities, that is a unique development, previously unknown. Статья поступила в редакцию 15.04.2014.