Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень
З метою підвищення ефективності передачі даних в безпровідних мережах, включаючи сигнали, зображення та відеокадри, в статті запропоноване нове просте цілочисельне косинусне перетворення розмірності 16, ефективне за швидкодією (2,2-3,2 рази). Перетворення орієнтоване на реалізацію об’єктними та бо...
Збережено в:
| Дата: | 2014 |
|---|---|
| Автор: | |
| Формат: | Стаття |
| Мова: | Ukrainian |
| Опубліковано: |
Інститут проблем штучного інтелекту МОН України та НАН України
2014
|
| Назва видання: | Искусственный интеллект |
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/85309 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень / В.К. Луц // Искусственный интеллект. — 2014. — № 4. — С. 31–43. — Бібліогр.: 5 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-85309 |
|---|---|
| record_format |
dspace |
| spelling |
nasplib_isofts_kiev_ua-123456789-853092025-02-09T11:07:11Z Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень Простое целочисленное косинусное преобразование порядка 16 для кодирования сигналов и изображений Simple integer cosine transform order 16 for coding signals and images Луц, В.К. Анализ и синтез коммуникационной информации З метою підвищення ефективності передачі даних в безпровідних мережах, включаючи сигнали, зображення та відеокадри, в статті запропоноване нове просте цілочисельне косинусне перетворення розмірності 16, ефективне за швидкодією (2,2-3,2 рази). Перетворення орієнтоване на реалізацію об’єктними та бортовими засобами, які входять до складу абонентських систем безпровідних мереж. Крім того, в статті пропонується використовувати перетворення, які мають підсилені властивості фільтрації даних для зменшення шумів та виділення найбільш інформативних даних. С целью повышения эффективности передачи данных в беспроводных сетях, включая сигналы, изображения и видеокадры, в статье предложено новое целочисленное косинусное преобразование размерности 16, эффективное по быстродействию (2,2 – 3,2 раза). Преобразование ориентировано на быструю реализацию объектными и бортовыми средствами, которые входят в состав абонентских систем беспроводных сетей. Кроме того, в статье предлагается использовать преобразования, которые имеют усиленные свойства фильтрации данных для уменьшения шумов и выделения наиболее информативных данных. To improve the efficiency of data transmission in wireless networks, including signals, images and videos, the article proposes a new integer cosine transform dimension 16, effective for speed (2.2-3.2 times). Transform focuses on rapid implementation object and on-board equipment, which are part of subscriber systems wireless networks. In addition, the article proposes to use transforms that have strengthened properties of data filtering to reduce noise and highlight the most informative data. Стаття написана і опублікована при підтримці Державного фонду фундаментальних досліджень України, проект № Ф54.2/004-2014 «Розробка методів оперативної обробки і передачі інформації для ефективного управління мобільними роботами і рухомими системами». 2014 Article Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень / В.К. Луц // Искусственный интеллект. — 2014. — № 4. — С. 31–43. — Бібліогр.: 5 назв. — укр. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/85309 681.391, 681.3, 621.372 uk Искусственный интеллект application/pdf Інститут проблем штучного інтелекту МОН України та НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Ukrainian |
| topic |
Анализ и синтез коммуникационной информации Анализ и синтез коммуникационной информации |
| spellingShingle |
Анализ и синтез коммуникационной информации Анализ и синтез коммуникационной информации Луц, В.К. Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень Искусственный интеллект |
| description |
З метою підвищення ефективності передачі даних в безпровідних мережах, включаючи сигнали, зображення
та відеокадри, в статті запропоноване нове просте цілочисельне косинусне перетворення розмірності 16,
ефективне за швидкодією (2,2-3,2 рази). Перетворення орієнтоване на реалізацію об’єктними та бортовими
засобами, які входять до складу абонентських систем безпровідних мереж. Крім того, в статті пропонується
використовувати перетворення, які мають підсилені властивості фільтрації даних для зменшення шумів та
виділення найбільш інформативних даних. |
| format |
Article |
| author |
Луц, В.К. |
| author_facet |
Луц, В.К. |
| author_sort |
Луц, В.К. |
| title |
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень |
| title_short |
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень |
| title_full |
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень |
| title_fullStr |
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень |
| title_full_unstemmed |
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень |
| title_sort |
просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень |
| publisher |
Інститут проблем штучного інтелекту МОН України та НАН України |
| publishDate |
2014 |
| topic_facet |
Анализ и синтез коммуникационной информации |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/85309 |
| citation_txt |
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів і зображень / В.К. Луц // Искусственный интеллект. — 2014. — № 4. — С. 31–43. — Бібліогр.: 5 назв. — укр. |
| series |
Искусственный интеллект |
| work_keys_str_mv |
AT lucvk prostecíločiselʹnekosinusneperetvorennâporâdku16dlâkoduvannâsignalívízobraženʹ AT lucvk prostoeceločislennoekosinusnoepreobrazovanieporâdka16dlâkodirovaniâsignaloviizobraženij AT lucvk simpleintegercosinetransformorder16forcodingsignalsandimages |
| first_indexed |
2025-11-25T21:02:07Z |
| last_indexed |
2025-11-25T21:02:07Z |
| _version_ |
1849797673527279616 |
| fulltext |
ISSN 1561-5359 «Штучний інтелект» 2014 № 4 31
2Л
УДК 681.391, 681.3, 621.372
В.К. Луц
Інститут кібернетики ім. В.М. Глушкова НАН України, м. Київ
Україна, 03680 МПС, м. Київ, пр. академіка Глушкова, 40, vkluts@gmail.com
Просте цілочисельне косинуснe перетворення порядку
16 для кодування сигналів і зображень*
V.K. Luts
V.M. Glushkov Institute of Cybernetics of National Academy of Sciences of Ukraine,
c. Kyiv, Ukraine, 03680 MSP, c. Kyiv, Glushkova av., 40, vkluts@gmail.com
Simple Integer Cosine Transform Order 16
for Coding Signals and Images
В.К. Луц
Институт кибернетики им. В.М. Глушкова НАН Украины, г. Киев
Украина, 03680 МПС, г. Киев, пр. академика Глушкова, 40, vkluts@gmail.com
Простое целочисленное косинусное преобразование
порядка 16 для кодирования сигналов и изображений
З метою підвищення ефективності передачі даних в безпровідних мережах, включаючи сигнали, зображення
та відеокадри, в статті запропоноване нове просте цілочисельне косинусне перетворення розмірності 16,
ефективне за швидкодією (2,2-3,2 рази). Перетворення орієнтоване на реалізацію об’єктними та бортовими
засобами, які входять до складу абонентських систем безпровідних мереж. Крім того, в статті пропонується
використовувати перетворення, які мають підсилені властивості фільтрації даних для зменшення шумів та
виділення найбільш інформативних даних.
Ключові слова: дискретне косинусне перетворення, ДКП,
цілочисельне косинусне перетворення, ЦКП, цілочисельне ступінчасте перетворення, ЦСП,
швидкі алгоритми, H.265, бездротові мережі.
To improve the efficiency of data transmission in wireless networks, including signals, images and videos, the article
proposes a new integer cosine transform dimension 16, effective for speed (2.2-3.2 times). Transform focuses on rapid
implementation object and on-board equipment, which are part of subscriber systems wireless networks. In addition,
the article proposes to use transforms that have strengthened properties of data filtering to reduce noise and highlight
the most informative data.
Keywords: discrete cosine transforms, DCT, integer cosine transforms, ICT, integer step
transforms, IST, fast algorithms, H.265, wireless networks.
С целью повышения эффективности передачи данных в беспроводных сетях, включая сигналы, изображения
и видеокадры, в статье предложено новое целочисленное косинусное преобразование размерности 16,
эффективное по быстродействию (2,2 – 3,2 раза). Преобразование ориентировано на быструю реализацию
объектными и бортовыми средствами, которые входят в состав абонентских систем беспроводных сетей.
Кроме того, в статье предлагается использовать преобразования, которые имеют усиленные свойства
фильтрации данных для уменьшения шумов и выделения наиболее информативных данных.
Ключевые слова: дискретное косинусное преобразование, ГКП,
целочисленное косинусное преобразование, ЦКП, целочисленное ступенчатое
преобразование, ЦСП, быстрые алгоритмы, H.265, беспроводные сети.
*
Стаття написана і опублікована при підтримці Державного фонду фундаментальних досліджень
України, проект № Ф54.2/004-2014 «Розробка методів оперативної обробки і передачі інформації для
ефективного управління мобільними роботами і рухомими системами».
Луц В.К.
«Искусственный интеллект» 2014 № 4 32
2Л
Вступ
Як відомо, підвищення ефективності функціонування безпровідних та сенсор-
них мереж ґрунтується на реалізації комплексу алгоритмів обробки, кодування та
шифрування вхідних потоків даних, формування компактних, захищених (крипто-
стійких та завадостійких) пакетів достовірної і точної інформації, що підлягають
передачі по радіоканалам безпровідних мереж (БМ) та ретрансляції по каналам
зв’язку міжмережної взаємодії [1]. Вхідними потоками даних можуть бути вихідні
сигнали аналогових датчиків, масиви даних інтелектуальних сенсорів та відеосенсорів,
різноманітні масиви двійкових даних. Особливо актуальною проблемою є підвищення
ефективності передачі пакетів даних (вимірювальних сигналів, відеоданих, масивів
даних) мобільними роботами, рухомими системами, включаючи безпілотні апарати,
мікросупутники.
Можна виділити два напрямки підвищення ефективності передачі інформації:
зменшення об’ємів необхідних обчислень та зменшення об’ємів безпосередніх даних.
Хоча в цілому ці напрямки призводять до протилежних результатів (зазвичай змен-
шення об’ємів даних пов’язано з додатковими обчисленнями, з метою збільшити степінь
стиску, і навпаки, зменшення об’ємів обчислень часто призводить до необхідності
збільшення об’ємів даних, що передаються), існують підходи, що мало впливають на
ці зв’язані характеристики, наприклад, розробка швидких алгоритмів перетворень, що
тільки збільшує швидкодію, не впливаючи на об’єми даних, або прості та ефективні
методи виділення найбільш інформативних кластерів інформації, які мало збіль-
шують загальну кількість необхідних обчислень.
Постановка задачі. З урахуванням обмежених обчислювальних ресурсів
об’єктних і бортових систем БМ актуальною проблемою є розробка нових пере-
творень зі швидкими алгоритмами, в першу чергу цілочисельних, які мають перевагу
перед використанням дискретних перетворень, наприклад, загальновідомого ДКП.
Крім того, необхідно швидко та адаптивно, з урахуванням багатьох умов та пара-
метрів, визначати найбільш інформативний об’єм даних, який підлягає першочерго-
вій передачі по каналам зв’язку БМ [2].
Метою статті є розробка нового простого цілочисельного косинусного пере-
творення розмірності 16 та його швидкого алгоритму, а також визначення доціль-
ності його використання замість прийнятого в новому стандарті відеокодування
Н.265 адаптивного застосування декількох перетворень різної розмірності: 4, 8, 16, 32.
Крім того, в статті обґрунтовується використання перетворень, які мають підсилені
властивості фільтрації даних для зменшення шумів і виділення найбільш інформа-
тивних даних, та наводяться результати тестування подібного однонормового пере-
творення-фільтра, яке виявилось кращим за аналогічне перетворення розмірності 16,
прийняте в стандарті відеокодування Н.265.
Розробка нового простого ЦКП порядку 16
В роботі [3] запропоновано методи побудови простих цілочисельних косинусних
перетворень (ЦКП) двох типів порядку 16 на основі ступінчастих функцій. За допо-
могою зазначеного методу побудуємо просте ЦКП порядку 16 низької складності, в
якого перші чотири непарні функції представляють собою 8-ми ступінчасті прості
косинусні базисні функції, а решта непарних функцій є 4-х ступінчастими функціями
цілочисельного ступінчастого перетворення (ЦСП). Парні функції представляють собою
4-х і 8-ми ступінчасті функції ЦСП.
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів...
«Штучний інтелект» 2014 № 4 33
2Л
На рис. 1 представлені 16 базисних функцій простого ЦКП (ПЦКП).
Рисунок 1 – Шістнадцять базисних функцій простого ЦКП
Матриця
16
ICT може бути представлена через матрицю ядра ПЦКП:
161616
CBICT = , (1)
де
16
ICT – матриця 16×16 ПЦКП,
16
C – матриця ядра ПЦКП,
16
B – діагональна
матриця 16×16 коефіцієнтів нормування.
Тоді матриця *
16
C може бути представлена рекурентно на основі методу,
запропонованого в [3]:
[ ] *
168
*
8
*
16
, HQSdiagC = (2)
888
*
8
SPGS = ,
де
*
16
C – матриця 16×16 ядра ПЦКП з переставленими рядками,
8
S –
матриця 8 ×8 ядра ЦСП, яке вперше було введено Л.О. Гнатівим в [3], і являється
узагальненням цілочисельного похилого перетворення в базисі ступінчастих функ-
Луц В.К.
«Искусственный интеллект» 2014 № 4 34
2Л
цій [1], *
8
S – матриця 8×8 ядра ЦСП з переставленими рядками на основі двійково-
інверсних перестановок (ДІП) і перестановок по коду Грея (ПКГ),
8
Q – матриця 8х8,
яка містить цілі елементи a± , b± , c± , d± , e± і f± ,
8
P ,
8
S – матриці 8х8 ДІП і
ПКГ відповідно.
Матриця
8
Q може бути представлена рекурентно як добуток трьох матриць:
[ ] TPHTQdiagQ
88448
, ′= ,
428
IHH ⊗′=′ ,
−
=′
11
11
2
H , (3)
де
8
H ′ – фактор-матриця 8×8 з ненульовими елементами 1± , T
P
8
– матриця 8×8
обернених досконалих перестановок [1],
4
Q – матриця 4×4 , яка містить цілі елементи
a± , b± , c± , d± ;
4
T – матриця 4×4, яка містить цілі елементи e± і f± , ⊗ – операція
кронекерівського добутку матриць,
4
I – одинична діагональна матриця 4×4.
Матриця
4
T може бути представлена через матрицю цілочисельного
ступінчастого перетворення типу IV (ЦСП-IV) :
IV
SIT
4
*
44
~
= ,
44444
~
SPGIS
IV
= , (4)
[ ]
224
, IIdiagG = , [ ]1,,1
24
IdiagP = , [ ]
22
*
4
, IIdiagI −= ,
де IV
S
4
~
– матриця 4×4 ядра ЦСП-IV (аналог ядра ЦКП-IV) з переставленими
рядками,
4
P ,
4
G – матриці 4×4 ДІП і ПКГ відповідно,
4
I – одинична антидіагональ-
на матриця 4х4,
2
I – одинична діагональна матриця 2×2.
Матриця
4
Q може бути представлена через матрицю ядра ЦКП-IV:
444
ICQ IV
= , (5)
де IVC
4
– матриця 4х4 ядра ЦКП-IV.
Матриці IV
S
4
~
,
8
H ′ ,
8
S і
4
Q мають вигляд:
−−
−−
−
=
ffee
ffee
eeff
eeff
S IV
4
~
,
−
=′
44
44
8
II
II
H ,
8
g g g g g g g g
e e f f f f e e
e f f e e f f e
f f e e e e f f
S
g g g g g g g g
e e f f f f e e
f e e f f e e f
f f e e e e f f
− − − −
− − − −
− − − − =
− − − −
− − − −
− − − −
− − − −
,
−−
−
−−−
=
dcba
cadb
bdac
abcd
Q
4
, (6)
Матриця
4
Q може бути представлена як добуток двох матриць:
444
MRQ = ,
де
4
R – фактор-матриця 4×4, яка містить на головній діагоналі елементи r , а на
протилежній – елементи s± ,
4
M – фактор-матриця 4×4 з елементами q,1,0 ± .
Тоді матриця
8
Q згідно (3) і на основі (4) та (5) може бути представлена на-
ступним чином:
[ ] TIVIV PHSIICdiagQ
884
*
4448
~
, ′= . (7)
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів...
«Штучний інтелект» 2014 № 4 35
2Л
Блок-схема швидкого простого ЦКП порядку 16 на основі методу згідно (2) та
враховуючи (7), представлена на рис. 2.
Рисунок 2 – Блок-схема швидкого простого ЦКП порядку 16
Алгоритм швидкого прямого ЦСП порядку 8
Матриця *
8
S може бути представлена як добуток трьох матриць:
123
*
8
SSSS = , (8)
де
i
S – i-ті ( 3,2,1=i ) фактор-матриці 8х8 алгоритму швидкого прямого ЦСП:
*
81
HS = , [ ]
4
*
42
,SHdiagS ′= , [ ]
22223
,,, HHSTdiagS ′=
11
11
11
11
*
4
−
−
=H ,
−
−
=′
ef
ef
fe
fe
S
4
,
=
gg
gg
T
2
,
−
=′
ef
fe
S
2
,
−
−
=
11
11
2
H .
На рис. 3 представлений граф алгоритму згідно (8) швидкого прямого ЦСП
порядку 8.
Луц В.К.
«Искусственный интеллект» 2014 № 4 36
2Л
Рисунок 3 – Граф алгоритму швидкого прямого ЦСП порядку 8
Алгоритм швидкого оберненого ЦСП порядку 8.
Обернене ЦСП можна отримати шляхом транспонування матриці:
T
i
SS
*
88
= , (9)
де
i
S
8
– матриця оберненого ЦСП.
Матриця
i
S
8
на основі (9) і алгоритму швидкого прямого ЦСП згідно (8) та
враховуючи симетричність фактор-матриць (
11
SS =′ ,
22
SS
T
′=′ ,
22
HH T = , *
8
*
8
HH
T
= ),
може бути представлена як добуток трьох матриць
3218
SSSS
i
= (10)
де
i
S – i-ті ( 3,2,1=i ) фактор-матриці 8×8 алгоритму швидкого оберненого ЦСП.
Граф алгоритму швидкого оберненого ЦСП порядку 8 згідно (10) представлений на
рис. 4.
Рисунок 4 – Граф алгоритму швидкого оберненого ЦСП порядку 8
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів...
«Штучний інтелект» 2014 № 4 37
2Л
На основі ядра ЦКП розмірності 8, що задано як [ ]gfedcbaC ;,;,,,
8
із цілими
елементами, які для прямого перетворення приймають значення [ ]4;2,4;1,2,3,5
8
C , а
для оберненого – [ ] 4/4;2,4;1,2,3,5
8
C , за наведеною схемою можна побудувати нове
просте неоднонормове ЦКП порядку 16, матриця ядра якого буде мати вигляд:
−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
−−−−−−−−
=
2222444444442222
2244442222444422
4444222222224444
2442244224422442
2222444444442222
4422224444222244
4444222222224444
4444444444444444
1122335555332211
2244442222444422
2255113333115522
4224422442244224
3311552222551133
4422224444222244
5533221111223355
4444444444444444
1
T
Загальновідомо, що неоднонормове перетворення потребує додаткового норм-
вання, що ускладнює алгоритм та потребує додаткову пам'ять для коефіцієнтів нор-
мування (квантування), тому більш оптимальними є перетворення з єдиною нормою
(однонормові), які розробити значно складніше.
Ще одним критерієм для оцінки перетворень є динамічний діапазон чисел для
представлення елементів матриці перетворення. Для наведеної матриці простого
ЦКП достатньо лише 3 бітів, в той час як для елементів матриць перетворень,
застосованих в стандарті Н.265, необхідно вже 7 біт.
Нескладно побудувати й просте ЦКП розмірності 16, використовуючи числа із
стандарту Н.265, тобто використавши за основу ядро ЦКП розмірності 8 з елементами
[ ]64;36,83;18,50,75,89
8
C . Але при тестуванні на реальних зображеннях обидва пере-
творення дають результати, дуже близькі між собою, тому ми наведемо результати
тестування лише першого з цих перетворень, більш швидкодіючого, а отже, кращого.
Обчислювальна складність.
Запропоновані перетворення можуть використовуватись в трьох формах: матричне
множення, часткова факторизація («partial butterfly», PB) и повна факторизація («full-
factorization form», FF).
Луц В.К.
«Искусственный интеллект» 2014 № 4 38
2Л
У табл. 1. наведена обчислювальна складність двох вищезгаданих перетворень та
нового однонормового простого ЦКП (Т2).
Також для порівняння наведена обчислювальна складність косинусного пере-
творення розмірності 16, яке використовується у стандарті Н.265.
Таблиця 1
Кількість операцій Т1 Т2 TН.265 Н.265
множення – – 36 86
додавання 72 74 68 100
зсуву 18 20 16 16
Всього: 90 94 156 288
Кількість ітерацій 4 4 4 4
нормування + – – –
Кількість біт
елемента матриці
3 4 7 7
При обчисленні загальної кількості операцій заміняємо 1 множення на 2
додавання, по мінімуму (хоча в цілому одне множення зазвичай заміняється та
виконується більшою кількістю додавань й зсувів). Але навіть без врахування типу
операцій, загальна кількість операцій для запропонованого простого ЦКП буде в 2,2
рази меншою, ніж для Н.265, а з урахуванням – в 3,2 рази меншою.
І хоча якість запропонованого перетворення за критерієм PSNR буде при цьому
на 2 – 3% меншою, ніж в стандарті Н.265, але проведене тестування на реальних
зображеннях показало, що це незначне погіршення людським оком мало сприймається,
тому є обґрунтованим застосування саме більш швидкодіючого перетворення, особливо в
умовах значних обмежень на час обробки та на обчислювальні ресурси.
Крім того, ще одною можливістю для збільшення швидкодії є застосування
єдиного запропонованого перетворення розмірності 16 замість адаптивного використання
перетворень розмірності від 4 до 32, як зараз прийнято в стандарті Н. 265 [4], яке
вимагає додаткових обчислень для вибору того чи іншого перетворення. Розглянемо
детальніше обґрунтування даного підходу.
Оцінка доцільності використання одного перетворення розмірності 16 замість
прийнятого в новому стандарті відеокодування Н.265 адаптивного застосування
декількох перетворень різної розмірності: 4, 8, 16, 32.
Використання адаптивного вибору розмірності перетворення базується на тому,
що для різних областей зображення (або, відповідно, для різних ділянок сигналу)
спостерігається значні коливання похибки при застосуванні перетворень.
Таким чином, для областей з найбільшою кореляцією (які, як відомо, найкраще
стискаються перетвореннями) використовують перетворення розмірності 32, яке дає
найбільший стиск, а для областей з найменшою кореляцією – перетворення розмір-
ності 4 або 8, які дають найвищу точність.
Іншими словами, кожен коефіцієнт перетворення більшої розмірності акумулює в
собі більше інформації (тому що стосується більшої кількості даних, більшого розміру
області), але має меншу точність щодо відтворення конкретних значень (оскільки їх
кількість зростає).
При цьому для вибору того чи іншого перетворення застосовується досить
складний алгоритм обчислення похибок для перетворень різної розмірності – і не
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів...
«Штучний інтелект» 2014 № 4 39
2Л
просто для поступового зменшення розмірності перетворення (тобто, якщо не під-
ходить на 32 – обчислюють похибку для перетворення розмірності 16, якщо вона
знов перевищує задане порогове значення – обчислюють похибку для перетворення
розмірності 8 та 4), а й для оптимального розбиття області зображення на блоки
відповідних розмірів.
Звичайно, деякий виграш в якості (стиску) при цьому спостерігається, але в
першу чергу для крайніх випадків, тобто для найбільшого стиску або для найкращої
якості (при цьому переваги перетворень різної розмірності найбільш помітні).
Якщо ж узяти середні значення стиску, які використовуються найчастіше, не-
обхідність застосування адаптивного вибору перетворень різної розмірності можна
взяти під сумнів, оскільки, з одного боку, виграш при цьому буде незначний, а з
іншого боку – суттєво збільшується кількість обчислювальних ресурсів.
Хоча в разі використання стандарту Н.265, де значно ускладнилось як обчислення
компенсації руху, так і відеокодек в цілому, обчислювальні затрати для цього будуть
не дуже великими, але для створення нового швидкодіючого кодека краще викори-
стовувати лише одне перетворення середньої розмірності, тобто 8 або 16 (згідно
статистики застосування перетворень різної розмірності в стандарті Н.265, найбільш
часто використовуються саме перетворення на 8 та 16).
Для більш точного визначення розмірності єдиного перетворення скористаємось
результатами тестування на реальних зображеннях, при середньому стиску, тобто
для QP = 27, 32 та 37 (при цьому параметр Qstep, на який ділять коефіцієнти пере-
творення, дорівнює відповідно 14, 24 та 44). Протестуємо відомі перетворення [5],
які прийняті в стандарті Н.265, розмірності 8, 16 та 32.
Результати тестування перетворень зі стандарту Н.265 на тестових зображеннях
класів А,В і С за критерієм PSNR (db.) для QP = 27 наведені в табл. 2, для QP = 32 в
табл. 3, та для QP= 37 в табл. 4.
Таблиця 2
QP = 27 Test images
Т8 Т16 T32
А3 32,971 33,043 33,022
A4 32,704 32,778 32,729
B1 30,360 31,015 30,953
B6 36,115 35,272 34,971
C3 35,249 34,056 33,669
C10 36,990 36,121 35,628
Таблиця 3
QP =32 Test images
Т8 Т16 T32
А3 30,840 30,887 30,840
A4 29,147 29,174 29,105
B1 26,844 27,123 27,072
B6 32,124 32,061 31,735
C3 31,511 30,296 30,111
C10 34,027 32,845 32,434
Луц В.К.
«Искусственный интеллект» 2014 № 4 40
2Л
Таблиця 4
QP =37 Test images
Т8 Т16 T32
А3 28,513 28,756 28,733
A4 25,587 25,623 25,562
B1 23,174 23,346 23,332
B6 28,710 28,720 28,456
C3 26,664 26,693 26,678
C10 29,595 29,497 29,347
Як бачимо, на зображеннях класу А з роздільною здатністю 2560×1600 для QP=
= 27, 32 найкращі результати демонструє перетворення Т16, на зображеннях класу В
з роздільною здатністю 1920×1072 спостерігається розбіжність: на зображенні В1
знову кращим є перетворення розмірності 16, а на зображенні В6 – перетворення Т8 (що
свідчить про більшу кількість блоків з малою кореляцією). На зображеннях ще меншої
розмірності, класу С, з роздільною здатністю 1280×720, спостерігаємо перевагу пере-
творення розмірності 8.
Таким чином, при QP = 27, 32 для зображень класу А краще підходить пере-
творення Т16, для зображень класу С – перетворення Т8, для зображень класу В –
обидва перетворення. Для більшого стиску, при QP=37, різниця між всіма перетво-
реннями є мінімальною, і нею можна нехтувати, тобто можна використовувати будь-
яке перетворення.
З іншого боку, враховуючи значно більшу швидкодію запропонованого пере-
творення на 16 порівняно з перетворенням на 8, та незначне й малопомітне для
людського ока (1 – 3%) збільшення якості для перетворення на 8 для класу зображень С
при QP = 27, 32, найбільш оптимальним для стиску зображень всіх класів при всіх
QP виглядає перетворення розмірності 16.
Крім того, оскільки спостерігається тенденція використання більшої роздільної
здатності, клас С з часом буде використовуватись все менше, а доля зображень
великої роздільної здатності, 4К та 8К, буде збільшуватись.
Новий підхід до виявлення найбільш інформативних
фрагментів сигналів та контурів об’єктів зображень.
Необхідною складовою обробки, стиску та відновлення сигналів і зображень є
фільтрація. Розрізняють фільтрацію з метою зменшення шумів та фільтрацію для
зменшення блочних артефактів.
Існують різні фільтри для зменшення шумів, але представляє цікавість задача
поєднати два в одному: фільтр та перетворення, тобто розробити таке перетворення,
яке, крім стиску даних, також помітно зменшує рівень шумів.
Звичайно, будь-яке перетворення має певні фільтруючі властивості, оскільки
зменшує кількість хаотичних флуктуацій, упорядковуючи початкові дані, але виникає
задача розробити перетворення зі значно підсиленими фільтруючими властивостями
(які найкраще будуть помітні при Qstep=1, при яких звичайні перетворення будуть
мати мінімальну похибку та велике значення PSNR, біля 48-50 db, а перетворення-
фільтр – досить значну похибку і PSNR біля 35 db, саме за рахунок фільтруючих
властивостей, які приводять до підсилення ключових даних).
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів...
«Штучний інтелект» 2014 № 4 41
2Л
Поставлена задача була успішно розв’язана, причому модифіковане перетворення-
фільтр (однонормове Т2) показало помітно кращу якість, ніж інші перетворення того
ж самого класу, в деяких випадках обійшовши аналогічне перетворення стандарту
Н.265, як це видно з тестувань на тестових зображеннях, що можна пояснити лише
здатністю посилення ключових даних.
Результати тестування
розроблених та відомих перетворень на зображеннях
Оскільки нас цікавить в першу чергу середній стиск, наведемо лише результати
тестування для QP=32, при цьому параметр Qstep, на який діляться коефіцієнти
перетворення, дорівнює 24. Візуальна оцінка якості зображень для Qstep з меншими
(14) або більшими (44) значеннями дозволяє стверджувати, що в першому випадку
похибки майже непомітні для людського ока, а стиск замалий, а в останньому випад-
ку, навпаки, відхилення від оригіналу занадто великі, добре помітні, і не можуть
бути повністю ліквідовані фільтрацією (на жаль, розміри статті не дозволяють при-
вести наглядні ілюстрації зображень для різних QP).
Крім того, перевірено, що схожа тенденція спостерігається при будь-яких QP,
тому для оцінки перетворень достатньо наведених результатів тестування, але при
цьому можемо використати більше реальних зображень, ніж звичайно.
Результати тестування за критерієм PSNR для зображень класу В наведені в
табл. 4, класу С – в табл. 5.
Таблиця 4
В1 В2 В3 В4 В5 В6 В7 В8 В9
Т1 26,80 33,19 32,42 32,56 33,09 31,73 32,32 34,27 27,86
Т2 27,94 33,95 33,10 33,54 33,73 32,73 32,89 35,08 28,74
Н.265 27,12 33,92 33,14 33,17 33,84 32,06 32,94 34,91 28,41
Таблиця 5
С1 С2 С3 С4 С5 С6 С7 С8 С9
Т1 28,42 29,80 29,80 29,19 28,72 31,46 32,15 32,56 31,65
Т2 29,44 30,59 30,91 30,08 29,62 32,15 32,81 33,23 32,86
Н.265 29,61 30,56 30,29 30,33 30,18 32,60 32,80 33,36 31,91
Як бачимо, перетворення Т1 відстає приблизно на 1 db від аналогічного коси-
нусного перетворення розмірності 16 із стандарту Н.265, тобто близько 3%, але при
візуальній оцінці стиснутих зображень різниці практично не помітно.
З іншого боку, перетворення Т2, яке для більшості зображень демонструє кращу
якість, ніж перетворення зі стандарту Н.265, і при візуальній оцінці має кращу
якість, тобто меншу розмитість та кращу передачу відтінків.
При менших QP перетворення Т2 має гірші результати за критерієм PSNR, ніж
аналогічне перетворення зі стандарту Н.265, причому різниця може досягати 10 db,
але при візуальному порівнянні ця похибка або не помічається, або, навпаки, є
додатньою, тобто має позитивний ефект – зображення видається більш чітким.
Луц В.К.
«Искусственный интеллект» 2014 № 4 42
2Л
Таким чином, якщо традиційні перетворення розробляються з метою якнайкраще
відтворити оригінальне зображення, то перетворення-фільтр візуально його покращує, що
особливо актуально для зображень з наявністю шумів, яких є переважна більшість,
внаслідок технічної недосконалості процесу їх отримання.
Висновки
Для зменшення надлишковості сигналів, зображень та відеокадрів широко викори-
стовують ортогональні перетворення, серед яких в першу чергу застосовуються ціло-
чисельні перетворення, особливо ті, які мають швидкий алгоритм реалізації.
Запропоноване нове просте цілочисельне косинусне перетворення зі швидким
алгоритмом виконання є оптимальним для оперативної обробки та кодування сигналів,
зображень та відеоданих засобами об’єктних систем безпровідних мереж, оскільки
суттєво (в 2,2 – 3,2 рази) зменшує необхідні обчислювальні ресурси, при незначному
(2 – 3%) погіршенні якості, що малопомітно для людського ока.
Окрім того, доведено, що запропоноване перетворення може бути використано
без необхідності застосування додаткових перетворень, розмірності 4, 8 та 32, як це
прийнято в стандарті Н.265, оскільки обчислювальні витрати при цьому значно
зменшуються без суттєвого погіршення якості, особливо для середніх ступенів
стиску, які зазвичай найширше використовуються.
В статті пропонується неоднонормове цілочисельне перетворення, яке потребує
додаткового нормування при використанні, та наведені результати тестування значно
кращого, однонормового перетворення-фільтру цього класу.
Стаття написана і опублікована при підтримці Державного фонду фундамен-
тальних досліджень України, проект № Ф54.2/004-2014 «Розробка методів оператив-
ної обробки і передачі інформації для ефективного управління мобільними роботами
і рухомими системами».
Список літератури
1. Технологія багатофункціональної обробки і передачі інформації в моніторингових мережах /
Б.М. Шевчук, В.К. Задірака, Л.О. Гнатів, С.В. Фраєр. – К. : Наук. думка, 2010. – 370 с.
2. Оперативне розпізнавання фрагментів і комплексів сигналів та виділення об’єктів відеоданих
засобами об’єктних систем безпровідних мереж / Б.М. Шевчук, В.К. Задірака, С.В. Фраєр,
В.К. Луц//Штучний інтелект. – 2013.– № 3.– С. 275-283.
3. Л.А. Гнатив. Целочисленные косинусные преобразования: методы построения новых быстрых
преобразований порядка 8,16 и их применение // Кибернетика и системный анализ. – 2014. – №6.
4. Wien M. ABT coding for higher resolution video // Doc. JVT-B053, JVT of ISO/IEC MPEG and ITU-T
VCEG, Geneva, Switzerland, Jan. 2002.
5. CE10: Core transform design for HEVC / A. Fuldseth, G. Bjøntegaard (Cisco Systems), M. Budagavi, V.
Sze (Texas Instruments) // Doc. JCTVC-G495, Geneva, CH, November, 2011.
References
1. Shevchuk B.M. Technology multi-processing and data transmission in monitoring networks / B.M. Shevchuk,
V.K. Zadiraka, L.A. Gnativ, S. Fraer. // - K. Naukova dumka, 2010. – 370 P.
2. B.M. Shevchuk, V.K. Zadiraka, S.V. Fraer, V.K. Luts. Rapid detection of fragments and complex signals and
selection of objects by means of video object of wireless// Artificial Intelligence.– 2013.– №3.– S. 275-283.
3. L.A. Hnativ. Іnteger cosine transforms: methods for building new fast transforms order 8,16 and their
applications // Cybernetics and Systems Analysis. - 2014. - №6.
4. Wien M. Variable block-size transforms for H.264/AVC// IEEE Trans. On Circuits and Systems for
Video Technology, 2003, v. 13, N 7, P. 604-613.
5. A. Fuldseth, G. Bjøntegaard (Cisco Systems), M. Budagavi, V. Sze (Texas Instruments). CE10: Core
transform design for HEVC // Doc. JCTVC-G495, Geneva, CH, November, 2011.
Просте цілочисельне косинуснe перетворення порядку 16 для кодування сигналів...
«Штучний інтелект» 2014 № 4 43
2Л
RESUME
V.K. Luts
Simple Integer Cosine-Step Transform Order 16
for Coding Signals And Images
Background: To reduce the redundancy of signals, images and video frames are widely
used orthogonal transforms, among which are primarily used integer transforms, especially
those who have a fast implementation algorithm.
Results: Proposed new simple integer cosine transform with fast algorithm implementation
is optimal for operative processing and coding of signals, images and video facilities of
object systems for wireless networks as significantly reduces the required computational
resources (2,2-3,2 time faster). Moreover, we prove that the proposed transform can be used
without the need for additional transforms, order 4, 8 and 32, as is customary in standard H.265
as computational costs while greatly reduced without significant deterioration, especially for the
average compression that typically are most frequently used.
Conclusion: The article discusses integer transform with varying norm, which requires the
additional normalization in use, and the results of testing the best transform with equal
norm of this class are presented. Additionally, transform has enhanced filtering abilities,
that is a unique development, previously unknown.
Статья поступила в редакцию 15.04.2014.
|