Технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму
Подано технологію вейвлет-фільтрації профілів експресій генів для видалення фонового «білого» шуму на основі критерію ентропія Шеннона, розрахованого з використанням методу оцінки Джеймса та Стейна. Запропоновано структурну блок-схему процесу визначення параметрів вейвлет-фільтру, яка передбачає роз...
Saved in:
| Date: | 2017 |
|---|---|
| Main Author: | |
| Format: | Article |
| Language: | Ukrainian Russian |
| Published: |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
2017
|
| Series: | Управляющие системы и машины |
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/131964 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму / С.А. Бабічев // Управляющие системы и машины. — 2017. — № 5. — С. 25-42. — укр., рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-131964 |
|---|---|
| record_format |
dspace |
| spelling |
nasplib_isofts_kiev_ua-123456789-1319642025-02-09T14:49:38Z Технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму Технология вейвлет-фильтрации профилей экспрессий генов с целью удаления фонового шума Technology of Wavelet-Filtration of the Gene Expression Profiles in Order to Remove the Background Noise Бабічев, С.А. Методы и средства обработки данных и знаний Подано технологію вейвлет-фільтрації профілів експресій генів для видалення фонового «білого» шуму на основі критерію ентропія Шеннона, розрахованого з використанням методу оцінки Джеймса та Стейна. Запропоновано структурну блок-схему процесу визначення параметрів вейвлет-фільтру, яка передбачає розрахунок ентропії Шеннона як для фільтрованого сигналу, так і для видаленої шумової компоненти. Представлена технология вейвлет-фильтрации профилей экспрессий генов для удаления фонового «белого» шума на основе критерия энтропия Шеннона, который рассчитан посредством использования метода оценки Джеймса и Стейна. Предложена структурная блок-схема процесса определения параметров вейвлет-фильтра, предполагающая расчет энтропии Шеннона как для фильтрованного сигнала, так и для удаленной шумовой компоненты. Introduction. The solved task is focused on increasing the gene expression profiles quality, which are used to reconstruct the gene regulatory networks. The filtration process is one of the stages of data preprocessing, implementation of which corresponds to the increasing data quality by removing the background “white” noise component. The aim of the paper is development of the wavelet filtration technology of gene expression profiles based on the Shannon entropy criterion, which calculated by James-Stein shrinkage estimator using. Methods. During the research, the methods of the computer simulation, wavelet analysis, and entropy methods to estimate the studied data comprehension are used. Results. The results of the simulation prove that the choice of the mother wavelet type from orthogonal and biorthogonal wavelets in case of the gene expression profiles filtration is not determinative. In terms of the relative criterion calculated as the Shannon entropy ratio of the filtered gene expression profiles and the extracted noise component, the best results are obtained using the biorthogonal wavelet bior1.5, however the difference obtained using other types of wavelets is insignificant. The choice of the type of the wavelet from the family of the mother’s wavelets, the choice of the level of the wavelet decomposition, and the choice of the value of the thresholding coefficient are determining in this case. Conclusions. The wavelet filtration technology of gene expression profiles based on complex use of the methods to estimate the filtered signal and extracted noise comprehension component is proposed based on the performed simulation. The implementation of this technology allows us to optimise the wavelet filtration process of complex signals in order to remove the “white” noise component. 2017 Article Технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму / С.А. Бабічев // Управляющие системы и машины. — 2017. — № 5. — С. 25-42. — укр., рос. 0130-5395 https://nasplib.isofts.kiev.ua/handle/123456789/131964 004.048 uk ru Управляющие системы и машины application/pdf Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Ukrainian Russian |
| topic |
Методы и средства обработки данных и знаний Методы и средства обработки данных и знаний |
| spellingShingle |
Методы и средства обработки данных и знаний Методы и средства обработки данных и знаний Бабічев, С.А. Технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму Управляющие системы и машины |
| description |
Подано технологію вейвлет-фільтрації профілів експресій генів для видалення фонового «білого» шуму на основі критерію ентропія Шеннона, розрахованого з використанням методу оцінки Джеймса та Стейна. Запропоновано структурну блок-схему процесу визначення параметрів вейвлет-фільтру, яка передбачає розрахунок ентропії Шеннона як для фільтрованого сигналу, так і для видаленої шумової компоненти. |
| format |
Article |
| author |
Бабічев, С.А. |
| author_facet |
Бабічев, С.А. |
| author_sort |
Бабічев, С.А. |
| title |
Технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму |
| title_short |
Технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму |
| title_full |
Технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму |
| title_fullStr |
Технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму |
| title_full_unstemmed |
Технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму |
| title_sort |
технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму |
| publisher |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України |
| publishDate |
2017 |
| topic_facet |
Методы и средства обработки данных и знаний |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/131964 |
| citation_txt |
Технологія вейвлет-фільтрації профілів експресій генів з метою видалення фонового шуму / С.А. Бабічев // Управляющие системы и машины. — 2017. — № 5. — С. 25-42. — укр., рос. |
| series |
Управляющие системы и машины |
| work_keys_str_mv |
AT babíčevsa tehnologíâvejvletfílʹtracííprofílívekspresíjgenívzmetoûvidalennâfonovogošumu AT babíčevsa tehnologiâvejvletfilʹtraciiprofilejékspressijgenovscelʹûudaleniâfonovogošuma AT babíčevsa technologyofwaveletfiltrationofthegeneexpressionprofilesinordertoremovethebackgroundnoise |
| first_indexed |
2025-11-27T00:38:53Z |
| last_indexed |
2025-11-27T00:38:53Z |
| _version_ |
1849901909649915904 |
| fulltext |
ISSN 0130-5395, УСиМ, 2017, № 5 25
Методы и средства обработки данных и знаний
УДК 004.048
С.А. Бабічев
Технологія вейвлет-фільтрації профілів експресій генів з метою видалення
фонового шуму
Представлена технология вейвлет-фильтрации профилей экспрессий генов для удаления фонового «белого» шума на основе
критерия энтропия Шеннона, который рассчитан посредством использования метода оценки Джеймса и Стейна. Предложена
структурная блок-схема процесса определения параметров вейвлет-фильтра, предполагающая расчет энтропии Шеннона как
для фильтрованного сигнала, так и для удаленной шумовой компоненты.
Ключевые слова: профили экспрессий генов, вейвлеты, трешолдинг, фильтрация.
Подано технологію вейвлет-фільтрації профілів експресій генів для видалення фонового «білого» шуму на основі критерію
ентропія Шеннона, розрахованого з використанням методу оцінки Джеймса та Стейна. Запропоновано структурну блок-схему
процесу визначення параметрів вейвлет-фільтру, яка передбачає розрахунок ентропії Шеннона як для фільтрованого сигналу,
так і для видаленої шумової компоненти.
Ключові слова: профілі експресій генів, вейвлети, трешолдінг, фільтрація.
Вступ. Детальний аналіз процесу формування
матриці експресій генів, отриманих шляхом мік-
рочіпових експериментів [1, 2] показує, що етап
сканування зображення мікрочіпу ДНК супро-
воджується появою фонового шуму. Часткова
фонова корекція проводиться при формуванні
матриці експресій генів, але слід зазначити, що
повне видалення шумової складової на даному
етапі є проблематичним. Тому виникає необхід-
ність подальшої фільтрації отриманих профілів
експресій генів з використанням кількісних кри-
теріїв оцінки інформативності профілів, що об-
робляються, або шумової складової, що видаля-
ється з відповідних генів. У даній статті задача
розв’язується з використанням вейвлет-аналізу
[3–5], який отримав широке розповсюдження у
різних галузях для обробки складних нестаціо-
нарних сигналів та зображень [6–10].
Аналіз сучасних досягнень та публікацій
Питанням створення матриці експресій генів,
отриманих шляхом ДНК-мікрочіпових експе-
риментів, присвячено роботи [11–14], де дета-
льно розглянуто етапи обробки експеримента-
льних даних, які містять фонову корекцію, но-
рмалізацію, РМ-корекцію та сумарізацію. На
кожному етапі передбачено використання різ-
них методів, кожен з яких має і переваги, і не-
доліки. У [15] представлено порівняльний ана-
ліз методів обробки профілів експресій генів,
хворих на рак легенів, отриманих шляхом
ДНК-мікрочіпових експериментів, визначено
оптимальну комбінацію методів з використан-
ням критерію ентропія Шеннона. Питанням
редукції неінформативних профілів експресій
генів з огляду на статистичні та ентропійні
критерії присвячено роботу [16]. Представлена
технологія покрокової обробки профілів екс-
пресій генів дозволяє скоротити кількість
ознак на 6–10 відсотків, що підвищує інформа-
тивність даних для подальших досліджень.
Однак слід зазначити, що на етапі фонової ко-
рекції проблемі видалення фонового білого
шуму, який виникає на етапі сканування зо-
браження мікрочіпу, приділяється недостатня
увага. У [17] запропоновано методику фільтра-
ції хроматограмм з використанням вейвлет-
аналізу та критерію ентропія Шеннона. Але для
профілів експресій генів дана задача на даний
час однозначного розв’язку не має.
Метою статті є розробка технології вейвлет-
фільтрації профілів експресій генів із застосу-
ванням критерію ентропія Шеннона, що розра-
26 ISSN 0130-5395, УСиМ, 2017, № 5
хована на основі методу Джеймса та Стейна, з
метою видалення фонового білого шуму.
Основний матеріал
До вейвлетів належать функції, що буду-
ються на основі одного материнського вейвле-
ту ψ t шляхом операцій зсуву за аргументом
τ та масштабною зміною за параметром a [4]:
,
1 τψ ψa
tt
aa
, (1)
де , τa R , 2ψ t L R , а множник 1 a
забезпечує незалежність норми функції від ма-
сштабного числа а. Материнському вейвлету
ψ t притаманні наступні властивості:
обмеженість, тобто вейвлет-функції ψ t
повинні мати кінцеву енергію:
2ψ ψ( )t t dt
; (2)
локалізація, тобто вони мають бути визна-
чені на кінцевому інтервалі як у часовій, так і у
частотній областях. Для цього достатньо, щоб
виконувалися при С = const та ε 0 наступні
умови:
1 ε
ψ 1t C t
та 1 ε
ψ ω 1 ωC
, (3)
де ω – середня частота вейвлету;
нульове середнє значення, тобто виконан-
ня наступної умови для нульового моменту:
ψ 0t dt
. (4)
У випадку безперервного вейвлет-перетво-
рення сигналу RLts 2 параметри а та τ на-
бувають будь-яких значень у межах області їх
визначення і вейвлетний масштабно-часовий
спектр baC , розраховується у відповідності з
формулою
1
2( , ) ( ) ψ t bC a b s t a dt
a
. (5)
Вейвлет-реконструкція сигналу ts за умо-
ви використання такого ж базису функцій ви-
конується так:
1
2
2
ψ
1 τ τ( ) , τ ψ
RR
t da ds t C a a
C a a
, (6)
де ψС – константа, що визначається функцією :
2
ψ ˆ2π ψ ω ω ωC d
, (7)
де ψ̂ – є фур’є образ функції . Для кількісного
аналізу сигналів, який передбачає його деком-
позицію та реконструкцію можливе викорис-
тання будь-яких локалізованих функцій ψ t ,
якщо для них існують такі функції-двійники
ψ' t , що сімейства ,τψa t та ,τψ 'a t ут-
ворюють парні базиси функціонального прос-
тору RL2 . Якщо вейвлет ψ t ортогональний,
то ψ ψ't t і вейвлетний базис також має
властивість ортогональності. У випадку неор-
тогональності вейвлету ψ t наявність двійни-
ка ψ' t дає можливість сформувати сімейства
,ψm k t та ,ψ 'g p t , що задовольняють умо-
ву біортогональності на множині цілих чисел Z:
, , , ,ψ , ψ ' δ δm k g p m k g pt t , Zpgkm ,,, . (8)
У цьому випадку можлива декомпозиція
будь-якого сигналу та його подальша реконст-
рукція. При дискретній вейвлет-декомпозиції
сигналу параметри а та τ набувають дискрет-
них значень на множині:
ja 2 та τ 2 jk , (9)
де j та k – є цілі числа, коефіцієнт j є парамет-
ром масштабу, а k визначає рівень вейвлет-
декомпозиції сигналу. За дискретних значень a
і τ вейвлет-функція набуває вигляду
2
, 0 0ψ ψ
j
j
j k t a a t k , (10)
а пряме дискретне вейвлет-перетворення зво-
диться до обчислення деталізуючих коефіцієн-
тів:
2
, 0 0ψ ( )
j
j
j kd a a t k s t dt
. (11)
Обернене дискретне вейвлет-перетворення
задається за допомогою того ж базису, як і
пряме:
ISSN 0130-5395, УСиМ, 2017, № 5 27
2
, 0 0
ψ
1( ) ψ
j
j
j k
j Z k Z
s t d a a t k
C
. (12)
Структурну схему процесу дискретного вей-
влет-перетворення даних, що досліджуються,
подано на рис. 1. Процес вейвлет-декомпозиції
одновимірного сигналу передбачає розрахунок
вектора коефіцієнтів, які апроксимують на N-рів-
ні вейвлет-декомпозиції та вектори коефіцієнтів,
які деталізують на рівнях від одиниці до N:
0 1 1 2 2 1
1 1
, , ,
... , , , ..., .N N N
s CA CA CD CA CD CD
CA CD CD CD
(13)
Рис. 1
Вектори коефіцієнтів, які апроксимують та
деталізують, розраховуються шляхом викорис-
тання для вектора відповідних даних фільтра
низьких частот LFF при апроксимації та філь-
тра високих частот HFF для деталізації. Апро-
ксимуючі коефіцієнти містять інформацію про
грубу складову сигналу; інформація про деталі
сигналу та високочастотна шумова складова
містяться у більшості деталізуючих коефіцієн-
тів. Видалення шумової складової з профілів
експресій генів у межах запропонованої моделі
проведено з використанням м’якого трешол-
дингу:
0, якщо τ,
τ, якщо τ,
d d
d d d
(14)
де τ – значення трешолдингового коефіцієнта,
d – значення деталізуючих коефіцієнтів на усіх
рівнях досліджуваних вейвлет-декомпозицій
вектора даних.
Реконструкція даних відбувається з викори-
станням апроксимуючих коефіцієнтів на N-рів-
ні вейвлет-декомпозиції та оброблених деталі-
зуючих коефіцієнтів на рівнях від одиниці до N.
Аналіз рис. 1 дозволяє визначити шляхи оп-
тимізації процесу вейвлет-фільтрації профілів
експресій генів. Процес передбачає наступні
кроки:
вибір материнського вейвлету;
визначення оптимального рівня вейвлет-
декомпозиції вектора досліджуваних даних;
вибір типу вейвлету з сімейства материн-
ського вейвлету;
визначення оптимального значення тре-
шолдингового коефіцієнта.
Оцінку якості обробки інформації на кож-
ному кроці проведено з використанням ентро-
пії Шеннона на основі оцінки Джеймса та
Стейна [18]. Вочевидь, що мінімальне значен-
ня критерію ентропія Шеннона, розраховане
для профілю експресій гена, відповідає най-
більш високій якості обробки інформації. З
іншого боку, максимальне значення ентропії
Шеннона, розраховане для видаленої шумової
компоненти, відповідає максимальному на-
ближенню до безупорядкованого білого шуму,
який має бути видалений з досліджуваних да-
них. Структурну блок-схему системи вейвлет-
фільтрації профілів експресій генів на основі
критерію ентропія Шеннона з використанням
ймовірнісної оцінки Джеймса та Стейна пода-
но на рис. 2.
Рис. 2
Реалізація даного процесу передбачає на-
ступні кроки:
1. Вибір материнського вейвлету зі списку
доступних для типу досліджуваних даних.
2. Визначення оптимального рівня вейвлет-
декомпозиції сигналу на основі максимального
Ве
йв
ле
т-
де
ко
мп
оз
иц
ія
О
бр
об
ка
к
ое
фі
ці
єн
ті
в
28 ISSN 0130-5395, УСиМ, 2017, № 5
значення ентропії Шеннона, що розраховуєть-
ся для видаленої шумової компоненти. На
цьому етапі вибір типу вейвлету з сімейства
материнського вейвлету та значення трешол-
дингового коефіцієнта встановлюються випад-
ково з інтервалу допустимих значень.
3. Визначення типу вейвлета з сімейства ма-
теринського вейвлету на основі максимального
значення ентропії Шеннона для видаленої шу-
мової компоненти.
4. Визначення оптимального значення тре-
шолдингового коефіцієнта на основі мінімаль-
ного значення ентропії Шеннона, що розрахо-
вується для фільтрованого сигналу.
Отже, процес оптимізації параметрів вейв-
лет-фільтру профілів експресій генів передба-
чає паралельну оцінку ентропії Шеннона для
фільтрованих даних та для видаленої шумової
компоненти.
Експерименти та результати
Моделювання процесу вейвлет-фільтрації
було проведено з використанням профілів екс-
пресій генів хворого на рак легенів, отриманих
шляхом ДНК-мікрочіпових експериментів [19]
та передобробленого за методикою [16]. Діаг-
рама розподілу експресій генів досліджуваного
об’єкта представлено на рис. 3.
Рис. 3
Статистичні характеристики вектора профі-
лю експресій досліджуваних генів представле-
но у таблиці.
Minimum 1 Quantile Median Mean 3 Quantile Maximum
–36,19 2,18 11,10 236,91 22,63 17360,00
Аналіз даних таблиці та рис. 3 дозволяє дій-
ти висновку, що вектор експресій генів, вико-
ристаних для моделювання процесу вейвлет-
фільтрації, містить 7129 генів, експресія яких
змінюється від –36,19 до 17360, при цьому слід
зазначити, що більшість генів мають низьке зна-
чення експресії. Більш того, з великою ймовір-
ністю можна стверджувати, що шумова ком-
понента міститься у високочастотній частині
спектра, що обґрунтовує використання вейв-
лет-аналізу для очистки даних від шуму.
В процесі моделювання досліджено ортого-
нальні вейвлети Добеші (db1, db2,…, db45), сим-
плети (sym2, sym3,…, sym30), койфлети (coif1,
coif2,…, coif5), біортогональні вейвлети (bior1.1,
bior1.3, bior1.5, bior2.2, bior2.4, bior2.6, bior2.8,
bior3.1, bior3.3, bior3.5, bior3.7, bior4.4, bior5.5,
bior6.8), та обернені біортогональні вейвлети
(rbio1.1, rbio1.3, rbio1.5, rbio2.2, rbio2.4, rbio2.6,
rbio2.8, rbio3.1, rbio3.3, rbio3.5, rbio3.7, rbio4.4,
rbio5.5, rbio6.8). Експериментальне визначення
порогового значення трешолдингового коефіці-
єнта проведено двома способами. У першому
випадку проводилася покрокова обробка дета-
лізуючих коефіцієнтів у відповідності з фор-
мулою (14), коли значення трешолдингового
коефіцієнту було досить малим (0,2) і не змі-
нювалося у процесі моделювання. Тривалість
експерименту обмежувалася кількістю кроків
обробки деталізуючих коефіцієнтів. Другий ви-
падок передбачав покрокове збільшення зна-
чення трешолдингового коефіцієнту від minτ
до maxτ з кроком τd . На рис. 4 показано резуль-
тати моделювання з використанням вейвлетів
Добеші. У відповідності зі схемою (див. рис. 2),
вибір типу вейвлету та визначення рівня вейв-
лет-декомпозиції проводилися на основі мак-
симального значення ентропії Шеннона, роз-
рахованої для видаленої шумової компоненти.
а) Ентропія Шеннона шумової компоненти
в залежності від рівня вейвлет-декомпозиції
ISSN 0130-5395, УСиМ, 2017, № 5 29
b) Ентропія Шеннона шумової компоненти
в залежності від типу вейвлета Добеші
тип вейвлета Добеші
d) Ентропія Шеннона фільтрованих даних
в залежності від рівня трешолдингу
Рис. 4
Визначення трешолдингового коефіцієнта про-
ведено на основі мінімального значення ент-
ропії Шеннона для фільтрованих даних.
Аналіз отриманих діаграм дозволяє зробити
висновок, що при визначенні максимального
значення ентропії Шеннона виділеної шумової
компоненти оптимальним є використання вей-
влета db5 (див. рис. 4, b), при другому рівні
вейвлет-декомпозиції даних (див. рис. 4, а). Ме-
тодика покрокового видалення шумової ком-
поненти при сталому значенні трешолдингово-
го коефіцієнта (див. рис. 4, с) не є ефективною,
оскільки вона не дає можливості однозначного
визначення кроку зупинки роботи алгоритму.
Для визначення оптимального трешолдингу є
ефективною методика покрокового збільшення
значення коефіцієнта трешолдингу, оскільки у
цьому випадку спостерігається яскраво вира-
жений мінімум значення ентропії Шеннона
фільтрованих даних, який відповідає значенню
коефіцієнта трешолдингу τ = 1,8 (див. рис. 4, d).
Фільтровані дані експресій генів та виділена
шумова компонента при використанні вейвлету
Добеші db5, другому рівні вейвлет-декомпози-
ції та значенні коефіцієнта трешолдингу τ = 1,8
подано на рис. 5.
a) Фільтровані дані з використанням вейвлету Добеші db5,
значення ентропії Шеннона = 3,913
Рис. 5
Аналогічні результати при використанні
койфлетів, симплетів, біортогональних та обе-
рнених біортогональних вейвлетів показано на
рис. 6–9. Аналіз результатів дозволяє зробити
висновок, що оптимальними за критерієм ент-
ропія Шеннона є використання наступних па-
раметрів вейвлет-фільтру: вейвлет Добеші db5
на другому рівні вейвлет-декомпозиції та кое-
фіцієнті трешолдингу 1,8; койфлет coif4 на
другому рівні вейвлет-декомпозиції та коефі-
цієнті трешолдингу 1,6; симплет sym5 на тре-
тьому рівні вейвлет-декомпозиції та коефіцієн-
ті трешолдингу 1,8; біортогональний вейвлет
bior1.5 на третьому рівні вейвлет-декомпозиції
та коефіцієнті трешолдингу 2,2 і обернений
біортогональний вейвлет rbio1.5 на четвертому
рівні вейвлет-декомпозиції та коефіцієнті тре-
шолдингу 1,8.
а) Ентропія Шеннона шумової компоненти
в залежності від рівня вейвлет-декомпозиції
b) Виділена шумова компонента, значення ентропії Шеннона = 6,77
30 ISSN 0130-5395, УСиМ, 2017, № 5
d) Ентропія Шеннона фільтрованих даних
в залежності від рівня трешолдингу
Рис. 6
а) Ентропія Шеннона шумової компоненти
в залежності від рівня вейвлет-декомпозиції
d) Ентропія Шеннона фільтрованих даних
в залежності від рівня трешолдингу
Рис. 7
а) Ентропія Шеннона шумової компоненти
в залежності від рівня вейвлет-декомпозиції
ISSN 0130-5395, УСиМ, 2017, № 5 31
d) Ентропія Шеннона фільтрованих даних
в залежності від рівня трешолдингу
Рис. 8
а) Ентропія Шеннона шумової компоненти
в залежності від рівня вейвлет-декомпозиції
d) Ентропія Шеннона фільтрованих даних
в залежності від рівня трешолдингу
Рис. 9
На рис. 10 представлено діаграму відношен-
ня ентропій фільтрованих даних та виділеного
шуму в залежності від використаного вейвле-
ту. Аналіз рис. 10 дозволяє зробити висновок,
що вибір типу материнського вейвлету з сім’ї
ортогональних та біортогональних вейвлетів у
випадку фільтрації профілів експресій генів не є
визначальним. З урахуванням відношення ент-
ропій Шеннона для фільтрованих даних та ви-
діленої шумової компоненти кращі результаті
щодо вейвлет-фільтрації отримуються з вико-
ристанням біортогонального вейвлету bior1.5.
Але різниця між результатами, отриманими з
використанням інших вейвлетів досить мала.
Визначальними у даному випадку є вибір типу
вейвлету з сім’ї використаного материнського
вейвлету, вибір рівня вейвлет-декомпозиції та
визначення оптимального значення коефіцієн-
та трешолдингу для обробки деталізуючих ко-
ефіцієнтів.
Рис. 10
Дослідження дозволяють розробити техно-
логію визначення оптимальних параметрів
вейвлет-фільтру для обробки профілів експре-
сій генів у вигляді структурної блок-схеми по-
крокової обробки інформації. Архітектуру да-
ної технології показано на рис. 11. Практична
реалізація представленої технології передбачає
наступні етапи:
Етап І. Ініціалізація вихідних параметрів
вейвлет-фільтру.
1. Формування вектора материнських вейв-
летів та векторів вейвлетів у межах виділених
материнських вейвлетів:
,,...,1,
,,...,1,
pjwvwv
kiwvwv
j
ii
i
(15)
32 ISSN 0130-5395, УСиМ, 2017, № 5
де k – кількість материнських вейвлетів, що
досліджуються у процесі моделювання, р –
кількість типів вейвлетів материнського вейв-
лету і. Визначення інтервалу та кроку зміни ко-
ефіцієнта трешолдингу min max minτ , τ , τ τd , ви-
бір максимального рівня вейвлет-декомпозиції.
2. Вибір материнського вейвлету, що відпо-
відає першому порядковому номеру вектора
материнських вейвлетів (і = 1), довільний ви-
бір типу вейвлету даного материнського вейв-
лету. Встановлення коефіцієнта трешолдінгу
minτ τ та рівня вейвлет-декомпозиції n = 1.
Етап ІІ. Визначення оптимального рівня
вейвлет декомпозиції.
3. Вейвлет-фільтрація вектора профілів
експресій генів відповідно до схеми, зобра-
женої на рис. 2 у межах встановленого інтер-
валу зміни рівня вейвлет-декомпозиції даних,
виділення шумової компоненти на кожному
її рівні та розрахунок ентропії Шеннона шу-
мової компоненти на кожному кроці.
4. Аналіз отриманих результатів. Фіксація
оптимального рівня вейвлет-декомпозиції для
даного материнського вейвлету opt
in , який від-
повідає максимальному значенню критерію
ентропія Шеннона.
Етап ІІІ. Визначення типу вейвлета з сім’ї
відповідного материнського вейвлета.
Рис. 11
n = n +1
j = j +1
а
а
n =1
я вейвлет-декомпозиції
я вейвлет-декомпозиції H
H
ISSN 0130-5395, УСиМ, 2017, № 5 33
5. Вейвлет-фільтрація вектора профілів
експресій генів для усіх р типів даного мате-
ринського вейвлета pjwv j
i ,...,1, . Виді-
лення шумової компоненти, відповідної кож-
ному типу вейвлета та розрахунок ентропії
Шеннона шумової компоненти на кожному
кроці.
6. Аналіз результатів. Фіксація оптималь-
ного такого типу вейвлета материнського вей-
влета, який відповідає максимальному значен-
ню критерія ентропія Шеннона.
Етап ІV. Визначення оптимального коефі-
цієнта трешолдінгу для обробки деталізуючих
коефіцієнтів.
7. Розрахунок ентропії Шеннона для вектора
вихідних даних τ τH d .
8. Вейвлет-фільтрація вектора профілів
експресій генів при використанні коефіцієнта
трешолдінгу . Виділення вектора фільтрова-
них даних.
9. Розрахунок ентропії Шеннона на даному
кроці обробки інформації τH .
10. Якщо τ τ τH H d , збільшення ко-
ефіцієнта трешолдінгу на τd та перехід на
крок 8 даного алгоритму. У протилежному ви-
падку – фіксація оптимального коефіцієнта
трешолдінгу для і-го материнського вейвлету:
optτ τ τi d .
11. Операція інкремента параметра і (і =
= і + 1) та за умови ki повторення етапів ІІ–IV
даного алгоритму.
Етап V. Формування остаточного рішення
щодо вибору параметрів вейвлет-фільтру.
12. Розрахунок відношень ентропій Шенно-
на для фільтрованих даних та виділеної шумо-
вої компоненти для кожного материнського
вейвлету з використанням оптимальних пара-
метрів вейвлет-фільтру.
13. Фіксація оптимальних параметрів вейв-
лет-фільтра, відповідних глобальному мініму-
му критерію відношення ентропій Шеннона
фільтрованих даних та виділеної шумової ком-
поненти.
Висновки. Представлено технологію вейв-
лет фільтрації профілів експресій генів з ме-
тою видалення фонового білого шуму. Як ос-
новний критерій оцінки інформативності до-
сліджуваного сигналу використано ентропію
Шеннона на основі методу оцінки ймовірності
Джеймса та Стейна, заснованого на комплекс-
ному використанні двох моделей даних: висо-
корозмірної з малим зміщенням та високою
дисперсією розподілу даних та низькорозмір-
ної з високим зміщенням та низькою дисперсі-
єю. Структурна блок-схема системи вейвлет-
фільтрації у запропонованій моделі передбачає
оцінку ентропії як фільтрованого сигналу, так і
видаленої шумової компоненти, коли остаточ-
не рішення щодо вибору параметрів вейвлет-
фільтра приймається на основі відносного кри-
терію, розрахованого як відношення ентропій
Шеннона фільтрованого сигналу та видаленої
шумової компоненти. У процесі моделювання
досліджено сім’ї ортогональних вейвлетів До-
беші, симплети, койфлети, біортогональні та
обернені біортогональні вейвлети. Проведено
дослідження з оптимізації процесу вибору ти-
пу вейвлета, рівня вейвлет-декомпозиції та
значення трешолдінгового коефіцієнта. Експе-
риментальне визначення порогового значення
трешолдингового коефіцієнта проведено у два
способи. У першому випадку проведено по-
крокову обробку деталізуючих коефіцієнтів,
коли значення трешолдингового коефіцієнта
досить мале (0,2) і не змінювалося у процесі
моделювання. Тривалість експерименту обме-
жувалася кількістю кроків обробки деталізую-
чих коефіцієнтів. Другий випадок передбачав
покрокове збільшення значення трешолдинго-
вого коефіцієнта від minτ до maxτ з кроком τd .
Результати моделювання подано у вигляді гра-
фіків залежності ентропії Шеннона від відпо-
відного параметра, максимальне або мінімаль-
не значення яких дозволяє прийняти об’єктив-
не рішення у виборі відповідного параметра.
Аналіз результатів показав, що оптималь-
ними за критерієм ентропії Шеннона є викори-
стання наступних параметрів вейвлет-фільтра:
вейвлет Добеші db5 на другому рівні вейвлет-
34 ISSN 0130-5395, УСиМ, 2017, № 5
декомпозиції та коефіцієнті трешолдингу 1,8;
койфлет coif4 на другому рівні вейвлет-деком-
позиції та коефіцієнті трешолдингу 1,6; симп-
лет sym5 на третьому рівні вейвлет-декомпози-
ції та коефіцієнті трешолдингу 1,8; біортого-
нальний вейвлет bior1.5 на третьому рівні вей-
влет-декомпозиції та коефіцієнті трешолдингу
2,2 та обернений біортогональний вейвлет
rbio1.5 на четвертому рівні вейвлет-декомпо-
зиції та коефіцієнті трешолдингу 1,8. Аналіз
діаграми залежності відносної ентропії від ти-
пу вейвлету дозволяє зробити висновок, що ви-
бір типу материнського вейвлету сім’ї ортого-
нальних та біортогональних вейвлетів у випад-
ку фільтрації профілів експресій генів не є ви-
значальним. З урахуванням відношення ентро-
пій Шеннона для фільтрованих даних та виді-
леної шумової компоненти кращі результаті
щодо вейвлет-фільтрації отримано за викорис-
тання біортогонального вейвлету bior1.5. Але
різниця між результатами, отриманими за ви-
користання інших вейвлетів, досить мала. Ви-
значальними у даному випадку є вибір типу
вейвлету з використаної сім’ї материнського
вейвлету, вибір рівня вейвлет-декомпозиції та
визначення оптимального значення коефіцієн-
та трешолдингу для обробки деталізуючих ко-
ефіцієнтів. На основі досліджень запропонова-
но технологію визначення оптимальних пара-
метрів вейвлет-фільтра для обробки профілів
експресій генів у вигляді структурної блок-
схеми покрокової обробки інформації.
Перспективами досліджень автора є прак-
тична реалізація запропонованої технології у
межах гібридної моделі передобробки профілів
експресій генів з метою подальшої реконстру-
кції генної регуляторної мережі.
1. Schermer M.J. DNA microarrays: a practical approach
// Oxford University Press. – 1999. – P. 17–42.
2. Microarray biochip technology / T. Basarsky, D. Verdnik,
J.Y. Zhai et al. – Eaton Publ. – 2000. – P. 265–284.
3. Daubechies I. The wavelet transform, time-frequency
localization and signal analysis // IEEE Trans. Inform.
Theory, 1990. – 36. – P. 961–1005.
4. Daubechies I. Ten lectures on wavelets // CBMS–
NSF conf. series in applied math. SLAM Ed., 1992. –
343 p.
5. Coifman R.R., Meyer Y., Wickerhauser M.V. Wavelet
Analysis and Signal Processing // Wavelets and Their
Applications. – Boston Jones and Bartlett, 1992. –
P. 153–178.
6. Antoshchuk S.G. Realizaciya vejvletnogo preobra-
zovaniya pri strukturnom analize izobrazhenij. Elek-
tromashinobuduvannya ta elektroobladnannya, 2004. –
62. – P. 153–157. (In Russian).
7. Benedetto J.J. Wavelets: Mathematics and Application
// CRC Press, Series: Studies in Advanced Mathemat-
ics, 1993. – 592 p.
8. Samsul A., Karim A., Mohd T.I. Compression of Che-
mical Signal Using Wavelet Transform // European J.
of Scientific Research, 2009. – 36(4). – P. 513–520.
9. Joshi A., Aravind H.S. Analysis of Adaptive Wave-
let Wiener Filtering for ECG Signals: Review // Int.
J. of Advanced Research in Electronics and Com-
munication Engineering, 2014. – 3. – Issue 4. –
P. 395–398.
10. Chandu R., Venkateswarlu M. ECG Signal Filtering
using an Improved Wavelet Wiener Filtering // Int. J.
of Advanced Technology and Innovative Research,
2015. – 7. – Issue 7. – P. 1242–1247.
11. Baldi P., Hatfield G.W. DNA Microarrays and gene
expression: From experiments to data analysis model-
ing // Cambridge University Press. – 2002. – Р. 22–23.
12. A Comparison of Normalization Methods for High
Density Oligonucleotide Array Data Based on Variance
and Bias / B.M. Bolstad, R.A. Irizarry, M. Astrand et
al. // Bioinformatics, 2003. – 19. – P. 185–193.
13. Exploration, normalization, and summaries of high den-
sity oligonucleotide array probe level data / R.A. Irizarry,
B. Hobbs, F. Collin et al. // Biostatistics. – 2003. – 4,
№ 2. – P. 249–264.
14. Chen Z., McGee M., Liu Q. Distribution-Free Convo-
lution Model for background correction of oligonu-
cleotide microarray data // BMC genomics, 2009. – 10. –
P. 1–19.
15. Computational analysis of gene expression profiles of
lung cancer / S. Babichev, A. Kornelyuk, V. Lytvynen-
ko et al. // Biopolymers and Cells. – 2016. – 32(1). –
P. 70–79.
16. Babichev S., Taif M.A., Lytvynenko V. Filtration of
DNA nucleotide gene expression profiles in the sys-
tems of biological objects clustering // Int. Frontier
Science Letters. – 2016. – 8. – Р. 1–8.
17. Fil'traciya hromatogramm s pomoshch'yu vejvlet-
analiza s ispol'zovaniem kriteriya ehntropii / S.A. Ba-
bichev, A.A. Didyk, V.I. Litvinenko et al. // System
technologies. – 2010. – N 6(71). – P. 117–131. (In
Russian).
18. Hausser J., Strimmer K. Entropy inference and the
James-Stein estimator, with application to nonlinear
gene association networks // J. of Machine Learning
Research. – 2009. – 10. – Р. 1469–1484.
ISSN 0130-5395, УСиМ, 2017, № 5 35
19. Gene-expression profiles predict survival of patients
with lung adenocarcinoma / D.G. Beer, S.L. Kardia,
C. Huang at al. // Nature Medicine. – 2002. – 8(8). –
P. 816–824.
Поступила 19.09.2017
E-mail: sergii.babichev@ujep.cz
© С.А. Бабичев, 2017
С.А. Бабичев
Технология вейвлет-фильтрации профилей экспрессий генов с целью удаления фонового шума
Введение. Детальный анализ процесса формирования мат-
рицы экспрессий генов, полученных посредством микро-
чиповых экспериментов [1, 2] показывает, что этап скани-
рования изображения микрочипа ДНК сопровождается
возникновением фонового шума. Частичная фоновая кор-
рекция проводится на этапе формирования матрицы экс-
прессии генов, но следует отметить, что полное удаление
фоновой шумовой составляющей на данном этапе пробле-
матично. Вследствие этого возникает необходимость даль-
нейшей фильтрации полученных профилей экспрессии
генов с использованием количественных критериев оценки
информативности обрабатываемых профилей и шумовой
составляющей, выделяемой из соответствующих профилей
экспрессий генов. В данной статье задача решается с ис-
пользованием вейвлет-анализа [3–5], получившим широ-
кое распространение в различных областях современной
науки и техники [6–10].
Анализ современных достижений и публикаций
Вопросам создания матрицы экспрессий генов, по-
лученных посредством ДНК-микрочиповых экспери-
ментов, посвящены работы [11–14], где подробно рас-
сматриваются этапы обработки экспериментальных дан-
ных, предполагающих фоновую коррекцию, нормализа-
цию, РМ-коррекцию и суммаризацию. На каждом этапе
предусмотрена возможность использования различных
методов со своими преимуществами и недостатками. В
[15] представлен сравнительный анализ методов обра-
ботки профилей экспрессий генов больных раком лег-
ких, полученных посредством ДНК-микрочиповых экс-
периментов, определена оптимальная комбинация мето-
дов с использованием критерия энтропия Шеннона. Во-
просам редукции неинформативных профилей экспрес-
сий генов с учетом статистических и энтропийных кри-
териев посвящена работа [16]. Представленная техноло-
гия пошаговой обработки профилей экспрессии генов
позволяет сократить количество признаков на 6–10 про-
центов, что повышает информативность данных для даль-
нейших исследований. Однако следует отметить, что на
этапе фоновой коррекции проблеме удаления фонового
белого шума, возникающего на этапе сканирования изо-
бражения микрочипа, уделено недостаточное внимание.
Методика фильтрации хроматограмм с использованием
вейвлет-анализа и критерия энтропия Шеннона предло-
жена в [17]. Но применительно к профилям экспрессий
генов данная задача в настоящее время однозначного
решения не имеет.
Цель статьи – разработка технологии вейвлет-филь-
трации профилей экспрессий генов для удаления фоно-
вого белого шума, оценка качества обработки данных в
которой осуществляется с применением критерия эн-
тропия Шеннона, рассчитанного на основе метода рас-
ширения Джеймса и Стейна.
Основной материал
К вейвлетам относятся функции, которые строятся на
основе одного материнского вейвлета ψ t посредством
операций сдвига по аргументу τ и масштабирования по
параметру a [4]:
, τ
1 τψ ψa
tt
aa
, (1)
где , τa R , 2ψ t L R , а множитель
1
a
обес-
печивает независимость нормы функции от масштабно-
го числа а. Материнский вейвлет ψ t обладает сле-
дующими свойствами:
ограниченность, т.е. вейвлет функции ψ t долж-
ны иметь конечную энергию:
2ψ ψ( )t t dt
; (2)
локализация, т.е. они должны быть определены на
конечном интервале как по времени, так и по частоте.
Для этого достаточно, чтобы при С = const и ε 0 вы-
полнялись следующие условия:
1 εψ 1t C t
и 1 εψ ω 1 ωC
, (3)
где ω – средняя частота вейвлета;
нулевое среднее значение, т.е. выполнение сле-
дующего условия для нулевого момента:
ψ 0t dt
. (4)
В случае непрерывного вейвлет-преобразования сиг-
нала 2s t L R параметры а и τ принимают любые
значения в пределах области их определения и вейвлет-
ный масштабно-временной спектр ,C a b рассчитыва-
ется в соответствии с формулой
1
2( , ) ( ) ψ t bC a b s t a dt
a
. (5)
36 ISSN 0130-5395, УСиМ, 2017, № 5
Вейвлет-реконструкция сигнала s t при условии ис-
пользования такого же базиса функций выполняется так:
1
2
2
ψ
1 τ τ( ) , τ ψ
RR
t da ds t C a a
C a a
, (6)
где ψС – константа, определяемая функцией :
2
ψ ˆ2π ψ ω ω ωC d
, (7)
где ψ̂ – фурье-образ функции . Для количественного
анализа сигналов, предусматривающего его декомпози-
цию и реконструкцию, возможно использование любых
локализованных функций ψ t , если для них сущее-
ствуют такие функции-двойники ψ ' t , что семейства
,τψa t и ,τψ 'a t образуют парные базисы функ-
ционального пространства 2L R . Если вейвлет ψ t
ортогональный, то ψ ψ 't t и вейвлетный базис
также имеет свойства ортогональности. В случае неор-
тогональности вейвлета ψ t наличие двойника ψ ' t
дает возможность сформировать семейства ,ψm k t и
,ψ 'g p t , удовлетворяющие условию биортогонально-
сти на множестве целых чисел Z:
, , , ,ψ ,ψ ' δ δm k g p m k g pt t , , , ,m k g p Z . (8)
В этом случае возможна декомпозиция и реконст-
рукция любого сигнала. При дискретной вейвлет-деком-
позиции сигнала параметры а и τ принимают дискрет-
ные значения на множестве
2 ja и τ 2 jk , (9)
где j и k – целые числа, коэффициент j – параметр мас-
штаба, а k определяет уровень вейвлет-декомпозиции
сигнала. При дискретных значениях a и τ вейвлет-
функция приобретает вид
2
, 0 0ψ ψ
j
j
j k t a a t k , (10)
а прямое дискретное вейвлет-преобразование сводится к
вычислению детализирующих коэффициентов
2
, 0 0ψ ( )
j
j
j kd a a t k s t dt
. (11)
Обратное дискретное вейвлет-преобразование зада-
ется тем же базисом, что и прямое:
2
, 0 0
ψ
1( ) ψ
j
j
j k
j Z k Z
s t d a a t k
C
. (12)
Структурная схема процесса вейвлет-фильтрации ис-
следуемых данных представлена на рис. 1.
Процесс вейвлет-декомпозиции одномерного сигна-
ла предполагает расчет вектора аппроксимирующих
коэффициентов на N-уровне вейвлет-декомпозиции и
векторов детализирующих коэффициентов на уровнях
от единицы до N:
0 1 1 2 2 1
1 1
, , ,
... , , , ..., .N N N
s CA CA CD CA CD CD
CA CD CD CD
(13)
Векторы аппроксимирующих и детализирующих ко-
эффициентов рассчитываются путем использования для
вектора соответствующих данных фильтра низких час-
тот LFF для аппроксимации и фильтра высоких частот
HFF для детализации. Аппроксимирующие коэффици-
енты содержат информацию о грубой составляющей
сигнала. Информация о деталях сигнала и высокочастот-
ная шумовая составляющая содержатся в большинстве
случаев в детализирующих коэффициентах. Удаление
шумовой составляющей из профилей экспрессии генов в
рамках предложенной модели проводилось с использо-
ванием мягкого трешолдинга так:
0, если τ,
τ, если τ ,
d d
d d d
(14)
где τ – значение трешолдингового коэффициента, d –
значение детализирующих коэффициентов на всех
уровнях вейвлет-декомпозиции вектора исследуемых
данных. Реконструкция сигнала проведена на основе
аппроксимирующих коэффициентов на N-уровне вейв-
лет-декомпозиции и обработанных детализирующих
коэффициентов на уровнях от единицы до N.
Рис. 1
Детальный анализ рис. 1 позволяет определить пути
оптимизации процесса вейвлет-фильтрации профилей
экспрессии генов. Данный процесс предусматривает
следующие шаги:
выбор материнского вейвлета;
определение оптимального уровня вейвлет-деком-
позиции вектора исследуемых данных;
выбор типа вейвлета из семейства материнского
вейвлета;
определение оптимального значения трешолдинго-
вого коэффициента.
Оценка качества обработки информации на каждом
шагу проводилась с использованием энтропии Шеннона на
основе оценки Джеймса и Стейна [18]. Очевидно, что ми-
нимальное значение критерия энтропия Шеннона, рассчи-
танное для профиля экспрессии гена, соответствует наибо-
Ве
йв
ле
т-
де
ко
мп
оз
иц
ия
О
бр
аб
от
ка
к
оэ
фф
иц
ие
нт
ов
ISSN 0130-5395, УСиМ, 2017, № 5 37
лее высокому качеству обработки информации. С другой
стороны, максимальное значение энтропии Шеннона, рас-
считанное для выделенной шумовой компоненты, соответ-
ствует максимальному приближению к хаотическому бе-
лому шуму, который должен быть удален из исследуемых
данных. Структурная блок-схема системы вейвлет-фильт-
рации профилей экспрессии генов на основе критерия эн-
тропия Шеннона с использованием вероятностной оценки
Джеймса и Стейна представлена на рис. 2.
Рис. 2
Реализация данного процесса предусматривает сле-
дующие шаги:
1. Выбор материнского вейвлета из списка доступ-
ных для данного типа исследуемых данных.
2. Определение оптимального уровня вейвлет-деком-
позиции сигнала на основе максимального значения
энтропии Шеннона, рассчитываемой для выделенной
шумовой компоненты. На этом этапе выбор типа вейв-
лета из семейства материнского вейвлета и значение
трешолдингового коэффициента устанавливаются про-
извольно из интервала допустимых значений.
3. Определение типа вейвлета из семейства материн-
ского вейвлета на основе максимального значения эн-
тропии Шеннона для выделенной шумовой компоненты.
4. Определение оптимального значения трешолдин-
гового коэффициента на основе минимального значения
энтропии Шеннона, рассчитываемой для фильтрованно-
го сигнала.
Таким образом, процесс оптимизации параметров
вейвлет-фильтра профилей экспрессии генов преду-
сматривает параллельную оценку энтропии Шеннона
для фильтруемых данных и для выделенной шумовой
компоненты.
Эксперименты и результаты
Моделирование процесса вейвлет-фильтрации было
проведено с использованием профиля экспрессии генов
больного раком легких, полученного посредством ДНК-
микрочиповых экспериментов [19] и предобработанного
по методике [16]. Диаграмма распределения экспрессий
генов исследуемого объекта представлена на рис. 3.
Рис. 3
Статистические характеристики вектора экспрессий
исследуемых генов представлены в таблице.
Minimum 25% Quartile Median Mean 75% Quartile Maximum
–36,19 2,18 11,10 236,91 22,63 17360,00
Анализ данных таблицы и рис. 3 позволяет сделать
вывод, что вектор экспрессий генов, использованный в
процессе моделирования, содержит 7129 генов, экспрес-
сия которых меняется от –36,19 до 17360, при этом сле-
дует отметить, что большинство генов имеют низкое
значение экспрессии. Более того, с большой вероятно-
стью можно утверждать, что шумовая компонента со-
держится в высокочастотной части спектра. Данный
факт обосновывает использование вейвлет-анализа для
очистки данных от шума.
В процессе моделирования исследовались: ортого-
нальные вейвлеты Добеши (db1, db2,…, db45), симплеты
(sym2, sym3, …, sym30), койфлеты (coif1, coif2, …, coif5),
биортогональные вейвлеты (bior1.1, bior1.3, bior1.5,
bior2.2, bior2.4, bior2.6, bior2.8, bior3.1, bior3.3, bior3.5,
bior3.7, bior4.4, bior5.5, bior6.8), и обратные биортого-
нальные вейвлеты (rbio1.1, rbio1.3, rbio1.5, rbio2.2,
rbio2.4, rbio2.6, rbio2.8, rbio3.1, rbio3.3, rbio3.5, rbio3.7,
rbio4.4, rbio5.5, rbio6.8). Экспериментальное определе-
ние порогового значения трешолдингового коэффици-
ента было проведено двумя способами. В первом случае
проводилась пошаговая обработка детализирующих
коэффициентов в соответствии с (14), при этом значение
трешолдингового коэффициента было достаточно ма-
лым (0,2) и не менялось в процессе моделирования.
Продолжительность эксперимента ограничивалась ко-
личеством шагов обработки детализирующих коэффи-
циентов. Второй случай предусматривал пошаговое
увеличение значения трешолдингового коэффициента
от minτ до maxτ с шагом τd . На рис. 4 представлены ре-
зультаты моделирования при использовании вейвлетов
Добеши. В соответствии со схемой, изображенной на
рис. 2, выбор типа вейвлета и определение уровня вейв-
лет-декомпозиции проводилось на основе максимально-
го значения энтропии Шеннона, рассчитанной для вы-
деленной шумовой компоненты. Определение трешол-
дингового коэффициента проводилось на основе мини-
мального значения энтропии Шеннона для фильтрован-
ных данных. Анализ полученных диаграмм позволяет
сделать вывод, что с учетом максимального значения
энтропии Шеннона выделенной шумовой компоненты
оптимально использование вейвлета db5 (см. рис. 4, b)
при втором уровне вейвлет-декомпозиции данных (см.
рис. 4, а). Методика пошагового удаления шумовой
компоненты при постоянном значении трешолдингового
коэффициента (см. рис. 4, с) не эффективна, поскольку
не дает возможности однозначного определения шага
остановки работы алгоритма. Для определения опти-
мального трешолдинга эффективна методика пошагово-
го увеличения значения трешолдингового коэффициен-
38 ISSN 0130-5395, УСиМ, 2017, № 5
та, поскольку в этом случае наблюдается ярко выражен-
ный минимум значения энтропии Шеннона фильтро-
ванных данных, соответствующий значению коэффици-
ента трешолдинга τ = 1,8 (см. рис. 4, d). Вектор фильт-
рованных экспрессий генов и выделенная шумовая ком-
понента при использовании вейвлета Добеши db5, вто-
ром уровне вейвлет-декомпозиции и значении коэффи-
циента трешолдинга τ = 1,8 представлены на рис. 5.
Рис. 4
Аналогичные результаты при использовании койф-
летов, симплетов, биортогональных и обратных биорто-
гональных вейвлетов представлены на рис. 6–9.
a) Фильтрованные данные с использованием вейвлета Добеши
db5, значение энтропии Шеннона = 3,913
Рис. 5
d) Энтропия Шеннона фильтрованных данных
в зависимости от уровня трешолдинга
Рис. 6.
b) Выделенная шумовая компонента, значение энтропии Шеннона = 6,77
ISSN 0130-5395, УСиМ, 2017, № 5 39
Рис. 7
Рис. 8
а) Энтропия Шеннона шумовой компоненты
в зависимости от уровня вейвлет-декомпозиции
b) Энтропия Шеннона шумовой компоненты
в зависимости от типа rbio вейвлета
40 ISSN 0130-5395, УСиМ, 2017, № 5
c) Энтропия Шеннона фильтрованных данных
в зависимости от шага удаления шума
d) Энтропия Шеннона фильтрованных данных
в зависимости от уровня трешолдинга
Рис. 9
Анализ результатов позволяет сделать вывод, что
оптимальными по критерию энтропия Шеннона явля-
ется использование следующих параметров вейвлет-
фильтра: вейвлет Добеши db5 при втором уровне вейв-
лет-декомпозиции и коэффициенте трешолдинга 1,8;
койфлет coif4 при втором уровне вейвлет-декомпозиции
и коэффициенте трешолдинга 1,6; симплет sym5 при
третьем уровне вейвлет-декомпозиции и коэффициенте
трешолдинга 1,8; биортогональный вейвлет bior1.5 при
третьем уровне вейвлет-декомпозиции и коэффициенте
трешолдинга 2,2 и обратный биортогональный вейвлет
rbio1.5 при четвертом уровне вейвлет-декомпозиции и
коэффициенте трешолдинга 1,8.
На рис. 10 представлена диаграмма отношения эн-
тропий фильтрованных данных и выделенного шума в
зависимости от типа используемого вейвлета при опти-
мальных параметрах вейвлет-фильтра. Анализ рис. 10
позволяет сделать вывод, что выбор типа материнского
вейвлета из семейства ортогональных и биортогональ-
ных вейвлетов в случае фильтрации профилей экспрес-
сии генов не является определяющим. С учетом отно-
шения энтропии Шеннона для фильтруемых данных и
выделенной шумовой компоненты лучшие результаты
вейвлет-фильтрации получаются с использованием био-
ртогонального вейвлета bior1.5. Но разница между ре-
зультатами, полученными с использованием других вейв-
летов достаточно мала. Определяющими в данном слу-
чае являются выбор типа вейвлета из семейства мате-
ринского вейвлета, выбор уровня вейвлет-декомпозиции
и определение оптимального значения коэффициента
трешолдинга для обработки детализирующих коэффи-
циентов.
Рис. 10
Исследо вания позволяют разработать технологию
определения оптимальных параметров вейвлет-фильтра
для обработки профилей экспрессии генов в виде струк-
турной блок-схемы пошаговой обработки информации.
Архитектура данной технологии представлена на
рис. 11. Практическая реализация представленной тех-
нологии предполагает наличие следующих этапов:
Этап I. Инициализация исходных параметров вейв-
лет-фильтра.
1. Формирование вектора материнских вейвлетов и
векторов вейвлетов из семейств выделенных материн-
ских вейвлетов:
, 1,..., ,
, 1,..., ,
i
j
i i
wv wv i k
wv wv j p
(15)
где k – количество материнских вейвлетов, исследуемых
в процессе моделирования, р –количество типов вейвле-
тов из семейства материнского вейвлета i. Определение
интервала и шага изменения трешолдингового коэффи-
циента: min max minτ , τ , τ τd , задание максимального уров-
ня вейвлет-декомпозиции.
2. Выбор материнского вейвлета, соответствующего
первому порядковому номеру вектора материнских
вейвлетов (i = 1), произвольный выбор типа вейвлета
данного материнского вейвлета, установление коэффи-
циента трешолдинга minτ τ и уровня вейвлет-деком-
позиции n = 1.
Этап II. Определение оптимального уровня вейвлет-
декомпозиции.
3. Вейвлет-фильтрация вектора профилей экспрес-
сии генов в соответствии со схемой, изображенной на
рис. 2, в пределах установленного интервала изменения
уровня вейвлет-декомпозиции данных, выделение шу-
мовой компоненты на каждом уровне вейвлет-деком-
позиции и расчет энтропии Шеннона шумовой компо-
ненты на каждом шаге.
4. Анализ результатов. Фиксация оптимального уров-
ня вейвлет-декомпозиции для данного материнского
вейвлета opt
in , соответствующего максимальному значе-
нию критерия энтропия Шеннона.
Этап III. Определение типа вейвлета из семейства
данного материнского вейвлета.
ISSN 0130-5395, УСиМ, 2017, № 5 41
5. Вейвлет-фильтрация вектора профилей экспрес-
сии генов для всех р типов данного материнского вейв-
лета , 1,...,j
iwv j p . Выделение шумовой компонен-
ты, соответствующей каждому типу вейвлета и расчет
энтропии Шеннона шумовой компоненты на каждом
шагу работы алгоритма.
6. Анализ результатов. Фиксация оптимального типа
вейвлета данного материнского вейвлета, соответст-
вующего максимальному значению критерия энтропия
Шеннона.
Этап ІV. Определение оптимального коэффициента
трешолдинга для обработки детализирующих коэффи-
циентов.
7. Расчет энтропии Шеннона для вектора исходных
данных τ τH d .
8. Вейвлет-фильтрация вектора профилей экспрес-
сии генов при использовании коэффициента трешол-
динга . Выделение вектора фильтрованных данных.
9. Расчет энтропии Шеннона на данном шаге обра-
ботки информации τH .
10. Если τ τ τH H d , увеличение коэффициен-
та трешолдинга на τd и переход на шаг 8 данного алго-
ритма. В противном случае фиксация оптимального ко-
эффициента трешолдинга для i-го мате-
ринского вейвлета: optτ τ τi d .
11. Операция инкремента параметра
і (і = і + 1) и, при условии i k , повто-
рение этапов ІІ–IV данного алгоритма.
Этап V. Формирование окончатель-
ного решения по выбору параметров
вейвлет-фильтра.
12. Расчет отношений энтропий
Шеннона для фильтрованных данных и
выделенной шумовой компоненты для
каждого материнского вейвлета с ис-
пользованием оптимальных параметров
вейвлет-фильтра.
13. Фиксация оптимальных пара-
метров вейвлет-фильтра, соответству-
ющих глобальному минимуму критерия
отношение энтропий Шеннона фильт-
рованных данных и выделенной шумо-
вой компоненты.
Заключение. Представлена техно-
логия вейвлет-фильтрации профилей
экспрессии генов с целью удаления фо-
нового белого шума. В качестве основ-
ного критерия оценки информативно-
сти исследуемого сигнала использована
энтропия Шеннона, рассчитанная по
методу оценки вероятности Джеймса и
Стейна, основанного на комплексном
использовании двух моделей данных:
высокорозмерной модели с малым смещением и высо-
кой дисперсией распределения данных и низкоразмер-
ной – с высоким смещением и низкой дисперсией. Реа-
лизация предложенной структурной блок-схемы систе-
мы вейвлет-фильтрации предполагает оценку энтропии
как фильтрованного сигнала, так и удаленной шумовой
компоненты, при этом окончательное решение по выбо-
ру параметров вейвлет-фильтра принимается на основе
относительного критерия, который рассчитывается как
отношение энтропий Шеннона фильтрованного сигнала
и выделенной шумовой компоненты. В процессе моде-
лирования исследованы семейства ортогональных вейв-
летов Добеши, симплеты, койфлеты, биортогональные и
обратные биортогональные вейвлеты. Проведено иссле-
дование по оптимизации процесса выбора типа вейвле-
та, уровня вейвлет-декомпозиции и значения трешол-
дингового коэффициента. Экспериментальное опреде-
ление порогового значения трешолдингового коэффи-
циента было проведено двумя способами. В первом слу-
чае проводилась пошаговая обработка детализирующих
коэффициентов, когда значение трешолдингового коэф-
фициента было достаточно малым (0,2) и не менялось в
процессе моделирования. Продолжительность экспери-
мента ограничивалась количеством шагов обработки
детализирующих коэффициентов. Второй случай пред-
Рис. 11
j = j +1
n = n +1
вейвлет-декомпозиции n=1
вейвлет-декомпозиции
H
H
42 ISSN 0130-5395, УСиМ, 2017, № 5
полагал пошаговое увеличение значения трешолдинго-
вого коэффициента от minτ до maxτ с шагом τd . Резуль-
таты моделирования представлены в виде графиков за-
висимости энтропий Шеннона от соответствующего па-
раметра, максимальное или минимальное значение ко-
торых позволяет принять объективное решение по вы-
бору соответствующего параметра.
Анализ результатов показал, что по критерию энтро-
пия Шеннона оптимальны использование следующих
параметров вейвлет-фильтра: вейвлет Добеши db5 при
втором уровне вейвлет-декомпозиции и коэффициенте
трешолдинга 1,8; койфлет coif4 при втором уровне вейв-
лет-декомпозиции и коэффициенте трешолдинга 1,6;
симплет sym5 при третьем уровне вейвлет-декомпози-
ции и коэффициенте трешолдинга 1,8; биортогональный
вейвлет bior1.5 при третьем уровне вейвлет-декомпо-
зиции и коэффициенте трешолдинга 2,2 и обратный
биортогональный вейвлет rbio1.5 при четвертом уровне
вейвлет-декомпозиции и коэффициенте трешолдинга 1,8.
Анализ диаграммы зависимости относительной энтро-
пии от типа вейвлета позволяет сделать вывод, что вы-
бор типа материнского вейвлета из семейства ортого-
нальных и биортогональных вейвлетов в случае фильт-
рации профилей экспрессии генов не является опреде-
ляющим. С учетом отношения энтропий Шеннона для
фильтруемых данных и выделенной шумовой компо-
ненты лучшие результаты по вейвлет-фильтрации полу-
чаются с использованием биортогонального вейвлета
bior1.5. Но разница между результатами, полученными с
использованием других вейвлетов достаточно мала. Оп-
ределяющими в данном случае является выбор типа
вейвлета из семейства используемого материнского
вейвлета, выбор уровня вейвлет-декомпозиции и опре-
деление оптимального значения коэффициента трешол-
динга для обработки детализирующих коэффициентов.
На основе проведенных исследований предложена тех-
нология определения оптимальных параметров вейвлет-
фильтра для обработки профилей экспрессии генов в
виде структурной блок-схемы пошаговой обработки
информации.
Перспективой дальнейших исследований является
практическая реализация предложенной технологии в
рамках гибридной модели предобработки профилей
экспрессии генов с целью реконструкции генной регу-
ляторной сети.
UDC 004.048
S.A. Babichev
PhD., associate professor, associate professor of department of informatics, Jan Evangelista Purkyne University in Usti nad Labem,
Czech Republic, 8, Ceske mladeze Str., Usti nad Labem, Czech Republic, 400 96.
Technology of Wavelet-Filtration of the Gene Expression Profiles in Order to Remove the Background Noise
Keywords: gene expression profiles, wavelets, tresholding, filtration.
Introduction. The solved task is focused on increasing the gene expression profiles quality, which are used to reconstruct
the gene regulatory networks. The filtration process is one of the stages of data preprocessing, implementation of which cor-
responds to the increasing data quality by removing the background “white” noise component.
The aim of the paper is development of the wavelet filtration technology of gene expression profiles based on the Shan-
non entropy criterion, which calculated by James-Stein shrinkage estimator using.
Methods. During the research, the methods of the computer simulation, wavelet analysis, and entropy methods to esti-
mate the studied data comprehension are used.
Results. The results of the simulation prove that the choice of the mother wavelet type from orthogonal and biorthogonal
wavelets in case of the gene expression profiles filtration is not determinative. In terms of the relative criterion calculated as
the Shannon entropy ratio of the filtered gene expression profiles and the extracted noise component, the best results are ob-
tained using the biorthogonal wavelet bior1.5, however the difference obtained using other types of wavelets is insignificant.
The choice of the type of the wavelet from the family of the mother’s wavelets, the choice of the level of the wavelet decom-
position, and the choice of the value of the thresholding coefficient are determining in this case.
Conclusions. The wavelet filtration technology of gene expression profiles based on complex use of the methods to esti-
mate the filtered signal and extracted noise comprehension component is proposed based on the performed simulation. The
implementation of this technology allows us to optimise the wavelet filtration process of complex signals in order to remove
the “white” noise component.
<<
/ASCII85EncodePages false
/AllowTransparency false
/AutoPositionEPSFiles true
/AutoRotatePages /None
/Binding /Left
/CalGrayProfile (Dot Gain 20%)
/CalRGBProfile (sRGB IEC61966-2.1)
/CalCMYKProfile (U.S. Web Coated \050SWOP\051 v2)
/sRGBProfile (sRGB IEC61966-2.1)
/CannotEmbedFontPolicy /Error
/CompatibilityLevel 1.4
/CompressObjects /Tags
/CompressPages true
/ConvertImagesToIndexed true
/PassThroughJPEGImages true
/CreateJobTicket false
/DefaultRenderingIntent /Default
/DetectBlends true
/DetectCurves 0.0000
/ColorConversionStrategy /CMYK
/DoThumbnails false
/EmbedAllFonts true
/EmbedOpenType false
/ParseICCProfilesInComments true
/EmbedJobOptions true
/DSCReportingLevel 0
/EmitDSCWarnings false
/EndPage -1
/ImageMemory 1048576
/LockDistillerParams false
/MaxSubsetPct 100
/Optimize true
/OPM 1
/ParseDSCComments true
/ParseDSCCommentsForDocInfo true
/PreserveCopyPage true
/PreserveDICMYKValues true
/PreserveEPSInfo true
/PreserveFlatness true
/PreserveHalftoneInfo false
/PreserveOPIComments true
/PreserveOverprintSettings true
/StartPage 1
/SubsetFonts true
/TransferFunctionInfo /Apply
/UCRandBGInfo /Preserve
/UsePrologue false
/ColorSettingsFile ()
/AlwaysEmbed [ true
]
/NeverEmbed [ true
]
/AntiAliasColorImages false
/CropColorImages true
/ColorImageMinResolution 300
/ColorImageMinResolutionPolicy /OK
/DownsampleColorImages true
/ColorImageDownsampleType /Bicubic
/ColorImageResolution 300
/ColorImageDepth -1
/ColorImageMinDownsampleDepth 1
/ColorImageDownsampleThreshold 1.50000
/EncodeColorImages true
/ColorImageFilter /DCTEncode
/AutoFilterColorImages true
/ColorImageAutoFilterStrategy /JPEG
/ColorACSImageDict <<
/QFactor 0.15
/HSamples [1 1 1 1] /VSamples [1 1 1 1]
>>
/ColorImageDict <<
/QFactor 0.15
/HSamples [1 1 1 1] /VSamples [1 1 1 1]
>>
/JPEG2000ColorACSImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 30
>>
/JPEG2000ColorImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 30
>>
/AntiAliasGrayImages false
/CropGrayImages true
/GrayImageMinResolution 300
/GrayImageMinResolutionPolicy /OK
/DownsampleGrayImages true
/GrayImageDownsampleType /Bicubic
/GrayImageResolution 300
/GrayImageDepth -1
/GrayImageMinDownsampleDepth 2
/GrayImageDownsampleThreshold 1.50000
/EncodeGrayImages true
/GrayImageFilter /DCTEncode
/AutoFilterGrayImages true
/GrayImageAutoFilterStrategy /JPEG
/GrayACSImageDict <<
/QFactor 0.15
/HSamples [1 1 1 1] /VSamples [1 1 1 1]
>>
/GrayImageDict <<
/QFactor 0.15
/HSamples [1 1 1 1] /VSamples [1 1 1 1]
>>
/JPEG2000GrayACSImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 30
>>
/JPEG2000GrayImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 30
>>
/AntiAliasMonoImages false
/CropMonoImages true
/MonoImageMinResolution 1200
/MonoImageMinResolutionPolicy /OK
/DownsampleMonoImages true
/MonoImageDownsampleType /Bicubic
/MonoImageResolution 1200
/MonoImageDepth -1
/MonoImageDownsampleThreshold 1.50000
/EncodeMonoImages true
/MonoImageFilter /CCITTFaxEncode
/MonoImageDict <<
/K -1
>>
/AllowPSXObjects false
/CheckCompliance [
/None
]
/PDFX1aCheck false
/PDFX3Check false
/PDFXCompliantPDFOnly false
/PDFXNoTrimBoxError true
/PDFXTrimBoxToMediaBoxOffset [
0.00000
0.00000
0.00000
0.00000
]
/PDFXSetBleedBoxToMediaBox true
/PDFXBleedBoxToTrimBoxOffset [
0.00000
0.00000
0.00000
0.00000
]
/PDFXOutputIntentProfile ()
/PDFXOutputConditionIdentifier ()
/PDFXOutputCondition ()
/PDFXRegistryName ()
/PDFXTrapped /False
/CreateJDFFile false
/Description <<
/ARA <FEFF06270633062A062E062F0645002006470630064700200627064406250639062F0627062F0627062A002006440625064606340627062100200648062B062706260642002000410064006F00620065002000500044004600200645062A064806270641064206290020064406440637062806270639062900200641064A00200627064406450637062706280639002006300627062A0020062F0631062C0627062A002006270644062C0648062F0629002006270644063906270644064A0629061B0020064A06450643064600200641062A062D00200648062B0627062606420020005000440046002006270644064506460634062306290020062806270633062A062E062F062706450020004100630072006F0062006100740020064800410064006F006200650020005200650061006400650072002006250635062F0627063100200035002E0030002006480627064406250635062F062706310627062A0020062706440623062D062F062B002E0635062F0627063100200035002E0030002006480627064406250635062F062706310627062A0020062706440623062D062F062B002E>
/BGR <FEFF04180437043f043e043b043704320430043904420435002004420435043704380020043d0430044104420440043e0439043a0438002c00200437043000200434043000200441044a0437043404300432043004420435002000410064006f00620065002000500044004600200434043e043a0443043c0435043d04420438002c0020043c0430043a04410438043c0430043b043d043e0020043f044004380433043e04340435043d04380020043704300020043204380441043e043a043e043a0430044704350441044204320435043d0020043f04350447043004420020043704300020043f044004350434043f0435044704300442043d04300020043f043e04340433043e0442043e0432043a0430002e002000200421044a04370434043004340435043d043804420435002000500044004600200434043e043a0443043c0435043d044204380020043c043e0433043004420020043404300020044104350020043e0442043204300440044f0442002004410020004100630072006f00620061007400200438002000410064006f00620065002000520065006100640065007200200035002e00300020043800200441043b0435043404320430044904380020043204350440044104380438002e>
/CHS <FEFF4f7f75288fd94e9b8bbe5b9a521b5efa7684002000410064006f006200650020005000440046002065876863900275284e8e9ad88d2891cf76845370524d53705237300260a853ef4ee54f7f75280020004100630072006f0062006100740020548c002000410064006f00620065002000520065006100640065007200200035002e003000204ee553ca66f49ad87248672c676562535f00521b5efa768400200050004400460020658768633002>
/CHT <FEFF4f7f752890194e9b8a2d7f6e5efa7acb7684002000410064006f006200650020005000440046002065874ef69069752865bc9ad854c18cea76845370524d5370523786557406300260a853ef4ee54f7f75280020004100630072006f0062006100740020548c002000410064006f00620065002000520065006100640065007200200035002e003000204ee553ca66f49ad87248672c4f86958b555f5df25efa7acb76840020005000440046002065874ef63002>
/CZE <FEFF005400610074006f0020006e006100730074006100760065006e00ed00200070006f0075017e0069006a007400650020006b0020007600790074007600e101590065006e00ed00200064006f006b0075006d0065006e0074016f002000410064006f006200650020005000440046002c0020006b00740065007200e90020007300650020006e0065006a006c00e90070006500200068006f006400ed002000700072006f0020006b00760061006c00690074006e00ed0020007400690073006b00200061002000700072006500700072006500730073002e002000200056007900740076006f01590065006e00e900200064006f006b0075006d0065006e007400790020005000440046002000620075006400650020006d006f017e006e00e90020006f007400650076015900ed007400200076002000700072006f006700720061006d0065006300680020004100630072006f00620061007400200061002000410064006f00620065002000520065006100640065007200200035002e0030002000610020006e006f0076011b006a016100ed00630068002e>
/DAN <FEFF004200720075006700200069006e0064007300740069006c006c0069006e006700650072006e0065002000740069006c0020006100740020006f007000720065007400740065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e007400650072002c0020006400650072002000620065006400730074002000650067006e006500720020007300690067002000740069006c002000700072006500700072006500730073002d007500640073006b007200690076006e0069006e00670020006100660020006800f8006a0020006b00760061006c0069007400650074002e0020004400650020006f007000720065007400740065006400650020005000440046002d0064006f006b0075006d0065006e0074006500720020006b0061006e002000e50062006e00650073002000690020004100630072006f00620061007400200065006c006c006500720020004100630072006f006200610074002000520065006100640065007200200035002e00300020006f00670020006e0079006500720065002e>
/DEU <FEFF00560065007200770065006e00640065006e0020005300690065002000640069006500730065002000450069006e007300740065006c006c0075006e00670065006e0020007a0075006d002000450072007300740065006c006c0065006e00200076006f006e002000410064006f006200650020005000440046002d0044006f006b0075006d0065006e00740065006e002c00200076006f006e002000640065006e0065006e002000530069006500200068006f006300680077006500720074006900670065002000500072006500700072006500730073002d0044007200750063006b0065002000650072007a0065007500670065006e0020006d00f60063006800740065006e002e002000450072007300740065006c006c007400650020005000440046002d0044006f006b0075006d0065006e007400650020006b00f6006e006e0065006e0020006d006900740020004100630072006f00620061007400200075006e0064002000410064006f00620065002000520065006100640065007200200035002e00300020006f0064006500720020006800f600680065007200200067006500f600660066006e00650074002000770065007200640065006e002e>
/ESP <FEFF005500740069006c0069006300650020006500730074006100200063006f006e0066006900670075007200610063006900f3006e0020007000610072006100200063007200650061007200200064006f00630075006d0065006e0074006f00730020005000440046002000640065002000410064006f0062006500200061006400650063007500610064006f00730020007000610072006100200069006d0070007200650073006900f3006e0020007000720065002d0065006400690074006f007200690061006c00200064006500200061006c00740061002000630061006c0069006400610064002e002000530065002000700075006500640065006e00200061006200720069007200200064006f00630075006d0065006e0074006f00730020005000440046002000630072006500610064006f007300200063006f006e0020004100630072006f006200610074002c002000410064006f00620065002000520065006100640065007200200035002e003000200079002000760065007200730069006f006e0065007300200070006f00730074006500720069006f007200650073002e>
/ETI <FEFF004b00610073007500740061006700650020006e0065006900640020007300e4007400740065006900640020006b00760061006c006900740065006500740073006500200074007200fc006b006900650065006c007300650020007000720069006e00740069006d0069007300650020006a0061006f006b007300200073006f00620069006c0069006b0065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e00740069006400650020006c006f006f006d006900730065006b0073002e00200020004c006f006f0064007500640020005000440046002d0064006f006b0075006d0065006e00740065002000730061006100740065002000610076006100640061002000700072006f006700720061006d006d006900640065006700610020004100630072006f0062006100740020006e0069006e0067002000410064006f00620065002000520065006100640065007200200035002e00300020006a00610020007500750065006d006100740065002000760065007200730069006f006f006e00690064006500670061002e000d000a>
/FRA <FEFF005500740069006c006900730065007a00200063006500730020006f007000740069006f006e00730020006100660069006e00200064006500200063007200e900650072002000640065007300200064006f00630075006d0065006e00740073002000410064006f00620065002000500044004600200070006f0075007200200075006e00650020007100750061006c0069007400e90020006400270069006d007000720065007300730069006f006e00200070007200e9007000720065007300730065002e0020004c0065007300200064006f00630075006d0065006e00740073002000500044004600200063007200e900e90073002000700065007500760065006e0074002000ea0074007200650020006f007500760065007200740073002000640061006e00730020004100630072006f006200610074002c002000610069006e00730069002000710075002700410064006f00620065002000520065006100640065007200200035002e0030002000650074002000760065007200730069006f006e007300200075006c007400e90072006900650075007200650073002e>
/GRE <FEFF03a703c103b703c303b903bc03bf03c003bf03b903ae03c303c403b5002003b103c503c403ad03c2002003c403b903c2002003c103c503b803bc03af03c303b503b903c2002003b303b903b1002003bd03b1002003b403b703bc03b903bf03c503c103b303ae03c303b503c403b5002003ad03b303b303c103b103c603b1002000410064006f006200650020005000440046002003c003bf03c5002003b503af03bd03b103b9002003ba03b103c42019002003b503be03bf03c703ae03bd002003ba03b103c403ac03bb03bb03b703bb03b1002003b303b903b1002003c003c103bf002d03b503ba03c403c503c003c903c403b903ba03ad03c2002003b503c103b303b103c303af03b503c2002003c503c803b703bb03ae03c2002003c003bf03b903cc03c403b703c403b103c2002e0020002003a403b10020005000440046002003ad03b303b303c103b103c603b1002003c003bf03c5002003ad03c703b503c403b5002003b403b703bc03b903bf03c503c103b303ae03c303b503b9002003bc03c003bf03c103bf03cd03bd002003bd03b1002003b103bd03bf03b903c703c403bf03cd03bd002003bc03b5002003c403bf0020004100630072006f006200610074002c002003c403bf002000410064006f00620065002000520065006100640065007200200035002e0030002003ba03b103b9002003bc03b503c403b103b303b503bd03ad03c303c403b503c103b503c2002003b503ba03b403cc03c303b503b903c2002e>
/HEB <FEFF05D405E905EA05DE05E905D5002005D105D405D205D305E805D505EA002005D005DC05D4002005DB05D305D9002005DC05D905E605D505E8002005DE05E105DE05DB05D9002000410064006F006200650020005000440046002005D405DE05D505EA05D005DE05D905DD002005DC05D405D305E405E105EA002005E705D305DD002D05D305E405D505E1002005D005D905DB05D505EA05D905EA002E002005DE05E105DE05DB05D90020005000440046002005E905E005D505E605E805D5002005E005D905EA05E005D905DD002005DC05E405EA05D905D705D4002005D105D005DE05E605E205D505EA0020004100630072006F006200610074002005D5002D00410064006F00620065002000520065006100640065007200200035002E0030002005D505D205E805E105D005D505EA002005DE05EA05E705D305DE05D505EA002005D905D505EA05E8002E05D005DE05D905DD002005DC002D005000440046002F0058002D0033002C002005E205D905D905E005D5002005D105DE05D305E805D905DA002005DC05DE05E905EA05DE05E9002005E905DC0020004100630072006F006200610074002E002005DE05E105DE05DB05D90020005000440046002005E905E005D505E605E805D5002005E005D905EA05E005D905DD002005DC05E405EA05D905D705D4002005D105D005DE05E605E205D505EA0020004100630072006F006200610074002005D5002D00410064006F00620065002000520065006100640065007200200035002E0030002005D505D205E805E105D005D505EA002005DE05EA05E705D305DE05D505EA002005D905D505EA05E8002E>
/HRV (Za stvaranje Adobe PDF dokumenata najpogodnijih za visokokvalitetni ispis prije tiskanja koristite ove postavke. Stvoreni PDF dokumenti mogu se otvoriti Acrobat i Adobe Reader 5.0 i kasnijim verzijama.)
/HUN <FEFF004b0069007600e1006c00f30020006d0069006e0151007300e9006701710020006e0079006f006d00640061006900200065006c0151006b00e90073007a00ed007401510020006e0079006f006d00740061007400e100730068006f007a0020006c006500670069006e006b00e1006200620020006d0065006700660065006c0065006c0151002000410064006f00620065002000500044004600200064006f006b0075006d0065006e00740075006d006f006b0061007400200065007a0065006b006b0065006c0020006100200062006500e1006c006c00ed007400e10073006f006b006b0061006c0020006b00e90073007a00ed0074006800650074002e0020002000410020006c00e90074007200650068006f007a006f00740074002000500044004600200064006f006b0075006d0065006e00740075006d006f006b00200061007a0020004100630072006f006200610074002000e9007300200061007a002000410064006f00620065002000520065006100640065007200200035002e0030002c0020007600610067007900200061007a002000610074007400f3006c0020006b00e9007301510062006200690020007600650072007a006900f3006b006b0061006c0020006e00790069007400680061007400f3006b0020006d00650067002e>
/ITA <FEFF005500740069006c0069007a007a006100720065002000710075006500730074006500200069006d0070006f007300740061007a0069006f006e00690020007000650072002000630072006500610072006500200064006f00630075006d0065006e00740069002000410064006f00620065002000500044004600200070006900f900200061006400610074007400690020006100200075006e00610020007000720065007300740061006d0070006100200064006900200061006c007400610020007100750061006c0069007400e0002e0020004900200064006f00630075006d0065006e007400690020005000440046002000630072006500610074006900200070006f00730073006f006e006f0020006500730073006500720065002000610070006500720074006900200063006f006e0020004100630072006f00620061007400200065002000410064006f00620065002000520065006100640065007200200035002e003000200065002000760065007200730069006f006e006900200073007500630063006500730073006900760065002e>
/JPN <FEFF9ad854c18cea306a30d730ea30d730ec30b951fa529b7528002000410064006f0062006500200050004400460020658766f8306e4f5c6210306b4f7f75283057307e305930023053306e8a2d5b9a30674f5c62103055308c305f0020005000440046002030d530a130a430eb306f3001004100630072006f0062006100740020304a30883073002000410064006f00620065002000520065006100640065007200200035002e003000204ee5964d3067958b304f30533068304c3067304d307e305930023053306e8a2d5b9a306b306f30d530a930f330c8306e57cb30818fbc307f304c5fc59808306730593002>
/KOR <FEFFc7740020c124c815c7440020c0acc6a9d558c5ec0020ace0d488c9c80020c2dcd5d80020c778c1c4c5d00020ac00c7a50020c801d569d55c002000410064006f0062006500200050004400460020bb38c11cb97c0020c791c131d569b2c8b2e4002e0020c774b807ac8c0020c791c131b41c00200050004400460020bb38c11cb2940020004100630072006f0062006100740020bc0f002000410064006f00620065002000520065006100640065007200200035002e00300020c774c0c1c5d0c11c0020c5f40020c2180020c788c2b5b2c8b2e4002e>
/LTH <FEFF004e006100750064006f006b0069007400650020016100690075006f007300200070006100720061006d006500740072007500730020006e006f0072011700640061006d00690020006b0075007200740069002000410064006f00620065002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b00750072006900650020006c0061006200690061007500730069006100690020007000720069007400610069006b007900740069002000610075006b01610074006f00730020006b006f006b007900620117007300200070006100720065006e006700740069006e00690061006d00200073007000610075007300640069006e0069006d00750069002e0020002000530075006b0075007200740069002000500044004600200064006f006b0075006d0065006e007400610069002000670061006c006900200062016b007400690020006100740069006400610072006f006d00690020004100630072006f006200610074002000690072002000410064006f00620065002000520065006100640065007200200035002e0030002000610072002000760117006c00650073006e0117006d00690073002000760065007200730069006a006f006d00690073002e>
/LVI <FEFF0049007a006d0061006e0074006f006a00690065007400200161006f00730020006900650073007400610074012b006a0075006d00750073002c0020006c0061006900200076006500690064006f00740075002000410064006f00620065002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b006100730020006900720020012b00700061016100690020007000690065006d01130072006f00740069002000610075006700730074006100730020006b00760061006c0069007401010074006500730020007000690072006d007300690065007300700069006501610061006e006100730020006400720075006b00610069002e00200049007a0076006500690064006f006a006900650074002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b006f002000760061007200200061007400760113007200740020006100720020004100630072006f00620061007400200075006e002000410064006f00620065002000520065006100640065007200200035002e0030002c0020006b0101002000610072012b00200074006f0020006a00610075006e0101006b0101006d002000760065007200730069006a0101006d002e>
/NLD (Gebruik deze instellingen om Adobe PDF-documenten te maken die zijn geoptimaliseerd voor prepress-afdrukken van hoge kwaliteit. De gemaakte PDF-documenten kunnen worden geopend met Acrobat en Adobe Reader 5.0 en hoger.)
/NOR <FEFF004200720075006b00200064006900730073006500200069006e006e007300740069006c006c0069006e00670065006e0065002000740069006c002000e50020006f0070007000720065007400740065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e00740065007200200073006f006d00200065007200200062006500730074002000650067006e0065007400200066006f00720020006600f80072007400720079006b006b0073007500740073006b00720069006600740020006100760020006800f800790020006b00760061006c0069007400650074002e0020005000440046002d0064006f006b0075006d0065006e00740065006e00650020006b0061006e002000e50070006e00650073002000690020004100630072006f00620061007400200065006c006c00650072002000410064006f00620065002000520065006100640065007200200035002e003000200065006c006c00650072002000730065006e006500720065002e>
/POL <FEFF0055007300740061007700690065006e0069006100200064006f002000740077006f0072007a0065006e0069006100200064006f006b0075006d0065006e007400f300770020005000440046002000700072007a0065007a006e00610063007a006f006e00790063006800200064006f002000770079006400720075006b00f30077002000770020007700790073006f006b00690065006a0020006a0061006b006f015b00630069002e002000200044006f006b0075006d0065006e0074007900200050004400460020006d006f017c006e00610020006f007400770069006500720061010700200077002000700072006f006700720061006d006900650020004100630072006f00620061007400200069002000410064006f00620065002000520065006100640065007200200035002e0030002000690020006e006f00770073007a0079006d002e>
/PTB <FEFF005500740069006c0069007a006500200065007300730061007300200063006f006e00660069006700750072006100e700f50065007300200064006500200066006f0072006d00610020006100200063007200690061007200200064006f00630075006d0065006e0074006f0073002000410064006f0062006500200050004400460020006d00610069007300200061006400650071007500610064006f00730020007000610072006100200070007200e9002d0069006d0070007200650073007300f50065007300200064006500200061006c007400610020007100750061006c00690064006100640065002e0020004f007300200064006f00630075006d0065006e0074006f00730020005000440046002000630072006900610064006f007300200070006f00640065006d0020007300650072002000610062006500720074006f007300200063006f006d0020006f0020004100630072006f006200610074002000650020006f002000410064006f00620065002000520065006100640065007200200035002e0030002000650020007600650072007300f50065007300200070006f00730074006500720069006f007200650073002e>
/RUM <FEFF005500740069006c0069007a00610163006900200061006300650073007400650020007300650074010300720069002000700065006e007400720075002000610020006300720065006100200064006f00630075006d0065006e00740065002000410064006f006200650020005000440046002000610064006500630076006100740065002000700065006e0074007200750020007400690070010300720069007200650061002000700072006500700072006500730073002000640065002000630061006c006900740061007400650020007300750070006500720069006f006100720103002e002000200044006f00630075006d0065006e00740065006c00650020005000440046002000630072006500610074006500200070006f00740020006600690020006400650073006300680069007300650020006300750020004100630072006f006200610074002c002000410064006f00620065002000520065006100640065007200200035002e00300020015f00690020007600650072007300690075006e0069006c006500200075006c0074006500720069006f006100720065002e>
/RUS <FEFF04180441043f043e043b044c04370443043904420435002004340430043d043d044b04350020043d0430044104420440043e0439043a043800200434043b044f00200441043e043704340430043d0438044f00200434043e043a0443043c0435043d0442043e0432002000410064006f006200650020005000440046002c0020043c0430043a04410438043c0430043b044c043d043e0020043f043e04340445043e0434044f04490438044500200434043b044f00200432044b0441043e043a043e043a0430044704350441044204320435043d043d043e0433043e00200434043e043f0435044704300442043d043e0433043e00200432044b0432043e04340430002e002000200421043e043704340430043d043d044b04350020005000440046002d0434043e043a0443043c0435043d0442044b0020043c043e0436043d043e0020043e0442043a0440044b043204300442044c002004410020043f043e043c043e0449044c044e0020004100630072006f00620061007400200438002000410064006f00620065002000520065006100640065007200200035002e00300020043800200431043e043b043504350020043f043e04370434043d043804450020043204350440044104380439002e>
/SKY <FEFF0054006900650074006f0020006e006100730074006100760065006e0069006100200070006f0075017e0069007400650020006e00610020007600790074007600e100720061006e0069006500200064006f006b0075006d0065006e0074006f0076002000410064006f006200650020005000440046002c0020006b0074006f007200e90020007300610020006e0061006a006c0065007001610069006500200068006f0064006900610020006e00610020006b00760061006c00690074006e00fa00200074006c0061010d00200061002000700072006500700072006500730073002e00200056007900740076006f00720065006e00e900200064006f006b0075006d0065006e007400790020005000440046002000620075006400650020006d006f017e006e00e90020006f00740076006f00720069016500200076002000700072006f006700720061006d006f006300680020004100630072006f00620061007400200061002000410064006f00620065002000520065006100640065007200200035002e0030002000610020006e006f0076016100ed00630068002e>
/SLV <FEFF005400650020006e006100730074006100760069007400760065002000750070006f0072006100620069007400650020007a00610020007500730074007600610072006a0061006e006a006500200064006f006b0075006d0065006e0074006f0076002000410064006f006200650020005000440046002c0020006b006900200073006f0020006e0061006a007000720069006d00650072006e0065006a016100690020007a00610020006b0061006b006f0076006f00730074006e006f0020007400690073006b0061006e006a00650020007300200070007200690070007200610076006f0020006e00610020007400690073006b002e00200020005500730074007600610072006a0065006e006500200064006f006b0075006d0065006e0074006500200050004400460020006a00650020006d006f0067006f010d00650020006f0064007000720065007400690020007a0020004100630072006f00620061007400200069006e002000410064006f00620065002000520065006100640065007200200035002e003000200069006e0020006e006f00760065006a01610069006d002e>
/SUO <FEFF004b00e40079007400e40020006e00e40069007400e4002000610073006500740075006b007300690061002c0020006b0075006e0020006c0075006f00740020006c00e400680069006e006e00e4002000760061006100740069007600610061006e0020007000610069006e006100740075006b00730065006e002000760061006c006d0069007300740065006c00750074007900f6006800f6006e00200073006f00700069007600690061002000410064006f0062006500200050004400460020002d0064006f006b0075006d0065006e007400740065006a0061002e0020004c0075006f0064007500740020005000440046002d0064006f006b0075006d0065006e00740069007400200076006f0069006400610061006e0020006100760061007400610020004100630072006f0062006100740069006c006c00610020006a0061002000410064006f00620065002000520065006100640065007200200035002e0030003a006c006c00610020006a006100200075007500640065006d006d0069006c006c0061002e>
/SVE <FEFF0041006e007600e4006e00640020006400650020006800e4007200200069006e0073007400e4006c006c006e0069006e006700610072006e00610020006f006d002000640075002000760069006c006c00200073006b006100700061002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e007400200073006f006d002000e400720020006c00e4006d0070006c0069006700610020006600f60072002000700072006500700072006500730073002d007500740073006b00720069006600740020006d006500640020006800f600670020006b00760061006c0069007400650074002e002000200053006b006100700061006400650020005000440046002d0064006f006b0075006d0065006e00740020006b0061006e002000f600700070006e00610073002000690020004100630072006f0062006100740020006f00630068002000410064006f00620065002000520065006100640065007200200035002e00300020006f00630068002000730065006e006100720065002e>
/TUR <FEFF005900fc006b00730065006b0020006b0061006c006900740065006c0069002000f6006e002000790061007a006401310072006d00610020006200610073006b013100730131006e006100200065006e0020006900790069002000750079006100620069006c006500630065006b002000410064006f006200650020005000440046002000620065006c00670065006c0065007200690020006f006c0075015f007400750072006d0061006b0020006900e70069006e00200062007500200061007900610072006c0061007201310020006b0075006c006c0061006e0131006e002e00200020004f006c0075015f0074007500720075006c0061006e0020005000440046002000620065006c00670065006c0065007200690020004100630072006f006200610074002000760065002000410064006f00620065002000520065006100640065007200200035002e003000200076006500200073006f006e0072006100730131006e00640061006b00690020007300fc007200fc006d006c00650072006c00650020006100e70131006c006100620069006c00690072002e>
/UKR <FEFF04120438043a043e0440043804410442043e043204430439044204350020044604560020043f043004400430043c043504420440043800200434043b044f0020044104420432043e04400435043d043d044f00200434043e043a0443043c0435043d044204560432002000410064006f006200650020005000440046002c0020044f043a04560020043d04300439043a04400430044904350020043f045604340445043e0434044f0442044c00200434043b044f0020043204380441043e043a043e044f043a04560441043d043e0433043e0020043f0435044004350434043404400443043a043e0432043e0433043e0020043404400443043a0443002e00200020042104420432043e04400435043d045600200434043e043a0443043c0435043d0442043800200050004400460020043c043e0436043d04300020043204560434043a0440043804420438002004430020004100630072006f006200610074002004420430002000410064006f00620065002000520065006100640065007200200035002e0030002004300431043e0020043f04560437043d04560448043e04570020043204350440044104560457002e>
/ENU (Use these settings to create Adobe PDF documents best suited for high-quality prepress printing. Created PDF documents can be opened with Acrobat and Adobe Reader 5.0 and later.)
>>
/Namespace [
(Adobe)
(Common)
(1.0)
]
/OtherNamespaces [
<<
/AsReaderSpreads false
/CropImagesToFrames true
/ErrorControl /WarnAndContinue
/FlattenerIgnoreSpreadOverrides false
/IncludeGuidesGrids false
/IncludeNonPrinting false
/IncludeSlug false
/Namespace [
(Adobe)
(InDesign)
(4.0)
]
/OmitPlacedBitmaps false
/OmitPlacedEPS false
/OmitPlacedPDF false
/SimulateOverprint /Legacy
>>
<<
/AddBleedMarks false
/AddColorBars false
/AddCropMarks false
/AddPageInfo false
/AddRegMarks false
/ConvertColors /ConvertToCMYK
/DestinationProfileName ()
/DestinationProfileSelector /DocumentCMYK
/Downsample16BitImages true
/FlattenerPreset <<
/PresetSelector /MediumResolution
>>
/FormElements false
/GenerateStructure false
/IncludeBookmarks false
/IncludeHyperlinks false
/IncludeInteractive false
/IncludeLayers false
/IncludeProfiles false
/MultimediaHandling /UseObjectSettings
/Namespace [
(Adobe)
(CreativeSuite)
(2.0)
]
/PDFXOutputIntentProfileSelector /DocumentCMYK
/PreserveEditing true
/UntaggedCMYKHandling /LeaveUntagged
/UntaggedRGBHandling /UseDocumentProfile
/UseDocumentBleed false
>>
]
>> setdistillerparams
<<
/HWResolution [2400 2400]
/PageSize [612.000 792.000]
>> setpagedevice
|