Использование композиций моделей Маркова для определения функциональных участков генов
Розглянуто застосування композицій алгоритмів з розділенням зон компетентності для підвищення якості класифікації фрагментів генів за допомогою моделей, що використовують ланцюги Маркова. Algorithmic compositions in the form of expert mixtures with exclusive competence zones are considered in order...
Saved in:
| Published in: | Кибернетика и системный анализ |
|---|---|
| Date: | 2013 |
| Main Authors: | , |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2013
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/86271 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Использование композиций моделей Маркова для определения функциональных участков генов / А.М. Гупал, А.В. Островский // Кибернетика и системный анализ. — 2013. — Т. 49, № 5. — С. 61-68. — Бібліогр.: 7 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1860254560217464832 |
|---|---|
| author | Гупал, А.М. Островский, А.В. |
| author_facet | Гупал, А.М. Островский, А.В. |
| citation_txt | Использование композиций моделей Маркова для определения функциональных участков генов / А.М. Гупал, А.В. Островский // Кибернетика и системный анализ. — 2013. — Т. 49, № 5. — С. 61-68. — Бібліогр.: 7 назв. — рос. |
| collection | DSpace DC |
| container_title | Кибернетика и системный анализ |
| description | Розглянуто застосування композицій алгоритмів з розділенням зон компетентності для підвищення якості класифікації фрагментів генів за допомогою моделей, що використовують ланцюги Маркова.
Algorithmic compositions in the form of expert mixtures with exclusive competence zones are considered in order to increase the quality of classification for gene fragments with the help of models based on Markov chains.
|
| first_indexed | 2025-12-07T18:47:20Z |
| format | Article |
| fulltext |
ÓÄÊ 519.217.2
À.Ì. ÃÓÏÀË, À.Â. ÎÑÒÐÎÂÑÊÈÉ
ÈÑÏÎËÜÇÎÂÀÍÈÅ ÊÎÌÏÎÇÈÖÈÉ ÌÎÄÅËÅÉ ÌÀÐÊÎÂÀ
ÄËß ÎÏÐÅÄÅËÅÍÈß ÔÓÍÊÖÈÎÍÀËÜÍÛÕ Ó×ÀÑÒÊΠÃÅÍÎÂ
Êëþ÷åâûå ñëîâà: ìîäåëü Ìàðêîâà, ñêðûòûå ïåðåìåííûå, ýêçîíû, èíòðîíû,
ïåðåõîäíûå âåðîÿòíîñòè.
ÂÂÅÄÅÍÈÅ
Îïðåäåëåíèå âíóòðåííåé ñòðóêòóðû ïîñëåäîâàòåëüíîñòåé íóêëåîòèäîâ èç ÄÍÊ,
ñîñòàâëÿþùèõ ãåíîì ÷åëîâåêà è äðóãèõ áèîëîãè÷åñêèõ îðãàíèçìîâ, ïðåäñòàâ-
ëÿåò çíà÷èòåëüíûé òåîðåòè÷åñêèé è ïðèêëàäíîé èíòåðåñ äëÿ ìíîãèõ îáëàñòåé
íàóêè. Îäíîé èç âåñîìûõ ïîäçàäà÷ ïðè îïðåäåëåíèè ñòðóêòóðû ãåíîìà ÿâëÿåòñÿ
ðàñïîçíàâàíèå ýêçîíîâ (ó÷àñòêîâ ÄÍÊ, êîòîðûå êîäèðóþò áåëêè) è èíòðîíîâ
(íåêîäèðóþùèõ ó÷àñòêîâ, ðàñïîëîæåííûõ ìåæäó ýêçîíàìè).  íàñòîÿùåå âðåìÿ
íàèáîëåå ðàñïðîñòðàíåííûé ñïîñîá ðåøåíèÿ ýòîé çàäà÷è — èñïîëüçîâàíèå îáîá-
ùåííûõ ìîäåëåé Ìàðêîâà ñî ñêðûòûìè ïàðàìåòðàìè (generalized hidden Markov
models) [1, 2].
Áîëåå ïðîñòîé ïîäõîä, èñïîëüçóþùèé ìîäåëè íà îñíîâå îáû÷íûõ öåïåé
Ìàðêîâà ñî ñêðûòûìè ïåðåìåííûìè, ðàññìîòðåí â [3]. Òàêîé ïîäõîä ïîçâîëÿåò
ñ òåîðåòè÷åñêîé òî÷êè çðåíèÿ îáîñíîâàòü íåêîòîðûå ýìïèðè÷åñêèå çàêîíîìåð-
íîñòè, êîòîðûå â äðóãèõ àëãîðèòìàõ ïðèíèìàþòñÿ a priori (íàïðèìåð, ñïåöèôè÷åñ-
êèé âèä ïåðåõîäíûõ ó÷àñòêîâ ìåæäó ýêçîíàìè è èíòðîíàìè). Êàê ïîêàçàíî â [3],
ïîëó÷åííóþ ìîäåëü ìîæíî èñïîëüçîâàòü äëÿ ýôôåêòèâíîãî ðàñïîçíàâàíèÿ ó÷àñ-
òêîâ ãåíîâ â îðãàíèçìàõ ñ îòíîñèòåëüíî ïðîñòî óñòðîåííûì ãåíîìîì, íàïðèìåð,
â áîëüøèíñòâå ðàñòåíèé èëè íàñåêîìûõ. Â òî æå âðåìÿ ïðè ïîïûòêå ïðèìåíèòü
ìîäåëü äëÿ áîëåå ðàçâèòûõ âèäîâ (ìëåêîïèòàþùèõ èëè ïòèö) êà÷åñòâî îïðåäåëå-
íèÿ ýêçîíîâ è èíòðîíîâ ñíèæàåòñÿ ïî ñðàâíåíèþ ñ èçâåñòíûìè àëãîðèòìàìè.
Äëÿ ïîâûøåíèÿ êà÷åñòâà êëàññèôèêàöèè ïðåäëàãàåòñÿ èñïîëüçîâàòü êîìïîçèöèè
àëãîðèòìîâ íà îñíîâå ìîäåëåé Ìàðêîâà.
 ïåðâîì ðàçäåëå íàñòîÿùåé ñòàòüè ñôîðìóëèðîâàíà çàäà÷à ðàñïîçíàâàíèÿ
ôóíêöèîíàëüíûõ ó÷àñòêîâ ãåíîâ è îïèñàíà â îáùèõ ÷åðòàõ ìîäåëü íà îñíîâå
êîìïîçèöèè àëãîðèòìîâ, ïðåäëàãàåìàÿ äëÿ åå ðåøåíèÿ. Âî âòîðîì ðàçäåëå âûâå-
äåí êðèòåðèé îïòèìàëüíîñòè êîìïîçèöèè, êîòîðûé â ñëåäóþùåì ðàçäåëå ñâÿçàí
ñ ïîíÿòèåì èíôîðìàöèîííîé ýíòðîïèè. Ïîëó÷åííûå òåîðåòè÷åñêèå ðåçóëüòàòû
ïîäûòîæåíû â ÷åòâåðòîì ðàçäåëå, ãäå ïðèâåäåí àëãîðèòì ïîñòðîåíèÿ îïòèìàëü-
íîé êîìïîçèöèè.  ïÿòîì ðàçäåëå ñòàòüè îïèñàí âû÷èñëèòåëüíûé ýêñïåðèìåíò,
öåëü êîòîðîãî — âûÿñíèòü ýôôåêòèâíîñòü íîâîãî ïîäõîäà, è ïðîàíàëèçèðîâàíû
åãî ðåçóëüòàòû.  çàêëþ÷åíèè ïðèâåäåíû íàïðàâëåíèÿ äëÿ âîçìîæíûõ
äàëüíåéøèõ èññëåäîâàíèé.
1. ÏÎÑÒÀÍÎÂÊÀ ÇÀÄÀ×È
Êàê èçâåñòíî èç áèîõèìèè, áåëêè âñåõ æèâûõ îðãàíèçìîâ êîäèðóþòñÿ ãåíà-
ìè — ïîñëåäîâàòåëüíîñòÿìè íóêëåîòèäîâ: àäåíèíà (A), öèòîçèíà ( )C , ãóàíè-
íà ( )G è òèìèíà ( )T . Ó÷àñòîê ãåíà ìåæäó íà÷àëîì ïåðâîãî è êîíöîì ïîñëåä-
íåãî ýêçîíà, ïðåäñòàâëÿþùèé íàèáîëüøèé èíòåðåñ, ñîñòîèò èç ÷åðåäóþùèõñÿ
ìåæäó ñîáîé ýêçîíîâ è èíòðîíîâ. Òàêèì îáðàçîì, çàäà÷à ñâîäèòñÿ ê îïðåäåëå-
ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 61
© À.Ì. Ãóïàë, À.Â. Îñòðîâñêèé, 2013
íèþ äëÿ êàæäîãî íóêëåîòèäà åãî ïðèíàäëåæíîñòè ê ýêçîíó èëè èíòðîíó. Áî-
ëåå ôîðìàëüíî, òðåáóåòñÿ ïî èçâåñòíîé ïîñëåäîâàòåëüíîñòè S O� *, ãäå
O � {A C G T}, , , — ìíîæåñòâî íàáëþäàåìûõ ñîñòîÿíèé, âîññòàíîâèòü ïîñëåäî-
âàòåëüíîñòü ñêðûòûõ ñîñòîÿíèé � � �S Q a c g t* *, , , , , , ,{A C G T } , ãäå ïðîïèñíû-
ìè áóêâàìè îáîçíà÷åíû íóêëåîòèäû, ïðèíàäëåæàùèå ýêçîíàì, à ñòðî÷íûìè —
èíòðîíû. Ïðè ýòîì ñêðûòûå ñîñòîÿíèÿ äîëæíû ñîîòâåòñòâîâàòü íàáëþäàåìûì,
ò.å. äëÿ àëãîðèòìà ðàñïîçíàâàíèÿ A : * *O Q� íåîáõîäèìî âûïîëíåíèå óñëî-
âèÿ � �S O * Pr ( ( ))A S S� , ãäå Pr : * *Q O� — ïðîåêöèÿ ñêðûòûõ ñîñòîÿíèé
Pr A C G T A C G T A C G T: , , , , , , , , , , , , , ,� � � a c g t . Êðîìå òîãî, àëãîðèòì äîëæåí
èìåòü ñâîéñòâî îïòèìàëüíîñòè, ò.å. ìàêñèìèçèðîâàòü óñëîâíóþ âåðîÿòíîñòü
öåïî÷êè ñêðûòûõ ñîñòîÿíèé
A( ) max ( | ) max( ( )[ ( ) ])S P S S P S S S
S S
� � � � � �arg arg Pr
' '
. (1)
 ðàáîòå [3] ðàññìîòðåíû ìîäåëè íà îñíîâå öåïåé Ìàðêîâà ïðîèçâîëüíîãî
m-ãî ïîðÿäêà, äëÿ êîòîðûõ âåðîÿòíîñòü P S( )� âû÷èñëÿåòñÿ ñëåäóþùèì îáðàçîì:
P S s s p s s s p s s sm m m n n m n( ) ( ) ( | ) ( |� � � � � � �
� � �� �� 1 1 1� � � � �1 ) , (2)
ãäå �( )x îáîçíà÷åíà âåðîÿòíîñòü ïîÿâëåíèÿ ïîäñòðîêè x â íà÷àëå ñòðîêè �S ,
à p y x( | ) — âåðîÿòíîñòü ïîÿâëåíèÿ â íåé ñîñòîÿíèÿ y ïðè èçâåñòíîé ïîñëåäî-
âàòåëüíîñòè ïðåäûäóùèõ ñîñòîÿíèé x. Îöåíêè íà÷àëüíûõ è ïåðåõîäíûõ âåðî-
ÿòíîñòåé ìîäåëè âçÿòû èç îáó÷àþùåé âûáîðêè T S Qi� �
{ } * , ñîäåðæàùåé
ãåíû ñ èçâåñòíûì ðàçáèåíèåì íà ýêçîíû è èíòðîíû
� ( ) ( , ) / | |� x N T x Tst� , � ( | ) ( , ) / ( , )p x y N T yx N T y� . (3)
Çäåñü N T xst ( , ) — êîëè÷åñòâî ïîñëåäîâàòåëüíîñòåé èç âûáîðêè, êîòîðûå íà÷è-
íàþòñÿ x, à N T x( , ) — ÷èñëî âõîæäåíèé ñòðîêè x âî âñå ïîñëåäîâàòåëüíîñòè T .
Àëãîðèòì âèäà (1), êîòîðûé èñïîëüçóåò äëÿ ïîäñ÷åòà âåðîÿòíîñòåé âûðàæåíèÿ
(2), (3) è ïîëó÷åí ïðè îáó÷åíèè íà âûáîðêå T , äàëåå áóäåì îáîçíà÷àòü A [ ]T .
Èññëåäóåì êîìïîçèöèþ àëãîðèòìîâ
A
A
A
A
( )
( ), ,
( ), ,
( ), ,
S
S S G
S S G
S S Gl l
�
�
�
�
�
�
�
�
�
�
�
1 1
2 2
�
(4)
ãäå îáëàñòè G G Gl1 2, , ,� îáðàçóþò ïîêðûòèå ìíîæåñòâà O * , ò.å.
i
iG O� � * ,
G Gi j� � {} ïðè i j� .
Ôàêòè÷åñêè ïîäîáíûå êîìïîçèöèè ÿâëÿþòñÿ ÷àñòíûì ñëó÷àåì ñìåñåé àëãî-
ðèòìîâ A A( ) ( ) ( )S C g S Si i
i
�
�
�
��
�
�
��� , ãäå g Oi : [ , ]* � 0 1 — âåñîâûå ôóíêöèè, C —
ðåøàþùåå ïðàâèëî.  äàííîì ñëó÷àå êàæäûé ñîñòàâëÿþùèé àëãîðèòì ýêñêëþ-
çèâíî êîìïåòåíòåí â ñîîòâåòñòâóþùåé åìó îáëàñòè g S S Gi i( ) [ ]� � . Èñïîëüçî-
âàíèå òàêèõ âåñîâûõ ôóíêöèé ïîçâîëÿåò íå îïðåäåëÿòü ïðîñòðàíñòâî äëÿ ïðîâå-
äåíèÿ ïðîìåæóòî÷íûõ àëãåáðàè÷åñêèõ îïåðàöèé ñëîæåíèÿ è óìíîæåíèÿ, à òàêæå
äåëàåò âîçìîæíûì èñïîëüçîâàíèå òðèâèàëüíîãî ðåøàþùåãî ïðàâèëà C S S( ) � .
Ïîñòðîåíèå êîìïîçèöèè âèäà (4), â êîòîðîé áàçîâûå àëãîðèòìû èñïîëüçóþò
öåïè Ìàðêîâà, íà îñíîâå îáó÷àþùåé âûáîðêè T , êàê è äëÿ ñìåñåé àëãîðèòìîâ
â îáùåì ñëó÷àå, âêëþ÷àåò ñëåäóþùèå øàãè.
62 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5
Øàã 1. Îïðåäåëåíèå êàêèì-ëèáî ñïîñîáîì îáëàñòåé G G Gl1 2, , ,� .
Øàã 2. Îáó÷åíèå ñîñòàâëÿþùèõ êîìïîçèöèþ àëãîðèòìîâ íà ñîîòâåòñòâóþ-
ùèõ èì ÷àñòÿõ âûáîðêè A Ak kT� [ ], ãäå T S T S Gk i� � � � �{ Pr }| ( ) .
Âòîðîé øàã ðàññìîòðåí â [3]. Òàêèì îáðàçîì, îñíîâíîé èíòåðåñ ïðåäñòàâëÿ-
åò íàõîæäåíèå îïòèìàëüíîãî ïîêðûòèÿ ìíîæåñòâà O * , äëÿ ÷åãî ïðåäëàãàåòñÿ èñ-
ïîëüçîâàòü âåðîÿòíîñòíûé ïîäõîä.
2. ÊÐÈÒÅÐÈÉ ÎÏÒÈÌÀËÜÍÎÃÎ ÐÀÇÁÈÅÍÈß
Îáîçíà÷èì P T Tk k( | [ ])A , k l�1, ,� , ñîâìåñòíóþ âåðîÿòíîñòü ïîðîæäåíèÿ
ñòðîê èç ìíîæåñòâà Tk ìîäåëüþ, îáó÷åííîé íà ýòîé ÷àñòè âûáîðêè. Ñîãëàñ-
íî (2), (3)
P T T s s p s sk k
S T
m
i m
S
i i
k
( | [ ]) � ( ) � ( |
| |
A � � � � �
� � �
�� �
'
'
� 1
1
� m is� �
�
�
�
�
�
!
!
�1 )
èëè ïîñëå ïåðåõîäà ê ëîãàðèôìàì
log ( | [ ]) log
( , )
| |
P T T
N T s s
T
k k
S T
st k m
k S Tk k
A �
� �
�
� �
� �
' '
1 �
i m
S
k i m i
k i m i
N T s s
N T s s� �
�
� �
�
� �
� �
�
1 1
| |
log
( , )
( , )
'
�
�
� � � � �
�
� log ( , ) | | log | |N T s s T Tst k m k k
S Tk
1 �
'
� � � � � �� � �
� �
�log ( , ) log ( , )
| |
N T s s N T s sk i m i k i m i
i m
S
� � 1
1
'
S Ti m
S
S T kk '
'
' �� ��
���
1
| |
.
Ñóììèðîâàíèå âî âñåõ ïîëó÷èâøèõñÿ ñóììàõ âûïîëíÿåòñÿ ïî êîðîòêèì
ôðàãìåíòàì ñòðîê, âõîäÿùèõ âî ìíîæåñòâî Tk : ïðåôèêñàì äëèíû m â ïåðâîé
ñóììå, ïîäñòðîêàì äëèíû m è m�1— âî âòîðîé è òðåòüåé ñîîòâåòñòâåííî. Òàêèì
îáðàçîì, âûðàæåíèå äëÿ âåðîÿòíîñòè ìîæíî óïðîñòèòü, åñëè ïåðåéòè ê íåïîñðåä-
ñòâåííîìó ñóììèðîâàíèþ ïî ñòðîêàì ôèêñèðîâàííîé äëèíû
log ( | [ ]) ( , ) log ( , ) | | log | |
|
P T T N T y N T y T Tk k st k st k k kA � � �
y m| �
�
� �
�� �
�� N T x N T x N T y N T yk k k k
y mx m
( , ) log ( , ) ( , ) log ( , )
| || | 1
. (5)
Ïðè ýòîì ïîäðàçóìåâàåòñÿ, ÷òî ïðè x � 0 âûïîëíÿåòñÿ òîæäåñòâî x xlog � 0 .
Ëîãàðèôì âåðîÿòíîñòè ãåíåðàöèè îáó÷àþùåé âûáîðêè íàáîðîì ìîäåëåé,
èñïîëüçóþùèõñÿ â àëãîðèòìàõ A A[ ], , [ ]T Tl1 � , â ñèëó íåïåðåñåêàåìîñòè ìíî-
æåñòâ T Tl1, ,� ðàâåí
log ( | [ ], , [ ]) log ( | [ ])P T T T P T Tl k k
k
l
A A A1
1
� �
�
� . (6)
Íåïîñðåäñòâåííàÿ ìàêñèìèçàöèÿ (6) ïî âîçìîæíûì ðàçáèåíèÿì G Gl1, ,�
è ñîîòâåòñòâóþùèì èì T Tl1, ,� ïðåäñòàâëÿåò çíà÷èòåëüíóþ ñëîæíîñòü. Äëÿ îá-
ëåã÷åíèÿ ýòîé çàäà÷è ïîñòðîèì ðàçáèåíèå â âèäå äåðåâà, ò.å. âíà÷àëå íàéäåì
îïòèìàëüíîå ðàçáèåíèå ìíîæåñòâà íàáëþäàåìûõ ñòðîê O * íà äâà ïîäìíîæåñ-
òâà, çàòåì îäíîãî èç ïîëó÷åííûõ ìíîæåñòâ — åùå íà äâà ïîäìíîæåñòâà, è ò.ä.
 êà÷åñòâå ìåðû ðàçäåëèòåëüíîé ñïîñîáíîñòè ðàçáèåíèÿ ìíîæåñòâà Tk íà ÷àñòè
T
k
� è Tk
� ïî àíàëîãèè ñ (6) èñïîëüçóåì ôóíêöèþ
" ( , , ) log ( | [ ]) log ( | [ ]) loT T T P T T P T Tk k k k k k k
� � � � � �� � �A A g ( | [ ])P T Tk kA . (7)
ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 63
Íåñëîæíî çàìåòèòü, ÷òî, ñêëàäûâàÿ âûðàæåíèÿ (7) äëÿ ðàçäåëÿåìîãî ìíîæåñòâà
íà êàæäîì èç l�1 ýòàïîâ îïèñàííîãî âûøå àëãîðèòìà, ïîëó÷èì (6) ñ òî÷íîñ-
òüþ äî íå çàâèñÿùåãî îò ïîëó÷åííîãî ðàçáèåíèÿ ñëàãàåìîãî log ( | [ ])P T TA .
Òàêèì îáðàçîì, àëãîðèòì ïîñòðîåíèÿ äåðåâà ÿâëÿåòñÿ ïîýòàïíûì æàäíûì ñïî-
ñîáîì ìàêñèìèçàöèè âåðîÿòíîñòè (6).
3. ÑÂßÇÜ Ñ ÈÍÔÎÐÌÀÖÈÎÍÍÎÉ ÝÍÒÐÎÏÈÅÉ
Âûðàæåíèå (5) ñîäåðæèò ÷ëåíû, íàïîìèíàþùèå èíôîðìàöèîííóþ ýíòðîïèþ
äëÿ ýìïèðè÷åñêèõ âåðîÿòíîñòíûõ ðàñïðåäåëåíèé �� è �p , ïîëó÷åííûõ íà îñíî-
âàíèè âûáîðêè Tk . Äåéñòâèòåëüíî, ýíòðîïèÿ äëÿ íà÷àëüíîãî ðàñïðåäåëåíèÿ
èìååò âèä
H y y
T
N T y N T y
k
st k st k( � ) � ( ) log � ( )
| |
( , )(log ( , )� � �� � � � �
1
log | | )
| || |
Tk
y my m ��
�� �
� �
�
�log | |
| |
( , ) log ( , )
| |
T
T
N T y N T yk
k
st k st k
y m
1
. (8)
Ýíòðîïèþ äëÿ óñëîâíîãî ðàñïðåäåëåíèÿ �p ìîæíî íàéòè ñëåäóþùèì
îáðàçîì:
H p H x y H x y H y H x H y( � ) ( � | � ) ( �, � ) ( � ) ( � ) ( � )� � � � � , (9)
H y
N T y
N T
N T y
N T
k
m ky m
k
m k
( � )
( , )
( )
log
( , )
( )| |
� � �
�
�
� �
�
�log ( )
( )
( , ) log ( , )
| |
N T
N T
N T y N T ym k
m k
k k
y m
1
, (10)
ãäå �x — ýìïèðè÷åñêîå ðàñïðåäåëåíèå äëÿ ïîñëåäîâàòåëüíîñòåé èç m�1 ñêðû-
òûõ ñîñòîÿíèé; �y — àíàëîãè÷íîå ðàñïðåäåëåíèå äëÿ ïîñëåäîâàòåëüíîñòåé äëè-
íû m ; N Tm k( ) — îáùåå ÷èñëî ïîñëåäîâàòåëüíîñòåé äëèíû m â âûáîðêå. Ïîä-
ñòàâèâ (10) è àíàëîãè÷íóþ åé ôîðìóëó äëÿ H x( � ) â (9) è âîñïîëüçîâàâøèñü
òåì, ÷òî
N T N T N T Sm k m k k
S Tk
( ) ( ) ( ) | |# # � ��
�
�1 1
'
,
èìååì
H p
N Tk
( � )
( )
# �
1
1
�
� � �
� �N T x N T x N T y N T yk k
x m
k k
y m
( , ) log ( , ) ( , ) log ( , )
| | | |1
�
�
�
�
�
�
�
�
. (11)
Ñðàâíèâ (8) è (11) ñ (5), ïîëó÷èì
log ( | [ ]) ( � ) | | ( � ) | |P T T H T H p Sk k k
S Tk
A # � � �
�
��
'
.
Òàêèì îáðàçîì, íàõîæäåíèå ìàêñèìóìà âûðàæåíèÿ (7) ïðèáëèçèòåëüíî ñîîòâåò-
ñòâóåò ìèíèìèçàöèè ýíòðîïèè ýìïèðè÷åñêè ïîëó÷àåìûõ ðàñïðåäåëåíèé íà÷àëü-
íûõ è ïåðåõîäíûõ âåðîÿòíîñòåé äëÿ ÷àñòåé âûáîðêè ïî ñðàâíåíèþ ñ ðàñïðå-
äåëåíèÿìè â öåëîì. Ýòî ñ òåîðåòè÷åñêîé òî÷êè çðåíèÿ ÿâëÿåòñÿ äîïîëíèòåëü-
íûì îáîñíîâàíèåì âûáîðà ìåðû ðàçäåëèòåëüíîé ñïîñîáíîñòè (7).
4. ÍÀÕÎÆÄÅÍÈÅ ÎÏÒÈÌÀËÜÍÛÕ ÐÀÇÁÈÅÍÈÉ
Ðàññìîòðèì áèíàðíûå ðàçáèåíèÿ èç (7) íà îñíîâå ïðåäèêàòîâ I O: ,* � { }0 1 ,
â êîòîðûõ èñïîëüçóþòñÿ êîíöåíòðàöèè îïðåäåëåííûõ íóêëåîòèäîâ â ïîñëåäî-
âàòåëüíîñòè ñêðûòûõ ñîñòîÿíèé
64 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5
I S n S xX
x X
, ( ) ( , )� �� $
�
�
�
�
!
�
� , X O
, � �( , )0 1 , n S x
N S x
S
( , )
( , )
| |
� . (12)
Ïðåèìóùåñòâî ïîäîáíûõ ïðåäèêàòîâ çàêëþ÷àåòñÿ â ëåãêîñòè èõ âû÷èñëåíèÿ è
ïðîñòîòå èíòåðïðåòàöèè. Äëÿ òàêîãî ïðåäèêàòà ìåðà êà÷åñòâà ðàçäåëåíèÿ (7)
ïðèìåò âèä
" "( , ) ( , | ( ) , | ( ) )T I T S T I S S T I Sk k k k� � � � � � % �{ } { } .
Èç âñåõ 2 164 � âîçìîæíûõ ïîäìíîæåñòâ ìíîæåñòâà íóêëåîòèäîâ èìååò
ñìûñë ðàññìàòðèâàòü ñåìü: X � �X {{A} {C} {G} {T} {A C} {A G} {A T}}, , , , , , , , , .
 ñàìîì äåëå, ïîäìíîæåñòâà {} è {A C G T}, , , äàþò òðèâèàëüíûé ðåçóëüòàò.  ñèëó
òîæäåñòâà � �S O * n S x
x O
( , ) �
�
� 1èìååò ìåñòî I IX O X, \ ,~� �1� , ñëåäîâàòåëüíî, íå
èìååò ñìûñëà èñïîëüçîâàòü è îñòàëüíûå ñåìü ïîäìíîæåñòâ, äîïîëíåíèÿ êîòîðûõ
íàõîäÿòñÿ â X .
Ïðåäèêàò, ðàçáèâàþùèé íàáîð ñòðîê Ts íà äâå ÷àñòè îïòèìàëüíûì îáðàçîì,
áóäåì èñêàòü ñðåäè ïðåäèêàòîâ âñåõ ñåìè òèïîâ (ïî q êàíäèäàòîâ êàæäîãî òèïà),
ãåíåðèðóåìûõ ïðèâåäåííûì äàëåå àëãîðèòìîì.
Àëãîðèòì 1. I � Predicates ( , )T qs .
Äàíî: Íàáîð ïîñëåäîâàòåëüíîñòåé ñêðûòûõ ñîñòîÿíèé Ts, ÷èñëî ïðåäèêàòîâ
êàæäîãî òèïà q.
Íàéòè: Íàáîð ïîòåíöèàëüíî îïòèìàëüíûõ ïðåäèêàòîâ I � �{ }I i i
q
1
7 .
1. I � {};
2. äëÿ âñåõ íàáîðîâ íóêëåîòèäîâ X �X :
3. n n S xX
x X
: ( ( ), )�
�
�
�
�
&
'
(�
� Pr , � �S Ts — ñòàòèñòèêà ïî êîíöåíòðàöèè íóê-
ëåîòèäîâ;
4. Óïîðÿäî÷èòü ýëåìåíòû nX ïî âîçðàñòàíèþ;
5. äëÿ i q�1, ,� :
6. � : [ | | / ( )]� ) �n i T qX s 1 — ïðåäèêàò I X ,� âûïîëíÿåòñÿ äëÿ i q/ ( )�1 -é
÷àñòè âûáîðêè;
7. I I: ,� *{ }I X � .
Ñ ó÷åòîì èçëîæåííîãî âûøå ñõåìà ïîèñêà îïòèìàëüíîãî ðàçáèåíèÿ, îïèñàí-
íàÿ â ðàçä. 2 ñòàòüè, ïðèìåò ñëåäóþùèé âèä.
Àëãîðèòì 2.
Äàíî: Îáó÷àþùàÿ âûáîðêà T ; êîëè÷åñòâî îáëàñòåé l; q .
Íàéòè: Ðàçáèåíèå G Gl1, ,� , àëãîðèòìû A A1, ,� l .
1. T : { }� T — òåêóùåå ðàçáèåíèå îáó÷àþùåé âûáîðêè;
2. G : { }*� O — ðàçáèåíèå ïðîñòðàíñòâà íàáëþäàåìûõ ñòðîê;
3. äëÿ i l� �1 1, ,� :
4. äëÿ k �1, , | |� T :
5. I : ( , )� Predicates T qk ;
6. I T I
k I
k
max : max ( , )�
�
arg
I
" — îïòèìàëüíûé ïðåäèêàò äëÿ òåêóùåé ÷àñòè;
7. r T I
k
k k
: max ( , )
, , | |
max�
�
arg
1 � T
" — ÷àñòü âûáîðêè, êîòîðóþ íàäî ðàçäåëèòü;
8. Âûäåëèòü íîâóþ ÷àñòü îáó÷àþùåé âûáîðêè:
T S T I Si r r� � � � �1: | ( )max{ }; T S T I Sr r r: | ( )max� � � % �{ };
ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 65
9. Àíàëîãè÷íî äëÿ ïðîñòðàíñòâà O * :
G S G I Si r r� � � � �1: { | ( )}max ; G S G I Sr r r: | ( )max� � � % �{ };
10. äëÿ i l�1, ,� :
11. A Ai iT: [ ]�
Çà ñ÷åò âûïîëíåíèÿ âû÷èñëåíèé ìåðû " ( , )T Ik íà øåñòîì øàãå àëãîðèòìà
â íåñêîëüêî ïàðàëëåëüíûõ ïîòîêîâ ìîæíî äîáèòüñÿ ñóùåñòâåííîãî óñêîðåíèÿ
ðàáîòû íà ìíîãîÿäåðíûõ ñèñòåìàõ.
5. ÂÛ×ÈÑËÈÒÅËÜÍÛÉ ÝÊÑÏÅÐÈÌÅÍÒ
Äëÿ îöåíêè ýôôåêòèâíîñòè èñïîëüçîâàíèÿ êîìáèíàöèé àëãîðèòìîâ èç áàíêà
äàííûõ NCBI âçÿëè ãåíîìû øåñòè áèîëîãè÷åñêèõ âèäîâ: Homo sapiens (÷åëî-
âåêà), Gallus gallus (êóðèöû), Suc scrofa (ñâèíüè), Rattus norvegicus (êðûñû),
Mus musculus (ìûøè), Papio anubis (ïàâèàíà). Ïðè ýòîì ðàññìàòðèâàëèñü òîëü-
êî ãåíû ñ ïîëíîñòüþ èçâåñòíîé íóêëåîòèäíîé çàïèñüþ, äëÿ ãåíîâ ÷åëîâåêà
áûëî ââåäåíî âåðõíåå îãðàíè÷åíèå íà äëèíó | |� +S 40000 . Äëÿ îöåíêè êà÷åñ-
òâà èñïîëüçîâàëàñü ïÿòèêðàòíàÿ êðîññ-âàëèäàöèÿ: âûáîðêà ñëó÷àéíûì îáðàçîì
ðàçáèâàëàñü íà ïÿòü ïðèáëèçèòåëüíî ðàâíûõ ÷àñòåé, êàæäàÿ èç êîòîðûõ ïî î÷å-
ðåäè èñïîëüçîâàëàñü â êà÷åñòâå êîíòðîëÿ, à îñòàëüíûå ÷åòûðå ÷àñòè — â êà÷åñ-
òâå îáó÷àþùåé âûáîðêè. Íà îáó÷àþùåé è êîíòðîëüíîé ÷àñòÿõ âûáîðêè çàìå-
ðÿëèñü ìåðû êà÷åñòâà [4]: ÷åòûðå, ñâÿçàííûå ñ îòäåëüíûìè íóêëåîòèäàìè, —
ñïåöèôè÷íîñòü NSp, ÷óâñòâèòåëüíîñòü NSn, êîýôôèöèåíò êîððåëÿöèè CC
è ñðåäíÿÿ óñëîâíàÿ âåðîÿòíîñòü ACP, à òàêæå äâå, ïîêàçûâàþùèå êà÷åñòâî
ðàñïîçíàâàíèÿ ãðàíèö ìåæäó ýêçîíàìè è èíòðîíàìè, — ýêçîííûå ñïåöèôè÷-
íîñòü ESp è ÷óâñòâèòåëüíîñòü ESn.
 õîäå ýêñïåðèìåíòà âûÿñíèëîñü, ÷òî äëÿ ðàçóìíûõ çíà÷åíèé ïîðÿäêà öåïåé
Ìàðêîâà m�{ , , }5 6 7 äåðåâüÿ ðàçáèåíèÿ, ïîñòðîåííûå íà îáó÷àþùåé âûáîðêå,
ïðàêòè÷åñêè íå îòëè÷àþòñÿ îò äåðåâà äëÿ âñåãî íàáîðà ãåíîâ, à òàêæå îäèí îò
äðóãîãî ïðè ðàçíûõ çíà÷åíèÿõ m. Ýòè ñâîéñòâà îáúÿñíÿþòñÿ îòíîñèòåëüíî ïðî-
ñòûì âèäîì ïðåäèêàòîâ (12). Â ñâÿçè ñ ýòèì äëÿ âñåõ òåñòîâ èñïîëüçîâàëèñü ðàç-
áèåíèÿ íà îñíîâå ïîëíûõ ãåíîìîâ, ïîëó÷åííûå äëÿ ïîðÿäêà öåïåé Ìàðêîâà
m � 6. ×òî êàñàåòñÿ äðóãèõ ïàðàìåòðîâ àëãîðèòìà, òî ÷èñëî ïðåäèêàòîâ êàæäîãî
òèïà â àëãîðèòìå 1 ïðèíèìàëîñü ðàâíûì q �10 , à êîëè÷åñòâî àëãîðèòìîâ â êîì-
ïîçèöèè l âàðüèðîâàëîñü îò îäíîãî äî øåñòè.
Ñõåìû äåðåâüåâ äëÿ ãåíîìîâ ÷åëîâåêà è êóðèöû, ïîëó÷åííûå â ðåçóëüòàòå
ðàáîòû àëãîðèòìà 2 ñ îïèñàííûìè âûøå ïàðàìåòðàìè, ïðèâåäåíû íà ðèñ. 1, 2, èç
êîòîðûõ âèäíî, ÷òî áîëüøàÿ ÷àñòü ïðåäèêàòîâ â îïòèìàëüíîé êîìïîçèöèè àëãî-
ðèòìîâ îñíîâàíà íà ñóììàðíîé êîíöåíòðàöèè íóêëåîòèäîâ A è T (èëè, ÷òî òîæå
ñàìîå, C è G). Çíà÷èìîñòü ýòîé êîíöåíòðàöèè îòìå÷åíà â [5, 6].
66 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5
n(A+T)�50,8%
n(A+T)�44,4% n(A+T)�59,6%
n(A+T)�55,3% n(A)�29,8%
1 2
3 4 5 6
,
,
,,
>
$
$
$ $
$
Ðèñ. 1. Äåðåâî, ïîñòðîåííîå äëÿ ãåíîâ ÷åëîâåêà ïðè m � 6
 òàáë. 1, 2 ïðèâåäåíû ðåçóëüòàòû êà÷åñòâà ðàñïîçíàâàíèÿ ýêçîíîâ è èíòðîíîâ
â ãåíîìå ÷åëîâåêà â çàâèñèìîñòè îò êîëè÷åñòâà àëãîðèòìîâ â êîìïîçèöèè ïðè èñ-
ïîëüçîâàíèè öåïåé Ìàðêîâà øåñòîãî è ñåäüìîãî ïîðÿäêà ñîîòâåòñòâåííî. Êàê âèä-
íî, èñïîëüçîâàíèå êîìïîçèöèé ïîçâîëÿåò ñóùåñòâåííî ïîâûñèòü âñå ìåðû êà÷åñòâà
ðàñïîçíàâàíèÿ, ïðåæäå âñåãî íóêëåîòèäíóþ ñïåöèôè÷íîñòü NSp è ýêçîííûå ìåðû
ESp è ESn. Ïîëó÷åííûå äàííûå òàêæå ñâèäåòåëüñòâóþò, ÷òî ïðè ïðåâûøåíèè îïðå-
ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 67
n(A+T)�56,1%
n(A+T)�48,1% n(A+T)�60,2%
n(A+T)�40,7%
5 6
1 2 3 4
,
,
,,
>
$
$
$ $
$
n(A+C)�48,0%
Ðèñ. 2. Äåðåâî, ïîñòðîåííîå äëÿ ãåíîâ êóðèöû ïðè m � 6
Ò à á ë è ö à 1
Ìåðà Âûáîðêà
Ðåçóëüòàòû êëàññèôèêàöèè äëÿ ãåíîìà ÷åëîâåêà ïðè m � 6
ñ ÷èñëîì àëãîðèòìîâ
1 2 3 4 5 6
NSp
îáó÷àþùàÿ 34,39 37,51 39,14 39,02 40,57 41,70
êîíòðîëüíàÿ 34,16 37,02 38,39 38,07 39,38 40,24
NSn
îáó÷àþùàÿ 88,72 91,70 92,24 92,32 92,55 92,77
êîíòðîëüíàÿ 88,22 90,78 90,81 90,49 90,43 90,07
CC
îáó÷àþùàÿ 47,96 52,18 53,95 53,87 55,42 56,53
êîíòðîëüíàÿ 47,55 51,36 52,70 52,27 53,49 54,15
ACP
îáó÷àþùàÿ 75,71 77,80 78,62 78,59 79,29 79,79
êîíòðîëüíàÿ 75,49 77,37 77,97 77,76 78,29 78,56
ESp
îáó÷àþùàÿ 25,70 31,59 33,09 34,45 35,64 36,79
êîíòðîëüíàÿ 24,91 29,92 30,58 31,26 31,92 32,35
ESn
îáó÷àþùàÿ 27,93 39,93 41,78 44,33 45,94 47,12
êîíòðîëüíàÿ 26,93 37,49 38,14 39,56 40,37 40,49
Ò à á ë è ö à 2
Ìåðà Âûáîðêà
Ðåçóëüòàòû êëàññèôèêàöèè äëÿ ãåíîìà ÷åëîâåêà ïðè m � 7
ñ ÷èñëîì àëãîðèòìîâ
1 2 3 4 5 6
NSp
îáó÷àþùàÿ 36,46 43,24 48,76 50,75 57,93 60,64
êîíòðîëüíàÿ 35,58 41,33 45,75 46,72 52,63 54,43
NSn
îáó÷àþùàÿ 91,32 94,52 95,26 95,48 95,75 96,03
êîíòðîëüíàÿ 89,56 91,42 90,57 89,02 87,62 87,53
CC
îáó÷àþùàÿ 51,01 58,62 63,68 65,40 71,10 73,23
êîíòðîëüíàÿ 49,48 55,67 59,17 59,38 63,49 64,71
ACP
îáó÷àþùàÿ 77,25 80,83 83,09 83,85 86,37 87,32
êîíòðîëüíàÿ 76,45 79,32 80,78 80,77 82,49 83,02
ESp
îáó÷àþùàÿ 30,68 40,57 45,21 48,94 53,95 56,36
êîíòðîëüíàÿ 27,64 34,81 37,29 38,87 42,27 43,84
ESn
îáó÷àþùàÿ 35,23 52,16 56,78 61,82 66,43 67,99
êîíòðîëüíàÿ 31,11 43,46 44,93 46,64 48,83 49,71
äåëåííîãî ïðåäåëà êîëè÷åñòâà àëãîðèòìîâ â êîìïîçèöèè îíà ñòàíîâèòñÿ ìåíåå ïðî-
äóêòèâíîé èç-çà óñèëåíèÿ ýôôåêòà ïåðåîáó÷åíèÿ — áàçîâûì àëãîðèòìàì êîìïîçè-
öèè íà÷èíàåò ñîîòâåòñòâîâàòü ñëèøêîì ìàëî ãåíîâ èç îáó÷àþùåé âûáîðêè.  òàáë. 3
ïðåäñòàâëåíû ðåçóëüòàòû ïðèìåíåíèÿ êëàññèôèêàöèè áàçîâîãî àëãîðèòìà è êîìïîçè-
öèè íà êîíòðîëüíîé âûáîðêå ïðè èñïîëüçîâàíèè öåïåé Ìàðêîâà ñåäüìîãî ïîðÿäêà.
Ñðàâíåíèå äàííûõ ïîçâîëÿåò ñäåëàòü âûâîä î òîì, ÷òî ïðèìåíåíèå êîìïîçèöèé äàåò
âîçìîæíîñòü ïîâûñèòü ìåðû êà÷åñòâà ðàñïîçíàâàíèÿ íà 10 15� % .
ÇÀÊËÞ×ÅÍÈÅ
Ðàññìîòðåíà çàäà÷à îïðåäåëåíèÿ ôðàãìåíòîâ ãåíîâ âûñøèõ îðãàíèçìîâ (ìëåêî-
ïèòàþùèõ è ïòèö). Ïðåäëîæåí ìåòîä ðåøåíèÿ ýòîé çàäà÷è íà îñíîâå îïðåäå-
ëåííîãî âèäà êîìïîçèöèé àëãîðèòìîâ, èñïîëüçóþùèõ ìîäåëè Ìàðêîâà ñî ñêðû-
òûìè ñîñòîÿíèÿìè. Èññëåäîâàííûå êîìïîçèöèè ïîçâîëÿþò ñóùåñòâåííî ïîâû-
ñèòü êà÷åñòâî êëàññèôèêàöèè ôðàãìåíòîâ ãåíîâ ïî ñðàâíåíèþ ñ îòäåëüíûìè
àëãîðèòìàìè è äîñòè÷ü óðîâíÿ èçâåñòíûõ àëãîðèòìîâ íà îñíîâå îáîáùåííûõ
ìîäåëåé Ìàðêîâà, ðåøàþùèõ ïîñòàâëåííóþ çàäà÷ó. Ýôôåêòèâíîñòü êîìïîçè-
öèé, òàêèì îáðàçîì, êîñâåííî ñâèäåòåëüñòâóåò î ïðèìåíèìîñòè ìàòåìàòè÷åñêî-
ãî àïïàðàòà, ââåäåííîãî â [3], äëÿ îïðåäåëåíèÿ ýêçîíîâ è èíòðîíîâ â ãåíàõ.
 êà÷åñòâå íàïðàâëåíèé äëÿ äàëüíåéøèõ èññëåäîâàíèé âûäåëèì èçó÷åíèå
áîëåå îáùåãî âèäà ïðåäèêàòîâ, èñïîëüçóåìûõ äëÿ ñîçäàíèÿ îïòèìàëüíîãî ðàçáè-
åíèÿ â àëãîðèòìå 1, à òàêæå îáîáùåíèå ðåçóëüòàòîâ äëÿ ïðèìåíåíèÿ â ñõîæèõ çà-
äà÷àõ, íàïðèìåð, äëÿ îïðåäåëåíèÿ âòîðè÷íîé ñòðóêòóðû áåëêîâ [7].
ÑÏÈÑÎÊ ËÈÒÅÐÀÒÓÐÛ
1. S t a n k e M . , W a a c k S . Gene prediction with a hidden Markov model and a new intron submodel //
Bioinformatics. — 2003. — 19, Suppl. 2. — P. 215–225.
2. M a j o r o s W . H . , P e r t e a M . , S a l z b e r g S . L . TigrScan and GlimmerHMM: two open source ab
initio eukaryotic gene-finders // Ibid. — 2004. — 20, N 16. — P. 2878–2879.
3. Ñ å ð ã è å í ê î È . Â . , Ã ó ï à ë À . Ì . , Î ñ ò ð î â ñ ê è é À . Â . Ðàñïîçíàâàíèå ôðàãìåíòîâ ãåíîâ
â ÄÍÊ ñ ïðèìåíåíèåì ìîäåëåé Ìàðêîâà ñî ñêðûòûìè ïåðåìåííûìè // Êèáåðíåòèêà è ñèñòåìíûé
àíàëèç. — 2012. — ¹ 3. — Ñ. 58–67.
4. K n a p p K . , C h e n Y . - P . P . An evaluation of contemporary hidden Markov model genefinders with
a predicted exon taxonomy // Nucleic Acids Research. — 2007. — 35. — P. 317–324.
5. S u m n e r A . T . , d e l a T o r r e J . , S t u p p i a L . The distribution of genes on chromosomes: a cyto-
logical approach // J. Mol. Evol. — 1993. — 37, N 2. — P. 117–122.
6. A ¿ s s a n i B . , B e r n a r d i G . CpG islands, genes and isochores in the genomes of vertebrates // Gene. —
1991. — 106, N 2. — P. 185–195.
7. Ï ð å ä ñ ê à ç à í è å âòîðè÷íîé ñòðóêòóðû áåëêîâ íà îñíîâå áàéåñîâñêèõ ïðîöåäóð ðàñïîçíàâàíèÿ íà
öåïÿõ Ìàðêîâà / È.Â. Ñåðãèåíêî, Á.À. Áåëåöêèé, Ñ.Â. Âàñèëüåâ, À.Ì. Ãóïàë // Êèáåðíåòèêà
è ñèñòåìíûé àíàëèç. — 2007. — ¹ 2. — Ñ. 59–64.
Ïîñòóïèëà 23.01.2012
68 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5
Ò à á ë è ö à 3
Âèä
×èñëî
àëãîðèòìîâ
Ðåçóëüòàòû èñïîëüçîâàíèÿ àëãîðèòìîâ
ñ ìåðàìè êà÷åñòâà
NSp NSn CC ACP ESp ESn
Homo sapiens (÷åëîâåê)
1 35,58 89,56 49,48 76,45 27,64 31,11
6 54,43 87,53 64,71 83,02 43,84 49,71
Gallus gallus (êóðèöà)
1 54,41 64,65 56,06 78,12 47,39 32,03
3 68,29 64,14 63,81 81,92 52,90 37,70
Sus scrofa (ñâèíüÿ)
1 33,24 85,66 47,60 75,75 24,87 26,64
4 47,54 81,02 58,04 79,83 36,21 40,86
Mus musculus (ìûøü)
1 59,97 85,32 67,20 83,97 42,22 40,39
4 71,96 83,03 74,08 87,11 50,90 47,73
Rattus norvegicus (êðûñà)
1 61,73 83,59 67,47 84,01 40,75 36,49
6 76,23 75,32 72,22 86,11 47,34 38,78
Papio anubis (ïàâèàí)
1 39,91 86,65 52,28 77,45 30,41 31,42
6 65,00 79,75 68,56 84,42 50,54 51,18
|
| id | nasplib_isofts_kiev_ua-123456789-86271 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 0023-1274 |
| language | Russian |
| last_indexed | 2025-12-07T18:47:20Z |
| publishDate | 2013 |
| publisher | Інститут кібернетики ім. В.М. Глушкова НАН України |
| record_format | dspace |
| spelling | Гупал, А.М. Островский, А.В. 2015-09-11T20:00:39Z 2015-09-11T20:00:39Z 2013 Использование композиций моделей Маркова для определения функциональных участков генов / А.М. Гупал, А.В. Островский // Кибернетика и системный анализ. — 2013. — Т. 49, № 5. — С. 61-68. — Бібліогр.: 7 назв. — рос. 0023-1274 https://nasplib.isofts.kiev.ua/handle/123456789/86271 519.217.2 Розглянуто застосування композицій алгоритмів з розділенням зон компетентності для підвищення якості класифікації фрагментів генів за допомогою моделей, що використовують ланцюги Маркова. Algorithmic compositions in the form of expert mixtures with exclusive competence zones are considered in order to increase the quality of classification for gene fragments with the help of models based on Markov chains. ru Інститут кібернетики ім. В.М. Глушкова НАН України Кибернетика и системный анализ Системный анализ Использование композиций моделей Маркова для определения функциональных участков генов Використання композицій моделей Маркова для визначення функціональних ділянок генів Using compositions of Markov models to determine functional gene regions Article published earlier |
| spellingShingle | Использование композиций моделей Маркова для определения функциональных участков генов Гупал, А.М. Островский, А.В. Системный анализ |
| title | Использование композиций моделей Маркова для определения функциональных участков генов |
| title_alt | Використання композицій моделей Маркова для визначення функціональних ділянок генів Using compositions of Markov models to determine functional gene regions |
| title_full | Использование композиций моделей Маркова для определения функциональных участков генов |
| title_fullStr | Использование композиций моделей Маркова для определения функциональных участков генов |
| title_full_unstemmed | Использование композиций моделей Маркова для определения функциональных участков генов |
| title_short | Использование композиций моделей Маркова для определения функциональных участков генов |
| title_sort | использование композиций моделей маркова для определения функциональных участков генов |
| topic | Системный анализ |
| topic_facet | Системный анализ |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/86271 |
| work_keys_str_mv | AT gupalam ispolʹzovaniekompoziciimodeleimarkovadlâopredeleniâfunkcionalʹnyhučastkovgenov AT ostrovskiiav ispolʹzovaniekompoziciimodeleimarkovadlâopredeleniâfunkcionalʹnyhučastkovgenov AT gupalam vikoristannâkompozicíimodeleimarkovadlâviznačennâfunkcíonalʹnihdílânokgenív AT ostrovskiiav vikoristannâkompozicíimodeleimarkovadlâviznačennâfunkcíonalʹnihdílânokgenív AT gupalam usingcompositionsofmarkovmodelstodeterminefunctionalgeneregions AT ostrovskiiav usingcompositionsofmarkovmodelstodeterminefunctionalgeneregions |