Использование композиций моделей Маркова для определения функциональных участков генов

Розглянуто застосування композицій алгоритмів з розділенням зон компетентності для підвищення якості класифікації фрагментів генів за допомогою моделей, що використовують ланцюги Маркова. Algorithmic compositions in the form of expert mixtures with exclusive competence zones are considered in order...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Кибернетика и системный анализ
Дата:2013
Автори: Гупал, А.М., Островский, А.В.
Формат: Стаття
Мова:Російська
Опубліковано: Інститут кібернетики ім. В.М. Глушкова НАН України 2013
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/86271
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Использование композиций моделей Маркова для определения функциональных участков генов / А.М. Гупал, А.В. Островский // Кибернетика и системный анализ. — 2013. — Т. 49, № 5. — С. 61-68. — Бібліогр.: 7 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1860254560217464832
author Гупал, А.М.
Островский, А.В.
author_facet Гупал, А.М.
Островский, А.В.
citation_txt Использование композиций моделей Маркова для определения функциональных участков генов / А.М. Гупал, А.В. Островский // Кибернетика и системный анализ. — 2013. — Т. 49, № 5. — С. 61-68. — Бібліогр.: 7 назв. — рос.
collection DSpace DC
container_title Кибернетика и системный анализ
description Розглянуто застосування композицій алгоритмів з розділенням зон компетентності для підвищення якості класифікації фрагментів генів за допомогою моделей, що використовують ланцюги Маркова. Algorithmic compositions in the form of expert mixtures with exclusive competence zones are considered in order to increase the quality of classification for gene fragments with the help of models based on Markov chains.
first_indexed 2025-12-07T18:47:20Z
format Article
fulltext ÓÄÊ 519.217.2 À.Ì. ÃÓÏÀË, À.Â. ÎÑÒÐÎÂÑÊÈÉ ÈÑÏÎËÜÇÎÂÀÍÈÅ ÊÎÌÏÎÇÈÖÈÉ ÌÎÄÅËÅÉ ÌÀÐÊÎÂÀ ÄËß ÎÏÐÅÄÅËÅÍÈß ÔÓÍÊÖÈÎÍÀËÜÍÛÕ Ó×ÀÑÒÊΠÃÅÍΠÊëþ÷åâûå ñëîâà: ìîäåëü Ìàðêîâà, ñêðûòûå ïåðåìåííûå, ýêçîíû, èíòðîíû, ïåðåõîäíûå âåðîÿòíîñòè. ÂÂÅÄÅÍÈÅ Îïðåäåëåíèå âíóòðåííåé ñòðóêòóðû ïîñëåäîâàòåëüíîñòåé íóêëåîòèäîâ èç ÄÍÊ, ñîñòàâëÿþùèõ ãåíîì ÷åëîâåêà è äðóãèõ áèîëîãè÷åñêèõ îðãàíèçìîâ, ïðåäñòàâ- ëÿåò çíà÷èòåëüíûé òåîðåòè÷åñêèé è ïðèêëàäíîé èíòåðåñ äëÿ ìíîãèõ îáëàñòåé íàóêè. Îäíîé èç âåñîìûõ ïîäçàäà÷ ïðè îïðåäåëåíèè ñòðóêòóðû ãåíîìà ÿâëÿåòñÿ ðàñïîçíàâàíèå ýêçîíîâ (ó÷àñòêîâ ÄÍÊ, êîòîðûå êîäèðóþò áåëêè) è èíòðîíîâ (íåêîäèðóþùèõ ó÷àñòêîâ, ðàñïîëîæåííûõ ìåæäó ýêçîíàìè).  íàñòîÿùåå âðåìÿ íàèáîëåå ðàñïðîñòðàíåííûé ñïîñîá ðåøåíèÿ ýòîé çàäà÷è — èñïîëüçîâàíèå îáîá- ùåííûõ ìîäåëåé Ìàðêîâà ñî ñêðûòûìè ïàðàìåòðàìè (generalized hidden Markov models) [1, 2]. Áîëåå ïðîñòîé ïîäõîä, èñïîëüçóþùèé ìîäåëè íà îñíîâå îáû÷íûõ öåïåé Ìàðêîâà ñî ñêðûòûìè ïåðåìåííûìè, ðàññìîòðåí â [3]. Òàêîé ïîäõîä ïîçâîëÿåò ñ òåîðåòè÷åñêîé òî÷êè çðåíèÿ îáîñíîâàòü íåêîòîðûå ýìïèðè÷åñêèå çàêîíîìåð- íîñòè, êîòîðûå â äðóãèõ àëãîðèòìàõ ïðèíèìàþòñÿ a priori (íàïðèìåð, ñïåöèôè÷åñ- êèé âèä ïåðåõîäíûõ ó÷àñòêîâ ìåæäó ýêçîíàìè è èíòðîíàìè). Êàê ïîêàçàíî â [3], ïîëó÷åííóþ ìîäåëü ìîæíî èñïîëüçîâàòü äëÿ ýôôåêòèâíîãî ðàñïîçíàâàíèÿ ó÷àñ- òêîâ ãåíîâ â îðãàíèçìàõ ñ îòíîñèòåëüíî ïðîñòî óñòðîåííûì ãåíîìîì, íàïðèìåð, â áîëüøèíñòâå ðàñòåíèé èëè íàñåêîìûõ.  òî æå âðåìÿ ïðè ïîïûòêå ïðèìåíèòü ìîäåëü äëÿ áîëåå ðàçâèòûõ âèäîâ (ìëåêîïèòàþùèõ èëè ïòèö) êà÷åñòâî îïðåäåëå- íèÿ ýêçîíîâ è èíòðîíîâ ñíèæàåòñÿ ïî ñðàâíåíèþ ñ èçâåñòíûìè àëãîðèòìàìè. Äëÿ ïîâûøåíèÿ êà÷åñòâà êëàññèôèêàöèè ïðåäëàãàåòñÿ èñïîëüçîâàòü êîìïîçèöèè àëãîðèòìîâ íà îñíîâå ìîäåëåé Ìàðêîâà.  ïåðâîì ðàçäåëå íàñòîÿùåé ñòàòüè ñôîðìóëèðîâàíà çàäà÷à ðàñïîçíàâàíèÿ ôóíêöèîíàëüíûõ ó÷àñòêîâ ãåíîâ è îïèñàíà â îáùèõ ÷åðòàõ ìîäåëü íà îñíîâå êîìïîçèöèè àëãîðèòìîâ, ïðåäëàãàåìàÿ äëÿ åå ðåøåíèÿ. Âî âòîðîì ðàçäåëå âûâå- äåí êðèòåðèé îïòèìàëüíîñòè êîìïîçèöèè, êîòîðûé â ñëåäóþùåì ðàçäåëå ñâÿçàí ñ ïîíÿòèåì èíôîðìàöèîííîé ýíòðîïèè. Ïîëó÷åííûå òåîðåòè÷åñêèå ðåçóëüòàòû ïîäûòîæåíû â ÷åòâåðòîì ðàçäåëå, ãäå ïðèâåäåí àëãîðèòì ïîñòðîåíèÿ îïòèìàëü- íîé êîìïîçèöèè.  ïÿòîì ðàçäåëå ñòàòüè îïèñàí âû÷èñëèòåëüíûé ýêñïåðèìåíò, öåëü êîòîðîãî — âûÿñíèòü ýôôåêòèâíîñòü íîâîãî ïîäõîäà, è ïðîàíàëèçèðîâàíû åãî ðåçóëüòàòû.  çàêëþ÷åíèè ïðèâåäåíû íàïðàâëåíèÿ äëÿ âîçìîæíûõ äàëüíåéøèõ èññëåäîâàíèé. 1. ÏÎÑÒÀÍÎÂÊÀ ÇÀÄÀ×È Êàê èçâåñòíî èç áèîõèìèè, áåëêè âñåõ æèâûõ îðãàíèçìîâ êîäèðóþòñÿ ãåíà- ìè — ïîñëåäîâàòåëüíîñòÿìè íóêëåîòèäîâ: àäåíèíà (A), öèòîçèíà ( )C , ãóàíè- íà ( )G è òèìèíà ( )T . Ó÷àñòîê ãåíà ìåæäó íà÷àëîì ïåðâîãî è êîíöîì ïîñëåä- íåãî ýêçîíà, ïðåäñòàâëÿþùèé íàèáîëüøèé èíòåðåñ, ñîñòîèò èç ÷åðåäóþùèõñÿ ìåæäó ñîáîé ýêçîíîâ è èíòðîíîâ. Òàêèì îáðàçîì, çàäà÷à ñâîäèòñÿ ê îïðåäåëå- ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 61 © À.Ì. Ãóïàë, À.Â. Îñòðîâñêèé, 2013 íèþ äëÿ êàæäîãî íóêëåîòèäà åãî ïðèíàäëåæíîñòè ê ýêçîíó èëè èíòðîíó. Áî- ëåå ôîðìàëüíî, òðåáóåòñÿ ïî èçâåñòíîé ïîñëåäîâàòåëüíîñòè S O� *, ãäå O � {A C G T}, , , — ìíîæåñòâî íàáëþäàåìûõ ñîñòîÿíèé, âîññòàíîâèòü ïîñëåäî- âàòåëüíîñòü ñêðûòûõ ñîñòîÿíèé � � �S Q a c g t* *, , , , , , ,{A C G T } , ãäå ïðîïèñíû- ìè áóêâàìè îáîçíà÷åíû íóêëåîòèäû, ïðèíàäëåæàùèå ýêçîíàì, à ñòðî÷íûìè — èíòðîíû. Ïðè ýòîì ñêðûòûå ñîñòîÿíèÿ äîëæíû ñîîòâåòñòâîâàòü íàáëþäàåìûì, ò.å. äëÿ àëãîðèòìà ðàñïîçíàâàíèÿ A : * *O Q� íåîáõîäèìî âûïîëíåíèå óñëî- âèÿ � �S O * Pr ( ( ))A S S� , ãäå Pr : * *Q O� — ïðîåêöèÿ ñêðûòûõ ñîñòîÿíèé Pr A C G T A C G T A C G T: , , , , , , , , , , , , , ,� � � a c g t . Êðîìå òîãî, àëãîðèòì äîëæåí èìåòü ñâîéñòâî îïòèìàëüíîñòè, ò.å. ìàêñèìèçèðîâàòü óñëîâíóþ âåðîÿòíîñòü öåïî÷êè ñêðûòûõ ñîñòîÿíèé A( ) max ( | ) max( ( )[ ( ) ])S P S S P S S S S S � � � � � �arg arg Pr ' ' . (1)  ðàáîòå [3] ðàññìîòðåíû ìîäåëè íà îñíîâå öåïåé Ìàðêîâà ïðîèçâîëüíîãî m-ãî ïîðÿäêà, äëÿ êîòîðûõ âåðîÿòíîñòü P S( )� âû÷èñëÿåòñÿ ñëåäóþùèì îáðàçîì: P S s s p s s s p s s sm m m n n m n( ) ( ) ( | ) ( |� � � � � � � � � �� �� 1 1 1� � � � �1 ) , (2) ãäå �( )x îáîçíà÷åíà âåðîÿòíîñòü ïîÿâëåíèÿ ïîäñòðîêè x â íà÷àëå ñòðîêè �S , à p y x( | ) — âåðîÿòíîñòü ïîÿâëåíèÿ â íåé ñîñòîÿíèÿ y ïðè èçâåñòíîé ïîñëåäî- âàòåëüíîñòè ïðåäûäóùèõ ñîñòîÿíèé x. Îöåíêè íà÷àëüíûõ è ïåðåõîäíûõ âåðî- ÿòíîñòåé ìîäåëè âçÿòû èç îáó÷àþùåé âûáîðêè T S Qi� � { } * , ñîäåðæàùåé ãåíû ñ èçâåñòíûì ðàçáèåíèåì íà ýêçîíû è èíòðîíû � ( ) ( , ) / | |� x N T x Tst� , � ( | ) ( , ) / ( , )p x y N T yx N T y� . (3) Çäåñü N T xst ( , ) — êîëè÷åñòâî ïîñëåäîâàòåëüíîñòåé èç âûáîðêè, êîòîðûå íà÷è- íàþòñÿ x, à N T x( , ) — ÷èñëî âõîæäåíèé ñòðîêè x âî âñå ïîñëåäîâàòåëüíîñòè T . Àëãîðèòì âèäà (1), êîòîðûé èñïîëüçóåò äëÿ ïîäñ÷åòà âåðîÿòíîñòåé âûðàæåíèÿ (2), (3) è ïîëó÷åí ïðè îáó÷åíèè íà âûáîðêå T , äàëåå áóäåì îáîçíà÷àòü A [ ]T . Èññëåäóåì êîìïîçèöèþ àëãîðèòìîâ A A A A ( ) ( ), , ( ), , ( ), , S S S G S S G S S Gl l � � � � � � � � � � � 1 1 2 2 � (4) ãäå îáëàñòè G G Gl1 2, , ,� îáðàçóþò ïîêðûòèå ìíîæåñòâà O * , ò.å. i iG O� � * , G Gi j� � {} ïðè i j� . Ôàêòè÷åñêè ïîäîáíûå êîìïîçèöèè ÿâëÿþòñÿ ÷àñòíûì ñëó÷àåì ñìåñåé àëãî- ðèòìîâ A A( ) ( ) ( )S C g S Si i i � � � �� � � ��� , ãäå g Oi : [ , ]* � 0 1 — âåñîâûå ôóíêöèè, C — ðåøàþùåå ïðàâèëî.  äàííîì ñëó÷àå êàæäûé ñîñòàâëÿþùèé àëãîðèòì ýêñêëþ- çèâíî êîìïåòåíòåí â ñîîòâåòñòâóþùåé åìó îáëàñòè g S S Gi i( ) [ ]� � . Èñïîëüçî- âàíèå òàêèõ âåñîâûõ ôóíêöèé ïîçâîëÿåò íå îïðåäåëÿòü ïðîñòðàíñòâî äëÿ ïðîâå- äåíèÿ ïðîìåæóòî÷íûõ àëãåáðàè÷åñêèõ îïåðàöèé ñëîæåíèÿ è óìíîæåíèÿ, à òàêæå äåëàåò âîçìîæíûì èñïîëüçîâàíèå òðèâèàëüíîãî ðåøàþùåãî ïðàâèëà C S S( ) � . Ïîñòðîåíèå êîìïîçèöèè âèäà (4), â êîòîðîé áàçîâûå àëãîðèòìû èñïîëüçóþò öåïè Ìàðêîâà, íà îñíîâå îáó÷àþùåé âûáîðêè T , êàê è äëÿ ñìåñåé àëãîðèòìîâ â îáùåì ñëó÷àå, âêëþ÷àåò ñëåäóþùèå øàãè. 62 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 Øàã 1. Îïðåäåëåíèå êàêèì-ëèáî ñïîñîáîì îáëàñòåé G G Gl1 2, , ,� . Øàã 2. Îáó÷åíèå ñîñòàâëÿþùèõ êîìïîçèöèþ àëãîðèòìîâ íà ñîîòâåòñòâóþ- ùèõ èì ÷àñòÿõ âûáîðêè A Ak kT� [ ], ãäå T S T S Gk i� � � � �{ Pr }| ( ) . Âòîðîé øàã ðàññìîòðåí â [3]. Òàêèì îáðàçîì, îñíîâíîé èíòåðåñ ïðåäñòàâëÿ- åò íàõîæäåíèå îïòèìàëüíîãî ïîêðûòèÿ ìíîæåñòâà O * , äëÿ ÷åãî ïðåäëàãàåòñÿ èñ- ïîëüçîâàòü âåðîÿòíîñòíûé ïîäõîä. 2. ÊÐÈÒÅÐÈÉ ÎÏÒÈÌÀËÜÍÎÃÎ ÐÀÇÁÈÅÍÈß Îáîçíà÷èì P T Tk k( | [ ])A , k l�1, ,� , ñîâìåñòíóþ âåðîÿòíîñòü ïîðîæäåíèÿ ñòðîê èç ìíîæåñòâà Tk ìîäåëüþ, îáó÷åííîé íà ýòîé ÷àñòè âûáîðêè. Ñîãëàñ- íî (2), (3) P T T s s p s sk k S T m i m S i i k ( | [ ]) � ( ) � ( | | | A � � � � � � � � �� � ' ' � 1 1 � m is� � � � � � � ! ! �1 ) èëè ïîñëå ïåðåõîäà ê ëîãàðèôìàì log ( | [ ]) log ( , ) | | P T T N T s s T k k S T st k m k S Tk k A � � � � � � � � ' ' 1 � i m S k i m i k i m i N T s s N T s s� � � � � � � � � � � 1 1 | | log ( , ) ( , ) ' � � � � � � � � � log ( , ) | | log | |N T s s T Tst k m k k S Tk 1 � ' � � � � � �� � � � � �log ( , ) log ( , ) | | N T s s N T s sk i m i k i m i i m S � � 1 1 ' S Ti m S S T kk ' ' ' �� �� ��� 1 | | . Ñóììèðîâàíèå âî âñåõ ïîëó÷èâøèõñÿ ñóììàõ âûïîëíÿåòñÿ ïî êîðîòêèì ôðàãìåíòàì ñòðîê, âõîäÿùèõ âî ìíîæåñòâî Tk : ïðåôèêñàì äëèíû m â ïåðâîé ñóììå, ïîäñòðîêàì äëèíû m è m�1— âî âòîðîé è òðåòüåé ñîîòâåòñòâåííî. Òàêèì îáðàçîì, âûðàæåíèå äëÿ âåðîÿòíîñòè ìîæíî óïðîñòèòü, åñëè ïåðåéòè ê íåïîñðåä- ñòâåííîìó ñóììèðîâàíèþ ïî ñòðîêàì ôèêñèðîâàííîé äëèíû log ( | [ ]) ( , ) log ( , ) | | log | | | P T T N T y N T y T Tk k st k st k k kA � � � y m| � � � � �� � �� N T x N T x N T y N T yk k k k y mx m ( , ) log ( , ) ( , ) log ( , ) | || | 1 . (5) Ïðè ýòîì ïîäðàçóìåâàåòñÿ, ÷òî ïðè x � 0 âûïîëíÿåòñÿ òîæäåñòâî x xlog � 0 . Ëîãàðèôì âåðîÿòíîñòè ãåíåðàöèè îáó÷àþùåé âûáîðêè íàáîðîì ìîäåëåé, èñïîëüçóþùèõñÿ â àëãîðèòìàõ A A[ ], , [ ]T Tl1 � , â ñèëó íåïåðåñåêàåìîñòè ìíî- æåñòâ T Tl1, ,� ðàâåí log ( | [ ], , [ ]) log ( | [ ])P T T T P T Tl k k k l A A A1 1 � � � � . (6) Íåïîñðåäñòâåííàÿ ìàêñèìèçàöèÿ (6) ïî âîçìîæíûì ðàçáèåíèÿì G Gl1, ,� è ñîîòâåòñòâóþùèì èì T Tl1, ,� ïðåäñòàâëÿåò çíà÷èòåëüíóþ ñëîæíîñòü. Äëÿ îá- ëåã÷åíèÿ ýòîé çàäà÷è ïîñòðîèì ðàçáèåíèå â âèäå äåðåâà, ò.å. âíà÷àëå íàéäåì îïòèìàëüíîå ðàçáèåíèå ìíîæåñòâà íàáëþäàåìûõ ñòðîê O * íà äâà ïîäìíîæåñ- òâà, çàòåì îäíîãî èç ïîëó÷åííûõ ìíîæåñòâ — åùå íà äâà ïîäìíîæåñòâà, è ò.ä.  êà÷åñòâå ìåðû ðàçäåëèòåëüíîé ñïîñîáíîñòè ðàçáèåíèÿ ìíîæåñòâà Tk íà ÷àñòè T k � è Tk � ïî àíàëîãèè ñ (6) èñïîëüçóåì ôóíêöèþ " ( , , ) log ( | [ ]) log ( | [ ]) loT T T P T T P T Tk k k k k k k � � � � � �� � �A A g ( | [ ])P T Tk kA . (7) ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 63 Íåñëîæíî çàìåòèòü, ÷òî, ñêëàäûâàÿ âûðàæåíèÿ (7) äëÿ ðàçäåëÿåìîãî ìíîæåñòâà íà êàæäîì èç l�1 ýòàïîâ îïèñàííîãî âûøå àëãîðèòìà, ïîëó÷èì (6) ñ òî÷íîñ- òüþ äî íå çàâèñÿùåãî îò ïîëó÷åííîãî ðàçáèåíèÿ ñëàãàåìîãî log ( | [ ])P T TA . Òàêèì îáðàçîì, àëãîðèòì ïîñòðîåíèÿ äåðåâà ÿâëÿåòñÿ ïîýòàïíûì æàäíûì ñïî- ñîáîì ìàêñèìèçàöèè âåðîÿòíîñòè (6). 3. ÑÂßÇÜ Ñ ÈÍÔÎÐÌÀÖÈÎÍÍÎÉ ÝÍÒÐÎÏÈÅÉ Âûðàæåíèå (5) ñîäåðæèò ÷ëåíû, íàïîìèíàþùèå èíôîðìàöèîííóþ ýíòðîïèþ äëÿ ýìïèðè÷åñêèõ âåðîÿòíîñòíûõ ðàñïðåäåëåíèé �� è �p , ïîëó÷åííûõ íà îñíî- âàíèè âûáîðêè Tk . Äåéñòâèòåëüíî, ýíòðîïèÿ äëÿ íà÷àëüíîãî ðàñïðåäåëåíèÿ èìååò âèä H y y T N T y N T y k st k st k( � ) � ( ) log � ( ) | | ( , )(log ( , )� � �� � � � � 1 log | | ) | || | Tk y my m �� �� � � � � �log | | | | ( , ) log ( , ) | | T T N T y N T yk k st k st k y m 1 . (8) Ýíòðîïèþ äëÿ óñëîâíîãî ðàñïðåäåëåíèÿ �p ìîæíî íàéòè ñëåäóþùèì îáðàçîì: H p H x y H x y H y H x H y( � ) ( � | � ) ( �, � ) ( � ) ( � ) ( � )� � � � � , (9) H y N T y N T N T y N T k m ky m k m k ( � ) ( , ) ( ) log ( , ) ( )| | � � � � � � � � �log ( ) ( ) ( , ) log ( , ) | | N T N T N T y N T ym k m k k k y m 1 , (10) ãäå �x — ýìïèðè÷åñêîå ðàñïðåäåëåíèå äëÿ ïîñëåäîâàòåëüíîñòåé èç m�1 ñêðû- òûõ ñîñòîÿíèé; �y — àíàëîãè÷íîå ðàñïðåäåëåíèå äëÿ ïîñëåäîâàòåëüíîñòåé äëè- íû m ; N Tm k( ) — îáùåå ÷èñëî ïîñëåäîâàòåëüíîñòåé äëèíû m â âûáîðêå. Ïîä- ñòàâèâ (10) è àíàëîãè÷íóþ åé ôîðìóëó äëÿ H x( � ) â (9) è âîñïîëüçîâàâøèñü òåì, ÷òî N T N T N T Sm k m k k S Tk ( ) ( ) ( ) | |# # � �� � �1 1 ' , èìååì H p N Tk ( � ) ( ) # � 1 1 � � � � � �N T x N T x N T y N T yk k x m k k y m ( , ) log ( , ) ( , ) log ( , ) | | | |1 � � � � � � � � . (11) Ñðàâíèâ (8) è (11) ñ (5), ïîëó÷èì log ( | [ ]) ( � ) | | ( � ) | |P T T H T H p Sk k k S Tk A # � � � � �� ' . Òàêèì îáðàçîì, íàõîæäåíèå ìàêñèìóìà âûðàæåíèÿ (7) ïðèáëèçèòåëüíî ñîîòâåò- ñòâóåò ìèíèìèçàöèè ýíòðîïèè ýìïèðè÷åñêè ïîëó÷àåìûõ ðàñïðåäåëåíèé íà÷àëü- íûõ è ïåðåõîäíûõ âåðîÿòíîñòåé äëÿ ÷àñòåé âûáîðêè ïî ñðàâíåíèþ ñ ðàñïðå- äåëåíèÿìè â öåëîì. Ýòî ñ òåîðåòè÷åñêîé òî÷êè çðåíèÿ ÿâëÿåòñÿ äîïîëíèòåëü- íûì îáîñíîâàíèåì âûáîðà ìåðû ðàçäåëèòåëüíîé ñïîñîáíîñòè (7). 4. ÍÀÕÎÆÄÅÍÈÅ ÎÏÒÈÌÀËÜÍÛÕ ÐÀÇÁÈÅÍÈÉ Ðàññìîòðèì áèíàðíûå ðàçáèåíèÿ èç (7) íà îñíîâå ïðåäèêàòîâ I O: ,* � { }0 1 , â êîòîðûõ èñïîëüçóþòñÿ êîíöåíòðàöèè îïðåäåëåííûõ íóêëåîòèäîâ â ïîñëåäî- âàòåëüíîñòè ñêðûòûõ ñîñòîÿíèé 64 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 I S n S xX x X , ( ) ( , )� �� $ � � � � ! � � , X O , � �( , )0 1 , n S x N S x S ( , ) ( , ) | | � . (12) Ïðåèìóùåñòâî ïîäîáíûõ ïðåäèêàòîâ çàêëþ÷àåòñÿ â ëåãêîñòè èõ âû÷èñëåíèÿ è ïðîñòîòå èíòåðïðåòàöèè. Äëÿ òàêîãî ïðåäèêàòà ìåðà êà÷åñòâà ðàçäåëåíèÿ (7) ïðèìåò âèä " "( , ) ( , | ( ) , | ( ) )T I T S T I S S T I Sk k k k� � � � � � % �{ } { } . Èç âñåõ 2 164 � âîçìîæíûõ ïîäìíîæåñòâ ìíîæåñòâà íóêëåîòèäîâ èìååò ñìûñë ðàññìàòðèâàòü ñåìü: X � �X {{A} {C} {G} {T} {A C} {A G} {A T}}, , , , , , , , , .  ñàìîì äåëå, ïîäìíîæåñòâà {} è {A C G T}, , , äàþò òðèâèàëüíûé ðåçóëüòàò.  ñèëó òîæäåñòâà � �S O * n S x x O ( , ) � � � 1èìååò ìåñòî I IX O X, \ ,~� �1� , ñëåäîâàòåëüíî, íå èìååò ñìûñëà èñïîëüçîâàòü è îñòàëüíûå ñåìü ïîäìíîæåñòâ, äîïîëíåíèÿ êîòîðûõ íàõîäÿòñÿ â X . Ïðåäèêàò, ðàçáèâàþùèé íàáîð ñòðîê Ts íà äâå ÷àñòè îïòèìàëüíûì îáðàçîì, áóäåì èñêàòü ñðåäè ïðåäèêàòîâ âñåõ ñåìè òèïîâ (ïî q êàíäèäàòîâ êàæäîãî òèïà), ãåíåðèðóåìûõ ïðèâåäåííûì äàëåå àëãîðèòìîì. Àëãîðèòì 1. I � Predicates ( , )T qs . Äàíî: Íàáîð ïîñëåäîâàòåëüíîñòåé ñêðûòûõ ñîñòîÿíèé Ts, ÷èñëî ïðåäèêàòîâ êàæäîãî òèïà q. Íàéòè: Íàáîð ïîòåíöèàëüíî îïòèìàëüíûõ ïðåäèêàòîâ I � �{ }I i i q 1 7 . 1. I � {}; 2. äëÿ âñåõ íàáîðîâ íóêëåîòèäîâ X �X : 3. n n S xX x X : ( ( ), )� � � � � & ' (� � Pr , � �S Ts — ñòàòèñòèêà ïî êîíöåíòðàöèè íóê- ëåîòèäîâ; 4. Óïîðÿäî÷èòü ýëåìåíòû nX ïî âîçðàñòàíèþ; 5. äëÿ i q�1, ,� : 6. � : [ | | / ( )]� ) �n i T qX s 1 — ïðåäèêàò I X ,� âûïîëíÿåòñÿ äëÿ i q/ ( )�1 -é ÷àñòè âûáîðêè; 7. I I: ,� *{ }I X � . Ñ ó÷åòîì èçëîæåííîãî âûøå ñõåìà ïîèñêà îïòèìàëüíîãî ðàçáèåíèÿ, îïèñàí- íàÿ â ðàçä. 2 ñòàòüè, ïðèìåò ñëåäóþùèé âèä. Àëãîðèòì 2. Äàíî: Îáó÷àþùàÿ âûáîðêà T ; êîëè÷åñòâî îáëàñòåé l; q . Íàéòè: Ðàçáèåíèå G Gl1, ,� , àëãîðèòìû A A1, ,� l . 1. T : { }� T — òåêóùåå ðàçáèåíèå îáó÷àþùåé âûáîðêè; 2. G : { }*� O — ðàçáèåíèå ïðîñòðàíñòâà íàáëþäàåìûõ ñòðîê; 3. äëÿ i l� �1 1, ,� : 4. äëÿ k �1, , | |� T : 5. I : ( , )� Predicates T qk ; 6. I T I k I k max : max ( , )� � arg I " — îïòèìàëüíûé ïðåäèêàò äëÿ òåêóùåé ÷àñòè; 7. r T I k k k : max ( , ) , , | | max� � arg 1 � T " — ÷àñòü âûáîðêè, êîòîðóþ íàäî ðàçäåëèòü; 8. Âûäåëèòü íîâóþ ÷àñòü îáó÷àþùåé âûáîðêè: T S T I Si r r� � � � �1: | ( )max{ }; T S T I Sr r r: | ( )max� � � % �{ }; ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 65 9. Àíàëîãè÷íî äëÿ ïðîñòðàíñòâà O * : G S G I Si r r� � � � �1: { | ( )}max ; G S G I Sr r r: | ( )max� � � % �{ }; 10. äëÿ i l�1, ,� : 11. A Ai iT: [ ]� Çà ñ÷åò âûïîëíåíèÿ âû÷èñëåíèé ìåðû " ( , )T Ik íà øåñòîì øàãå àëãîðèòìà â íåñêîëüêî ïàðàëëåëüíûõ ïîòîêîâ ìîæíî äîáèòüñÿ ñóùåñòâåííîãî óñêîðåíèÿ ðàáîòû íà ìíîãîÿäåðíûõ ñèñòåìàõ. 5. ÂÛ×ÈÑËÈÒÅËÜÍÛÉ ÝÊÑÏÅÐÈÌÅÍÒ Äëÿ îöåíêè ýôôåêòèâíîñòè èñïîëüçîâàíèÿ êîìáèíàöèé àëãîðèòìîâ èç áàíêà äàííûõ NCBI âçÿëè ãåíîìû øåñòè áèîëîãè÷åñêèõ âèäîâ: Homo sapiens (÷åëî- âåêà), Gallus gallus (êóðèöû), Suc scrofa (ñâèíüè), Rattus norvegicus (êðûñû), Mus musculus (ìûøè), Papio anubis (ïàâèàíà). Ïðè ýòîì ðàññìàòðèâàëèñü òîëü- êî ãåíû ñ ïîëíîñòüþ èçâåñòíîé íóêëåîòèäíîé çàïèñüþ, äëÿ ãåíîâ ÷åëîâåêà áûëî ââåäåíî âåðõíåå îãðàíè÷åíèå íà äëèíó | |� +S 40000 . Äëÿ îöåíêè êà÷åñ- òâà èñïîëüçîâàëàñü ïÿòèêðàòíàÿ êðîññ-âàëèäàöèÿ: âûáîðêà ñëó÷àéíûì îáðàçîì ðàçáèâàëàñü íà ïÿòü ïðèáëèçèòåëüíî ðàâíûõ ÷àñòåé, êàæäàÿ èç êîòîðûõ ïî î÷å- ðåäè èñïîëüçîâàëàñü â êà÷åñòâå êîíòðîëÿ, à îñòàëüíûå ÷åòûðå ÷àñòè — â êà÷åñ- òâå îáó÷àþùåé âûáîðêè. Íà îáó÷àþùåé è êîíòðîëüíîé ÷àñòÿõ âûáîðêè çàìå- ðÿëèñü ìåðû êà÷åñòâà [4]: ÷åòûðå, ñâÿçàííûå ñ îòäåëüíûìè íóêëåîòèäàìè, — ñïåöèôè÷íîñòü NSp, ÷óâñòâèòåëüíîñòü NSn, êîýôôèöèåíò êîððåëÿöèè CC è ñðåäíÿÿ óñëîâíàÿ âåðîÿòíîñòü ACP, à òàêæå äâå, ïîêàçûâàþùèå êà÷åñòâî ðàñïîçíàâàíèÿ ãðàíèö ìåæäó ýêçîíàìè è èíòðîíàìè, — ýêçîííûå ñïåöèôè÷- íîñòü ESp è ÷óâñòâèòåëüíîñòü ESn.  õîäå ýêñïåðèìåíòà âûÿñíèëîñü, ÷òî äëÿ ðàçóìíûõ çíà÷åíèé ïîðÿäêà öåïåé Ìàðêîâà m�{ , , }5 6 7 äåðåâüÿ ðàçáèåíèÿ, ïîñòðîåííûå íà îáó÷àþùåé âûáîðêå, ïðàêòè÷åñêè íå îòëè÷àþòñÿ îò äåðåâà äëÿ âñåãî íàáîðà ãåíîâ, à òàêæå îäèí îò äðóãîãî ïðè ðàçíûõ çíà÷åíèÿõ m. Ýòè ñâîéñòâà îáúÿñíÿþòñÿ îòíîñèòåëüíî ïðî- ñòûì âèäîì ïðåäèêàòîâ (12).  ñâÿçè ñ ýòèì äëÿ âñåõ òåñòîâ èñïîëüçîâàëèñü ðàç- áèåíèÿ íà îñíîâå ïîëíûõ ãåíîìîâ, ïîëó÷åííûå äëÿ ïîðÿäêà öåïåé Ìàðêîâà m � 6. ×òî êàñàåòñÿ äðóãèõ ïàðàìåòðîâ àëãîðèòìà, òî ÷èñëî ïðåäèêàòîâ êàæäîãî òèïà â àëãîðèòìå 1 ïðèíèìàëîñü ðàâíûì q �10 , à êîëè÷åñòâî àëãîðèòìîâ â êîì- ïîçèöèè l âàðüèðîâàëîñü îò îäíîãî äî øåñòè. Ñõåìû äåðåâüåâ äëÿ ãåíîìîâ ÷åëîâåêà è êóðèöû, ïîëó÷åííûå â ðåçóëüòàòå ðàáîòû àëãîðèòìà 2 ñ îïèñàííûìè âûøå ïàðàìåòðàìè, ïðèâåäåíû íà ðèñ. 1, 2, èç êîòîðûõ âèäíî, ÷òî áîëüøàÿ ÷àñòü ïðåäèêàòîâ â îïòèìàëüíîé êîìïîçèöèè àëãî- ðèòìîâ îñíîâàíà íà ñóììàðíîé êîíöåíòðàöèè íóêëåîòèäîâ A è T (èëè, ÷òî òîæå ñàìîå, C è G). Çíà÷èìîñòü ýòîé êîíöåíòðàöèè îòìå÷åíà â [5, 6]. 66 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 n(A+T)�50,8% n(A+T)�44,4% n(A+T)�59,6% n(A+T)�55,3% n(A)�29,8% 1 2 3 4 5 6 , , ,, > $ $ $ $ $ Ðèñ. 1. Äåðåâî, ïîñòðîåííîå äëÿ ãåíîâ ÷åëîâåêà ïðè m � 6  òàáë. 1, 2 ïðèâåäåíû ðåçóëüòàòû êà÷åñòâà ðàñïîçíàâàíèÿ ýêçîíîâ è èíòðîíîâ â ãåíîìå ÷åëîâåêà â çàâèñèìîñòè îò êîëè÷åñòâà àëãîðèòìîâ â êîìïîçèöèè ïðè èñ- ïîëüçîâàíèè öåïåé Ìàðêîâà øåñòîãî è ñåäüìîãî ïîðÿäêà ñîîòâåòñòâåííî. Êàê âèä- íî, èñïîëüçîâàíèå êîìïîçèöèé ïîçâîëÿåò ñóùåñòâåííî ïîâûñèòü âñå ìåðû êà÷åñòâà ðàñïîçíàâàíèÿ, ïðåæäå âñåãî íóêëåîòèäíóþ ñïåöèôè÷íîñòü NSp è ýêçîííûå ìåðû ESp è ESn. Ïîëó÷åííûå äàííûå òàêæå ñâèäåòåëüñòâóþò, ÷òî ïðè ïðåâûøåíèè îïðå- ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 67 n(A+T)�56,1% n(A+T)�48,1% n(A+T)�60,2% n(A+T)�40,7% 5 6 1 2 3 4 , , ,, > $ $ $ $ $ n(A+C)�48,0% Ðèñ. 2. Äåðåâî, ïîñòðîåííîå äëÿ ãåíîâ êóðèöû ïðè m � 6 Ò à á ë è ö à 1 Ìåðà Âûáîðêà Ðåçóëüòàòû êëàññèôèêàöèè äëÿ ãåíîìà ÷åëîâåêà ïðè m � 6 ñ ÷èñëîì àëãîðèòìîâ 1 2 3 4 5 6 NSp îáó÷àþùàÿ 34,39 37,51 39,14 39,02 40,57 41,70 êîíòðîëüíàÿ 34,16 37,02 38,39 38,07 39,38 40,24 NSn îáó÷àþùàÿ 88,72 91,70 92,24 92,32 92,55 92,77 êîíòðîëüíàÿ 88,22 90,78 90,81 90,49 90,43 90,07 CC îáó÷àþùàÿ 47,96 52,18 53,95 53,87 55,42 56,53 êîíòðîëüíàÿ 47,55 51,36 52,70 52,27 53,49 54,15 ACP îáó÷àþùàÿ 75,71 77,80 78,62 78,59 79,29 79,79 êîíòðîëüíàÿ 75,49 77,37 77,97 77,76 78,29 78,56 ESp îáó÷àþùàÿ 25,70 31,59 33,09 34,45 35,64 36,79 êîíòðîëüíàÿ 24,91 29,92 30,58 31,26 31,92 32,35 ESn îáó÷àþùàÿ 27,93 39,93 41,78 44,33 45,94 47,12 êîíòðîëüíàÿ 26,93 37,49 38,14 39,56 40,37 40,49 Ò à á ë è ö à 2 Ìåðà Âûáîðêà Ðåçóëüòàòû êëàññèôèêàöèè äëÿ ãåíîìà ÷åëîâåêà ïðè m � 7 ñ ÷èñëîì àëãîðèòìîâ 1 2 3 4 5 6 NSp îáó÷àþùàÿ 36,46 43,24 48,76 50,75 57,93 60,64 êîíòðîëüíàÿ 35,58 41,33 45,75 46,72 52,63 54,43 NSn îáó÷àþùàÿ 91,32 94,52 95,26 95,48 95,75 96,03 êîíòðîëüíàÿ 89,56 91,42 90,57 89,02 87,62 87,53 CC îáó÷àþùàÿ 51,01 58,62 63,68 65,40 71,10 73,23 êîíòðîëüíàÿ 49,48 55,67 59,17 59,38 63,49 64,71 ACP îáó÷àþùàÿ 77,25 80,83 83,09 83,85 86,37 87,32 êîíòðîëüíàÿ 76,45 79,32 80,78 80,77 82,49 83,02 ESp îáó÷àþùàÿ 30,68 40,57 45,21 48,94 53,95 56,36 êîíòðîëüíàÿ 27,64 34,81 37,29 38,87 42,27 43,84 ESn îáó÷àþùàÿ 35,23 52,16 56,78 61,82 66,43 67,99 êîíòðîëüíàÿ 31,11 43,46 44,93 46,64 48,83 49,71 äåëåííîãî ïðåäåëà êîëè÷åñòâà àëãîðèòìîâ â êîìïîçèöèè îíà ñòàíîâèòñÿ ìåíåå ïðî- äóêòèâíîé èç-çà óñèëåíèÿ ýôôåêòà ïåðåîáó÷åíèÿ — áàçîâûì àëãîðèòìàì êîìïîçè- öèè íà÷èíàåò ñîîòâåòñòâîâàòü ñëèøêîì ìàëî ãåíîâ èç îáó÷àþùåé âûáîðêè.  òàáë. 3 ïðåäñòàâëåíû ðåçóëüòàòû ïðèìåíåíèÿ êëàññèôèêàöèè áàçîâîãî àëãîðèòìà è êîìïîçè- öèè íà êîíòðîëüíîé âûáîðêå ïðè èñïîëüçîâàíèè öåïåé Ìàðêîâà ñåäüìîãî ïîðÿäêà. Ñðàâíåíèå äàííûõ ïîçâîëÿåò ñäåëàòü âûâîä î òîì, ÷òî ïðèìåíåíèå êîìïîçèöèé äàåò âîçìîæíîñòü ïîâûñèòü ìåðû êà÷åñòâà ðàñïîçíàâàíèÿ íà 10 15� % . ÇÀÊËÞ×ÅÍÈÅ Ðàññìîòðåíà çàäà÷à îïðåäåëåíèÿ ôðàãìåíòîâ ãåíîâ âûñøèõ îðãàíèçìîâ (ìëåêî- ïèòàþùèõ è ïòèö). Ïðåäëîæåí ìåòîä ðåøåíèÿ ýòîé çàäà÷è íà îñíîâå îïðåäå- ëåííîãî âèäà êîìïîçèöèé àëãîðèòìîâ, èñïîëüçóþùèõ ìîäåëè Ìàðêîâà ñî ñêðû- òûìè ñîñòîÿíèÿìè. Èññëåäîâàííûå êîìïîçèöèè ïîçâîëÿþò ñóùåñòâåííî ïîâû- ñèòü êà÷åñòâî êëàññèôèêàöèè ôðàãìåíòîâ ãåíîâ ïî ñðàâíåíèþ ñ îòäåëüíûìè àëãîðèòìàìè è äîñòè÷ü óðîâíÿ èçâåñòíûõ àëãîðèòìîâ íà îñíîâå îáîáùåííûõ ìîäåëåé Ìàðêîâà, ðåøàþùèõ ïîñòàâëåííóþ çàäà÷ó. Ýôôåêòèâíîñòü êîìïîçè- öèé, òàêèì îáðàçîì, êîñâåííî ñâèäåòåëüñòâóåò î ïðèìåíèìîñòè ìàòåìàòè÷åñêî- ãî àïïàðàòà, ââåäåííîãî â [3], äëÿ îïðåäåëåíèÿ ýêçîíîâ è èíòðîíîâ â ãåíàõ.  êà÷åñòâå íàïðàâëåíèé äëÿ äàëüíåéøèõ èññëåäîâàíèé âûäåëèì èçó÷åíèå áîëåå îáùåãî âèäà ïðåäèêàòîâ, èñïîëüçóåìûõ äëÿ ñîçäàíèÿ îïòèìàëüíîãî ðàçáè- åíèÿ â àëãîðèòìå 1, à òàêæå îáîáùåíèå ðåçóëüòàòîâ äëÿ ïðèìåíåíèÿ â ñõîæèõ çà- äà÷àõ, íàïðèìåð, äëÿ îïðåäåëåíèÿ âòîðè÷íîé ñòðóêòóðû áåëêîâ [7]. ÑÏÈÑÎÊ ËÈÒÅÐÀÒÓÐÛ 1. S t a n k e M . , W a a c k S . Gene prediction with a hidden Markov model and a new intron submodel // Bioinformatics. — 2003. — 19, Suppl. 2. — P. 215–225. 2. M a j o r o s W . H . , P e r t e a M . , S a l z b e r g S . L . TigrScan and GlimmerHMM: two open source ab initio eukaryotic gene-finders // Ibid. — 2004. — 20, N 16. — P. 2878–2879. 3. Ñ å ð ã è å í ê î È .  . , à ó ï à ë À . Ì . , Î ñ ò ð î â ñ ê è é À .  . Ðàñïîçíàâàíèå ôðàãìåíòîâ ãåíîâ â ÄÍÊ ñ ïðèìåíåíèåì ìîäåëåé Ìàðêîâà ñî ñêðûòûìè ïåðåìåííûìè // Êèáåðíåòèêà è ñèñòåìíûé àíàëèç. — 2012. — ¹ 3. — Ñ. 58–67. 4. K n a p p K . , C h e n Y . - P . P . An evaluation of contemporary hidden Markov model genefinders with a predicted exon taxonomy // Nucleic Acids Research. — 2007. — 35. — P. 317–324. 5. S u m n e r A . T . , d e l a T o r r e J . , S t u p p i a L . The distribution of genes on chromosomes: a cyto- logical approach // J. Mol. Evol. — 1993. — 37, N 2. — P. 117–122. 6. A ¿ s s a n i B . , B e r n a r d i G . CpG islands, genes and isochores in the genomes of vertebrates // Gene. — 1991. — 106, N 2. — P. 185–195. 7. Ï ð å ä ñ ê à ç à í è å âòîðè÷íîé ñòðóêòóðû áåëêîâ íà îñíîâå áàéåñîâñêèõ ïðîöåäóð ðàñïîçíàâàíèÿ íà öåïÿõ Ìàðêîâà / È.Â. Ñåðãèåíêî, Á.À. Áåëåöêèé, Ñ.Â. Âàñèëüåâ, À.Ì. Ãóïàë // Êèáåðíåòèêà è ñèñòåìíûé àíàëèç. — 2007. — ¹ 2. — Ñ. 59–64. Ïîñòóïèëà 23.01.2012 68 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2013, ¹ 5 Ò à á ë è ö à 3 Âèä ×èñëî àëãîðèòìîâ Ðåçóëüòàòû èñïîëüçîâàíèÿ àëãîðèòìîâ ñ ìåðàìè êà÷åñòâà NSp NSn CC ACP ESp ESn Homo sapiens (÷åëîâåê) 1 35,58 89,56 49,48 76,45 27,64 31,11 6 54,43 87,53 64,71 83,02 43,84 49,71 Gallus gallus (êóðèöà) 1 54,41 64,65 56,06 78,12 47,39 32,03 3 68,29 64,14 63,81 81,92 52,90 37,70 Sus scrofa (ñâèíüÿ) 1 33,24 85,66 47,60 75,75 24,87 26,64 4 47,54 81,02 58,04 79,83 36,21 40,86 Mus musculus (ìûøü) 1 59,97 85,32 67,20 83,97 42,22 40,39 4 71,96 83,03 74,08 87,11 50,90 47,73 Rattus norvegicus (êðûñà) 1 61,73 83,59 67,47 84,01 40,75 36,49 6 76,23 75,32 72,22 86,11 47,34 38,78 Papio anubis (ïàâèàí) 1 39,91 86,65 52,28 77,45 30,41 31,42 6 65,00 79,75 68,56 84,42 50,54 51,18
id nasplib_isofts_kiev_ua-123456789-86271
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 0023-1274
language Russian
last_indexed 2025-12-07T18:47:20Z
publishDate 2013
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
record_format dspace
spelling Гупал, А.М.
Островский, А.В.
2015-09-11T20:00:39Z
2015-09-11T20:00:39Z
2013
Использование композиций моделей Маркова для определения функциональных участков генов / А.М. Гупал, А.В. Островский // Кибернетика и системный анализ. — 2013. — Т. 49, № 5. — С. 61-68. — Бібліогр.: 7 назв. — рос.
0023-1274
https://nasplib.isofts.kiev.ua/handle/123456789/86271
519.217.2
Розглянуто застосування композицій алгоритмів з розділенням зон компетентності для підвищення якості класифікації фрагментів генів за допомогою моделей, що використовують ланцюги Маркова.
Algorithmic compositions in the form of expert mixtures with exclusive competence zones are considered in order to increase the quality of classification for gene fragments with the help of models based on Markov chains.
ru
Інститут кібернетики ім. В.М. Глушкова НАН України
Кибернетика и системный анализ
Системный анализ
Использование композиций моделей Маркова для определения функциональных участков генов
Використання композицій моделей Маркова для визначення функціональних ділянок генів
Using compositions of Markov models to determine functional gene regions
Article
published earlier
spellingShingle Использование композиций моделей Маркова для определения функциональных участков генов
Гупал, А.М.
Островский, А.В.
Системный анализ
title Использование композиций моделей Маркова для определения функциональных участков генов
title_alt Використання композицій моделей Маркова для визначення функціональних ділянок генів
Using compositions of Markov models to determine functional gene regions
title_full Использование композиций моделей Маркова для определения функциональных участков генов
title_fullStr Использование композиций моделей Маркова для определения функциональных участков генов
title_full_unstemmed Использование композиций моделей Маркова для определения функциональных участков генов
title_short Использование композиций моделей Маркова для определения функциональных участков генов
title_sort использование композиций моделей маркова для определения функциональных участков генов
topic Системный анализ
topic_facet Системный анализ
url https://nasplib.isofts.kiev.ua/handle/123456789/86271
work_keys_str_mv AT gupalam ispolʹzovaniekompoziciimodeleimarkovadlâopredeleniâfunkcionalʹnyhučastkovgenov
AT ostrovskiiav ispolʹzovaniekompoziciimodeleimarkovadlâopredeleniâfunkcionalʹnyhučastkovgenov
AT gupalam vikoristannâkompozicíimodeleimarkovadlâviznačennâfunkcíonalʹnihdílânokgenív
AT ostrovskiiav vikoristannâkompozicíimodeleimarkovadlâviznačennâfunkcíonalʹnihdílânokgenív
AT gupalam usingcompositionsofmarkovmodelstodeterminefunctionalgeneregions
AT ostrovskiiav usingcompositionsofmarkovmodelstodeterminefunctionalgeneregions