Симметрия и свойства записи генетической информации в ДНК

Показано, що для пар основ можливі два види симетрії, але в природі реалізований один ефективніший спосіб запису і зчитування інформації. Доведено, що із симетрії послідовностей основ витікає симетрія коротких послідовностей — окремих основ. На базі моделі ланцюгів Маркова показано, що симетрія посл...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2011
Hauptverfasser: Гупал, А.М., Гупал, Н.А., Островський, А.В.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут кібернетики ім. В.М. Глушкова НАН України 2011
Schriftenreihe:Проблемы управления и информатики
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/207315
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Симметрия и свойства записи генетической информации в ДНК / А.М. Гупал, Н.А. Гупал, А.В. Островский // Проблемы управления и информатики. — 2011. — № 3. — С. 120–127. — Бібліогр.: 4 назви. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-207315
record_format dspace
spelling nasplib_isofts_kiev_ua-123456789-2073152025-10-06T00:07:32Z Симметрия и свойства записи генетической информации в ДНК Симетрія і властивості запису генетичної інформації в ДНК Symmetry and Properties in Recording of Genetic Information in DNA Гупал, А.М. Гупал, Н.А. Островський, А.В. Методы обработки информации Показано, що для пар основ можливі два види симетрії, але в природі реалізований один ефективніший спосіб запису і зчитування інформації. Доведено, що із симетрії послідовностей основ витікає симетрія коротких послідовностей — окремих основ. На базі моделі ланцюгів Маркова показано, що симетрія послідовностей основ витікає з симетрії пар основ. It is shown that for the pair of bases two types of symmetry are possible, but one more effective method of recording and reading information is realized in nature. It is proved that the symmetry of short sequences including separate bases follows from the symmetry of sequences of bases. On the basis of the Markov chains model, it is shown that the symmetry of sequences of bases follows from the symmetry of pairs of bases. Работа выполнена в рамках проекта НАН Украины и Российского фонда фундаментальных исследований 2010-2011 гг. при финансовой поддержке Президиума НАН Украины. 2011 Article Симметрия и свойства записи генетической информации в ДНК / А.М. Гупал, Н.А. Гупал, А.В. Островский // Проблемы управления и информатики. — 2011. — № 3. — С. 120–127. — Бібліогр.: 4 назви. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/207315 519.217.2 10.1615/JAutomatInfScien.v43.i6.40 ru Проблемы управления и информатики application/pdf Інститут кібернетики ім. В.М. Глушкова НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Методы обработки информации
Методы обработки информации
spellingShingle Методы обработки информации
Методы обработки информации
Гупал, А.М.
Гупал, Н.А.
Островський, А.В.
Симметрия и свойства записи генетической информации в ДНК
Проблемы управления и информатики
description Показано, що для пар основ можливі два види симетрії, але в природі реалізований один ефективніший спосіб запису і зчитування інформації. Доведено, що із симетрії послідовностей основ витікає симетрія коротких послідовностей — окремих основ. На базі моделі ланцюгів Маркова показано, що симетрія послідовностей основ витікає з симетрії пар основ.
format Article
author Гупал, А.М.
Гупал, Н.А.
Островський, А.В.
author_facet Гупал, А.М.
Гупал, Н.А.
Островський, А.В.
author_sort Гупал, А.М.
title Симметрия и свойства записи генетической информации в ДНК
title_short Симметрия и свойства записи генетической информации в ДНК
title_full Симметрия и свойства записи генетической информации в ДНК
title_fullStr Симметрия и свойства записи генетической информации в ДНК
title_full_unstemmed Симметрия и свойства записи генетической информации в ДНК
title_sort симметрия и свойства записи генетической информации в днк
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
publishDate 2011
topic_facet Методы обработки информации
url https://nasplib.isofts.kiev.ua/handle/123456789/207315
citation_txt Симметрия и свойства записи генетической информации в ДНК / А.М. Гупал, Н.А. Гупал, А.В. Островский // Проблемы управления и информатики. — 2011. — № 3. — С. 120–127. — Бібліогр.: 4 назви. — рос.
series Проблемы управления и информатики
work_keys_str_mv AT gupalam simmetriâisvoistvazapisigenetičeskoiinformaciivdnk
AT gupalna simmetriâisvoistvazapisigenetičeskoiinformaciivdnk
AT ostrovsʹkiiav simmetriâisvoistvazapisigenetičeskoiinformaciivdnk
AT gupalam simetríâívlastivostízapisugenetičnoíínformacíívdnk
AT gupalna simetríâívlastivostízapisugenetičnoíínformacíívdnk
AT ostrovsʹkiiav simetríâívlastivostízapisugenetičnoíínformacíívdnk
AT gupalam symmetryandpropertiesinrecordingofgeneticinformationindna
AT gupalna symmetryandpropertiesinrecordingofgeneticinformationindna
AT ostrovsʹkiiav symmetryandpropertiesinrecordingofgeneticinformationindna
first_indexed 2025-12-01T02:49:33Z
last_indexed 2025-12-01T02:49:33Z
_version_ 1850272520841723904
fulltext © А.М. ГУПАЛ, Н.А. ГУПАЛ, А.В. ОСТРОВСКИЙ, 2011 120 ISSN 0572-2691 МЕТОДЫ ОБРАБОТКИ ИНФОРМАЦИИ УДК 519.217.2 А.М. Гупал, Н.А. Гупал, А.В. Островский СИММЕТРИЯ И СВОЙСТВА ЗАПИСИ ГЕНЕТИЧЕСКОЙ ИНФОРМАЦИИ В ДНК Введение Симметрия в записи оснований, вычисленных по нитям в хромосомах ДНК, исследовалась в [1–3]. В работах [2, 3] соотношения симметрии приведены в виде коротких формул, что значительно упрощает восприятие этих результатов и явля- ется основой построения математического аппарата для получения новых резуль- татов. Статистический анализ подтвердил выполнение соотношений симметрии на геномах бактерий, растений, высших организмов (примерно сто геномов), в том числе и на ДНК человека [2, 3]. Таким образом, в записи генетической ин- формации в ДНК явно наблюдается симметрия, однако до настоящего времени не выяснены причины, которые объясняют этот феномен в природе. В настоящей работе исследованы свойства двух видов симметрии для проти- воположной и одинаковой полярности цепей ДНК. Доказано, что из симметрии последовательностей оснований вытекает симметрия коротких последовательно- стей, в том числе отдельных оснований. Выведены новые связывающие ограниче- ния для пар и троек оснований. На базе модели цепей Маркова показано, что симметрия для троек, четверок и коротких последовательностей оснований вытекает из симметрии пар оснований. 1. Противоположная полярность цепей ДНК ДНК имеет форму двойной спирали, информация записана в четырехбуквен- ном алфавите оснований: аденин (A), цитозин (C), гуанин (G), тимин (T). Извест- но, что C – G, A – T — комплементарные пары оснований, связывающие две цепи. Хромосомы — неделимые участки ДНК, в них содержится информация относи- тельно тысяч генов, поэтому расчеты проводились на уровне всей хромосомы, а не на уровне отдельного гена. нить я-2 5______C________G________3 ............................................................... нить я- 13_____G________C________5    Рис. 1 Запись и считывание оснований у первой нити хромосомы ДНК выполняется слева направо в направлении ,35  а у второй комплементарной нити — в направлении 35  справа налево (рис. 1, модель Уотсона–Крика). Приводимые ниже соотношения, как правило, выполняются приближенно.  Работа выполнена в рамках проекта НАН Украины и Российского фонда фундаментальных исследований 2010-2011 гг. при финансовой поддержке Президиума НАН Украины. Международный научно-технический журнал «Проблемы управления и информатики», 2011, № 3 121 Симметрия оснований. Для оснований, записанных по одной нити ДНК хромосомы, выполняются приближенные соотношения ),T()A( nn  ),G()C( nn  (1) где )(in — количество оснований i, T},G,C,{A,i вычисленных на одной нити. Заметим, что из комплементарности пар оснований по двум нитям ДНК не следует, что количества букв A и T, а также C и G, вычисленные по одной нити, совпадают между собой. Из соотношений (1) вытекает, что количество каждого основания, подсчи- танного по первой и второй нити, совпадает: ).2G,()1G,()2C,(),1C,(),2T,()1T,(),2A,()1A,( nnnnnnnn  (2) Таким образом, имеет место симметрия относительно записи оснований по каждой нити ДНК. Отсюда следует важный вывод о том, что веса двух нитей сов- падают. Симметрия пар оснований. Расчеты показали, что для пар оснований вы- полняются соотношения n(AC)  n(GT), n(AG)  n(CT), n(TC)  n(GA), n(TG)  n(CA), (3) n(AA)  n(TT), n(CC)  n(GG), или короче, в виде формулы ),()( ijnijn  (4) где },TG,C,A,{, ji ,TA  G,C  ,AT  C.G  Заметим, что пары AT, TA, CG и GC не присутствуют в (3), поскольку они приводят к тавтологии. В табл. 1 записано количество пар оснований в геноме человека [2]. Таблица 1 Пары букв Хромосома 1 Хромосома 3 Хромосома 6 Хромосома 10 Хромосома 18 AA 21191409 19746023 17083089 12607303 7553856 TT 21245312 19772366 17080492 12628305 7560778 AC 11189673 9791735 8417550 6641892 3762190 GT 11209763 9798222 8411037 6651425 3776890 AG 15878823 13482539 11543173 9275834 5136579 CT 15904404 13478613 11532563 9286062 5138944 CA 16200299 13972734 11983646 9656789 5382301 TG 16226750 13970283 11984196 9667666 5401993 CC 12132633 9518322 8128472 7073095 3640163 GG 12121539 9520091 8140958 7062604 3647384 GA 13313713 11472583 9879809 7851856 4411285 TC 13322934 11477596 9862177 7860740 4408666 AT 16615348 15646889 13495077 9896788 6012563 TA 14169829 13466193 11592344 8305870 5117737 CG 2256627 1620941 1473327 1353534 677210 GC 9838754 7836943 6709818 5793769 3027601 Из соотношений (3), (4) вытекает симметрия относительно записи 16 пар ос- нований по каждой нити ДНК: ),2,(1),( ijnijn  (5) где }.TG,C,A,{, ji 122 ISSN 0572-2691 Известно, что соотношения , )( )( )(ˆ in jin ijp  (6) где )(ijn — число пар ),(ij },TG,C,A,{, ji )(in — число оснований i в цепи хромосомы, представляют собой оценки переходных вероятностей для однород- ных цепей Маркова. В [4] выведены асимптотические свойства оценок переходных вероятностей. Из (5) и (6) вытекает, что вторая комплементарная нить в направлении 35  имеет такие же оценки переходных вероятностей ),(ˆ ijp что и исходная первая нить (рис. 1). Легко заметить, что для любой последовательности без пропусков букв с точностью до единицы выполняются соотношения )(in n(Ai)  n(Ci)  n(Gi)  n(Ti)  n(iA)  n(iC)  n(iG)  n(iT), (7) где },TG,C,A,{i т.е. количество каждой буквы текста можно подсчитать на основе количеств пар букв. Для основания A из (7) получаем связывающее ограничение для пар AT, TA, которые не входят в (3), n(CA)  n(GA)  n(TA)  n(AC)  n(AG)  n(AT), (8) для основания C из (7) — ограничение для пар CG и GC n(AC)  n(GC)  n(TC)  n(CA)  n(CG)  n(CT). (9) Утверждение 1. Из симметрии пар оснований вытекает симметрия оснований. Действительно, с помощью соотношений (7) количества оснований n(A) и n(T) записываются в виде равенств n(A)  n(AA)  n(AC)  n(AG)  n(AT), n(T)  n(TA)  n(TC)  n(TG)  n(TT), поэтому с учетом ),()( ijnijn  },TG,C,A,{, ji и соотношения (8), которое примет вид n(AC)  n(AG)  n(AT)  n(TA)  n(GA)  n(CA), получаем n(A)  n(T). Вывод равенства n(C)  n(G) выполняется аналогично на основе (7), (9). Симметрия троек оснований. Кодоны (тройки оснований) связаны следу- ющими соотношениями: ).()( ijknijkn  (10) Здесь )(ijkn — число троек оснований ),(ijk T},G,C,{A,,, kji )( ijk — ан- тикодон кодона ).(ijk В работе [2] получено 32 соотношения вида (10) типа ко- дон–антикодон в хромосоме 6 генома человека (табл. 2). Аналогично (5) из соотношений (10) вытекает симметрия относительно запи- си 64 троек оснований для каждой нити ДНК: ).2,(1),( ijknijkn  (11) По аналогии с (8), (9) выводятся связывающие ограничения для троек осно- ваний. Международный научно-технический журнал «Проблемы управления и информатики», 2011, № 3 123 Таблица 2 Кодон Количество кодонов Кодон Количество кодонов Кодон Количество кодонов Кодон Количество кодонов AAA 6742017 TTT 6744 661 CAG 3216 761 CTG 3 217346 AAC 2509339 GTT 2507886 CCA 2932409 TGG 2932367 AAG 3412535 CTT 3407422 CCC 1980135 GGG 1986846 AAT 4419198 ATT 4420523 CCG 394680 CGG 396760 ACA 3417383 TGT 3417331 CGA 341096 TCG 340572 ACC 1872766 GGT 1869465 CGC 345302 GCG 346653 ACG 391422 CGT 390169 CTA 2226977 TAG 2227635 ACT 2735979 AGT 2734072 CTC 2680818 GAG 2686241 AGA 3741389 TCT 3735896 GAA 3394901 TTC 3388807 AGC 2242727 GCT 2239440 GAC 1533503 GTC 1532047 AGG 2824985 CCT 2821248 GCA 2330699 TGC 2327157 ATA 3684661 TAT 3682369 GCC 1793026 GGC 1794632 ATC 2260505 GAT 2265164 GGA 2490014 TCC 2482545 ATG 3129388 CAT 3128346 GTA 1962626 TAC 1966011 CAA 3229842 TTG 3228944 TAA 3716329 TTA 3718 080 CAC 2408697 GTG 2408478 TCA 3303155 TGA 3307 301 Для 16 пар оснований ),(ij },TG,C,A,{, ji справедливы соотношения )(ijn n(Aij)  n(Cij)  n(Gij)  n(Tij)  n(ijA)  n(ijC)  n(ijG)  n(ijT). Для шести пар оснований (3), используя соотношения (10), получаем следу- ющие связывающие ограничения: n(AAC)  n(AAG)  n(AAT)  n(CAA)  n(GAA)  n(TAA), (12) n(ACA)n(ACC)n(ACG)n(ACT)  n(AAC)n(CAC)n(GAC)n(TAC), (13) n(AGA)n(AGC)n(AGG)n(AGT)  n(AAG)n(CAG)n(GAG)n(TAG), (14) n(CAA)n(CAC)n(CAG)n(CAT)  n(ACA)n(CCA)n(GCA)n(TCA), (15) n(CCA)  n(CCG)  n(CCT)  n(ACC)  n(GCC)  n(TCC), (16) n(GAA)n(GAC)n(GAG)n(GAT)  n(AGA)n(CGA)n(GGA)n(TGA), (17) Для пар AT, TA, CG и GC новые соотношения не выводятся, поскольку из (10) получаем тавтологии. Формулы (12)–(17) важны тем, что с помощью уни- версального генетического кода они переводятся в соотношения для аминокислот. Утверждение 2. Из симметрии троек оснований вытекает симметрия пар ос- нований. По аналогии с (7) для пар букв количество n(AA) и n(TT) записывается в виде соотношений n(AA)  n(AAA)  n(AAC)  n(AAG)  n(AAT), n(TT)  n(TTA)  n(TTC)  n(TTG)  n(TTT). Данные выражения с помощью )()( ijknijkn  преобразуются в равенство (12): n(AAC)  n(AAG)  n(AAT)  n(TAA)  n(GAA)  n(CAA). Доказательство для остальных пар n(CC)n(GG), n(AC)n(GT), n(AG)n(CT), n(CA)n(TG), n(GA)n(TC) проводится аналогично с учетом формул (13)–(17). Таким образом, из симметрии последовательностей оснований по индукции вытекает симметрия коротких последовательностей. Заметим, что соотноше- ния (12)–(17) выполняются для модели однородной цепи Маркова. Поскольку симметрия в записи оснований по нитям в ДНК обнаружена эмпирически и в 124 ISSN 0572-2691 настоящее время не существует объяснения этого феномена в природе, важно по- строить модель, которая будет подтверждать симметрию последовательностей оснований на базе симметрии коротких последовательностей. Утверждение 3. Для модели однородной цепи Маркова симметрия троек ос- нований вытекает из симметрии оснований и симметрии пар оснований. Из соотношений (1), (4) следует, что для однородной цепи Маркова оценки вероятностей троек оснований )(ijk и )( ijk совпадают , )()( )()()( )(ˆ )()( )()()( )(ˆ jnkn ijnjknkn ijkpn jnin jknijnin ijkpn  где n — длина хромосомы. Таким образом, ожидаемое число повторов троек ос- нований )(ijk и )( ijk совпадает по длине хромосомы. Симметрия для последовательностей оснований также подтверждается для модели однородной цепи Маркова и вытекает из симметрии пар оснований. Этот результат является следствием важного утверждения. Утверждение 4. Оценка вероятности последовательности nn xxxx ,...,,, 121  совпадает с оценкой вероятности последовательности ,,...,,, 121 xxxx nn  т.е. ).,,...,,(ˆ),...,,,(ˆ 121121 xxxxpxxxxp nnnn   (18) Вероятность однородной цепи Маркова определяется соотношением ),,(...),()(),...,,,( 1211121 nnnn xxpxxpxpxxxxp   (19) где )( 1xp — вероятность начального состояния, ),( 1 ii xxp  — переходные веро- ятности, ....,,2,1 ni  Заменив вероятность начального состояния частотой, а переходные вероят- ности ),( 1 ii xxp  в (19) их оценками (6), имеем , )(...)()( ),(...),(),()( ),...,,,(ˆ 121 132211 121     n nn nn xnxnxnn xxnxxnxxnxn xxxxp , )(...)()( ),(...),(),()( ),...,,,(ˆ 21 12211 121 xnxnxnn xxnxxnxxnxn xxxxp nn nnnnn nn     поэтому из соотношений (1), (4) получаем (18). Отсюда следует, что вероятности двух противоположных нитей хромосомы, подсчитанные в модели однородной цепи Маркова на основе оценок переходных вероятностей (6), совпадают. Учитывая , что для модели цепей Маркова симметрия последовательностей оснований вытекает из симметрии пар, соотношения для пар ),()( ijnijn  },TG,C,A,{, ji являются основными в записи информации в ДНК. 2. Одинаковая полярность цепей ДНК Заметим, что симметрия оснований (1), (2) ),2,()1,( inin  }TG,C,A,{i может выполняться и в том случае, когда обе комплементарные нити ДНК имеют одинаковые направления записи оснований (рис. 2). Однако в природе такой вид симметрии отсутствует. нить я-2 3______)________()________(5 ............................................................... нить я1- 3_____)________()________(5   ijji jiij  Рис. 2 Международный научно-технический журнал «Проблемы управления и информатики», 2011, № 3 125 Поэтому из симметрии оснований (1), (2) нельзя вывести симметрию пар основа- ний. В таком случае симметрия пар оснований ),2,(1),( ijnijn  }TG,C,A,{, ji вытекает из следующих соотношений, выполняющихся для одной нити: n(AA)  n(TT), n(CC)  n(GG), n(AC)  n(TG), n(CA)  n(GT), (20) n(AG)  n(TC), n(CG)  n(GC), n(AT)  n(TA), n(CT)  n(GA) или в виде одной формулы ).()( jinijn  (21) Заметим, что в отличие от рассмотренной симметрии (4) пары AT, TA, CG и GC присутствуют в (20), т.е. для пар оснований на два ограничения больше. Для симметрии (21) ограничения (8), (9) с учетом (21) трансформируются в одно ограничение n(CA)  n(GA)  n(AC)  n(AG). (22) Симметрия троек оснований )2,(1),( ijknijkn  вытекает из соотношений, выполняющихся для одной нити ДНК: ).()( kjinijkn  (23) Для симметрии вида (23) к шести соотношениям (12)–(17) добавляется два ограничения: n(ATC)  n(ATG)  n(ATT)  n(AAT)  n(CAT)  n(GAT), (24) n(CGA)  n(CGC)  n(CGT)  n(ACG)  n(CCG)  n(TCG). (25) Для симметрии с одинаковой полярностью нитей ДНК справедливы рассмот- ренные выше утверждения 1–3. Из соотношений (1), (21) вытекает, что для однородной цепи Маркова оценки вероятностей троек оснований )(ijk и )( kji совпадают: . )()( )()()( )(ˆ )()( )()()( )(ˆ jnin kjnjinin kjipn jnin jknijnin ijkpn  Утверждение 4 записывается следующим образом. Утверждение 4. Оценка вероятности последовательности nn xxxx ,...,,, 121  совпадает с оценкой вероятности последовательности ,,...,,, 121 nn xxxx  т.е. ).,...,,,(ˆ),...,,,(ˆ 121121 nnnn xxxxpxxxxp   (26) Проведенные исследования показывают, что симметрия вида )()( ijnijn  имеет восемь связывающих ограничений (3), (8), (9) для пар оснований, а симмет- рия )()( jinijn  содержит девять ограничений (20), (22). Для троек оснований у симметрии вида )()( kjinijkn  на два ограничения больше, чем у симметрии ).()( ijknijkn  Поэтому ДНК c противоположной полярностью нитей имеет больше степе- ней свободы, чем ДНК с одинаковой полярностью, т.е. с точки зрения теории ин- формации модель Уотсона–Крика более эффективна. 3. Генерация случайных последовательностей с симметриями обоих видов С помощью модели цепей Маркова можно легко сгенерировать случайную последовательность, для которой будет выполняться симметрия вида (1), (4), (10) для модели Уотсона–Крика. На основе оценок переходных вероятностей (6), табл. 1 126 ISSN 0572-2691 (хромосома 1) и программы псевдослучайных чисел строились случайные после- довательности оснований различной длины. В табл. 3 приведены данные по отно- сительной разности чисел комплементарных оснований (1). Табл. 4 содержит данные по тройкам оснований (10) для случайной последо- вательности длиной 22310 6 оснований. Аналогичным образом генерировались случайные последовательности, для ко- торых выполняются симметрии вида (1), (21), (23) для модели с одинаковой полярностью цепей ДНК. В табл. 5 приведены данные по относительной разности троек оснований (23) для случайной последовательности длиной 22310 6 оснований. Таблица 3 Количество оснований Минимальное отклонение min , % Максимальное отклонение max , % Среднее отклонение  , % 20000 0,13 10,39 2,86 50000 0,03 2,86 1,14 200000 0,05 2,27 0,81 106 0,02 0,91 0,29 5106 0,01 0,40 0,18 223106 5,110–3 0,31 0,13 Таблица 4 ijk ijk n(ijk) )( ijkn , % ijk ijk n(ijk) )( ijkn , % AAA TTT 6931319 6953141 0,31 CAG CTG 3968104 3971877 0,09 AAC GTT 3659367 3667685 0,23 CCA TGG 4231496 4232443 0,02 AAG CTT 5196124 5202925 0,13 CCC GGG 3166451 3163597 0,09 AAT ATT 5430603 5437075 0,12 CCG CGG 588979 587592 0,24 ACA TGT 3906403 3915530 0,23 CGA TCG 647493 646673 0,13 ACC GGT 2921470 2925418 0,13 CGC GCG 478028 477042 0,21 ACG CGT 543435 543016 0,08 CTA TAG 3472066 3470901 0,03 ACT AGT 3830137 3833597 0,09 CTC GAG 3261613 3263830 0,07 AGA TCT 4554218 4560669 0,14 GAA TTC 4353459 4362550 0,21 AGC GCT 3365393 3365564 0,01 GAC GTC 2298885 2301870 0,13 AGG CCT 4145751 4152111 0,15 GCA TGC 3432455 3435791 0,10 ATA TAT 3627798 3630628 0,08 GCC GGC 2570998 2566847 0,16 ATC GAT 3408799 3411769 0,09 GGA TCC 3473521 3480118 0,19 ATG CAT 4152825 4153497 0,02 GTA TAC 2447121 2445778 0,05 CAA TTG 5298710 5310889 0,23 TAA TTA 4633924 4634246 0,01 CAC GTG 2797415 2800885 0,12 TCA TGA 4647372 4652712 0,11 Таблица 5 ijk kji n(ijk) )( kjin , % ijk kji n(ijk) )( kjin % AAA TTT 7341532 7359207 0,24 CAA GTT 5149990 5154109 0,08 AAC TTG 3875183 3882096 0,18 CAC GTG 2720083 2720158 0,00 AAG TTC 5502305 5511508 0,17 CAG GTC 3856752 3859271 0,07 AAT TTA 5752239 5752431 0,00 CAT GTA 4034677 4036244 0,04 ACA TGT 4379729 4386669 0,16 CCA GGT 4354970 4352330 0,06 ACC TGG 3275634 3274232 0,04 CCC GGG 3259661 3253668 0,18 ACG TGC 609760 611086 0,22 CCG GGC 605309 603964 0,22 ACT TGA 3597609 3602725 0,14 CCT GGA 3575644 3569488 0,17 AGA TCT 5104466 5112922 0,17 CGA GCT 665943 664977 0,15 AGC TCG 865613 865745 0,02 CGC GCG 112966 112580 0,34 AGG TCC 4647487 4654703 0,16 CGG GCC 604063 605586 0,25 AGT TCA 6220361 6216317 0,07 CGT GCA 810422 810486 0,01 ATA TAT 4503685 4506729 0,07 CTA GAT 3311569 3313749 0,07 ATC TAG 4308309 4308723 0,01 CTC GAG 3170599 3170147 0,01 ATG TAC 3039110 3035319 0,12 CTG GAC 2233348 2232147 0,05 ATT TAA 5756291 5753158 0,05 CTT GAA 4235636 4226579 0,21 Международный научно-технический журнал «Проблемы управления и информатики», 2011, № 3 127 Таким образом, на основе модели цепей Маркова генерируются случайные последовательности, для которых выполняется симметрия для двух видов поляр- ности цепей ДНК. Заключение Показано, что для нитей ДНК возможно два вида симметрии, но в природе реализована более эффективная с точки зрения теории информации модель Уот- сона–Крика. Симметрия отдельных оснований — следствие симметрии пар осно- ваний и соответственно симметрия пар оснований — следствие симметрии троек оснований. С помощью модели однородной цепи Маркова подтверждается, что симметрия последовательностей оснований вытекает из симметрии коротких по- следовательностей (пар оснований). Решение сложных задач предсказания пространственной структуры белков показало, что если соотношения симметрии в записи генетической информации не выполняются, то байесовские процедуры распознавания на цепях Маркова не работают [3]. Полученные результаты открывают широкие возможности применения байе- совских процедур на моделях цепей Маркова для распознавания свойств участков оснований (генов), в том числе генетических заболеваний. А.М. Гупал, М.А. Гупал, О.В. Островський СИМЕТРІЯ І ВЛАСТИВОСТІ ЗАПИСУ ГЕНЕТИЧНОЇ ІНФОРМАЦІЇ В ДНК Показано, що для пар основ можливі два види симетрії, але в природі реалізо- ваний один ефективніший спосіб запису і зчитування інформації. Доведено, що з симетрії послідовностей основ витікає симетрія коротких послідовностей — окремих основ. На базі моделі ланцюгів Маркова показано, що симетрія послі- довностей основ витікає з симетрії пар основ. A.M. Gupal, N.A. Gupal, A.V. Ostrovskiy SYMMETRY AND PROPERTIES IN RECORDING OF GENETIC INFORMATION IN DNA It is shown that for the pair of bases two types of symmetry are possible, but one more effective method of record and reading of information is realized in nature. It is proved that symmetry of short sequences including separate bases follows from symmetry of sequences of bases. On the basis of Markov chains model it is shown that symmetry of sequences of bases follows from symmetry of pair of bases. 1. Baisnée P.-F., Hampson S., Baldi P. Why are complementary DNA strands symmetric? // Bioin- formatics. — 2002. — 18, N 2. — P. 1021–1033. 2. Гупал А.М., Вагис А.А. Комплементарность оснований в хромосомах ДНК // Проблемы управления и информатики. — 2005. — № 5. — С. 90–94. 3. Гупал А.М., Сергиенко И.В. Оптимальные процедуры распознавания. — Киев : Наук. дум- ка, 2008. — 232 с. 4. Anderson T.W., Goodman L.A. Statistical inference about Markov chains // The Annals of Mathemat. Statist. — 1957. — 28. — P. 89–110. Получено 16.03.2011