Симметричный код и генетические мутации

С учетом свойств симметрии в ДНК построен код, симметричный относительно полярности аминокислот при мутациях в нуклеотидах. Проведено сравнение стандартного кода со случайно сгенерированными кодами. Исследована помехоустойчивость генетических кодов относительно полярности аминокислот. На основе баз...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Кибернетика и системный анализ
Дата:2016
Автори: Сергиенко, И.В., Гупал, А.М., Вагис, А.А.
Формат: Стаття
Мова:Російська
Опубліковано: Інститут кібернетики ім. В.М. Глушкова НАН України 2016
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/131413
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Симметричный код и генетические мутации / И.В. Сергиенко, А.М. Гупал, А.А. Вагис // Кибернетика и системный анализ. — 2016. — Т. 52, № 2. — С. 73-80. — Бібліогр.: 6 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859940590675820544
author Сергиенко, И.В.
Гупал, А.М.
Вагис, А.А.
author_facet Сергиенко, И.В.
Гупал, А.М.
Вагис, А.А.
citation_txt Симметричный код и генетические мутации / И.В. Сергиенко, А.М. Гупал, А.А. Вагис // Кибернетика и системный анализ. — 2016. — Т. 52, № 2. — С. 73-80. — Бібліогр.: 6 назв. — рос.
collection DSpace DC
container_title Кибернетика и системный анализ
description С учетом свойств симметрии в ДНК построен код, симметричный относительно полярности аминокислот при мутациях в нуклеотидах. Проведено сравнение стандартного кода со случайно сгенерированными кодами. Исследована помехоустойчивость генетических кодов относительно полярности аминокислот. На основе баз данных генетических заболеваний показано, что симметричный код в большинстве случаев исправляет нарушение полярности при мутациях. З урахуванням властивостей симетрії у ДНК побудовано код, симетричний відносно полярності амінокислот при мутаціях у нуклеотидах. Проведено порівняння стандартного коду з випадково згенерованими кодами. Досліджено завадостійкість генетичного коду щодо полярності амінокислот. На основі баз даних генетичних захворювань показано, що симетричний код у більшості випадків виправляє порушення полярності при мутаціях. The symmetric code concerning polarity of amino acids at mutations in nucleotides is constructed using symmetry in DNA. A universal code is compared with randomly generated codes. The noise immunity of genetic code against amino acid polarity is analyzed. Databases of genetic diseases are used to show that symmetric code corrects violation of polarity in mutations in most cases.
first_indexed 2025-12-07T16:11:17Z
format Article
fulltext È.Â. ÑÅÐÃÈÅÍÊÎ, À.Ì. ÃÓÏÀË, À.À. ÂÀÃÈÑ ÓÄÊ 519.217.2 ÑÈÌÌÅÒÐÈ×ÍÛÉ ÊÎÄ È ÃÅÍÅÒÈ×ÅÑÊÈÅ ÌÓÒÀÖÈÈ Àííîòàöèÿ. Ñ ó÷åòîì ñâîéñòâ ñèììåòðèè â ÄÍÊ ïîñòðîåí êîä, ñèììåòðè÷íûé îòíîñè- òåëüíî ïîëÿðíîñòè àìèíîêèñëîò ïðè ìóòàöèÿõ â íóêëåîòèäàõ. Ïðîâåäåíî ñðàâíåíèå ñòàí- äàðòíîãî êîäà ñî ñëó÷àéíî ñãåíåðèðîâàííûìè êîäàìè. Èññëåäîâàíà ïîìåõîóñòîé÷èâîñòü ãåíåòè÷åñêèõ êîäîâ îòíîñèòåëüíî ïîëÿðíîñòè àìèíîêèñëîò. Íà îñíîâå áàç äàííûõ ãåíåòè- ÷åñêèõ çàáîëåâàíèé ïîêàçàíî, ÷òî ñèììåòðè÷íûé êîä â áîëüøèíñòâå ñëó÷àåâ èñïðàâëÿåò íàðóøåíèå ïîëÿðíîñòè ïðè ìóòàöèÿõ. Êëþ÷åâûå ñëîâà: ãåíåòè÷åñêèé êîä, ìóòàöèè, ïîìåõîóñòîé÷èâîñòü, àìèíîêèñëîòà, íóêëå- îòèä, êîäîí, ãåíåòè÷åñêèé àëãîðèòì. ÂÂÅÄÅÍÈÅ Óíèâåðñàëüíûé ãåíåòè÷åñêèé êîä, ñîãëàñíî êîòîðîìó â æèâûõ îðãàíèçìàõ ïðîèñõîäèò ñèíòåç áåëêîâ íà îñíîâå èíôîðìàöèè, ñîäåðæàùåéñÿ â ÄÍÊ, áûë îòêðûò â 60-õ ãîäàõ XX âåêà [1]. Îäíèì èç îñíîâíûõ ôàêòîðîâ, êîòîðûå ìîãëè âëèÿòü íà ýâîëþöèþ êîäà, ÿâëÿëîñü ïîâûøåíèå åãî óñòîé÷èâîñòè ïî îòíîøåíèþ ê ìóòàöèÿì — èñêàæåíèÿì ãåíåòè÷åñêîé èíôîðìàöèè, âîçíèêàþùèì â êëåòêàõ ëþáîãî îðãàíèçìà. Ìóòàöèè ïðîèñõîäÿò èç-çà îøèáîê â ðåïëèêàöèè â ÄÍÊ èëè ðàçðóøèòåëüíûõ âîçäåéñòâèé ìóòàãåíîâ, òàêèõ êàê õèìè÷åñêèå àãåíòû è ðàäè- àöèÿ, êîòîðûå ðåàãèðóþò ñ ÄÍÊ è èçìåíÿþò ñòðóêòóðó îòäåëüíûõ íóêëåîòè- äîâ (îñíîâàíèé).  ìíîãîêëåòî÷íîì îðãàíèçìå òîëüêî ñîáûòèÿ, ïðîèñõîäÿùèå â çàðîäûøåâûõ êëåòêàõ, ñîïðÿæåíû ñ ýâîëþöèåé ãåíîìà. Èçìåíåíèÿ â ãåíî- ìàõ ñîìàòè÷åñêèõ êëåòîê íå âëèÿþò íà ýâîëþöèþ, íî îíè ïðèîáðåòàþò áèî- ëîãè÷åñêóþ çíà÷èìîñòü, åñëè ïîðîæäàþò ïîðî÷íûé ôåíîòèï, êîòîðûé ãóáè- òåëüíî ñêàçûâàåòñÿ íà çäîðîâüå îðãàíèçìà. Îïðåäåëåíèå ïîñëåäîâàòåëüíîñòè íóêëåîòèäîâ ïåðâîãî ðàñøèôðîâàííîãî ãåíîìà áûëî âûïîëíåíî â ïðîåêòå «Ãåíîì ×åëîâåêà», êîòîðûé çàâåðøèëñÿ â 2001 ãîäó è ñòîèë 3 ìëðä äîëëàðîâ. Îòìå÷àëîñü, ÷òî ãåíîìû ëþäåé èäåíòè÷- íû íà 99,9%, îñòàâøèåñÿ 0,1% ãåíîìà îòâå÷àþò çà èíäèâèäóàëüíûå ïðèçíàêè, òàêèå êàê öâåò ãëàç, ñïîñîáíîñòü óñâàèâàòü ëàêòîçó ëèáî ñêëîííîñòü ê îïðåäå- ëåííûì çàáîëåâàíèÿì. Ñëåäóþùåé öåëüþ ñîîáùåñòâà, ñîñòîÿùåãî èç àêàäåìè- ÷åñêèõ è êîììåð÷åñêèõ îðãàíèçàöèé, ñòàëî ïîâûøåíèå ýôôåêòèâíîñòè ìåòîäîâ ðàñøèôðîâêè ãåíîìîâ, äëÿ òîãî ÷òîáû ñíèçèòü öåíó çà ýòó ïðîöåäóðó äî òûñÿ- ÷è äîëëàðîâ çà ãåíîì. Ñ òåõ ïîð ñêîðîñòü è òî÷íîñòü ðàñøèôðîâêè ãåíîìîâ ïî- ñòîÿííî ïîâûøàåòñÿ, à ñòîèìîñòü íåóêëîííî ñíèæàåòñÿ.  íàñòîÿùèé ïåðèîä âðåìÿ ðàñøèôðîâêè ãåíîìà ÷åëîâåêà ñîñòàâëÿåò ïðèìåðíî íåñêîëüêî ìåñÿöåâ, à öåíà — òûñÿ÷ó äîëëàðîâ. Èçâåñòíî, ÷òî çàìåíà àìèíîêèñëîòû è íàðóøåíèå åå ïîëÿðíîñòè â áåëêàõ âðåäíû, ïîñêîëüêó ÷åðåäîâàíèåì ïîëÿðíûõ è íåïîëÿðíûõ àìèíîêèñëîò îïðåäå- ëÿåòñÿ èõ ïðîñòðàíñòâåííàÿ ñòðóêòóðà.  ðàáîòàõ [1, 2] ïðåäïîëàãàëîñü, ÷òî â ðå- çóëüòàòå ýâîëþöèè îòîáðàí íàèáîëåå ïîìåõîóñòîé÷èâûé âàðèàíò, ò.å. ñòàíäàðò- ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2016, òîì 52, ¹ 2 73 © È.Â. Ñåðãèåíêî, À.Ì. Ãóïàë, À.À. Âàãèñ, 2016 74 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2016, òîì 52, ¹ 2 íûé ãåíåòè÷åñêèé êîä æèâûõ îðãàíèçìîâ (òàáë. 1) ñâîäèò ê ìèíèìóìó çàìåíû ìåæäó ïîëÿðíûìè (ï) è íåïîëÿðíûìè (í) àìèíîêèñëîòàìè. Àìèíîêèñëîòû, ñëàãàþùèå áåëîê, äåëÿòñÿ íà ïîëÿðíûå (10 øòóê) è íåïîëÿð- íûå (10 øòóê). Ïîëÿðíûå: àñïàðàãèíîâàÿ êèñëîòà (D), ãëóòàìèíîâàÿ êèñëîòà (E), ãèñòèäèí (H), ëèçèí (K), àñïàðàãèí (N), ãëóòàìèí (Q), àðãèíèí (R), ñåðèí (S), òðå- îíèí (T), òèðîçèí (Y). Íåïîëÿðíûå: àëàíèí (A), öèñòåèí (C), ôåíèëàëàíèí (F), ãëèöèí (G), èçîëåéöèí (I), ëåéöèí (L), ìåòèîíèí (M), ïðîëèí (P), âàëèí (V), òðèï- òîôàí (W). Àìèíîêèñëîòû îòëè÷àþòñÿ ïî âçàèìîäåéñòâèþ ñ ìîëåêóëàìè âîäû. Íåïîëÿðíûå àìèíîêèñëîòû áîëåå ãèäðîôîáíû, îíè îòòàëêèâàþò ìîëåêóëû âîäû è ñëèïàþòñÿ îäíà ñ äðóãîé, ïîëÿðíûå — ãèäðîôèëüíû è âçàèìîäåéñòâóþò ñ âî- äîé; â ðåçóëüòàòå îáðàçóåòñÿ ñëîæíàÿ ôîðìà, ñîîòâåòñòâóþùàÿ âûïîëíÿåìîé áåëêîì ôóíêöèè. Åñëè ïðè ìóòàöèè ïîëÿðíûé îñòàòîê â áåëêå ñìåíèòñÿ íà íå- ïîëÿðíûé (èëè íàîáîðîò), òî ôîðìà ìîëåêóëû ìîæåò èçìåíèòüñÿ íàñòîëüêî, ÷òî áåëîê íå ñìîæåò âûïîëíÿòü ñâîåé ôóíêöèè. ÏÎÌÅÕÎÓÑÒÎÉ×ÈÂÎÑÒÜ ÊÎÄÀ Èññëåäóåì ïîâåäåíèå ïîìåõîóñòîé÷èâîñòè êîäà ïðè èçìåíåíèè îäíîãî èç îñíîâàíèé (íóêëåîòèäîâ) â òðèïëåòå, êîòîðûé êîäèðóåò àìèíîêèñëîòó. Êàæ- äûé êîäîí äîïóñêàåò äåâÿòü îäíîêðàòíûõ çàìåí, ÷èñëî êîäèðóþùèõ àìèíî- êèñëîòû òðèïëåòîâ ðàâíî 61. Ïîýòîìó êîëè÷åñòâî âîçìîæíûõ çàìåí íóêëåî- òèäîâ äëÿ âñåõ êîäîíîâ — 549; èç íèõ 23 çàìåíû íóêëåîòèäîâ ïðèâîäÿò ê ïîÿâëåíèþ ñòîï-êîäîíîâ, 134 çàìåíû íå ìåíÿþò êîäèðóåìîé àìèíîêèñëîòû, 230 çàìåí íå ìåíÿþò êëàññà êîäèðóåìîé àìèíîêèñëîòû. Äëÿ ñòàíäàðòíîãî êîäà âîçìîæíû 526 çàìåùåíèé, â êîòîðûõ êîäîí äî è ïîñëå ìóòàöèè íå ÿâ- ëÿåòñÿ îäíèì èç òðåõ ñòîï-êîäîíîâ, èç íèõ 364 çàìåùåíèÿ íå ìåíÿþò ïîëÿð- íîñòè, ò.å. åãî ïîìåõîóñòîé÷èâîñòü ñîñòàâëÿåò 364/526 = 69,20%. Ñòàíäàðòíûé ãåíåòè÷åñêèé êîä ñîïîñòàâëÿåò êàæäîé òðîéêå ïîñëåäîâàòåëüíûõ íóêëåîòèäîâ (êîäîíó) ãåíà îäíó èç ïåðå÷èñëåííûõ àìèíîêèñëîò (òàáë. 1). Ïðè ýòîì òðåì êîäîíàì (TAA, TAG è TGA — òàê íàçûâàåìûå ñòîï-êîäîíû) íå ñîîòâå- òñòâóåò íè îäíà àìèíîêèñëîòà — îíè ñèãíàëèçèðóþò îá îñòàíîâå ïðîöåññà ñèíòå- çà áåëêà. Ïîñêîëüêó îñòàâøèéñÿ 61 êîäîí êîäèðóåò 20 àìèíîêèñëîò, còàíäàðòíûé Ïåðâîå îñíîâàíèå Âòîðîå îñíîâàíèå Òðåòüå îñíîâàíèå T C A G T Ôåíèëàëàíèí (F), í Ñåðèí (S), ï Òèðîçèí (Y), ï Öèñòåèí (C), í T Ôåíèëàëàíèí (F), í Ñåðèí (S), ï Òèðîçèí (Y), ï Öèñòåèí (C), í C Ëåéöèí (L), í Ñåðèí (S), ï Ñòîï Ñòîï A Ëåéöèí (L), í Ñåðèí (S), ï Ñòîï Òðèïòîôàí (W), í G C Ëåéöèí (L), í Ïðîëèí (P), í Ãèñòèäèí (H), ï Àðãèíèí (R), ï T Ëåéöèí (L), í Ïðîëèí (P), í Ãèñòèäèí (H), ï Àðãèíèí (R), ï C Ëåéöèí (L), í Ïðîëèí (P), í Ãëóòàìèí (Q), ï Àðãèíèí (R), ï A Ëåéöèí (L), í Ïðîëèí (P), í Ãëóòàìèí (Q), ï Àðãèíèí (R), ï G A Èçîëåéöèí (I), í Òðåîíèí (T), ï Àñïàðàãèí (N), ï Ñåðèí (S), ï T Èçîëåéöèí (I), í Òðåîíèí (T), ï Àñïàðàãèí (N), ï Ñåðèí (S), ï C Èçîëåéöèí (I), í Òðåîíèí (T), ï Ëèçèí (K), ï Àðãèíèí (R), ï A Ìåòèîíèí (M), í Òðåîíèí (T), ï Ëèçèí (K), ï Àðãèíèí (R), ï G G Âàëèí (V), í Àëàíèí (A), í Àñïàðàãèíîâàÿ êèñëîòà (D), ï Ãëèöèí (G), í T Âàëèí (V), í Àëàíèí (A), í Àñïàðàãèíîâàÿ êèñëîòà (D), ï Ãëèöèí (G), í C Âàëèí (V), í Àëàíèí (A), í Ãëóòàìèíîâàÿ êèñëîòà (E), ï Ãëèöèí (G), í A Âàëèí (V), í Àëàíèí (A), í Ãëóòàìèíîâàÿ êèñëîòà (E), ï Ãëèöèí (G), í G Ò à á ë è ö à 1 . Ñòàíäàðòíûé ãåíåòè÷åñêèé êîä æèâûõ îðãàíèçìîâ êîä õàðàêòåðèçóåòñÿ âûðîæäåííîñòüþ: âñåì àìèíîêèñëîòàì, êðîìå òðèïòîôàíà è ìåòèîíèíà, ñîîòâåòñòâóåò áîëåå ÷åì îäèí êîäîí. Âûðîæäåííîñòü êîäà ñíèæàåò âîçìîæíûå íàðóøåíèÿ, âûçâàííûå ìóòàöèÿìè. Íåêîòîðûå àìèíîêèñëîòû, òàêèå êàê âàëèí, îïðåäåëÿþòñÿ ÷åòâåðêîé êîäîíîâ, ïîýòîìó ïðè ëþáîé çàìåíå òðåòüåãî íóê- ëåîòèäà â êîäîíå èçìåíåíèÿ àìèíîêèñëîòû â áåëêå íå ïðîèñõîäèò. Êîìïüþòåðíûå ðàñ÷åòû ïîêàçàëè, ÷òî ñòàíäàðòíûé ãåíåòè÷åñêèé êîä íå ÿâëÿåòñÿ îïòèìàëüíûì îòíîñèòåëüíî ïîìåõîóñòîé÷èâîñòè äàæå ëîêàëüíî, ïîñêîëüêó èìåþòñÿ ïàðíûå ïåðåñòàíîâêè êîäîíîâ, à òàêæå èçìåíåíèÿ â òèïå àìèíîêèñëîòû, ïîâûøàþùèå åãî ïîìåõîóñòîé÷èâîñòü [3, 4]. Ñóùåñòâóåò 40 åäèíè÷íûõ èçìåíåíèé â òèïå àìèíîêèñ- ëîòû, óâåëè÷èâàþùèõ ïîìåõîóñòîé÷èâîñòü êîäà. Èç íèõ 38 ñëó÷àåâ ñîñòàâëÿþò çàìåíû àìèíîêèñëîòû íà ñòîï-êîäîí.  äâóõ ñëó÷àÿõ ñòîï-êîäîí çàìåíÿåòñÿ ïîëÿðíîé àìèíî- êèñëîòîé. Òàêèì îáðàçîì, íå ñóùåñòâóåò åäèíè÷íûõ èçìåíåíèé, óëó÷øàþùèõ ïîìåõî- óñòîé÷èâîñòü, êîòîðûå áû ñîõðàíÿëè ïðè ýòîì òðè ñòîï-êîäîíà. Èìååòñÿ 51 ïàðíàÿ ïå- ðåñòàíîâêà àìèíîêèñëîò ñî ñòîï-êîäîíîì, ïîâûøàþùàÿ ïîìåõîóñòîé÷èâîñòü. ÑÈÌÌÅÒÐÈß Â ÄÍÊ È ÑÈÌÌÅÒÐÈ×ÍÛÉ ÊÎÄ Â ðàáîòå [5] èññëåäîâàíà ñèììåòðèÿ è ñâîéñòâà çàïèñè ãåíåòè÷åñêîé èíôîðìà- öèè â ÄÍÊ. Ñîîòíîøåíèÿ ñèììåòðèè âûâîäÿòñÿ ïî îäíîé íèòè â ÄÍÊ: êîëè- ÷åñòâî êîðîòêèõ ïîñëåäîâàòåëüíîñòåé íóêëåîòèäîâ ïðèìåðíî ðàâíî êîëè÷åñòâó îáðàòíî êîìïëåìåíòàðíûõ ïîñëåäîâàòåëüíîñòåé. Äëÿ êîäîíîâ ñèììåòðèÿ ïî îäíîé íèòè ÄÍÊ çàïèñûâàåòñÿ â âèäå n ijk n k ji( ) ( )� . (1) ãäå n ijk( ) — ÷èñëî òðîåê îñíîâàíèé ( )ijk , i j k, , { }� A,C,G,T , ( )k ji — àíòèêîäîí êîäîíà ( )ijk .  êîäå, ñèììåòðè÷íîì îòíîñèòåëüíî ïîëÿðíîñòè, êîäîí ( )ijk êî- äèðóåò ïîëÿðíóþ àìèíîêèñëîòó, à àíòèêîäîí ( )k ji — íåïîëÿðíóþ, ëèáî íàî- áîðîò (áåç ó÷åòà ñòîï-êîäîíîâ). Äëÿ ÷åòíûõ êîäîâ ñèììåòðè÷íûé êîä, ïîíèìàåìûé â òàêîì ñìûñëå, ïîñòðî- èòü íåëüçÿ. Äëÿ ïàð íóêëåîòèäîâ âûïîëíÿþòñÿ ñîîòíîøåíèÿ n ij n ji( ) ( )� , (2) ãäå i j, { }� A,C,G,T , A T� , C G� , T A� , G C� . Çàìåòèì, ÷òî ïàðû AT, TA, CG è GC íå ñîäåðæàòñÿ â (2), ïîñêîëüêó îíè ïðèâîäÿò ê òàâòîëîãèè. Ïîýòîìó n n( ) ( )AT TA� , n n( ) ( )GC CG� . Äëÿ ÷åòûðåõáóêâåííîãî êîäà òàêèõ èñêëþ÷åíèé 16. Òàêèì îáðàçîì, ñèììåòðèÿ â ÄÍÊ äàåò âîçìîæíîñòü ïîñòðîèòü êîä, ñèììåòðè÷íûé îòíîñèòåëüíî ïîëÿðíîñòè àìèíîêèñëîò. Àíàëèçèðóÿ òàáë. 1, îòìåòèì, ÷òî â ñòîëáöå T ñîäåðæàòñÿ íåïîëÿðíûå àìè- íîêèñëîòû, â ñòîëáöå A — ïîëÿðíûå, â ñòîëáöàõ C è G â äâóõ êëåòêàõ òàáëèöû — ïîëÿðíûå è íåïîëÿðíûå. Ïîýòîìó ìîæíî ñ÷èòàòü, ÷òî ñòàíäàðòíûé êîä íà 3/4 ñî- îòâåòñòâóåò ñèììåòðè÷íîìó êîäó.  òàáë. 2 ïðåäñòàâëåí îïòèìàëüíûé ïîìåõîóñòîé÷èâûé ñèììåòðè÷íûé êîä [3, 4], â êîòîðîì òðè ñòîï-êîäîíà è ÷èñëî òðèïëåòîâ, îïðåäåëÿþùèõ ïîëÿðíûå è íåïî- ëÿðíûå àìèíîêèñëîòû, òàêîå æå, êàê â ñòàíäàðòíîì êîäå: 30 òðèïëåòîâ çàäàþò ïîëÿðíûå àìèíîêèñëîòû, 31 — íåïîëÿðíûå. Ýòîò êîä ïîñòðîåí íà îñíîâå âîñüìè ïàðíûõ ïåðåñòàíîâîê èç ñòàíäàðòíîãî êîäà, æèðíûì øðèôòîì âûäåëåíû èçìåíå- íèÿ ïî ñðàâíåíèþ ñî ñòàíäàðòíûì êîäîì. Ïîìåõîóñòîé÷èâîñòü êîäà ñîñòàâëÿåò 408/524 = 77,86%, ïðè ýòîì 138 çàìåí â îñíîâàíèÿõ ñîõðàíÿþò òó æå àìèíîêèñ- ëîòó. Êàê âèäíî, ñèììåòðè÷íûé êîä èìååò äîñòàòî÷íî ïðîñòóþ ñòðóêòóðó è åãî ìîæíî ïîëó÷èòü áåç âûïîëíåíèÿ êîìïüþòåðíûõ ðàñ÷åòîâ: ÷åòûðå ïàðíûå ïåðå- ñòàíîâêè çàìåíÿþò òðåîíèí íà ãëèöèí è ÷åòûðå ïåðåñòàíîâêè — ñåðèí íà ñòîï-êîäîí, òðèïòîôàí è öèñòåèí, öèñòåèí. Ýòîò êîä îáðàçóåòñÿ èç ñòàíäàðòíîãî êîäà ñ ïîìîùüþ ìèíèìàëüíîãî ÷èñëà ïåðåñòàíîâîê. Ïîìåõîóñòîé÷èâîñòü ñèììåòðè÷íîãî êîäà íåìíîãî ïðåâûøàåò 7/9 (çà ñ÷åò íà- ëè÷èÿ ñòîï-êîäîíîâ), ïîñêîëüêó íå áîëåå äâóõ ìóòàöèé èç äåâÿòè íàðóøàþò ïîëÿð- íîñòü àìèíîêèñëîò. Ïåðâûå äâà ñòîëáöà ïîëó÷åííîãî êîäà ñîäåðæàò íåïîëÿðíûå ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2016, òîì 52, ¹ 2 75 àìèíîêèñëîòû, òðåòèé è ÷åòâåðòûé — ïîëÿðíûå, ò.å. åñëè êîäîí ( )ijk îïðåäåëÿåò ïî- ëÿðíóþ àìèíîêèñëîòó, òî êîäîí ( )k ji — íåïîëÿðíóþ, è íàîáîðîò. Ñ ïîìîùüþ ïàð- íûõ ïåðåñòàíîâîê àìèíîêèñëîò íåëüçÿ ïîâûñèòü ïîìåõîóñòîé÷èâîñòü ñèììåòðè÷íî- ãî êîäà, à äðóãèõ ñïîñîáîâ åå ïîâûøåíèÿ íå ñóùåñòâóåò. Íàïðèìåð, åñëè â êëåòêå ñ ïåðâûìè äâóìÿ íóêëåîòèäàìè TC ñîäåðæàòñÿ àìèíîêèñëîòû öèñòåèí, öèñòåèí, ñòîï-êîäîí è òðèïòîôàí, òî ïîëó÷àåòñÿ êîä, èìåþùèé ïîìåõîóñòîé÷èâîñòü 408/526 = 77,57% . ÑËÓ×ÀÉÍÛÅ ÃÅÍÅÒÈ×ÅÑÊÈÅ ÊÎÄÛ. ÃÅÍÅÒÈ×ÅÑÊÈÅ ÀËÃÎÐÈÒÌÛ Ïåðâûì ýòàïîì âû÷èñëèòåëüíîãî ýêñïåðèìåíòà áûëà îöåíêà ïîìåõîóñòîé÷èâîñ- òè ñòàíäàðòíîãî ãåíåòè÷åñêîãî êîäà ïî ñðàâíåíèþ ñî ñëó÷àéíûìè ãåíåòè÷åñêè- ìè êîäàìè, ïðèíàäëåæàùèìè ê îäíîìó èç äâóõ êëàññîâ: êîäû, ÿâëÿþùèåñÿ «ïå- ðåñòàíîâêàìè» ñòàíäàðòíîãî êîäà, è êîäû, èìåþùèå ïðèìåðíî îäèíàêîâîå ñî ñòàíäàðòíûì êîäîì ðàñïðåäåëåíèå õàðàêòåðèñòèê. Êîëè÷åñòâî ñòîï-êîäîíîâ â êîäàõ ýòîãî êëàññà èçìåíÿëîñü îò äâóõ äî ÷åòûðåõ, êîëè÷åñòâî êîäîíîâ ïî- ëÿðíûõ è íåïîëÿðíûõ àìèíîêèñëîò íàõîäèëîñü â äèàïàçîíå 27 � �ï, í 34 . Ðåçóëüòàòû óñðåäíåííûõ çíà÷åíèé è ñðåäíåêâàäðàòè÷íûõ îòêëîíåíèé äëÿ105 êîäîâ ñëåäóþùèå: ïîìåõîóñòîé÷èâîñòü ïåðåñòàíîâî÷íûõ êîäîâ — 4919 2 91, ,� , ïî- ìåõîóñòîé÷èâîñòü áëèçêèõ êîäîâ — 50 21 310, ,� . Êàê âèäíî, ñòàíäàðòíûé ãåíåòè- ÷åñêèé êîä óñòîé÷èâ ê ïîìåõàì â ñóùåñòâåííî áîëüøåé ñòåïåíè, ÷åì ãåíåòè÷åñ- êèé êîä â ñðåäíåì, ÷òî ñâèäåòåëüñòâóåò îá îáîñíîâàííîñòè ãèïîòåçû î ïîìåõîóñ- òîé÷èâîñòè êàê îäíîãî èç ôàêòîðîâ, âëèÿþùèõ íà ýâîëþöèþ êîäà.  ãåíåòè÷åñêèõ àëãîðèòìàõ â êà÷åñòâå «îðãàíèçìîâ» ïîïóëÿöèè èñïîëüçîâà- ëèñü íå ñàìè ãåíåòè÷åñêèå êîäû (òàáëèöû, ñòàâÿùèå êàæäîìó êîäîíó â ñîîòâå- òñòâèå îäíó èç 20 àìèíîêèñëîò èëè ñòîï-ñèãíàë), à òàáëèöû ïîëÿðíîñòè, ñòàâÿùèå â ñîîòâåòñòâèå êàæäîìó êîäîíó îäèí èç òðåõ òèïîâ èíôîðìàöèè: ïîëÿðíóþ àìè- íîêèñëîòó, íåïîëÿðíóþ àìèíîêèñëîòó èëè ñòîï-êîäîí. Ñ ïîìîùüþ òàáëèö ïîëÿðíîñòè ìîæíî èñêëþ÷èòü èçáûòî÷íóþ èíôîðìà- öèþ, ïîñêîëüêó âàðèàíòîâ ãåíåòè÷åñêèõ êîäîâ ñóùåñòâóåò ïðèìåðíî 2164 , à òàá- 76 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2016, òîì 52, ¹ 2 Ïåðâîå îñíîâàíèå Âòîðîå îñíîâàíèå Òðåòüå îñíîâàíèå T C A G T Ôåíèëàëàíèí (F), í Ñòîï Òèðîçèí (Y), ï Ñåðèí (S), ï T Ôåíèëàëàíèí (F), í Òðèïòîôàí (W), í Òèðîçèí (Y), ï Ñåðèí (S), ï C Ëåéöèí (L), í Öèñòåèí (C), í Ñòîï Ñåðèí (S), ï A Ëåéöèí (L), í Öèñòåèí (C), í Ñòîï Ñåðèí (S), ï G C Ëåéöèí (L), í Ïðîëèí (P), í Ãèñòèäèí (H), ï Àðãèíèí (R), ï T Ëåéöèí (L), í Ïðîëèí (P), í Ãèñòèäèí (H), ï Àðãèíèí (R), ï C Ëåéöèí (L), í Ïðîëèí (P), í Ãëóòàìèí (Q), ï Àðãèíèí (R), ï A Ëåéöèí (L), í Ïðîëèí (P), í Ãëóòàìèí (Q), ï Àðãèíèí (R), ï G A Èçîëåéöèí (I), í Ãëèöèí (G), í Àñïàðàãèí (N), ï Ñåðèí (S), ï T Èçîëåéöèí (I), í Ãëèöèí (G), í Àñïàðàãèí (N), ï Ñåðèí (S), ï C Èçîëåéöèí (I), í Ãëèöèí (G), í Ëèçèí (K), ï Àðãèíèí (R), ï A Ìåòèîíèí (M), í Ãëèöèí (G), í Ëèçèí (K), ï Àðãèíèí (R), ï G G Âàëèí (V), í Àëàíèí (A), í Àñïàðàãèíîâàÿ êèñëîòà (D), ï Òðåîíèí (T), ï T Âàëèí (V), í Àëàíèí (A), í Àñïàðàãèíîâàÿ êèñëîòà (D), ï Òðåîíèí (T), ï C Âàëèí (V), í Àëàíèí (A), í Ãëóòàìèíîâàÿ êèñëîòà (E), ï Òðåîíèí (T), ï A Âàëèí (V), í Àëàíèí (A), í Ãëóòàìèíîâàÿ êèñëîòà (E), ï Òðåîíèí (T), ï G Ò à á ë è ö à 2 . Ñèììåòðè÷íûé êîä ëèö ïîëÿðíîñòè — âñåãî 364 . Ïîýòîìó, èñïîëüçóÿ ãåíåòè÷åñêèå àëãîðèòìû, óäà- ëîñü äîñòàòî÷íî ýêîíîìíî è áûñòðî ïîñòðîèòü îïòèìàëüíûå âàðèàíòû ïîìåõîóñ- òîé÷èâûõ ãåíåòè÷åñêèõ êîäîâ, êîòîðûå îòëè÷àþòñÿ îò ñòàíäàðòíîãî êîäà ÷èñëîì ñòîï-êîäîíîâ è êîëè÷åñòâîì ïîëÿðíûõ è íåïîëÿðíûõ òðèïëåòîâ. Ïî àíàëîãèè ñî ñòàíäàðòíûì êîäîì ïðîèçâîëüíûé ãåíåòè÷åñêèé êîä ìîæíî ðàññìàòðèâàòü êàê ôóíêöèþ f C S: � , îòîáðàæàþùóþ ìíîæåñòâî êîäîíîâ C � { }A,C,G,T 3 íà ìíîæåñòâî S stop� { , , }0 1 . Äëÿ îïòèìèçàöèè ïîìåõîóñòîé÷èâîñòè íà ìíîæåñòâàõ ïåðåñòàíîâîê ñòàí- äàðòíîãî êîäà è «áëèçêèõ» ê íåìó êîäîâ èñïîëüçîâàëñÿ ãåíåòè÷åñêèé àëãîðèòì. Øàã 1. Çàäàòü íà÷àëüíîå ïîêîëåíèå, ñîñòîÿùåå èç N 0 ñëó÷àéíûõ ïåðåñòàíî- âîê ñòàíäàðòíîãî ãåíåòè÷åñêîãî êîäà. Øàã 2. Äëÿ êàæäîãî èç T ïîêîëåíèé Ft , t T�1, ..., , âûïîëíèòü øàãè 3–6. Øàã 3. Äîáàâèòü â òåêóùåå ïîêîëåíèå Ft ðåçóëüòàòû ñêðåùèâàíèÿ êàæäîãî êîäà f Fi t� ñ îïðåäåëåííûì êîëè÷åñòâîì N c äðóãèõ êîäîâ èç Ft , âûáðàííûõ ñëó÷àéíûì îáðàçîì. Øàã 4. Äîáàâèòü â ïîêîëåíèå Ft çàäàííîå êîëè÷åñòâî N m ìóòàöèé êàæäîãî êîäà f Fi t� . Øàã 5. Óäàëèòü èç ïîêîëåíèÿ êîäû, íå ïðèíàäëåæàùèå ê ðàññìàòðèâàåìîìó êëàññó. Øàã 6. Ïåðåâåñòè â ñëåäóþùåå ïîêîëåíèå íå áîëåå L êîäîâ, îáëàäàþùèõ íàèáîëüøåé ïîìåõîóñòîé÷èâîñòüþ. Ïóñòü St — ñòàíäàðòíûé ãåíåòè÷åñêèé êîä, P sSt ( ), s S� , — âåðîÿòíîñòè ôèêñàöèè â íåì ñîîòâåòñòâóþùèõ ñîñòîÿíèé: P s St sSt ( ) | ( )|� 1 64 1 . Ïîíÿòèå ìóòàöèè ãåíåòè÷åñêîãî êîäà m f( ), f C S: � , îïðåäåëåíî ñëåäóþ- ùèì îáðàçîì: m f u f u p x S pP ( )( ) ( ) ( ), � � ñ âåðîÿòíîñòüþ ñ âåðîÿòíîñòüþ 1 St Stx P f u( ) / ( ( ( ))).1 � � Òàêèì îáðàçîì, ïðè ìóòàöèè çíà÷åíèå ôóíêöèè êîäà, ñîîòâåòñòâóþùåå êàæäî- ìó èç 64 êîäîíîâ, ìîæåò ñ îïðåäåëåííîé âåðîÿòíîñòüþ p èçìåíèòüñÿ íà äðó- ãîå âîçìîæíîå çíà÷åíèå, ïðè÷åì ðàñïðåäåëåíèå âåðîÿòíîñòåé ïåðåõîäà ñîîòâåò- ñòâóåò ðàñïðåäåëåíèþ çíà÷åíèé â ñòàíäàðòíîì ãåíåòè÷åñêîì êîäå. Ðåçóëüòàò ñêðåùèâàíèÿ äâóõ êîäîâ, f i è f j , îïðåäåëÿëñÿ êàê ( )( ) ( ) / , ( ) f f u f u f u i j i j � ñ âåðîÿòíîñòüþ ñ âåðîÿòíîñ 1 2 òüþ 1 2/ . � � Èñïîëüçîâàëèñü ñëåäóþùèå ïàðàìåòðû àëãîðèòìà: êîëè÷åñòâî ïîêîëåíèé T � 50 000 ; ðàçìåð íà÷àëüíîãî ïîêîëåíèÿ N 0 50� ; ìàêñèìàëüíûé ðàçìåð ïîêî- ëåíèÿ L � 250 ; ÷èñëî ñêðåùèâàíèé è ìóòàöèé äëÿ êàæäîãî êîäà N c � 4 è N m � 2 ñîîòâåòñòâåííî; âåðîÿòíîñòü ìóòàöèè â îòäåëüíîì êîäîíå p � 0 1, . Ñ ïîìîùüþ ãåíåòè÷åñêèõ àëãîðèòìîâ ïîñòðîåíû ðàçëè÷íûå âàðèàíòû íàè- áîëåå ïîìåõîóñòîé÷èâûõ îòíîñèòåëüíî ïîëÿðíîñòè êîäîâ, â òîì ÷èñëå ïîëó÷åí îïòèìàëüíûé ñèììåòðè÷íûé êîä â òàáë. 2, à òàêæå êîäû, îòëè÷àþùèåñÿ îò ñòàí- äàðòíîãî êîäà ÷èñëîì ñòîï-êîäîíîâ è êîëè÷åñòâîì òðèïëåòîâ, îïðåäåëÿþùèõ ïîëÿðíûå è íåïîëÿðíûå àìèíîêèñëîòû. Íàïðèìåð, ïîñòðîåí ñèììåòðè÷íûé êîä ñ ïîìåõîóñòîé÷èâîñòüþ 78 29, %, â êîòîðîì ÷åòûðå ñòîï-êîäîíà ðàñïîëîæåíû â êëåòêå òàáëèöû c ïåðâûìè äâóìÿ íóêëåîòèäàìè TA, â êëåòêå TC ñîäåðæàòñÿ àìèíîêèñëîòû öèñòåèí, öèñòåèí, òðèïòîôàí, òðèïòîôàí, à â êëåòêå TG — àìèíî- êèñëîòû òèðîçèí, òèðîçèí, ñåðèí, ñåðèí. ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2016, òîì 52, ¹ 2 77 ÃÅÍÅÒÈ×ÅÑÊÈÅ ÌÓÒÀÖÈÈ Âîçìîæíîñòü áûñòðî ðàñøèôðîâûâàòü èíäèâèäóàëüíûå ãåíîìû ëþäåé ïîçâîëèëà íàêîïèòü îãðîìíûå ìàññèâû äàííûõ î çàáîëåâàíèÿõ è ñâÿçàííûõ ñ íèìè ìóòàöè- ÿõ â ÄÍÊ. Ïîÿâèëèñü ñëóæáû ïëàíèðîâàíèÿ ñåìüè, ïîçâîëÿþùèå ñóïðóæåñêèì ïàðàì îïðåäåëèòü ñêëîííîñòü èõ áóäóùèõ äåòåé ê îïðåäåëåííûì çàáîëåâàíèÿì. Íàèáîëåå ðàñïðîñòðàíåííûì òèïîì ìóòàöèé, êîòîðûå ïðèâîäÿò ê çàáîëåâàíèÿì, ÿâëÿþòñÿ òî÷å÷íûå ìóòàöèè, â ðåçóëüòàòå êîòîðûõ åäèíè÷íûé íóêëåîòèä ãåíà ìåíÿåòñÿ íà äðóãîé íóêëåîòèä.  íàñòîÿùåé ðàáîòå èññëåäîâàíû ìóòàöèè, ñâÿ- çàííûå ñ ÷åòûðüìÿ òèïàìè çàáîëåâàíèé: àóòîèììóííûå, ãåíåòè÷åñêèå, íåéðîäåãå- íåðàòèâíûå, à òàêæå äðóãèå çàáîëåâàíèÿ, íå ïîïàâøèå â ïåðå÷èñëåííûå ãðóïïû. Òî÷å÷íûå ìóòàöèè ïîäðàçäåëÿþò íà äâå êàòåãîðèè, ðàçëè÷àþùèåñÿ ïî õà- ðàêòåðó èçìåíåíèé â ÄÍÊ, âûçâàííûõ ìóòàãåííûì àãåíòîì. Ïðè òðàíçèöèÿõ ïðîèñõîäèò çàìåùåíèå íóêëåîòèäà òèïà ïóðèí íà ïóðèí ( )A G, G A� � èëè ïèðèìèäèí íà ïèðèìèäèí ( )C T, T C� � . Òðàíñâåðñèè ïðåäñòàâëÿþò ñîáîé çà- ìåíû òèïà ïóðèí íà ïèðèìèäèí èëè ïèðèìèäèí íà ïóðèí (A C,G C,G T,� � � C A, C G, T A èëè T G� � � � ) . Ìåõàíèçì òðàíñâåðñèé íåÿñåí, äî ñèõ ïîð íå íàéäåíû àãåíòû, êîòîðûå áû èçáèðàòåëüíî âûçûâàëè òàêèå çàìåíû [6]. Ïîñêîëüêó íàèáîëåå ÷àñòûìè ìóòàöèÿìè ÿâëÿþòñÿ òðàíçèöèè, â ñòàíäàðò- íîì è ñèììåòðè÷íîì êîäàõ ìîæíî çàìåòèòü, ÷òî ïðè çàìåíå òðåòüåãî íóêëåîòè- äà A â êîäîíå íà G èëè T íà C àìèíîêèñëîòà íå ìåíÿåòñÿ. Ïîýòîìó òàêèå àìèíî- êèñëîòû, êàê òèðîçèí, öèñòåèí, ñåðèí, àðãèíèí è äðóãèå, ðàñïîëîæåíû â ñîîòâåò- ñòâóþùèõ ïîçèöèÿõ ïî òðåòüåìó íóêëåîòèäó. Ñðåäè âñåõ ìóòàöèé íàõîäèëèñü òå, êîòîðûå ïîïàäàþò â áåëîê-êîäèðóþùóþ îáëàñòü ãåíà è ïîòåíöèàëüíî ìîãóò ïîâëèÿòü íà àìèíîêèñëîòíûé ñîñòàâ áåëêà. Äëÿ ýòîãî èñïîëüçîâàëèñü äàííûå ðåñóðñà (http://www.eupedia.com/genetics/medical_ dna_test.shtml), ãäå çàáîëåâàíèÿì ñòàâÿòñÿ â ñîîòâåòñòâèå ñâÿçàííûå ñ íèìè ìóòàöèè â ÄÍÊ. Ïîäðîáíûå äàííûå ïî êàæäîé ìóòàöèè âû÷èñëÿëèñü ïî èäåíòèôèêàòîðó ìóòàöèè èç ðåñóðñà (http://www.ncbi.nlm.nih.gov/snp). Òàêèì îáðàçîì, áûëè ïîëó÷å- íû ïàðû èñõîäíûõ è ìóòèðîâàâøèõ òðèïëåòîâ íóêëåîòèäîâ è ñîîòâåòñòâåííî êîäè- ðóåìûõ èìè àìèíîêèñëîò. Âñåãî áûëî ïðîâåðåíî 103 ìóòàöèè äëÿ ïåðå÷èñëåííûõ òèïîâ çàáîëåâàíèé, â 55 ñëó÷àÿõ èìåëî ìåñòî ñîõðàíåíèå ïîëÿðíîñòè íà ïàðå èñõîäíûé êîäîí è åãî ìóòàöèÿ. Íàáëþäàëîñü 48 òðàíçèöèé òèïà ïóðèí íà ïóðèí è 27 — ïèðèìèäèí íà ïèðèìèäèí, òðàíñâåðñèè èìåëè ìåñòî â 28 ñëó÷àÿõ. Êîëè÷åñòâî ìóòàöèé ïåðâîãî íóêëåîòèäà — 57, çàìåí âòîðîãî — 33 è òðåòüåãî — 13. Ìóòàöèè òðåòüåãî íóêëåî- òèäà íå ìåíÿþò àìèíîêèñëîòû, îäíàêî îíè íàáëþäàþòñÿ â èíòðîíàõ, íàðóøàÿ âû- ðåçàíèå (ñïëàéñèíã) èíòðîíîâ èç áåëîê-êîäèðóþùåé ïîñëåäîâàòåëüíîñòè ãåíà, ïîýòîìó òàêæå ïðèâîäÿò ê çàáîëåâàíèÿì. Ñîãëàñíî ïàëåîíòîëîãè÷åñêèì äàííûì áàêòåðèè óæå ñóùåñòâîâàëè òðè ìèëëè- àðäà ëåò íàçàä. Òàêèì îáðàçîì, âåñüìà âåðîÿòíî, ÷òî ãåíåòè÷åñêèé êîä òîæå ôóíê- öèîíèðîâàë â òî âðåìÿ. Ïîñêîëüêó ó áàêòåðèé îòñóòñòâóþò èíòðîíû, â ñòàíäàðòíîì êîäå íå áûëî ñïîñîáîâ çàùèòû îò ìóòàöèé â íåêîäèðóþùèõ îáëàñòÿõ ãåíà.  22 ñëó÷àÿõ ñèììåòðè÷íûé êîä (òàáë. 2) ñîõðàíÿåò ïîëÿðíîñòü èñõîäíîãî êîäîíà çà ñ÷åò èñïðàâëåíèÿ ïîëÿðíîñòè ìóòèðîâàííîãî êîäîíà.  îäíîì ñëó÷àå îí íàðóøàåò ïîëÿð- íîñòü íà ïàðå êîäîíîâ òàì, ãäå îíà èìåëà ìåñòî äëÿ ñòàíäàðòíîãî êîäà.  21 ñëó÷àå ýòîò êîä èñïðàâèë íàðóøåíèå ïîëÿðíîñòè çà ñ÷åò èçìåíåíèÿ ïîëÿðíîñòè èñõîäíîãî êîäîíà. Ñèììåòðè÷íûé êîä ìîæíî ðàññìàòðèâàòü êàê íàäñòðîéêó íàä ñòàíäàðòíûì êîäîì, êîòîðàÿ èñïðàâëÿåò ïîëÿðíîñòü ïðè ìóòàöèÿõ â êîäîíàõ.  ñòàíäàðòíîì ãåíåòè÷åñêîì êîäå ñîõðàíåíèå ïîëÿðíîñòè â áîëüøîé ñòåïåíè çàâèñèò îò òîãî, êàêîé èìåííî íóêëåîòèä â êîäîíå ïîäâåðãàåòñÿ èçìåíåíèþ. Íàïðè- ìåð, â ñòàíäàðòíîì êîäå ïðè ìóòàöèè âòîðîãî íóêëåîòèäà ñîõðàíåíèå ïîëÿðíîñòè ñîñòàâëÿåò âåëè÷èíó 0.38, à ïðè çàìåíå ïåðâîãî íóêëåîòèäà — 0.59.  ñèììåòðè÷- íîì êîäå ñîõðàíåíèå ïîëÿðíîñòè ïðè çàìåíå ïåðâîãî íóêëåîòèäà çíà÷èòåëüíî âûøå, ÷åì â ñòàíäàðòíîì êîäå, — 0.91, à äëÿ âòîðîãî íåìíîãî íèæå — 0.30. Ïîëó÷åííûå 78 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2016, òîì 52, ¹ 2 âåëè÷èíû ëåãêî ïîëó÷èòü èç òàáë. 1 è 2. Òàêèì îáðàçîì, ñèììåòðè÷íûé êîä ïðèìåð- íî íà ÷åòâåðòü ïðåâîñõîäèò ñòàíäàðòíûé êîä îòíîñèòåëüíî ñîõðàíåíèÿ ïîëÿðíîñòè ïðè ìóòàöèÿõ â ïåðâûõ äâóõ íóêëåîòèäàõ êîäîíà è ýòî ñîîòâåòñòâóåò òîìó, ÷òî ñòàíäàðòíûé êîä íà 3/4 ñèììåòðè÷åí. Åñëè ó÷åñòü, ÷òî ìóòàöèè ïåðâûõ äâóõ íóêëå- îòèäîâ íàáëþäàëèñü â 90 ñëó÷àÿõ, òî îäíà ÷åòâåðòü îò 90 ïðèìåðíî ñîâïàäàåò ñ ïî- ëó÷åííûì ÷èñëîì 22 èñïðàâëåíèé ïîëÿðíîñòè äëÿ ñèììåòðè÷íîãî êîäà. Ïðîâåðåí åùå îäèí âàðèàíò ñèììåòðè÷íîãî êîäà, êîòîðûé ìîæíî ïîñòðîèòü íà îñíîâå âîñüìè ïàðíûõ ïåðåñòàíîâîê èç ñòàíäàðòíîãî êîäà.  òàáë. 3 æèðíûì øðèôòîì âûäåëåíû èçìåíåíèÿ êîäà ïî ñðàâíåíèþ ñî ñòàíäàðòíûì. Ïîìåõîóñ- òîé÷èâîñòü ýòîãî êîäà ñîñòàâëÿåò âåëè÷èíó 408/526 = 77,57%, è îí óñòóïàåò ñèì- ìåòðè÷íîìó êîäó â òàáë. 2.  19 ñëó÷àÿõ êîä â òàáë. 3 èñïðàâëÿåò íàðóøåíèå ïî- ëÿðíîñòè íà ïàðå èñõîäíûé êîäîí–ìóòèðîâàííûé êîäîí çà ñ÷åò èñïðàâëåíèÿ ïî- ëÿðíîñòè ìóòèðîâàííîãî êîäîíà, îäíàêî â âîñüìè ñëó÷àÿõ îí íàðóøàåò ïîëÿðíîñòü òàì, ãäå îíà èìåëà ìåñòî äëÿ ñòàíäàðòíîãî êîäà. Çàìåòèì, ÷òî ñèììåòðèÿ êîäà, ïîíèìàåìàÿ êàê ïåðåõîä îò ïîëÿðíîé àìèíîêèñ- ëîòû ê íåïîëÿðíîé ïðè ïåðåõîäå îò êîäîíà ê àíòèêîäîíó, íå ÿâëÿåòñÿ íåîáõîäèìûì óñëîâèåì îïòèìàëüíîñòè ãåíåòè÷åñêîãî êîäà. Íàïðèìåð, åñëè âî âñåõ êîäîíàõ êîäà â òàáë. 2 ïåðåñòàâèòü ìåñòàìè âòîðîé è òðåòèé íóêëåîòèäû, ò.å. â êàæäîé ñòðîêå êî- äîíû «ïîâåðíóòü íà 90 ãðàäóñîâ», ïîëó÷èì êîä â òàáë. 4 ñ òàêîé æå ïîìåõîóñòîé÷è- âîñòüþ, â êîòîðîì ñèììåòðèÿ âûïîëíÿåòñÿ ïðèìåðíî â ïîëîâèíå ñëó÷àåâ. Åñëè â êîäå, ïðèâåäåííîì â òàáë. 2, ïîìåíÿòü ìåñòàìè àìèíîêèñëîòû ñòîëáöîâ C è A, ïî- ëó÷èì êîä, äëÿ êîòîðîãî ñèììåòðèÿ íå âûïîëíÿåòñÿ — êîäîí è àíòèêîäîí âñåãäà êîäèðóþò àìèíîêèñëîòó îäíîãî òèïà (ïîëÿðíóþ èëè íåïîëÿðíóþ). Îêàçàëîñü, ÷òî îïèñàííûé íåñèììåòðè÷íûé êîä äàåò ïëîõèå ðåçóëüòàòû íà èññëåäóåìûõ ìóòàöèÿõ, ïîñêîëüêó â 26 ñëó÷àÿõ îí íàðóøàåò ïîëÿðíîñòü íà ïàðå: èñõîäíûé êîäîí–ìóòàöèÿ êîäîíà, òàì, ãäå îíà ñîõðàíÿëàñü äëÿ ñòàíäàðòíîãî êîäà. Êîä, äëÿ êîòîðîãî ñèììåòðèÿ âûïîëíÿåòñÿ â ïîëîâèíå ñëó÷àåâ (òàáë. 4), òàêæå èìååò ìíîãî òàêèõ íàðóøåíèé ïî ñðàâíåíèþ ñî ñòàíäàðòíûì êîäîì.  òàáë. 5 ïðèâåäåíû ïðèìåðû ñîõðàíåíèÿ ïîëÿðíîñòè èñõîäíîãî êîäîíà çà ñ÷åò èñïðàâëåíèÿ ïîëÿðíîñòè êîäîíà ñ ìóòàöèåé íà îñíîâå ñèììåòðè÷íîãî êîäà. ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2016, òîì 52, ¹ 2 79 Ïåðâîå îñíîâàíèå Âòîðîå îñíîâàíèå Òðåòüå îñíîâàíèå T C A G T Ôåíèëàëàíèí (F), í Ñåðèí (S), ï Òèðîçèí (Y), ï Öèñòåèí (C), í T Ôåíèëàëàíèí (F), í Ñåðèí (S), ï Òèðîçèí (Y), ï Öèñòåèí (C), í C Ëåéöèí (L), í Ñåðèí (S), ï Ñòîï Ñòîï A Ëåéöèí (L), í Ñåðèí (S), ï Ñòîï Òðèïòîôàí (W), í G C Ëåéöèí (L), í Àðãèíèí (R), ï Ãèñòèäèí (H), ï Ïðîëèí (P), í T Ëåéöèí (L), í Àðãèíèí (R), ï Ãèñòèäèí (H), ï Ïðîëèí (P), í C Ëåéöèí (L), í Àðãèíèí (R), ï Ãëóòàìèí (Q), ï Ïðîëèí (P), í A Ëåéöèí (L), í Àðãèíèí (R), ï Ãëóòàìèí (Q), ï Ïðîëèí (P), í G A Èçîëåéöèí (I), í Òðåîíèí (T), ï Àñïàðàãèí (N), ï Àëàíèí (A), í T Èçîëåéöèí (I), í Òðåîíèí (T), ï Àñïàðàãèí (N), ï Àëàíèí (A), í C Èçîëåéöèí (I), í Òðåîíèí (T), ï Ëèçèí (K), ï Àëàíèí (A), í A Ìåòèîíèí (M), í Òðåîíèí (T), ï Ëèçèí (K), ï Àëàíèí (A), í G G Âàëèí (V), í Ñåðèí (S), ï Àñïàðàãèíîâàÿ êèñëîòà (D), ï Ãëèöèí (G), í T Âàëèí (V), í Ñåðèí (S), ï Àñïàðàãèíîâàÿ êèñëîòà (D), ï Ãëèöèí (G), í C Âàëèí (V), í Àðãèíèí (R), ï Ãëóòàìèíîâàÿ êèñëîòà (E), ï Ãëèöèí (G), í A Âàëèí (V), í Àðãèíèí (R), ï Ãëóòàìèíîâàÿ êèñëîòà (E), ï Ãëèöèí (G), í G Ò à á ë è ö à 3 . Âàðèàíò ñèììåòðè÷íîãî êîäà ÇÀÊËÞ×ÅÍÈÅ Íà îñíîâå ñîîòíîøåíèé ñèììåòðèè â ÄÍÊ ïîñòðîåí ñèììåòðè÷íûé êîä, ïîìå- õîóñòîé÷èâîñòü êîòîðîãî ïðè ìóòàöèÿõ â íóêëåîòèäàõ íà 9% âûøå, ÷åì ó ñòàí- äàðòíîãî êîäà. Ñèììåòðè÷íûé êîä â òàáë. 2 îáðàçîâàí èç ñòàíäàðòíîãî êîäà çà ñ÷åò ìèíèìàëüíîãî ÷èñëà èç âîñüìè ïàðíûõ ïåðåñòàíîâîê. Ñ ïîìîùüþ ãåíåòè- ÷åñêèõ àëãîðèòìîâ ïîñòðîåíû âàðèàíòû íàèáîëåå ïîìåõîóñòîé÷èâûõ êîäîâ, îòëè- ÷àþùèõñÿ îò ñòàíäàðòíîãî êîäà ÷èñëîì ñòîï-êîäîíîâ, à òàêæå êîëè÷åñòâîì òðèï- ëåòîâ, îïðåäåëÿþùèõ ïîëÿðíûå è íåïîëÿðíûå àìèíîêèñëîòû. Ñîãëàñíî èíôîðìà- öèè èç ñîâðåìåííûõ áàç äàííûõ ãåíåòè÷åñêèõ çàáîëåâàíèé ìíîãèå áîëåçíè ñâÿçàíû ñ òî÷å÷íûìè ìóòàöèÿìè íóêëåîòèäîâ. Íàðóøåíèå ïîëÿðíîñòè àìèíîêèñ- ëîò ïðè ìóòàöèÿõ ïðèâîäèò ê èçìåíåíèþ ñòðóêòóðû áåëêà è ñîîòâåòñòâåííî âîç- íèêíîâåíèþ ñåðüåçíûõ çàáîëåâàíèé â îðãàíèçìå ÷åëîâåêà. Ïðè èññëåäîâàíèè ãå- íåòè÷åñêèõ áîëåçíåé îêàçàëîñü, ÷òî ïîñòðîåííûé ñèììåòðè÷íûé êîä âî ìíîãèõ ñëó÷àÿõ èñïðàâëÿåò íàðóøåíèå ïîëÿðíîñòè ïðè ìóòàöèÿõ â íóêëåîòèäàõ. ÑÏÈÑÎÊ ËÈÒÅÐÀÒÓÐÛ 1. È ÷ à ñ Ì . Áèîëîãè÷åñêèé êîä. — Ì.: Ìèð, 1971. — 352 ñ. 2. Ì å ä í è ê î â Á . Ì . Àêñèîìû áèîëîãèè. — Ì.: Çíàíèå, 1982. — 136 ñ. 3. Ñ å ð ã è å í ê î È .  . , à ó ï à ë À . Ì . , Î ñ ò ð î â ñ ê è é À .  . Ïîìåõîóñòîé÷èâîñòü ãåíåòè÷åñêèõ êîäîâ. Îïòèìàëüíûå êîäû // Äîêë. Àêàä. Íàóê. — 2013. — 453, ¹ 5. — Ñ. 492–495. 4. Ñ å ð ã è å í ê î È .  . , à ó ï à ë À . Ì . , Î ñ ò ð î â ñ ê è é À .  . Óñòîé÷èâîñòü ãåíåòè÷åñêîãî êîäà ê òî÷å÷íûì ìóòàöèÿì // Êèáåðíåòèêà è ñèñòåìíûé àíàëèç. — 2014. — ¹ 5. — Ñ. 17–24. 5. Ñ å ð ã è å í ê î È .  . , à ó ï à ë À . Ì . ,  à ã è ñ À . À . Ïðàâèëà ñèììåòðèè â çàïèñè ãåíåòè÷åñêîé èíôîðìàöèè â ÄÍÊ // Êèáåðíåòèêà è ñèñòåìíûé àíàëèç. — 2011. — ¹ 3. — Ñ. 88–94. 6. Ë å í è í ä æ å ð À . Îñíîâû áèîõèìèè. — Ì.: Ìèð, 1985. — Ò. 3. — 320 ñ. Ïîñòóïèëà 27.10.2015 80 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2016, òîì 52, ¹ 2 Èñõîäíûé êîäîí Ìóòàöèÿ êîäîíà Áîëåçíü GCA ACA Äèàáåò CGG TGG Äèàáåò ATA ACA Àñòìà ATC ACC Ñëîæíûé ñêëåðîç GCC ACC Íàðóøåíèå ñëóõà CGC TGC Àëüöãåéìåðà Ò à á ë è ö à 5. Ïðèìåðû ñîõðàíåíèÿ ïîëÿðíîñòè Ïåðâîå îñíîâàíèå Âòîðîå îñíîâàíèå Òðåòüå îñíîâàíèå T C A G T Ôåíèëàëàíèí (F) Ôåíèëàëàíèí (F) Ëåéöèí (L) Ëåéöèí (L) T Ñòîï Òðèïòîôàí (W) Öèñòåèí (Ñ) Öèñòåèí (Ñ) C Òèðîçèí (Y) Òèðîçèí (Y) Ñòîï Còîï A Cåðèí (S) Cåðèí (S) Cåðèí (S) Cåðèí (S) G C Ëåéöèí (L) Ëåéöèí (L) Ëåéöèí (L) Ëåéöèí (L) T Ïðîëèí (P) Ïðîëèí (P) Ïðîëèí (P) Ïðîëèí (P) C Ãèñòèäèí (H) Ãèñòèäèí (H) Ãëóòàìèí (Q) Ãëóòàìèí (Q) A Àðãèíèí (R) Àðãèíèí (R) Àðãèíèí (R) Àðãèíèí (R) G A Èçîëåéöèí (I) Èçîëåéöèí (I) Èçîëåéöèí (I) Ìåòèîèí (S) T Ãëèöèí (G) Ãëèöèí (G) Ãëèöèí (G) Ãëèöèí (G) C Àñïàðàãèí (N) Àñïàðàãèí (N) Ëèçèí (K) Ëèçèí (K) A Ñåðèí (S) Ñåðèí (S) Àðãèíèí (R) Àðãèíèí (R) G G Âàëèí (V) Âàëèí (V) Âàëèí (V) Âàëèí (V) T Àëàíèí (A) Àëàíèí (A) Àëàíèí (A) Àëàíèí (A) C Àñïàðàãèíîâàÿ êèñëîòà (D) Àñïàðàãèíîâàÿ êèñëîòà (D) Ãëóòàìèíîâàÿ êèñëîòà (E) Ãëóòàìèíîâàÿ êèñëîòà (E) A Òðåîíèí (T) Òðåîíèí (T) Òðåîíèí (T) Òðåîíèí (T) G Ò à á ë è ö à 4 . Êîä, äëÿ êîòîðîãî ñèììåòðèÿ âûïîëíÿåòñÿ â ïîëîâèíå ñëó÷àåâ
id nasplib_isofts_kiev_ua-123456789-131413
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 0023-1274
language Russian
last_indexed 2025-12-07T16:11:17Z
publishDate 2016
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
record_format dspace
spelling Сергиенко, И.В.
Гупал, А.М.
Вагис, А.А.
2018-03-22T17:04:34Z
2018-03-22T17:04:34Z
2016
Симметричный код и генетические мутации / И.В. Сергиенко, А.М. Гупал, А.А. Вагис // Кибернетика и системный анализ. — 2016. — Т. 52, № 2. — С. 73-80. — Бібліогр.: 6 назв. — рос.
0023-1274
https://nasplib.isofts.kiev.ua/handle/123456789/131413
519.217.2
С учетом свойств симметрии в ДНК построен код, симметричный относительно полярности аминокислот при мутациях в нуклеотидах. Проведено сравнение стандартного кода со случайно сгенерированными кодами. Исследована помехоустойчивость генетических кодов относительно полярности аминокислот. На основе баз данных генетических заболеваний показано, что симметричный код в большинстве случаев исправляет нарушение полярности при мутациях.
З урахуванням властивостей симетрії у ДНК побудовано код, симетричний відносно полярності амінокислот при мутаціях у нуклеотидах. Проведено порівняння стандартного коду з випадково згенерованими кодами. Досліджено завадостійкість генетичного коду щодо полярності амінокислот. На основі баз даних генетичних захворювань показано, що симетричний код у більшості випадків виправляє порушення полярності при мутаціях.
The symmetric code concerning polarity of amino acids at mutations in nucleotides is constructed using symmetry in DNA. A universal code is compared with randomly generated codes. The noise immunity of genetic code against amino acid polarity is analyzed. Databases of genetic diseases are used to show that symmetric code corrects violation of polarity in mutations in most cases.
ru
Інститут кібернетики ім. В.М. Глушкова НАН України
Кибернетика и системный анализ
Системный анализ
Симметричный код и генетические мутации
Симетричний код та генетичні мутації
Symmetric code and genetic mutations
Article
published earlier
spellingShingle Симметричный код и генетические мутации
Сергиенко, И.В.
Гупал, А.М.
Вагис, А.А.
Системный анализ
title Симметричный код и генетические мутации
title_alt Симетричний код та генетичні мутації
Symmetric code and genetic mutations
title_full Симметричный код и генетические мутации
title_fullStr Симметричный код и генетические мутации
title_full_unstemmed Симметричный код и генетические мутации
title_short Симметричный код и генетические мутации
title_sort симметричный код и генетические мутации
topic Системный анализ
topic_facet Системный анализ
url https://nasplib.isofts.kiev.ua/handle/123456789/131413
work_keys_str_mv AT sergienkoiv simmetričnyikodigenetičeskiemutacii
AT gupalam simmetričnyikodigenetičeskiemutacii
AT vagisaa simmetričnyikodigenetičeskiemutacii
AT sergienkoiv simetričniikodtagenetičnímutacíí
AT gupalam simetričniikodtagenetičnímutacíí
AT vagisaa simetričniikodtagenetičnímutacíí
AT sergienkoiv symmetriccodeandgeneticmutations
AT gupalam symmetriccodeandgeneticmutations
AT vagisaa symmetriccodeandgeneticmutations