Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК

Для организмов с простым строением генома численно подтверждается, что из симметрии последовательностей оснований в ДНК вытекает симметрия аминокислот в белках, синтезируемых по двум нитям ДНК. Для організмів з простою будовою геному експериментально підтверджується, що з симетрії послідовності осно...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Компьютерная математика
Дата:2016
Автори: Вагис, А.А., Гупал, Н.А.
Формат: Стаття
Мова:Російська
Опубліковано: Інститут кібернетики ім. В.М. Глушкова НАН України 2016
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/168404
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК / А.А. Вагис, Н.А. Гупал // Компьютерная математика. — 2016. — № 1. — С. 113-118. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859680870127894528
author Вагис, А.А.
Гупал, Н.А.
author_facet Вагис, А.А.
Гупал, Н.А.
citation_txt Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК / А.А. Вагис, Н.А. Гупал // Компьютерная математика. — 2016. — № 1. — С. 113-118. — рос.
collection DSpace DC
container_title Компьютерная математика
description Для организмов с простым строением генома численно подтверждается, что из симметрии последовательностей оснований в ДНК вытекает симметрия аминокислот в белках, синтезируемых по двум нитям ДНК. Для організмів з простою будовою геному експериментально підтверджується, що з симетрії послідовності основ у ДНК випливає симетрія амінокислот у білках, синтезованих по двох нитках ДНК. For organisms with a simple structure of the genome, it is experimentally confirmed that the symmetry of bases implies the symmetry of the amino acids in proteins synthesized by two strands of DNA.
first_indexed 2025-11-30T17:49:12Z
format Article
fulltext Компьютерная математика. 2016, № 1 113 Для организмов с простым стро- ением генома численно подтвер- ждается, что из симметрии последовательностей оснований в ДНК вытекает симметрия ами- нокислот в белках, синтезируе- мых по двум нитям ДНК.  А.А. Вагис, Н.А. Гупал, 2016 УДК 519.217.2 А.А. ВАГИС, Н.А. ГУПАЛ СИММЕТРИЯ АМИНОКИСЛОТ В БЕЛКАХ, СИНТЕЗИРУЕМЫХ ПО ДВУМ НИТЯМ ДНК Введение. Как известно, вся информация о строении белков организма находится в ге- нах ДНК: аминокислота, входящая в состав белка, кодируется последовательностью из трех оснований на основе стандартного гене- тического кода. Поскольку последовательности ДНК ко- дируют все белки организма, наличие сим- метрии по отношению к нуклеотидам, не- сомненно, должно определенным образом влиять на закономерности строения белков. Вместе с тем, для развитых организмов, та- ких как высшие растения и животные, пере- ход от оснований к аминокислотам, затруд- нен из-за сложной структуры ДНК. Лишь небольшая часть ДНК используется для ко- дирования белков, а гены имеют сложную структуру, включающую не применяемые при кодировании интроны. Интрон – участок ДНК, который является частью гена, но не содержит информации о последовательности аминокислот белка. Число и длина интронов весьма отличаются не только для генов одно- го организма, но и их видов. Например, геном дрожжей содержит в це- лом 293 интрона, в то время как в человече- ском геноме присутствует свыше 300 тысяч интронов. Обычно интроны длиннее экзонов, участков гена (ДНК), кодирующих синтез белка. Интроны присутствуют в генах эука- риот. Поэтому наиболее естественными объ- ектами для исследования симметрии в белках являются бактерии, геном которых имеет относительно простое строение и не содер- жит интронов. А.А. ВАГИС, Н.А. ГУПАЛ Компьютерная математика. 2016, № 1114 В предположении, что участки, кодирующие белки, занимают большую часть последовательности ДНК, из соотношений (1.7) для троек оснований следует сим- метрия по отдельным аминокислотам и их коротким последовательностям. Пусть * 1 2, a aT T R – множества, состоящие из белков, получаемых при трансляции генов, расположенных на соответствующих нитях ДНК. В предпо- ложении, что участки, кодирующие белки, занимают большую часть последова- тельности ДНК, из соотношения симметрии для троек нуклеотидов следует сим- метрия по отдельным аминокислотам и их коротким последовательностям. Гипотеза 1. Для совокупности белков, синтезируемых организмом, выпол- няется отношение 1 2( ) ( ),N x N x где * aax R – последовательность аминокислот, 1N и 2N – число ее вхождений в белки, синтезируемые из генов, расположенных на соответствующей нити ДНК: | | 1( ) [ ]; s s i i x Q T i N x Q x      {1, 2}.s Так как суммарные длины белков, кодируемых генами на разных нитях ДНК, не совпадают, между числом вхождений и вероятностью нельзя провести прямое соответствие. Поэтому логично ожидать выполнение следующего пред- положения. Гипотеза 2. Пусть * a ax R – произвольные аминокислоты, sf – частота вхождения последовательности на нити {1, 2},s т. е. несмещенная оценка вероятности ( ) ( ) / | |. s s s Q T f x N x Q    Тогда выполняется отношение 1 2( ) ( ).f x f x Вычислительный эксперимент. Для проверки гипотез использовались последовательности семи видов геномов бактерий, которые приведены в табл. 1, а также геномы плоского червя (C. elegans), медоносной пчелы (Apis mellifera), плодовой мушки (Drosophila melanogaster), тропической рыбки (Danio rerio) и растений: тополь (Populus trichocarpa), виноград (Vitis vinifera). Для оценки точности выполнения гипотез 1 и 2 вычисляются абсолютная и относительная разности между числом встреч отдельных аминокислот и их пар в пределах каждой из нитей (проверять симметрию для более длинных последо- вательностей аминокислот нецелесообразно, так как число вхождений в белки отдельных цепочек длиной 3 и выше слишком мало). Относительные разности подсчитываются по формулам 1 2 1 2 | ( ) ( ) |( ) ; max{ ( ), ( )}n N x N xx N x N x    1 2 1 2 | ( ) ( ) |( ) , max{ ( ), ( )}f f x f xx f x f x    где x – аминокислота или пара аминокислот; 1N , 2N – число вхождений по- следовательности x в белки, синтезируемые из генов, расположенных на соот- ветствующей нити ДНК; 1f , 2f – доли x среди всех последовательностей той же длины в пределах одной нити.  Гупал А.М., Гупал Н.А., Островский А.В. Симметрия и свойства записи генетической информации в ДНК // Проблемы управления и информатики. – 2011. – № 3. – С. 120 – 127. СИММЕТРИЯ АМИНОКИСЛОТ В БЕЛКАХ, СИНТЕЗИРУЕМЫХ ПО ДВУМ НИТЯМ ДНК Компьютерная математика. 2016, № 1 115 ТАБЛИЦА 1. Общая информация по исследуемым бактериям Вид Число хромосом Длина генома Число белков Общая длина белков Средняя длина белка Bifidobacterium lactis 1 к. 1) 1938709 1567 554371 354 Corynebacterium glu- tamicum 1 к. 3309401 2993 950323 318 Gordonia bronchialis 1 к. 5208602 4616 1500908 325 Mycobacterium gilvum 1 к. 5619607 5241 1728118 330 Propionibacterium acnes 1 к. 2560265 2297 761899 332 Rhodococcus erythropolis 1 к. 6516310 6030 1980605 328 Streptomyces aver- mitilis 1 лин. 2) 9025608 7580 2588611 342 Caenorhabditis elegans 6 лин. 100267632 23818 10488116 440 Примечание: 1) кольцевая хромосома; 2) линейная хромосома. Результаты для белков C. elegans приведены в табл. 2 для отдельных амино- кислот, а для двадцати наиболее распространенных пар аминокислот – в табл. 3. Для остальных организмов итоги в целом аналогичны. ТАБЛИЦА 2. Симметрия по отдельным аминокислотам для белков C. elegans АК Количество Частота, % АК Количество Частота, % 1N 2N n 1f 2f f 1N 2N n 1f 2f f A 340748 328970 3,46 6,39 6,38 0,13 M 139418 135306 2,95 2,61 2,62 0,39 C 106685 103890 2,62 2,00 2,02 0,73 N 258940 251406 2,91 4,86 4,88 0,43 D 288541 274893 4,73 5,41 5,33 1,45 P 265578 254727 4,09 4,98 4,94 0,78 E 355398 339859 4,37 6,66 6,59 1,08 Q 223260 216276 3,13 4,19 4,20 0,21 F 246764 241401 2,17 4,63 4,68 1,18 R 276677 268958 2,79 5,19 5,22 0,55 G 284622 278687 2,09 5,34 5,41 1,27 S 434562 416359 4,19 8,15 8,08 0,89 H 122517 119700 2,30 2,30 2,32 1,05 T 316097 301751 4,54 5,93 5,85 1,25 I 322613 313674 2,77 6,05 6,08 0,57 V 331505 322291 2,78 6,22 6,25 0,56 K 338555 326479 3,57 6,35 6,33 0,25 W 57709 56708 1,73 1,08 1,10 1,62 L 455951 441969 3,07 8,55 8,57 0,27 Y 166662 162010 2,79 3,13 3,14 0,55 А.А. ВАГИС, Н.А. ГУПАЛ Компьютерная математика. 2016, № 1116 ТАБЛИЦА 3. Симметрия по парам аминокислот для белков C. elegans АК Количество Частота, % АК Количество Частота, % 1N 2N n 1f 2f f 1N 2N n 1f 2f f SS 47865 45880 4,15 0,90 0,89 0,85 KL 29924 29359 1,89 0,56 0,57 1,47 LL 43726 42189 3,52 0,82 0,82 0,19 LE 30190 28831 4,50 0,57 0,56 1,21 LS 35545 34013 4,31 0,67 0,66 1,02 VL 29256 28642 2,10 0,55 0,56 1,26 SL 34307 33806 1,46 0,64 0,66 1,90 IL 29194 28423 2,64 0,55 0,55 0,71 EE 32866 30560 7,02 0,62 0,59 3,82 AA 29277 27891 4,73 0,55 0,54 1,45 KK 31778 30632 3,61 0,60 0,59 0,29 TS 28635 28001 2,21 0,54 0,54 1,14 EK 31302 30580 2,31 0,59 0,59 1,05 LI 28466 27500 3,39 0,53 0,53 0,07 ST 31654 29026 8,30 0,59 0,56 5,15 AL 28325 27464 3,04 0,53 0,53 0,30 LK 30680 29949 2,38 0,58 0,58 0,97 EL 28487 27036 5,09 0,53 0,52 1,83 LA 30295 29336 3,17 0,57 0,57 0,17 SA 27828 26522 4,69 0,52 0,51 1,41 Численные результаты проверки гипотез 1 и 2 подытожены в табл. 4 и 5, ко- торые содержат максимальные, средние и взвешенные средние значения разно- стей, а также среднеквадратичные отклонения. ТАБЛИЦА 4. Выполнение симметрии для отдельных аминокислот Вид Разность по количеству, % Разность по частоте, % макси- мальные средние взве- шен- ные откло- нения макси- мальные средние взве- шен- ные откло- нения Bifidobacterium lactis 9,99 6,01 5,89 2,08 4,34 1,84 1,70 1,18 C. glutamicum 11,56 8,44 8,31 1,93 5,59 1,67 1,44 1,21 Gordonia bronchialis 5,97 2,72 2,91 1,38 3,77 1,34 0,96 1,12 Mycobacterium gilvum 9,22 6,64 7,04 1,61 4,49 1,33 1,01 1,12 P. acnes 6,46 3,77 3,77 1,41 2,79 1,23 1,25 0,77 R. erythropolis 9,35 6,02 6,07 1,69 5,83 1,15 0,79 1,30 S. avermitilis 13,40 10,04 10,35 1,81 4,67 1,62 1,17 1,17 Apis mellifera 7,26 5,52 5,68 0,94 1,82 0,89 0,86 0,46 C. elegans 4,73 3,15 3,32 0,83 1,62 0,76 0,72 0,43 Danio rerio 1,88 0,76 0,74 0,45 1,85 0,77 0,73 0,45 D. melanogaster 10,44 5,83 5,39 1,78 5,33 1,59 1,40 1,09 Populus trichocarpa 2,42 1,11 1,09 0,67 1,60 0,65 0,57 0,44 Vitis vinifera 1,49 0,81 0,76 0,35 0,85 0,30 0,29 0,24 СИММЕТРИЯ АМИНОКИСЛОТ В БЕЛКАХ, СИНТЕЗИРУЕМЫХ ПО ДВУМ НИТЯМ ДНК Компьютерная математика. 2016, № 1 117 Взвешенные значения при этом считаются по формулам ( ) ( ),n n x f x x   ( ) ( ),f f x f x x   где суммирование производится по всем аминокислотам или парам аминокислот, а 1 2 1 2 ( ) ( )( ) ( ( ) ( )) y N x N xf x N y N y    обозначает частоту появления последовательности x во всех белках организма. ТАБЛИЦА 5. Выполнение соотношений симметрии для пар аминокислот Вид Разность по количеству, % Разность по частоте, % мак- си- маль- ные сред- ние взве- шен- ные от- кло- нения мак- си- маль- ные сред- ние взве- шен- ные от- кло- нения Bifidobacterium lactis 32,18 8,02 6,61 5,91 27,93 6,06 4,54 5,23 C. glutamicum 33,75 9,26 8,47 5,44 27,74 4,98 3,52 4,45 Gordonia bronchialis 26,36 4,53 3,70 3,72 24,21 3,99 2,61 3,71 Mycobacterium gilvum 22,89 7,05 7,16 3,88 18,56 3,81 2,63 3,49 P. acnes 34,51 5,99 4,69 5,14 31,94 5,15 3,52 4,74 R. erythropolis 24,60 6,62 6,20 3,83 19,72 3,51 2,28 3,35 S. avermitilis 28,50 9,79 10,32 4,42 24,44 3,84 2,55 3,48 Apis mellifera 12,58 5,54 5,73 2,49 14,29 2,22 1,85 1,88 C. elegans 10,69 3,37 3,47 2,09 12,82 2,03 1,77 1,73 Danio rerio 9,58 1,77 1,55 1,45 9,60 1,77 1,55 1,45 D. melanogaster 18,44 6,44 5,47 3,38 13,79 2,99 2,54 2,53 Populus trichocarpa 9,00 1,71 1,48 1,43 8,04 1,49 1,22 1,32 Vitis vinifera 7,31 1,66 1,37 1,35 7,28 1,53 1,27 1,22 Видно, что симметрия по отдельным аминокислотам и их парам выполняет- ся с точностью порядка 1 %. Большие значения максимальных разностей для пар аминокислот объясняются сравнительно малым размером выборки – каждая па- ра аминокислот встречается в белках в среднем несколько тысяч раз. Обозначает частоту появления последовательности x во всех белках организма. Выводы. Рассмотрена симметрия последовательностей нуклеотидов, на- блюдаемая в ДНК; на ее основе построены гипотезы относительно симметрии по аминокислотам и группам аминокислот для белков, кодируемых ДНК. А.А. ВАГИС, Н.А. ГУПАЛ Компьютерная математика. 2016, № 1118 Для подтверждения справедливости гипотез проведен вычислительный экспе- римент, который показал, что симметрия по отдельным аминокислотам и их па- рам наблюдается как для организмов с простым строением генома (бактерий), так и для шести более сложных видов. О.А. Вагіс, М.А. Гупал СИМЕТРІЯ АМІНОКИСЛОТ У БІЛКАХ, СИНТЕЗОВАНИХ ПО ДВОХ НИТКАХ ДНК Для організмів з простою будовою геному експериментально підтверджується, що з симетрії послідовності основ у ДНК випливає симетрія амінокислот у білках, синтезованих по двох нитках ДНК. A.A. Vagis, N.A. Gupal SYMMETRY OF AMINO ACIDS IN PROTEINS SYNTHESIZED BY TWO STRANDS OF DNA For organisms with a simple structure of the genome, it is experimentally confirmed that the sym- metry of bases implies the symmetry of the amino acids in proteins synthesized by two strands of DNA. Получено 02.10.2015 Об авторах: Вагис Александра Анатольевна, доктор физико-математических наук, старший научный сотрудник Института кибернетики имени В.М. Глушкова НАН Украины, Гупал Никита Анатольевич, научный сотрудник Института кибернетики имени В.М. Глушкова НАН Украины.
id nasplib_isofts_kiev_ua-123456789-168404
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 2616-938Х
language Russian
last_indexed 2025-11-30T17:49:12Z
publishDate 2016
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
record_format dspace
spelling Вагис, А.А.
Гупал, Н.А.
2020-05-01T16:04:59Z
2020-05-01T16:04:59Z
2016
Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК / А.А. Вагис, Н.А. Гупал // Компьютерная математика. — 2016. — № 1. — С. 113-118. — рос.
2616-938Х
https://nasplib.isofts.kiev.ua/handle/123456789/168404
519.217.2
Для организмов с простым строением генома численно подтверждается, что из симметрии последовательностей оснований в ДНК вытекает симметрия аминокислот в белках, синтезируемых по двум нитям ДНК.
Для організмів з простою будовою геному експериментально підтверджується, що з симетрії послідовності основ у ДНК випливає симетрія амінокислот у білках, синтезованих по двох нитках ДНК.
For organisms with a simple structure of the genome, it is experimentally confirmed that the symmetry of bases implies the symmetry of the amino acids in proteins synthesized by two strands of DNA.
ru
Інститут кібернетики ім. В.М. Глушкова НАН України
Компьютерная математика
Математические модели в биологии и медицине
Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК
Симетрія амінокислот у білках, синтезованих по двох нитках ДНК
Symmetry of amino acids in proteins synthesized by two strands of DNA
Article
published earlier
spellingShingle Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК
Вагис, А.А.
Гупал, Н.А.
Математические модели в биологии и медицине
title Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК
title_alt Симетрія амінокислот у білках, синтезованих по двох нитках ДНК
Symmetry of amino acids in proteins synthesized by two strands of DNA
title_full Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК
title_fullStr Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК
title_full_unstemmed Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК
title_short Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК
title_sort симметрия аминокислот в белках, синтезируемых по двум нитям днк
topic Математические модели в биологии и медицине
topic_facet Математические модели в биологии и медицине
url https://nasplib.isofts.kiev.ua/handle/123456789/168404
work_keys_str_mv AT vagisaa simmetriâaminokislotvbelkahsinteziruemyhpodvumnitâmdnk
AT gupalna simmetriâaminokislotvbelkahsinteziruemyhpodvumnitâmdnk
AT vagisaa simetríâamínokislotubílkahsintezovanihpodvohnitkahdnk
AT gupalna simetríâamínokislotubílkahsintezovanihpodvohnitkahdnk
AT vagisaa symmetryofaminoacidsinproteinssynthesizedbytwostrandsofdna
AT gupalna symmetryofaminoacidsinproteinssynthesizedbytwostrandsofdna