Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК
Для организмов с простым строением генома численно подтверждается, что из симметрии последовательностей оснований в ДНК вытекает симметрия аминокислот в белках, синтезируемых по двум нитям ДНК. Для організмів з простою будовою геному експериментально підтверджується, що з симетрії послідовності осно...
Збережено в:
| Опубліковано в: : | Компьютерная математика |
|---|---|
| Дата: | 2016 |
| Автори: | , |
| Формат: | Стаття |
| Мова: | Російська |
| Опубліковано: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2016
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/168404 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК / А.А. Вагис, Н.А. Гупал // Компьютерная математика. — 2016. — № 1. — С. 113-118. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859680870127894528 |
|---|---|
| author | Вагис, А.А. Гупал, Н.А. |
| author_facet | Вагис, А.А. Гупал, Н.А. |
| citation_txt | Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК / А.А. Вагис, Н.А. Гупал // Компьютерная математика. — 2016. — № 1. — С. 113-118. — рос. |
| collection | DSpace DC |
| container_title | Компьютерная математика |
| description | Для организмов с простым строением генома численно подтверждается, что из симметрии последовательностей оснований в ДНК вытекает симметрия аминокислот в белках, синтезируемых по двум нитям ДНК.
Для організмів з простою будовою геному експериментально підтверджується, що з симетрії послідовності основ у ДНК випливає симетрія амінокислот у білках, синтезованих по двох нитках ДНК.
For organisms with a simple structure of the genome, it is experimentally confirmed that the symmetry of bases implies the symmetry of the amino acids in proteins synthesized by two strands of DNA.
|
| first_indexed | 2025-11-30T17:49:12Z |
| format | Article |
| fulltext |
Компьютерная математика. 2016, № 1 113
Для организмов с простым стро-
ением генома численно подтвер-
ждается, что из симметрии
последовательностей оснований в
ДНК вытекает симметрия ами-
нокислот в белках, синтезируе-
мых по двум нитям ДНК.
А.А. Вагис, Н.А. Гупал,
2016
УДК 519.217.2
А.А. ВАГИС, Н.А. ГУПАЛ
СИММЕТРИЯ АМИНОКИСЛОТ
В БЕЛКАХ, СИНТЕЗИРУЕМЫХ
ПО ДВУМ НИТЯМ ДНК
Введение. Как известно, вся информация о
строении белков организма находится в ге-
нах ДНК: аминокислота, входящая в состав
белка, кодируется последовательностью из
трех оснований на основе стандартного гене-
тического кода.
Поскольку последовательности ДНК ко-
дируют все белки организма, наличие сим-
метрии по отношению к нуклеотидам, не-
сомненно, должно определенным образом
влиять на закономерности строения белков.
Вместе с тем, для развитых организмов, та-
ких как высшие растения и животные, пере-
ход от оснований к аминокислотам, затруд-
нен из-за сложной структуры ДНК. Лишь
небольшая часть ДНК используется для ко-
дирования белков, а гены имеют сложную
структуру, включающую не применяемые
при кодировании интроны. Интрон – участок
ДНК, который является частью гена, но не
содержит информации о последовательности
аминокислот белка. Число и длина интронов
весьма отличаются не только для генов одно-
го организма, но и их видов.
Например, геном дрожжей содержит в це-
лом 293 интрона, в то время как в человече-
ском геноме присутствует свыше 300 тысяч
интронов. Обычно интроны длиннее экзонов,
участков гена (ДНК), кодирующих синтез
белка. Интроны присутствуют в генах эука-
риот. Поэтому наиболее естественными объ-
ектами для исследования симметрии в белках
являются бактерии, геном которых имеет
относительно простое строение и не содер-
жит интронов.
А.А. ВАГИС, Н.А. ГУПАЛ
Компьютерная математика. 2016, № 1114
В предположении, что участки, кодирующие белки, занимают большую часть
последовательности ДНК, из соотношений (1.7) для троек оснований следует сим-
метрия по отдельным аминокислотам и их коротким последовательностям.
Пусть *
1 2, a aT T R – множества, состоящие из белков, получаемых при
трансляции генов, расположенных на соответствующих нитях ДНК. В предпо-
ложении, что участки, кодирующие белки, занимают большую часть последова-
тельности ДНК, из соотношения симметрии для троек нуклеотидов следует сим-
метрия по отдельным аминокислотам и их коротким последовательностям.
Гипотеза 1. Для совокупности белков, синтезируемых организмом, выпол-
няется отношение
1 2( ) ( ),N x N x
где *
aax R – последовательность аминокислот, 1N и 2N – число ее вхождений
в белки, синтезируемые из генов, расположенных на соответствующей нити ДНК:
| | 1( ) [ ];
s
s i i x
Q T i
N x Q x
{1, 2}.s
Так как суммарные длины белков, кодируемых генами на разных нитях
ДНК, не совпадают, между числом вхождений и вероятностью нельзя провести
прямое соответствие. Поэтому логично ожидать выполнение следующего пред-
положения.
Гипотеза 2. Пусть *
a ax R – произвольные аминокислоты, sf – частота
вхождения последовательности на нити {1, 2},s т. е. несмещенная оценка
вероятности
( ) ( ) / | |.
s
s s
Q T
f x N x Q
Тогда выполняется отношение 1 2( ) ( ).f x f x
Вычислительный эксперимент. Для проверки гипотез использовались
последовательности семи видов геномов бактерий, которые приведены в табл. 1,
а также геномы плоского червя (C. elegans), медоносной пчелы (Apis mellifera),
плодовой мушки (Drosophila melanogaster), тропической рыбки (Danio rerio)
и растений: тополь (Populus trichocarpa), виноград (Vitis vinifera).
Для оценки точности выполнения гипотез 1 и 2 вычисляются абсолютная и
относительная разности между числом встреч отдельных аминокислот и их пар
в пределах каждой из нитей (проверять симметрию для более длинных последо-
вательностей аминокислот нецелесообразно, так как число вхождений в белки
отдельных цепочек длиной 3 и выше слишком мало). Относительные разности
подсчитываются по формулам
1 2
1 2
| ( ) ( ) |( ) ;
max{ ( ), ( )}n
N x N xx
N x N x
1 2
1 2
| ( ) ( ) |( ) ,
max{ ( ), ( )}f
f x f xx
f x f x
где x – аминокислота или пара аминокислот; 1N , 2N – число вхождений по-
следовательности x в белки, синтезируемые из генов, расположенных на соот-
ветствующей нити ДНК; 1f , 2f – доли x среди всех последовательностей той
же длины в пределах одной нити.
Гупал А.М., Гупал Н.А., Островский А.В. Симметрия и свойства записи генетической
информации в ДНК // Проблемы управления и информатики. – 2011. – № 3. – С. 120 – 127.
СИММЕТРИЯ АМИНОКИСЛОТ В БЕЛКАХ, СИНТЕЗИРУЕМЫХ ПО ДВУМ НИТЯМ ДНК
Компьютерная математика. 2016, № 1 115
ТАБЛИЦА 1. Общая информация по исследуемым бактериям
Вид Число
хромосом
Длина
генома
Число
белков
Общая
длина белков
Средняя
длина белка
Bifidobacterium lactis 1 к. 1) 1938709 1567 554371 354
Corynebacterium glu-
tamicum
1 к. 3309401 2993 950323 318
Gordonia bronchialis 1 к. 5208602 4616 1500908 325
Mycobacterium gilvum 1 к. 5619607 5241 1728118 330
Propionibacterium acnes 1 к. 2560265 2297 761899 332
Rhodococcus
erythropolis
1 к. 6516310 6030 1980605 328
Streptomyces aver-
mitilis
1 лин. 2) 9025608 7580 2588611 342
Caenorhabditis
elegans
6 лин. 100267632 23818 10488116 440
Примечание: 1) кольцевая хромосома; 2) линейная хромосома.
Результаты для белков C. elegans приведены в табл. 2 для отдельных амино-
кислот, а для двадцати наиболее распространенных пар аминокислот – в табл. 3.
Для остальных организмов итоги в целом аналогичны.
ТАБЛИЦА 2. Симметрия по отдельным аминокислотам для белков C. elegans
АК Количество Частота, % АК Количество Частота, %
1N 2N n 1f 2f f 1N 2N n 1f 2f f
A 340748 328970 3,46 6,39 6,38 0,13 M 139418 135306 2,95 2,61 2,62 0,39
C 106685 103890 2,62 2,00 2,02 0,73 N 258940 251406 2,91 4,86 4,88 0,43
D 288541 274893 4,73 5,41 5,33 1,45 P 265578 254727 4,09 4,98 4,94 0,78
E 355398 339859 4,37 6,66 6,59 1,08 Q 223260 216276 3,13 4,19 4,20 0,21
F 246764 241401 2,17 4,63 4,68 1,18 R 276677 268958 2,79 5,19 5,22 0,55
G 284622 278687 2,09 5,34 5,41 1,27 S 434562 416359 4,19 8,15 8,08 0,89
H 122517 119700 2,30 2,30 2,32 1,05 T 316097 301751 4,54 5,93 5,85 1,25
I 322613 313674 2,77 6,05 6,08 0,57 V 331505 322291 2,78 6,22 6,25 0,56
K 338555 326479 3,57 6,35 6,33 0,25 W 57709 56708 1,73 1,08 1,10 1,62
L 455951 441969 3,07 8,55 8,57 0,27 Y 166662 162010 2,79 3,13 3,14 0,55
А.А. ВАГИС, Н.А. ГУПАЛ
Компьютерная математика. 2016, № 1116
ТАБЛИЦА 3. Симметрия по парам аминокислот для белков C. elegans
АК Количество Частота, % АК Количество Частота, %
1N 2N n 1f 2f f 1N 2N n 1f 2f f
SS 47865 45880 4,15 0,90 0,89 0,85 KL 29924 29359 1,89 0,56 0,57 1,47
LL 43726 42189 3,52 0,82 0,82 0,19 LE 30190 28831 4,50 0,57 0,56 1,21
LS 35545 34013 4,31 0,67 0,66 1,02 VL 29256 28642 2,10 0,55 0,56 1,26
SL 34307 33806 1,46 0,64 0,66 1,90 IL 29194 28423 2,64 0,55 0,55 0,71
EE 32866 30560 7,02 0,62 0,59 3,82 AA 29277 27891 4,73 0,55 0,54 1,45
KK 31778 30632 3,61 0,60 0,59 0,29 TS 28635 28001 2,21 0,54 0,54 1,14
EK 31302 30580 2,31 0,59 0,59 1,05 LI 28466 27500 3,39 0,53 0,53 0,07
ST 31654 29026 8,30 0,59 0,56 5,15 AL 28325 27464 3,04 0,53 0,53 0,30
LK 30680 29949 2,38 0,58 0,58 0,97 EL 28487 27036 5,09 0,53 0,52 1,83
LA 30295 29336 3,17 0,57 0,57 0,17 SA 27828 26522 4,69 0,52 0,51 1,41
Численные результаты проверки гипотез 1 и 2 подытожены в табл. 4 и 5, ко-
торые содержат максимальные, средние и взвешенные средние значения разно-
стей, а также среднеквадратичные отклонения.
ТАБЛИЦА 4. Выполнение симметрии для отдельных аминокислот
Вид Разность по количеству, % Разность по частоте, %
макси-
мальные средние
взве-
шен-
ные
откло-
нения
макси-
мальные средние
взве-
шен-
ные
откло-
нения
Bifidobacterium lactis 9,99 6,01 5,89 2,08 4,34 1,84 1,70 1,18
C. glutamicum 11,56 8,44 8,31 1,93 5,59 1,67 1,44 1,21
Gordonia bronchialis 5,97 2,72 2,91 1,38 3,77 1,34 0,96 1,12
Mycobacterium gilvum 9,22 6,64 7,04 1,61 4,49 1,33 1,01 1,12
P. acnes 6,46 3,77 3,77 1,41 2,79 1,23 1,25 0,77
R. erythropolis 9,35 6,02 6,07 1,69 5,83 1,15 0,79 1,30
S. avermitilis 13,40 10,04 10,35 1,81 4,67 1,62 1,17 1,17
Apis mellifera 7,26 5,52 5,68 0,94 1,82 0,89 0,86 0,46
C. elegans 4,73 3,15 3,32 0,83 1,62 0,76 0,72 0,43
Danio rerio 1,88 0,76 0,74 0,45 1,85 0,77 0,73 0,45
D. melanogaster 10,44 5,83 5,39 1,78 5,33 1,59 1,40 1,09
Populus trichocarpa 2,42 1,11 1,09 0,67 1,60 0,65 0,57 0,44
Vitis vinifera 1,49 0,81 0,76 0,35 0,85 0,30 0,29 0,24
СИММЕТРИЯ АМИНОКИСЛОТ В БЕЛКАХ, СИНТЕЗИРУЕМЫХ ПО ДВУМ НИТЯМ ДНК
Компьютерная математика. 2016, № 1 117
Взвешенные значения при этом считаются по формулам ( ) ( ),n n
x
f x x
( ) ( ),f f
x
f x x где суммирование производится по всем аминокислотам или
парам аминокислот, а 1 2
1 2
( ) ( )( )
( ( ) ( ))
y
N x N xf x
N y N y
обозначает частоту появления
последовательности x во всех белках организма.
ТАБЛИЦА 5. Выполнение соотношений симметрии для пар аминокислот
Вид Разность по количеству, % Разность по частоте, %
мак-
си-
маль-
ные
сред-
ние
взве-
шен-
ные
от-
кло-
нения
мак-
си-
маль-
ные
сред-
ние
взве-
шен-
ные
от-
кло-
нения
Bifidobacterium lactis 32,18 8,02 6,61 5,91 27,93 6,06 4,54 5,23
C. glutamicum 33,75 9,26 8,47 5,44 27,74 4,98 3,52 4,45
Gordonia bronchialis 26,36 4,53 3,70 3,72 24,21 3,99 2,61 3,71
Mycobacterium gilvum 22,89 7,05 7,16 3,88 18,56 3,81 2,63 3,49
P. acnes 34,51 5,99 4,69 5,14 31,94 5,15 3,52 4,74
R. erythropolis 24,60 6,62 6,20 3,83 19,72 3,51 2,28 3,35
S. avermitilis 28,50 9,79 10,32 4,42 24,44 3,84 2,55 3,48
Apis mellifera 12,58 5,54 5,73 2,49 14,29 2,22 1,85 1,88
C. elegans 10,69 3,37 3,47 2,09 12,82 2,03 1,77 1,73
Danio rerio 9,58 1,77 1,55 1,45 9,60 1,77 1,55 1,45
D. melanogaster 18,44 6,44 5,47 3,38 13,79 2,99 2,54 2,53
Populus trichocarpa 9,00 1,71 1,48 1,43 8,04 1,49 1,22 1,32
Vitis vinifera 7,31 1,66 1,37 1,35 7,28 1,53 1,27 1,22
Видно, что симметрия по отдельным аминокислотам и их парам выполняет-
ся с точностью порядка 1 %. Большие значения максимальных разностей для пар
аминокислот объясняются сравнительно малым размером выборки – каждая па-
ра аминокислот встречается в белках в среднем несколько тысяч раз. Обозначает
частоту появления последовательности x во всех белках организма.
Выводы. Рассмотрена симметрия последовательностей нуклеотидов, на-
блюдаемая в ДНК; на ее основе построены гипотезы относительно симметрии
по аминокислотам и группам аминокислот для белков, кодируемых ДНК.
А.А. ВАГИС, Н.А. ГУПАЛ
Компьютерная математика. 2016, № 1118
Для подтверждения справедливости гипотез проведен вычислительный экспе-
римент, который показал, что симметрия по отдельным аминокислотам и их па-
рам наблюдается как для организмов с простым строением генома (бактерий),
так и для шести более сложных видов.
О.А. Вагіс, М.А. Гупал
СИМЕТРІЯ АМІНОКИСЛОТ У БІЛКАХ, СИНТЕЗОВАНИХ ПО ДВОХ НИТКАХ ДНК
Для організмів з простою будовою геному експериментально підтверджується, що з симетрії
послідовності основ у ДНК випливає симетрія амінокислот у білках, синтезованих по двох
нитках ДНК.
A.A. Vagis, N.A. Gupal
SYMMETRY OF AMINO ACIDS IN PROTEINS SYNTHESIZED BY TWO STRANDS
OF DNA
For organisms with a simple structure of the genome, it is experimentally confirmed that the sym-
metry of bases implies the symmetry of the amino acids in proteins synthesized by two strands
of DNA.
Получено 02.10.2015
Об авторах:
Вагис Александра Анатольевна,
доктор физико-математических наук,
старший научный сотрудник
Института кибернетики имени В.М. Глушкова НАН Украины,
Гупал Никита Анатольевич,
научный сотрудник
Института кибернетики имени В.М. Глушкова НАН Украины.
|
| id | nasplib_isofts_kiev_ua-123456789-168404 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 2616-938Х |
| language | Russian |
| last_indexed | 2025-11-30T17:49:12Z |
| publishDate | 2016 |
| publisher | Інститут кібернетики ім. В.М. Глушкова НАН України |
| record_format | dspace |
| spelling | Вагис, А.А. Гупал, Н.А. 2020-05-01T16:04:59Z 2020-05-01T16:04:59Z 2016 Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК / А.А. Вагис, Н.А. Гупал // Компьютерная математика. — 2016. — № 1. — С. 113-118. — рос. 2616-938Х https://nasplib.isofts.kiev.ua/handle/123456789/168404 519.217.2 Для организмов с простым строением генома численно подтверждается, что из симметрии последовательностей оснований в ДНК вытекает симметрия аминокислот в белках, синтезируемых по двум нитям ДНК. Для організмів з простою будовою геному експериментально підтверджується, що з симетрії послідовності основ у ДНК випливає симетрія амінокислот у білках, синтезованих по двох нитках ДНК. For organisms with a simple structure of the genome, it is experimentally confirmed that the symmetry of bases implies the symmetry of the amino acids in proteins synthesized by two strands of DNA. ru Інститут кібернетики ім. В.М. Глушкова НАН України Компьютерная математика Математические модели в биологии и медицине Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК Симетрія амінокислот у білках, синтезованих по двох нитках ДНК Symmetry of amino acids in proteins synthesized by two strands of DNA Article published earlier |
| spellingShingle | Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК Вагис, А.А. Гупал, Н.А. Математические модели в биологии и медицине |
| title | Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК |
| title_alt | Симетрія амінокислот у білках, синтезованих по двох нитках ДНК Symmetry of amino acids in proteins synthesized by two strands of DNA |
| title_full | Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК |
| title_fullStr | Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК |
| title_full_unstemmed | Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК |
| title_short | Симметрия аминокислот в белках, синтезируемых по двум нитям ДНК |
| title_sort | симметрия аминокислот в белках, синтезируемых по двум нитям днк |
| topic | Математические модели в биологии и медицине |
| topic_facet | Математические модели в биологии и медицине |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/168404 |
| work_keys_str_mv | AT vagisaa simmetriâaminokislotvbelkahsinteziruemyhpodvumnitâmdnk AT gupalna simmetriâaminokislotvbelkahsinteziruemyhpodvumnitâmdnk AT vagisaa simetríâamínokislotubílkahsintezovanihpodvohnitkahdnk AT gupalna simetríâamínokislotubílkahsintezovanihpodvohnitkahdnk AT vagisaa symmetryofaminoacidsinproteinssynthesizedbytwostrandsofdna AT gupalna symmetryofaminoacidsinproteinssynthesizedbytwostrandsofdna |