Матрична множинна регресія та сучасні методи бiометрiї для прогнозування бiологiчних показникiв: приклади
In this article, examples of prediction of biological indicators are considered. In this case, the classical methods of biometrics and methods based on matrix multiple regression are used. In order to solve the problem of estimation by the method of least squares for multiple matrix regression, a ma...
Збережено в:
| Дата: | 2021 |
|---|---|
| Автори: | , |
| Формат: | Стаття |
| Мова: | Українська |
| Опубліковано: |
The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
2021
|
| Теми: | |
| Онлайн доступ: | https://journal.iasa.kpi.ua/article/view/252177 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | System research and information technologies |
| Завантажити файл: | |
Репозитарії
System research and information technologies| _version_ | 1867334422300196864 |
|---|---|
| author | Nazaraha, Inna Nazaraha, Yaroslav |
| author_facet | Nazaraha, Inna Nazaraha, Yaroslav |
| author_institution_txt_mv | [
{
"author": "Inna Nazaraha",
"institution": "Київський національний університет імені Тараса Шевченка, Київ"
},
{
"author": "Yaroslav Nazaraha",
"institution": "Національний технічний університет України \"Київський політехнічний інститут імені Ігоря Сікорського\", Київ"
}
] |
| author_sort | Nazaraha, Inna |
| baseUrl_str | http://journal.iasa.kpi.ua/oai |
| collection | OJS |
| datestamp_date | 2022-06-20T14:19:48Z |
| description | In this article, examples of prediction of biological indicators are considered. In this case, the classical methods of biometrics and methods based on matrix multiple regression are used. In order to solve the problem of estimation by the method of least squares for multiple matrix regression, a mathematical apparatus for the singular value decomposition (SVD) and pseudo-inversion technique for Moore–Penrose was used within the development of the concept of tuple operators. The empirical data for calculations were data from an experiment conducted at the Educational and Scientific Center “Institute of Biology and Medicine” (Taras Shevchenko National University of Kyiv). The calculations were made in Microsoft Office Excel and Wolfram Mathematica. The algorithm based on matrix multiple regression has the prediction accuracy in terms of the APE (absolute percentage error) criterion (the error is from 0% to 10%) higher than the accuracy of modern methods of biometrics (some errors are greater than 30%). As shown in the examples, matrix multiple regression can be an effective prediction instrument in biology with an acceptable planning processes accuracy. |
| doi_str_mv | 10.20535/SRIT.2308-8893.2021.4.06 |
| first_indexed | 2025-07-17T10:27:44Z |
| format | Article |
| fulltext |
І.М. Назарага, Я.Р. Назарага, 2021
Системні дослідження та інформаційні технології, 2021, № 4 81
УДК 51-76
DOI: 10.20535/SRIT.2308-8893.2021.4.06
МАТРИЧНА МНОЖИННА РЕГРЕСIЯ ТА СУЧАСНI МЕТОДИ
БIОМЕТРIЇ ДЛЯ ПРОГНОЗУВАННЯ БIОЛОГIЧНИХ
ПОКАЗНИКIВ: ПРИКЛАДИ
І.М. НАЗАРАГА, Я.Р. НАЗАРАГА
Aнотація. Розглянуто приклади прогнозування біологічних показників із за-
стосуванням сучасних методів біометрії та методів на основі матричної мно-
жинної регресії. З метою розв’язання задачі оцінювання методом найменших
квадратів для множинної матричної регресії використано розроблений матема-
тичний апарат сингулярного розкладу і техніку псевдообернення за Муром–
Пенроузом у межах розвитку концепції кортежних операторів. Емпіричними
даними для розрахунків стали дані експерименту, проведеного в навчально-
науковому центрі «Інститут біології та медицини» Київського національного
університету імені Тараса Шевченка. Розрахунки виконано у Microsoft Office
Excel та в середовищі Wolfram Mathematica, проаналізовано результати за різ-
ними варіантами. Точність прогнозування за критерієм APE (абсолютний від-
соток похибки) згідно з алгоритмом на основі матричної множинної регресії
(похибка від 0% до 10%) вища, ніж для сучасних методів біометрії (деякі по-
хибки перевищують 30%). Показано, що матрична множинна регресія може
бути ефективним інструментом прогнозування в біології з прийнятною для
цього точністю.
Kлючові слова: матрична множинна регресія, методи біометрії, біологічні по-
казники, прогнозування, сингулярний розклад.
ВСТУП
Сучасна біологія широко використовує математичний апарат для моделю-
вання та прогнозування процесів у живих системах і формалізації механіз-
мів, покладених в основу біологічних процесів. Для передбачення поведінки
таких систем дедалі частіше вдаються до віртуальних експериментів із ви-
користанням математичних засобів, що дає змогу контролювати, вимірюва-
ти чи прогнозувати ключові змінні, а також окремо розглядати пов’язані
процеси, які в реальних експериментах розділити неможливо. У зв’язку з
цим полегшується інтерпретація отриманих результатів і з’являється мож-
ливість проводити віртуальні експерименти без участі живих істот, які
в житті неприпустимі з етичних міркувань.
Таким чином, реалізація та апробація математичних алгоритмів про-
гнозування біологічних показників є актуальними завданнями для сучасної
біологічної науки.
АНАЛІЗ ЛІТЕРАТУРНИХ ДЖЕРЕЛ ТА ПОСТАНОВКА ПРОБЛЕМИ
Сучасними методами, які найчастіше використовувалися в біології, є методи
біометрії (біологічної статистики) [1–3], але завдяки біохімії і біофізиці де-
далі популярнішими стають складні математичні моделі та алгоритми.
І.М. Назарага, Я.Р. Назарага
ISSN 1681–6048 System Research & Information Technologies, 2021, № 4 82
Натепер є багато причин збільшення кількості різноманітних матема-
тичних методів у біологічних науках [4], одними з яких є збільшення кіль-
кості нової експериментальної інформації, яку неможливо систематизувати
без нового математичного апарату, а також пошук нових аспектів та знань,
що випливають після застосувань такого апарату до відомих положень та
законів біології, сформульованих без застосування математики. Застосуван-
ня таких математичних методів та моделей дає змогу не тільки обробляти
дані реальних дослідів, а і прогнозувати перебіг біологічних процесів під
час віртуальних експериментів [5]. При цьому виникає потреба у створенні
обчислювальних алгоритмів і розробленні програмного забезпечення, що
надійно і ефективно використовує розроблені алгоритми [5].
У працях [6–11] запропоновано нові методи аналізування об’єктів як
складних багаторозмірних табличних структур (матриць) і досліджується
сучасний математичний апарат, який дозволяє оперувати із цими
структурами. Зокрема, В.С. Донченком та його учнями у працях [8–10] за-
пропоновано концепцію кортежних операторів, що дозволяє перенести тех-
ніки сингулярного розкладу і псевдообернення на евклідові простори
матриць фіксованої розмірності.
Таким чином, для розв’язання задач прогнозування запропоновано до
розгляду клас матричних функцій набору матричних аргументів (матричну
множинну регресію), а також алгоритм оцінювання методом найменших
квадратів для вектора невідомих параметрів згаданого класу матричних
функцій [9]. Застосування такого підходу для прогнозування макроекономі-
чних показників економіки України продемонстровано у праці [11], де на
розглянутих прикладах показано його ефективність. Оскільки для біологіч-
них задач природними представниками досліджуваних об’єктів є табличні
структури, то запропоновані методи можна успішно застосовувати і для
прогнозування біологічних показників.
Мета дослідження — з’ясувати можливість використання запропоно-
ваного у праці [9] алгоритму для розв’язання задач прогнозування біологіч-
них показників з прийнятною точністю.
Для досягнення мети необхідно:
розрахувати прогнозні значення досліджуваних показників із вико-
ристанням сучасних методів біометрії;
розрахувати прогнозні значення показників із застосуванням запро-
понованого алгоритму на основі матричної множинної регресії;
проаналізувати результати прогнозування за різними варіантами.
Емпіричними даними для розрахунків стали дані експерименту, прове-
деного у науковій лабораторії кафедри біохімії навчально-наукового центру
«Інститут біології та медицини» Київського національного університету
імені Тараса Шевченка.
ТЕОРЕТИЧНІ ОСНОВИ МЕТОДУ ПРОГНОЗУВАННЯ НА БАЗІ
МАТРИЧНОЇ МНОЖИННОЇ РЕГРЕСІЇ
Теоретичні засади методу аналізу та прогнозування об’єктів, що виражені
матрицями, детально подано у працях [6–10].
Нехай маємо M матриць спостережень: .,...,, 21 MXXX означимо ,iO
Ni ,1 — матричні кортежі-рядки:
)...( 11 KXXO )...( 122 KXXO ,…, )...( 1 NKNN XXO ,
Матрична множинна регресiя та сучаснi методи бiометрiї для прогнозування …
Системні дослідження та інформаційні технології, 2021, № 4 83
KNM , K — довжина основи.
Називатимемо NiOi ,1, основами (опорами) прогнозу, а
,iKi XY Ni ,1 — відгуками прогнозу. Вхідні та вихідні дані моделі за-
дають матричні пари ),(,...,),(),,( 2211 NN YOYOYO .
Визначимо множинну матричну регресію з матричними значеннями [8]
як матричну функцію Y матричного кортежу-рядка )...( 1,1 KK XX
nm
k RX Kk ,1 такого вигляду KKK XXY ...)( 11,1 ,1Rk
Kk ,1 , що визначаються на основі спостережень ),( )(
,1 i
i
K Y Ni ,1 , де
)(
,1
i
K , Ni ,1 — і-а компонента матричного кортежу-рядка K,1
)...( 1 KXX . Визначимо аналогічно, як і у працях [9, 10], оператор
nmNK RR
KN
,:
,
— матричний кортежний оператор з евклідового про-
стору KR в евклідів простір стовпчикових кортежів довжини N з матриць
розмірності nm покомпонентним скалярним добутком для стовпчикових
кортежів ,... ,
1
1
nmN
N
R
A
A
nmN
N
R
B
B
,
1
2 ... у вигляді nmN ,21 ),(
trii
N
i
BA ),(
1
і оператор, спряжений до
KN , — KnmN RR
KN
,* :
,
.
АЛГОРИТМ ПРОГНОЗУВАННЯ ПОКАЗНИКІВ НА ОСНОВІ МАТРИЧНОЇ
МНОЖИННОЇ РЕГРЕСІЇ
1. Побудова стовпчикових «компонентних» кортежів Kjj ,1, Y
)(
)(
2
)(
1
j
N
j
j
j
O
O
O
, де j
iO — j -а компонента NiOi ,1, ;
N
Y
Y
Y
Y
2
1
— матрич-
ний стовпчиковий кортеж, отриманий зі значень спостережень NiYi ,1, .
2. Побудова матриці Грама F товпчикових «компонентних» кортежів
Kjiji ,1,),( F :
),(...),(),(
............
),(...),(),(
),(...),(),(
21
22212
12111
KKKK
K
K
F ,
де Kjiji ,1,),( — скалярний добуток матричних кортежів, який визнача-
ється покомпонентним скалярним добутком відповідних матриць.
І.М. Назарага, Я.Р. Назарага
ISSN 1681–6048 System Research & Information Technologies, 2021, № 4 84
Зауваження: для матриць )( ijaA а njmi ,1,,1 , скалярний добуток
визначається таким чином: BtrAbaBA T
ijij
njmi
,1,,1
),( .
3. Знаходження розв’язку задачі на власні значення для матриці F .
Обчислення ненульових сингулярностей ),( 2
ii матриці Грама F стовпчи-
кових «компонентних» кортежів, Frank,,1 rri .
Зауваження: ненульові сингулярності ),( 2
ii , ri ,1 записуємо у від-
повідності до зростання власних значень.
4. Обчислення власних кортежів ,
1
:
1
kik
K
ki
ii
ri ,1 оператора
*
,, KNKN i — стовпчиковий кортеж довжини N .
5. Знаходження скалярних добутків ,),( , nmNYiisk ri ,1 .
6. Обчислення ̂ за формулою ̂ nmNYkkk
r
k
,
1
1
),( .
7. Знаходження прогнозної функції як умовного математичного
сподівання:
)|)(()(ˆˆ
,1,1,1 KNNKNNKNN YEYY
,ˆ),,|)(((
1
1,1 kNk
K
k
KNNKNN XXXYYE
.
ЕМПІРИЧНІ ДАНІ ДЛЯ РОЗРАХУНКІВ
Для розглянутих у роботі прикладів використано дані досліджень, проведе-
них у науковій лабораторії кафедри біохімії навчально-наукового центру
«Інститут біології та медицини» Київського національного університету
імені Тараса Шевченка [12, 13] під керівництвом О.М. Савчука, завідувача
кафедри біохімії, доктора біологічних наук, професора. Експерименти про-
водились на білих нестатевозрілих пацюках жіночої статі з початковою ма-
сою 90–110 г відповідно до стандартів Конвенції про біоетику Ради Європи
1997 р., Європейської конвенції про захист хребетних тварин, що застосо-
вуються для експериментальних та інших наукових цілей, загальних етич-
них принципів експериментів на тваринах, затверджених першим
Національним конгресом біоетики України (вересень 2001 р.) та інших
міжнародних угод та національного законодавства у цій сфері. Під час екс-
перименту досліджувався вплив водного екстракту стручків Phaseolus
vulgaris на фізіологічні параметри та запалення пацюків при опіках страво-
ходу 2-го ступеня.
Тварин розділили на 4 групи: група 1 (G1) — контрольна група тварин
(фізіологічне введення); група 2 (G2) — контрольна група тварин, яким вво-
дили екстракт Phaseolus vulgaris у дозі 1мг / кг; група 3 (G3) — пацюки з
опіками стравоходу 2-го ступеня та фізіологічним уведенням; група 4 (G4) —
пацюки з опіками стравоходу 2-го ступеня, яким уводили екстракт Phaseolus
vulgaris у дозі 1мг/кг.
Під час експерименту вимірювалися такі показники: приріст маси тіла
відносно початкового значення, % (P1); споживання рідини, г (P2); спожи-
Матрична множинна регресiя та сучаснi методи бiометрiї для прогнозування …
Системні дослідження та інформаційні технології, 2021, № 4 85
вання корму, г (P3). У табл. 1–3 подано значення показників P1, Р2, P3 для
досліджуваних груп G1 – G4 на 6-й, 9-й, 12-й, …, 30-й дні спостережень.
Т а б л и ц я 1 . Значення показників для досліджуваних груп на 6-й, 9-й та
12-й дні
6-й день 9-й день 12-й день
Група
P1 P2 P3 P1 P2 P3 P1 P2 P3
G1 30,77 30,00 19,00 51,68 30,00 20,60 74,75 36,00 21,60
G2 44,33 40,00 19,00 65,18 25,00 18,80 82,59 25,00 17,80
G3 24,94 27,08 18,41 38,24 33,75 22,00 49,10 31,67 18,20
G4 24,37 26,54 16,00 39,97 30,62 19,00 60,73 30,38 18,80
Т а б л и ц я 2 . Значення показників для досліджуваних груп на 15-й, 18-й
та 21-й дні
15-й день 18-й день 21-й день
Група
P1 P2 P3 P1 P2 P3 P1 P2 P3
G1 114,60 36,00 22,00 137,87 46,00 21,60 151,68 40,00 22,60
G2 95,34 27,00 21,00 111,34 34,00 20,00 122,87 30,00 20,00
G3 59,84 42,00 20,30 68,70 43,00 20,60 69,65 34,70 19,40
G4 73,55 37,50 22,60 83,38 42,50 21,30 86,73 39,10 18,30
Т а б л и ц я 3 . Значення показників для досліджуваних груп на 24-й, 27-й
та 30-й дні
24-й день 27-й день 30-й день
Група
P1 P2 P3 P1 P2 P3 P1 P2 P3
G1 162,52 42,00 23,20 172,58 42,00 25,00 182,45 44,00 23,00
G2 129,76 34,00 21,20 136,84 35,00 22,40 142,31 35,00 21,60
G3 73,62 37,50 18,40 78,97 43,10 16,00 85,16 35,00 16,40
G4 90,60 49,20 19,40 97,51 40,60 17,40 102,74 34,80 18,60
РЕЗУЛЬТАТИ ПРОГНОЗУВАННЯ З ВИКОРИСТАННЯМ УБУДОВАНИХ
ЗАСОБІВ MICROSOFT OFFICE EXCEL
Прогнозування досліджуваних показників для кожної з груп здійснювалося
на 1 крок вперед (на 30-й день за наявними даними за 6-й – 27-й дні), при
цьому використано сучасні методи біометрії (інструменти Excel: лінії тренду).
Зокрема у варіанті 1 застосовано лінійну апроксимацію, у варіанті 2 — експо-
ненційну апроксимацію, а у варіанті 3 — логарифмічну апроксимацію (табл. 4).
Т а б л и ц я 4 . Прогнозні значення показників P1, P2, P3 для досліджуваних груп
на 30-й день у трьох варіантах апроксимації
Варіант 1 Варіант 2 Варіант 3
Група
P1 P2 P3 P1 P2 P3 P1 P2 P3
G1 208,53 46,63 25,03 284,53 47,46 25,11 176,80 43,96 23,99
G2 157,83 32,96 22,23 181,57 33,08 22,20 138,69 30,82 21,33
G3 91,38 44,14 17,51 106,47 44,73 17,42 81,13 42,20 18,45
G4 115,26 48,96 19,57 142,04 50,72 19,46 101,54 45,16 20,00
І.М. Назарага, Я.Р. Назарага
ISSN 1681–6048 System Research & Information Technologies, 2021, № 4 86
Стyпiнь наближення фактичниx та пpогнозниx даниx xаpактеpизyється
коефiцiєнтами детеpмiнацiї R2 та коефіцієнтами кореляції R, значення яких
для кожного з варіантів подано у табл. 5 і 6.
Т а б л и ц я 5 . Коефіцієнти детермінації прогнозу значень показників P1,
P2, P3 для досліджуваних груп у трьох варіантах апроксимації
Варіант 1 Варіант 2 Варіант 3
Група
R2 (P1) R2 (P2) R2 (P3) R2 (P1) R2 (P2) R2 (P3) R2 (P1) R2 (P2) R2 (P3)
G1 0,960 0,696 0,895 0,880 0,721 0,893 0,951 0,747 0,864
G2 0,971 0,030 0,659 0,902 0,054 0,649 0,978 0,004 0,504
G3 0,931 0,493 0,242 0,851 0,514 0,251 0,986 0,596 0,099
G4 0,917 0,754 0,015 0,817 0,782 0,022 0,985 0,769 0,123
Т а б л и ц я 6 . Коефіцієнти кореляції прогнозу значень показників P1, P2, P3 для
досліджуваних груп у трьох варіантах апроксимації
Варіант 1 Варіант 2 Варіант 3
Група
R (P1) R (P2) R (P3) R (P1) R (P2) R (P3) R (P1) R (P2) R (P3)
G1 0,980 0,834 0,946 0,938 0,849 0,945 0,975 0,864 0,930
G2 0,985 0,173 0,812 0,950 0,232 0,806 0,989 0,063 0,710
G3 0,965 0,702 0,492 0,922 0,717 0,501 0,993 0,772 0,315
G4 0,958 0,868 0,122 0,904 0,884 0,148 0,992 0,877 0,351
Зауважимо, що згiдно зi шкалою Чеддока (табл. 7), показникy R даєть-
ся якicна оцiнка, див. напр. [14].
Т а б л и ц я 7 . Якicна оцiнка коефiцiєнта кореляції
R (0 – 0,3) [0,3 – 0,5) [0,5 – 0,7) [0,7 – 0,9) [0,9 – 1)
Оцінка Слабка Помipна Помiтна Виcока Дyже виcока
Як бачимо з табл. 6, коефіцієнти кореляції іноді не перевищують 0,3,
що свідчить про слабкий ступінь наближення прогнозних значень показни-
ків до фактичних. Про високий ступінь наближення можна говорити для
показників, клітинки табл. 6 для яких виділено. У розділі «Обговорення ре-
зультатів обчислень» наведено похибки прогнозу для кожного з варіантів та
проаналізовано отримані результати.
РЕЗУЛЬТАТИ ОБЧИСЛЕНЬ ЗА АЛГОРИТМОМ
На основі даних табл. 1 очевидним чином формуємо матриці спостережень
1X , 2X і 3X , на основі даних табл. 2 — матриці 4X , 5X і 6X , а на основі
даних табл. 3 — матриці 7X , 8X , 9X . Маємо 9 матриць спостережень:
921 ,...,, XXX . Поданий вище алгоритм реалізовано у середовищі Wolfram
Mathematica, за яким виконано розрахунки. Наведемо детальну схему роз-
рахунку для варіанта групування даних, ,4K N = 4.
1. Формування основи прогнозу:
)( 43211 XXXXO , 51 XY ; )( 54322 XXXXO , 62 XY ;
65433 XXXXO , 73 XY ; 76544 XXXXO , 84 XY .
2. Побудова стовпчикових «компонентних» кортежів:
Матрична множинна регресiя та сучаснi методи бiометрiї для прогнозування …
Системні дослідження та інформаційні технології, 2021, № 4 87
4
3
2
1
1
X
X
X
X
,
5
4
3
2
2
X
X
X
X
,
6
5
4
3
3
X
X
X
X
,
7
6
5
4
4
X
X
X
X
,
8
7
6
5
X
X
X
X
Y
.
3. Обчислення матриці Грама:
51,21266556,18982231,16262248,129760
56,18982204,17116086,14744975,118441
31,16262286,14744962,12903128,104641
48,12976075,11844128,10464196,86665
F , 4,0rank Fr .
4. Обчислення ненульових сингулярностей матриці Грама F
cтовпчикових «компонентних» кортежів:
)199665,0 ;609736,0 ;700455,0 ;312599,0(1 v , 3022,181 ;
)507306,0;563729,0 ;408739,0 ;507724,0(2 v , 9231,232 ;
)589663,0 ;148895,0 ;355271,0 ;709866,0(3 v , ;0334,803
)59588,0 ;5369,0 ;464841,0 ;374951,0(4 v 5520,7694 .
8. Обчислення власних кортежів i , ri ,1 : отримуємо чотири власні
кортежі-матриці розмірності 316 , які не наводимо через їх великий розмір.
5. Обчислення скалярних добутків:
0496,3sk1 ; 9760,12sk2 ; 2573,65sk3 ; 4360,491sk4 .
6. Знаходження ̂ :
)1698,1 ;0569,0 ;0978,0 ;1161,0(ˆ .
7. Прогнозування показників на наступний період (30-й день) (табл. 8).
Т а б л и ц я 8 . Прогнозні значення досліджуваних показників
30-й день, прогноз
Група
P1 P2 P3
G1 189,74 45,11 23,43
G2 147,30 36,13 22,15
G3 88,83 35,70 16,04
G4 106,80 33,67 18,73
ОБГОВОРЕННЯ РЕЗУЛЬТАТІВ ОБЧИСЛЕНЬ
Для визначення точності прогнозування показників використаємо формаль-
ний критерій точності (absolute percentage error):
z
zz
APE
ˆ
·100, де z —
фактичне значення відповідного показника, а ẑ — його прогнозне значен-
ня. Якість запропонованого методу перевiрено з використанням pетpоcпек-
тивного оцiнювання пpогнозy. Зауважимо, що загальноприйнятим є твер-
дження, що значення АРЕ, яке менше за 10%, вiдповiдає виcокiй точноcтi
пpогнозy, а отже, i якоcтi моделi чи підходу; вiд 10 до 20 % — добpiй точ-
ноcтi; вiд 20 до 30 % — задовiльнiй; бiльше як 30 % — незадовiльнiй. Роз-
І.М. Назарага, Я.Р. Назарага
ISSN 1681–6048 System Research & Information Technologies, 2021, № 4 88
раховані значення похибок прогнозу значень показників за вказаним крите-
рієм для кожного з варіантів подано у табл. 9.
Т а б л и ц я 9 . Точність прогнозних показників для різних варіантів про-
гнозування
Варіант 1 Варіант 2 Варіант 3 Варіант 4
Група
P1 P2 P3 P1 P2 P3 P1 P2 P3 P1 P2 P3
G1, % 14,30 5,99 8,80 55,95 7,86 9,19 3,09 0,10 4,32 4,00 2,52 1,89
G2, % 10,91 5,83 2,91 27,59 5,50 2,79 2,54 11,94 1,27 3,51 3,22 2,53
G3, % 7,30 26,12 6,76 25,02 27,80 6,24 4,73 20,56 12,49 4,30 2,00 2,18
G4, % 12,19 40,70 5,23 38,26 45,76 4,64 1,17 29,78 7,52 3,95 3,26 0,68
Як бачимо з табл. 9, для варіантів 1, 2 і 3 значення похибок для деяких
значень (виділених) варіюють від 20% до 30%, що вiдповiдає задовільній
точноcтi пpогнозy, для варіантів 1 та 2 деякі значення (виділені) перевищу-
ють 30%, що свідчить про незадовільну точність прогнозу. Для варіанта 4
похибки не перевищують 10%, що свідчить про високу точність прогнозу і,
відповідно, якість методу прогнозування. Таким чином, згідно з обчислени-
ми значеннями критерію APE (від 0% до 10%), точнiсть прогнозування вка-
заних біологічних показників за алгоритмом, який базується на матричній
множинній регресії, є високою.
ВИСНОВКИ
Розглянуто приклади прогнозування біологічних показників із застосуван-
ням сучасних методів біометрії та алгоритму на основі матричної множин-
ної регресії. Емпіричними даними для обчислень стали дані експерименту,
проведеного в науковій лабораторії кафедри біохімії навчально-наукового
центру «Інститут біології та медицини» Київського національного універси-
тету імені Тараса Шевченка. Розрахунки проведені у Microsoft Office Excel
та середовищі Wolfram Mathematica. Згідно з обчисленими значеннями по-
хибок прогнозу значень показників за критерієм APE, точнiсть прогнозу за
алгоритмом, який базується на матричній множинній регресії і, відповідно,
якість методу прогнозування вказаних показників є високою (похибки від
0% до 10%). Точність прогнозу за критерієм APE для одного з розглянутих
методів біометрії є задовільною (похибки становлять від 0% до 30%), для двох
інших — незадовільною (похибки для деяких показників понад 30%).
Таким чином, виконані розрахунки показують, що методи прогнозу-
вання на основі матричної множинної регресії є конкурентоспроможними і
можуть бути використані для розв’язання задач прогнозування біологічних
показників з прийнятною для цього точністю.
ЛІТЕРАТУРА
1. О.Г. Близнюченко, Біометрія: Монографія. Полтава: Редакційно-видавничий
відділ “Terra”, 2003, 346 с.
2. Biomedical statistics (website devoted to statistical analysis of biomedical data).
[Online]. Available: http://www.biomedicalstatistics.info/en.
3. М.П. Горошко, С.І. Миклуш, та П.Г. Хомюк, Біометрія. Львів: Камула, 2004, 285 с.
4. Н.В. Кепчик, Математические методы в биологии в контексте университетского
образования. [Электронный ресурс]. Доступно: https://bsu.by/ Cache/pdf/96113.pdf.
5. А. Кизилова и И. Сбальцарини, “Пространственно-временное моделирование в
биологии”, Биомолекула, 2012. [Электронный ресурс]. Доступно: https://biomolecula.
ru/articles/prostranstvenno-vremennoe-modelirovanie-v-biologii.
Матрична множинна регресiя та сучаснi методи бiометрiї для прогнозування …
Системні дослідження та інформаційні технології, 2021, № 4 89
6. V. Donchenko, I. Nazaraga, and O. Tarasova, “Vectors and matrixes least square method:
foundation and application examples”, International Journal Information Theories and
Applications, vol. 20, no. 4, pp. 311–322, 2013.
7. V. Donchenko, I. Nazaraga, and O. Tarasova, “Matrixes least squares method: examples
of its application in macroeconomics and TV-media business”, Eastern-European
Journal of Enterprise Technologies, vol. 4, no. 4(70), pp. 42–46, 2014. doi:
https://doi.org/10.15587/1729-4061.2014.26292.
8. V. Donchenko, T. Zinko, and F. Skotarenko, “Feature Vectors” in Grouping Information
Problem in Applied Mathematics: Vectors and Matrixes”, in Proc. Int. Conf. Problems of
Computer Intellectualization, Kyiv, Ukraine–Sofia, Bulgaria, 2012, pp. 111–124.
[Online]. Available: http://foibg.com/ibs_isc/ibs-28/ibs-28-p13.pdf.
9. В.С. Донченко та О.В. Тарасова, “Матрична множинна регресія”, Вісник КНУ імені
Тараса Шевченка. Серія: фіз.-мат. науки, № 2, c. 133–138, 2015.
10. В.С. Донченко, Т.П. Зінько, та Ф.М. Скотаренко, “Концепцiя кортежностi для
лiнiйних операторiв та її реалiзацiя для матричних кортежів”, Журнал
обчислювальної та прикладної математики, № 3 (120), c. 127–140, 2015.
11. I. Nazaraha, “Predictions of macroeconomic indicators based on matrix multiple regres-
sion: examples”, System Research and Information Technologies, no. 1, pp. 119–131,
2018. doi: https://doi.org/10.20535/SRIT.2308-8893.2018.1.10.
12. A. Pasіchnyk, V. Dmytryk, and Ya. Rayetska, “The effect of aqueous extract of Phaseolus
Vulgaris pods on the some biochemical parameters in the conditions of esophagus burn of
second degree in rats”, in Book of Abstr. of XIIІ Int. Scientific Conf. for Students and PhD
Students Youth and Progress of Biology, Ukraine, Lviv, 25 – 27 April 2017, pp. 67–68.
13. Yana Raetska et al., “The effect of Phaseolus vulgaris pods extract on cytokines profile in
the condition of alkali burn esophagus 2 degree”, Biomedical Research and Therapy, vol.
6, no. 9, pp. 3352–3358, 2019. [Online]. Available: http://www.bmrat. org/index.php/
BMRAT/article/view/563. doi: 10.15419/bmrat.v6i9.563
14. В.П. Сторожук та ін., Теорія статистики: курс лекцій. Частина 1. Тернопіль:
Економічна думка, 2006, 224 с.
Надійшла 27.09.2021
INFORMATION ON THE ARTICLE
Inna M. Nazaraha, ORCID: 0000-0001-8256-515X, Taras Shevchenko National Univer-
sity of Kyiv, Ukraine, e-mail: inna_na@ukr.net
Yaroslav R. Nazaraha, Igor Sikorsky Kyiv Polytechnic Institute, Ukraine, e-mail:
yarikn21@gmail.com
МАТРИЧНАЯ МНОЖЕСТВЕННАЯ РЕГРЕССИЯ И СОВРЕМЕННЫЕ
МЕТОДЫ БИОМЕТРИИ ДЛЯ ПРОГНОЗИРОВАНИЯ БИОЛОГИЧЕСКИХ
ПОКАЗАТЕЛЕЙ: ПРИМЕРЫ / И.М. Назарага, Я.Р. Назарага
Аннотация. Рассмотрены примеры прогнозирования биологических показате-
лей с применением современных методов биометрии и методов на основе мат-
ричной множественной регрессии. С целью решения задач оценивания
методом наименьших квадратов для множественной матричной регрессии ис-
пользованы математический аппарат сингулярного разложения и техника псе-
вдообращения по Муру–Пенроузу в пределах развития концепции кортежных
операторов. Эмпирическими данными для расчетов стали данные эксперимен-
та, проведенного в учебно-научном центре «Институт биологии и медицины»
(Киевский национальный университет имени Тараса Шевченко). Расчеты вы-
полнены в Microsoft Office Excel и Wolfram Mathematica, проанализированы
результаты. Точность прогнозирования по критерию APE (абсолютный про-
цент ошибки) согласно алгоритму, основанном на матричной множественной
регрессии (погрешность от 0% до 10%), выше, чем для современных методов
биометрии (некоторые погрешности превышают 30%). Показано, что матрич-
ная множественная регрессия может быть эффективным инструментом про-
гнозирования в биологии с приемлемой для этого точностью.
Ключевые слова: матричная множественная регрессия, методы биометрии,
биологические показатели, прогнозирование, сингулярное разложение.
І.М. Назарага, Я.Р. Назарага
ISSN 1681–6048 System Research & Information Technologies, 2021, № 4 90
MATRIX MULTIPLE REGRESSION AND MODERN BIOMETRIC METHODS
FOR PREDICTION OF BIOLOGICAL INDICATORS: EXAMPLES / I.M. Nazaraha,
Ya.R. Nazaraha
Abstract. In this article, examples of prediction of biological indicators are
considered. In this case, the classical methods of biometrics and methods based on
matrix multiple regression are used. In order to solve the problem of estimation by
the method of least squares for multiple matrix regression, a mathematical apparatus
for the singular value decomposition (SVD) and pseudo-inversion technique for
Moore–Penrose was used within the development of the concept of tuple operators.
The empirical data for calculations were data from an experiment conducted at the
Educational and Scientific Center “Institute of Biology and Medicine” (Taras
Shevchenko National University of Kyiv). The calculations were made in Microsoft
Office Excel and Wolfram Mathematica. The algorithm based on matrix multiple
regression has the prediction accuracy in terms of the APE (absolute percentage
error) criterion (the error is from 0% to 10%) higher than the accuracy of modern
methods of biometrics (some errors are greater than 30%). As shown in the
examples, matrix multiple regression can be an effective prediction instrument in
biology with an acceptable planning processes accuracy.
Keywords: matrix multiple regression, methods of biometrics, biological indicators,
prediction, singular-value decomposition.
REFERENCES
1. O.H. Blyzniuchenko, Biometrics: monohraph, (in Ukrainian). Poltava: “Terra”, 2003, 346 p.
2. Biomedical statistics. [Online]. Available: http://www.biomedicalstatistics.info/en.
3. M.P. Horoshko, S.I. Myklush, and P.H. Khomiuk, Biometrics, (in Ukrainian). Lviv: Ka-
mula, 2004, 285 p.
4. N.V. Kepchik, Mathematical methods in biology in the context of university education,
(in Russian). [Online]. Available: https://bsu.by/Cache/ pdf/96113.pdf.
5. A. Kizilova and I. Sbal`czarini, “Space-time modeling in biology”, (in Russian), Bio-
molecula, 2012. [Online]. Available: https://biomolecula.ru/articles/ prostranstvenno-
vremennoe-modelirovanie-v-biologii.
6. V. Donchenko, I. Nazaraga, and O. Tarasova, “Vectors and matrixes least square method:
foundation and application examples”, International Journal Information Theories and
Applications, vol. 20, no. 4, pp. 311–322, 2013.
7. V. Donchenko, I. Nazaraga, and O. Tarasova, “Matrixes least squares method: examples
of its application in macroeconomics and TV-media business”, Eastern-European Jour-
nal of Enterprise Technologies, vol. 4, no. 4(70), pp. 42–46, 2014. doi: https://doi.org/
10.15587/1729-4061.2014.26292.
8. V. Donchenko, T. Zinko, and F. Skotarenko, “Feature Vectors” in Grouping Information
Problem in Applied Mathematics: Vectors and Matrixes”, in Proc. Int. Conf. Problems of
Computer Intellectualization, Kyiv, Ukraine–Sofia, Bulgaria, 2012, pp. 111–124.
[Online]. Available: http://foibg.com/ibs_isc/ibs-28/ibs-28-p13.pdf.
9. V. Donchenko and O. Tarasova, “Matrix multiple regression”, (in Ukrainian), Bulletin of
Taras Shevchenko National University of Kyiv. Series: Physics and Mathematics, no. 2,
pp. 133–138, 2015.
10. V. Donchenko, T. Zinko, and F. Skotarenko, “Сortege conception for linear operators
and its implementation for matrix corteges”, (in Ukrainian), Journal of Computational
and Applied Mathematics, no. 3 (120), pp. 127–140, 2015.
11. I. Nazaraha, “Predictions of macroeconomic indicators based on matrix multiple regres-
sion: examples”, System Research and Information Technologies, no. 1, pp. 119–131,
2018. doi: https://doi.org/10.20535/SRIT.2308-8893.2018.1.10.
12. A. Pasіchnyk, V. Dmytryk, and Ya. Rayetska, “The effect of aqueous extract of Phaseolus
Vulgaris pods on the some biochemical parameters in the conditions of esophagus burn of
second degree in rats”, in Book of Abstr. of XIIІ Int. Scientific Conf. for Students and PhD
Students Youth and Progress of Biology, Ukraine, Lviv, 25 – 27 April 2017, pp. 67–68.
13. Yana Raetska et al., “The effect of Phaseolus vulgaris pods extract on cytokines profile in
the condition of alkali burn esophagus 2 degree”, Biomedical Research and Therapy, vol. 6,
no. 9, pp. 3352–3358, 2019. [Online]. Available: http://www.bmrat.org/index.php/
BMRAT/article/view/563. doi: 10.15419/bmrat.v6i9.563
14. V.P. Storozhuket al., Theory of Statistics: Lecture Course, Part 1, (in Ukrainian). Terno-
pil: Ekonomichna dumka, 2006, 224 p.
|
| id | journaliasakpiua-article-252177 |
| institution | System research and information technologies |
| keywords_txt_mv | keywords |
| language | Ukrainian |
| last_indexed | 2025-07-17T10:27:44Z |
| publishDate | 2021 |
| publisher | The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" |
| record_format | ojs |
| resource_txt_mv | journaliasakpiua/b4/ba6fc871d22d8b1ab11c79535af68bb4.pdf |
| spelling | journaliasakpiua-article-2521772022-06-20T14:19:48Z Matrix multiple regression and modern biometric methods for prediction of biological indicators: examples Матричная множественная регрессия и современные методы биометрии для прогнозирования биологических показателей: примеры Матрична множинна регресія та сучасні методи бiометрiї для прогнозування бiологiчних показникiв: приклади Nazaraha, Inna Nazaraha, Yaroslav matrix multiple regression methods of biometrics biological indicators prediction singular-value decomposition матрична множинна регресія методи біометрії біологічні показники прогнозування сингулярний розклад матричная множественная регрессия методы биометрии биологические показатели прогнозирование сингулярное разложение In this article, examples of prediction of biological indicators are considered. In this case, the classical methods of biometrics and methods based on matrix multiple regression are used. In order to solve the problem of estimation by the method of least squares for multiple matrix regression, a mathematical apparatus for the singular value decomposition (SVD) and pseudo-inversion technique for Moore–Penrose was used within the development of the concept of tuple operators. The empirical data for calculations were data from an experiment conducted at the Educational and Scientific Center “Institute of Biology and Medicine” (Taras Shevchenko National University of Kyiv). The calculations were made in Microsoft Office Excel and Wolfram Mathematica. The algorithm based on matrix multiple regression has the prediction accuracy in terms of the APE (absolute percentage error) criterion (the error is from 0% to 10%) higher than the accuracy of modern methods of biometrics (some errors are greater than 30%). As shown in the examples, matrix multiple regression can be an effective prediction instrument in biology with an acceptable planning processes accuracy. Рассмотрены примеры прогнозирования биологических показателей с применением современных методов биометрии и методов на основе матричной множественной регрессии. С целью решения задач оценивания методом наименьших квадратов для множественной матричной регрессии использованы математический аппарат сингулярного разложения и техника псевдообращения по Муру–Пенроузу в пределах развития концепции кортежных операторов. Эмпирическими данными для расчетов стали данные эксперимента, проведенного в учебно-научном центре «Институт биологии и медицины» (Киевский национальный университет имени Тараса Шевченко). Расчеты выполнены в Microsoft Office Excel и Wolfram Mathematica, проанализированы результаты. Точность прогнозирования по критерию APE (абсолютный процент ошибки) согласно алгоритму, основанном на матричной множественной регрессии (погрешность от 0% до 10%), выше, чем для современных методов биометрии (некоторые погрешности превышают 30%). Показано, что матричная множественная регрессия может быть эффективным инструментом прогнозирования в биологии с приемлемой для этого точностью. Розглянуто приклади прогнозування біологічних показників із застосуванням сучасних методів біометрії та методів на основі матричної множинної регресії. З метою розв’язання задачі оцінювання методом найменших квадратів для множинної матричної регресії використано розроблений математичний апарат сингулярного розкладу і техніку псевдообернення за Муром–Пенроузом у межах розвитку концепції кортежних операторів. Емпіричними даними для розрахунків стали дані експерименту, проведеного в навчально-науковому центрі «Інститут біології та медицини» Київського національного університету імені Тараса Шевченка. Розрахунки виконано у Microsoft Office Excel та в середовищі Wolfram Mathematica, проаналізовано результати за різними варіантами. Точність прогнозування за критерієм APE (абсолютний відсоток похибки) згідно з алгоритмом на основі матричної множинної регресії (похибка від 0% до 10%) вища, ніж для сучасних методів біометрії (деякі похибки перевищують 30%). Показано, що матрична множинна регресія може бути ефективним інструментом прогнозування в біології з прийнятною для цього точністю. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2021-12-22 Article Article application/pdf https://journal.iasa.kpi.ua/article/view/252177 10.20535/SRIT.2308-8893.2021.4.06 System research and information technologies; No. 4 (2021); 81-90 Системные исследования и информационные технологии; № 4 (2021); 81-90 Системні дослідження та інформаційні технології; № 4 (2021); 81-90 2308-8893 1681-6048 uk https://journal.iasa.kpi.ua/article/view/252177/249510 |
| spellingShingle | матрична множинна регресія методи біометрії біологічні показники прогнозування сингулярний розклад Nazaraha, Inna Nazaraha, Yaroslav Матрична множинна регресія та сучасні методи бiометрiї для прогнозування бiологiчних показникiв: приклади |
| title | Матрична множинна регресія та сучасні методи бiометрiї для прогнозування бiологiчних показникiв: приклади |
| title_alt | Matrix multiple regression and modern biometric methods for prediction of biological indicators: examples Матричная множественная регрессия и современные методы биометрии для прогнозирования биологических показателей: примеры |
| title_full | Матрична множинна регресія та сучасні методи бiометрiї для прогнозування бiологiчних показникiв: приклади |
| title_fullStr | Матрична множинна регресія та сучасні методи бiометрiї для прогнозування бiологiчних показникiв: приклади |
| title_full_unstemmed | Матрична множинна регресія та сучасні методи бiометрiї для прогнозування бiологiчних показникiв: приклади |
| title_short | Матрична множинна регресія та сучасні методи бiометрiї для прогнозування бiологiчних показникiв: приклади |
| title_sort | матрична множинна регресія та сучасні методи бiометрiї для прогнозування бiологiчних показникiв: приклади |
| topic | матрична множинна регресія методи біометрії біологічні показники прогнозування сингулярний розклад |
| topic_facet | matrix multiple regression methods of biometrics biological indicators prediction singular-value decomposition матрична множинна регресія методи біометрії біологічні показники прогнозування сингулярний розклад матричная множественная регрессия методы биометрии биологические показатели прогнозирование сингулярное разложение |
| url | https://journal.iasa.kpi.ua/article/view/252177 |
| work_keys_str_mv | AT nazarahainna matrixmultipleregressionandmodernbiometricmethodsforpredictionofbiologicalindicatorsexamples AT nazarahayaroslav matrixmultipleregressionandmodernbiometricmethodsforpredictionofbiologicalindicatorsexamples AT nazarahainna matričnaâmnožestvennaâregressiâisovremennyemetodybiometriidlâprognozirovaniâbiologičeskihpokazatelejprimery AT nazarahayaroslav matričnaâmnožestvennaâregressiâisovremennyemetodybiometriidlâprognozirovaniâbiologičeskihpokazatelejprimery AT nazarahainna matričnamnožinnaregresíâtasučasnímetodibiometriídlâprognozuvannâbiologičnihpokaznikivprikladi AT nazarahayaroslav matričnamnožinnaregresíâtasučasnímetodibiometriídlâprognozuvannâbiologičnihpokaznikivprikladi |