Нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих
Представлено нові методи розробки програмного забезпечення для байєсівського підходу, які раніше при дослідженні запальних процесів у разі пухлин головного мозку не застосовувалися до таких показників, як модифікована швидкість осідання еритроцитів; поверхневий плазмонний резонанс; властивості плазм...
Saved in:
| Published in: | Проблеми керування та інформатики |
|---|---|
| Date: | 2025 |
| Main Authors: | , |
| Format: | Article |
| Language: | Ukrainian |
| Published: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2025
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/211405 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих / А.М. Гупал, А.Л. Тарасов // Проблемы управления и информатики. — 2025. — № 3. — С. 96-106. — Бібліогр.: 8 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859910525321740288 |
|---|---|
| author | Гупал, А.М. Тарасов, А.Л. |
| author_facet | Гупал, А.М. Тарасов, А.Л. |
| citation_txt | Нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих / А.М. Гупал, А.Л. Тарасов // Проблемы управления и информатики. — 2025. — № 3. — С. 96-106. — Бібліогр.: 8 назв. — укр. |
| collection | DSpace DC |
| container_title | Проблеми керування та інформатики |
| description | Представлено нові методи розробки програмного забезпечення для байєсівського підходу, які раніше при дослідженні запальних процесів у разі пухлин головного мозку не застосовувалися до таких показників, як модифікована швидкість осідання еритроцитів; поверхневий плазмонний резонанс; властивості плазми крові; та результати роботи лазерного спектрографа щодо визначення структури білків плазми крові. Надано рекомендації щодо оптимізації байєсівської процедури розпізнавання за однією ознакою.
New approaches for software development using the Bayesian approach are described, which have not been used for one research indicator in the study of inflammatory processes in brain tumors using modified erythrocyte sedimentation rate, surface plasmon resonance in the study of blood plasma properties, and laser spectrograph indicators for indicators of plasma protein structures. New approaches are expedient to use for hematological diseases — secondary erythrocytosis and polycythemia vera.
|
| first_indexed | 2026-03-17T12:01:38Z |
| format | Article |
| fulltext |
© А.М. ГУПАЛ, А.Л. ТАРАСОВ, 2025
96 ISSN 2786-6491
КЕРУВАННЯ В ТЕХНІЧНИХ, ЕКОНОМІЧНИХ
ТА БІОЛОГІЧНИХ СИСТЕМАХ
УДК 519.217.2+616.006
А.М. Гупал, А.Л. Тарасов
НОВІ РЕКОМЕНДАЦІЇ ЩОДО
ЗАСТОСУВАННЯ БАЙЄСІВСЬКОГО
ПІДХОДУ ЗА ОДНІЄЮ ОЗНАКОЮ
ВІДНОСНО ДОСЛІДЖЕНЬ
ПОКАЗНИКІВ ОНКОХВОРИХ
Гупал Анатолій Михайлович
Інститут кібернетики імені В.М. Глушкова НАН України, м. Київ,
gupalanatol@gmail.com
Тарасов Андрій Леонтійович
Інститут кібернетики імені В.М. Глушкова НАН України, м. Київ,
freearcher@ukr.net
Представлено нові методи розробки програмного забезпечення для байєсівсько-
го підходу, які раніше при дослідженні запальних процесів у разі пухлин голов-
ного мозку не застосовувалися до таких показників, як модифікована швидкість
осідання еритроцитів; поверхневий плазмонний резонанс; властивості плазми
крові; та результати роботи лазерного спектрографа щодо визначення структури
білків плазми крові. Надано рекомендації щодо оптимізації байєсівської проце-
дури розпізнавання за однією ознакою. Описані підходи доцільно застосовувати
у разі гематологічних захворювань — вторинного еритроцитозу та справжньої
поліцитемії. Внаслідок цього очікується підвищення швидкості розрахунків та
збільшення їхньої загальної кількості. Пояснюється, що саме підвищує швид-
кість розрахунків для оптимізації використання оперативної пам’яті. До-
слідження отриманих результатів за допомогою методів теорії ймовірності та
математичної статистики сприятимуть формулюванню рекомендацій щодо оп-
тимізації розрахунків. Після отримання позитивних висновків буде зрозуміло,
як краще використовувати байєсівську процедуру розпізнавання за декількома
показниками для визначення діагнозу. Модифікований метод обчислення швид-
кості осідання еритроцитів дає змогу фіксувати їх осідання з часом. Вимірюван-
ня структур білків плазми крові за допомогою лазерного спектрографа залежить
від діапазону хвиль 0–1000 нм і має приблизно десять вимірювань на до-
слідження, тому запропоновано нові методи використання байєсівського підхо-
ду в разі застосування ланцюгів Маркова, байєсівських дерев або інших алгори-
тмів, у яких враховується динаміка зняття показників подібних досліджень.
У наступній роботі буде висвітлено відповідні висновки щодо зазначених нових
підходів для одного показника дослідження та надано нові рекомендації щодо
подальших удосконалень.
Ключові слова: рекомендації щодо вдосконалення розробки програмного за-
безпечення, байєсівська процедура розпізнавання, модифікована швидкість осі-
дання еритроцитів, поверхневий плазмонний резонанс, білкові структури плаз-
ми крові, лазерний спектрограф, вторинний еритроцитоз, справжня поліцитемія.
mailto:freearcher@ukr.net
Міжнародний науково-технічний журнал
Проблеми керування та інформатики, 2025, № 3 97
Вступ
При байєсівському підході використовується байєсівська процедура роз-
пізнавання (БПР), за допомогою якої аналізуються показники двох груп онко-
хворих (для обох груп досліджуються відповідні показники здорових лю-
дей) [1–5].
1. Пацієнти з гліомами II, ІІІ, IV ступенів (надалі — ст.; чим вищий сту-
пінь гліом, тим важче захворювання; на жаль, прогресуючі процеси розвитку
гліом можна лише розтягнути в часі для продовження життя пацієнта; наразі
це невиліковно), метастазами в головному мозку (пухлинними утвореннями, які
з’являються з пухлин інших органів людини; метастази вказують на більш тяжке
захворювання, ніж гліоми, та не піддаються лікуванню), менінгіомами (добро-
якісними пухлинними утвореннями, які зазвичай видаляються хірургічним шля-
хом), черепно-мозковим струсом (ЧМС) та контрольна група здорових людей [1–4].
Цікаво те, що у 24 % пацієнтів з гліомами в минулому спостерігались ЧМС [5].
Для пацієнтів цієї групи аналізуються такі показники.
1.1. Модифікована швидкість осідання еритроцитів (МШОЕ) [1, 2]. Це є ви-
дозміною швидкості осідання еритроцитів (ШОЕ) — вимірюваного в міліметрах
осідання червоної частини крові, еритроцитів, на 60-й хв без додавання в кров рі-
дин-домішок. Швидкість осідання еритроцитів є показником наявності запальних
процесів в організмі, коли показник знаходиться поза межами релевантних зна-
чень (останні відповідають здоровому стану людини). Модифікована швидкість
осідання еритроцитів вимірюється після додавання в кров рідин-домішок, що ви-
користовуються для лікування запальних процесів при різних захворюваннях, та
фіксації осідання еритроцитів з інтервалом 5–90 хв. Останній показник МШОЕ зні-
мається через добу. Отже, осідання еритроцитів досліджується в динаміці під час
впливу доданих рідин-домішок.
1.2. Поверхневий плазмонний резонанс (ППР) [3]. Цей показник базується на
збудженні зовнішньою електромагнітною хвилею поверхневого плазмону (поверх-
невим плазмоном виступають клітини крові з додаванням рідин-домішок, ана-
логічних рідинам-домішкам при знятті показників МШОЕ) на його резонансній
частоті.
1.3. Білкові структури (БС) плазми крові [4]. Вони вимірюються за допомо-
гою лазерного спектрографа, що фіксує інтенсивність відбиття лазерного промін-
ня від поверхні пластини з плазмою крові в діапазоні хвиль 1–1000 нм.
2. Пацієнти із вторинним еритроцитозом та справжньою поліцитемією [5].
При дослідженні цієї групи пацієнтів аналізуються здебільшого клінічні показни-
ки крові, що дають можливість робити висновки щодо порушення фізіологічних
функцій крові.
Основною метою оптимізації БПР є підвищення швидкості роботи розробле-
ного програмного забезпечення (ПЗ) за допомогою зменшення обсягу використа-
ної оперативної пам’яті комп’ютера і застосування оптимізаційних підходів та ре-
комендацій щодо подальшої розробки ПЗ, що надає змогу отримати кращі резуль-
тати розпізнавання [1–5]. Деякі програмні підходи оптимізації вже використо-
вувалися розробниками ПЗ, але не висвітлювались. Інші оптимізаційні підходи
розглядаються вперше.
Одним з факторів підвищення швидкості роботи ПЗ є відмова від будь-якої
ОС Windows, що використовувалась для отримання результатів розпізнавання [1–5].
Причиною такої відмови є те, що будь-яка ОС Windows перш за все орієнтована
98 ISSN 2786-6491
на кінцевого користувача (user-friendly — дружній до користувача), тобто зруч-
ність роботи в ОС Windows витісняє основні завдання будь-якого ПЗ, навіть ті,
що виконуються користувачем конкретного ПЗ [6].
Оптимізаційні підходи описано для показників МШОЕ. Подібна оптимізація
застосована також до показників ППР, БС та клінічних досліджень пацієнтів із
вторинним еритроцитозом та справжньою поліцитемією.
Байєсівську процедуру розпізнавання можна задати формулою
1 2
1 2
1 2
( , ,..., | ) ( )
( | , ,..., ) , {1, 2,..., },
( , ,..., )
n
n
n
P x x x f i P f i
P f i x x x i k
P x x x
= =
= = = (1)
де n — кількість незалежних показників (для МШОЕ незалежні показники — це
рідини-домішки, які додаються у кров, що береться з вени), що описують об’єкт
дослідження (пацієнт з відомим діагнозом або здорова людина); k — стан об’єкта
дослідження (діагнози пацієнтів; стан здорової людини); 1 2( , ,..., | )nP x x x f i= —
ймовірність того, що розрахунки ґрунтуються на незалежних показниках стану i
об’єкта дослідження; 1 2( , ,..., )nP x x x — ймовірність, визначена з урахуванням не-
залежних ознак n для всіх k можливих станів об’єктів досліджень; ( )P f i= — від-
ношення кількості досліджень стану і об’єктів до загальної кількості досліджень
всіх станів k.
На рис. 1 показано осідання еритроцитів з додаванням різних рідин-домішок
на 20-й хв та через добу, коли осідання максимальне.
Рис. 1
Під час аналізу показників МШОЕ всі ймовірності в формулі (1) замінюють-
ся відповідними частотами, що підраховуються вже з урахуванням існуючих ре-
зультатів досліджень МШОЕ. Для оцінки нового об’єкта дослідження за новими
показниками МШОЕ потрібно визначити один стан об’єкта i (діагноз або здоро-
вий стан) з усіх можливих k станів (діагнози пацієнтів; здоровий стан). Для цього
за формулою (1) для кожного стану i з k можливих підраховуються всі значення
1 2( | , ,..., ), {1, 2,..., },iP f i x x x i k= = та вибирається той стан i, що має максималь-
не значення порівняно з розрахованими значеннями інших станів. Перейдемо до
методів оптимізації використання БПР для показників МШОЕ.
Оптимізація розпізнавання показників МШОЕ
за допомогою однієї рідини-домішки
При розпізнаванні можливих станів об’єктів досліджень для простоти об-
межимося двома станами — ЧМС та гліома II ст. Приклад роботи БПР наведено
МШОЕ на 20-й хв МШОЕ через добу
Міжнародний науково-технічний журнал
Проблеми керування та інформатики, 2025, № 3 99
для однієї рідини-домішки — аміназину. Розпізнавання зазначених діагнозів для
аміназину відповідає найкращому результату розпізнавання на основі однієї
рідини-домішки [1]. З урахуванням вищезазначеного формула (1) набуває ви-
гляду
1
1
1
( | ) ( )
( | ) , {ЧМС, Гліоми II cт.}.
( )
P x f i P f i
P f i x i
P x
= =
= = = (2)
На рис. 2 представлено усереднені графіки показників МШОЕ при ЧМС та
гліомах II ст. після додавання в кров аміназину.
Рис. 2
У роботі [1] запропоновано аналізувати показники МШОЕ як різниці
показника МШОЕ вибраної хвилини щодо відповідних показників поперед-
ніх хвилин.
Якщо вибрати, наприклад, 25-ту хв зняття показника МШОЕ, то можна
отримати такі різниці між показниками МШОЕ: 25- і 20-та хв; 25- і 15-та хв;
25- і 10-та хв; 25- і 5-та хв; 25-та і 0-ва хв (така різниця відповідає показнику
МШОЕ на 25-й хв (див. рис. 2) та розрахунку не підлягає). При такому підхо-
ді отримано 190 показників МШОЕ для кожного дослідження.
Найкращий результат розпізнавання отримано для аміназину (рис. 3) [1].
Якщо в формулі (2) замість імовірностей підставити частотні розподіли
показників МШОЕ (див. рис. 3), то наявність у об’єкта дослідження ЧМС або
гліом II ст. визначається за допомогою рідини-домішки. Тобто, якщо різниця
показників МШОЕ між 55- та 15-ю хв нового об’єкта дослідження становить
33 мм (6-й інтервал на рис. 3: 30,6–35,7 мм), визначаємо діагноз пацієнта,
ЧМС, за формулою
1 2
1 2
1 2
,
( ) ,
,
j j
j j
j j
m m
A i m m
m m
=
=
(3)
де A(i) — функція визначення стану об’єкта дослідження; 1 — розподіл ЧМС
(див. рис. 3); 2 — розподіл гліом II ст. (див. рис. 3); i — стан об’єкта досліджен-
ня (ЧМС; Гліоми II ст., Невідомий стан; іноді встановити стан об’єкта дослідження
неможливо); j — номер інтервалу, в який потрапляє показник МШОЕ для обох
можливих станів об’єктів дослідження (див. рис. 3 та таблицю, в якій показано
виконання БПР для розподілів з рис. 3 відповідно до формули (3)).
i — ЧМС
i — Гліоми II ст.
i — Невідомий стан
,
Графіки показників МШОЕ після додавання
в кров аміназину
ЧМС
Гліоми II ст.
0 15 30 45 60 75 90 доба
хв
15
30
45
мм
100 ISSN 2786-6491
Рис. 3
Результати застосування БПР при ЧМС та гліомах II ст. за однією ознакою
обчислюються за формулою (3) на основі розподілів, аналогічних наведеним на
рис. 3. Для визначення діагнозу потрібно виконати обчислення на кожному з інтер-
валів на рис. 3, зменшуючи кількість досліджень показників МШОЕ, що потрапили
в кожний інтервал, на одиницю (водночас таке зменшення дає оцінку БПР для
всіх досліджень МШОЕ діагнозу, показники яких потрапили у відповідний інтер-
вал). Отримані значення порівнюються з незмінним значенням відповідних інтерва-
лів для іншого діагнозу. Якщо обчислення виконуються за формулою (3), то кіль-
кість розпізнаних досліджень діагнозу збільшується на первинну кількість показ-
ників МШОЕ в інтервалах, у яких формула (3) коректна. Після порівняння
кількість досліджень діагнозу, що розпізнається, збільшується на початкову
кількість досліджень, що потрапили у відповідний інтервал. На рис. 3 та в таблиці
показники МШОЕ 10-го інтервалу є тільки при ЧМС; для гліом ІІ ст. цих показ-
ників немає, оскільки максимальне значення МШОЕ для гліом ІІ ст. — 45 мм,
що менше за мінімальне значення діапазону 10-го інтервалу (45,9 мм). Теорети-
чно таких інтервалів може бути більше. Умова розпізнавання показників
МШОЕ, які потрапляють у ці інтервали, — ( 1) 0,jN − де jN — кількість показ-
ників МШОЕ, що потрапили в інтервал j (для ЧМС). У разі виконання зазначеної
0
1
0 0
1
5
0
4
6
2
ЧМС (крок розбиття діапазону можливих значень від 0 до 50,2 мм — 5,1 мм)
0 мм 5,1 мм 10,2 мм 15,3 мм 20,4 мм 25,5 мм 30,6 мм 35,7 мм 40,8 мм 45,9 мм 51,0 мм
0 мм 5,1 мм 10,2 мм 15,3 мм 20,4 мм 25,5 мм 30,6 мм 35,7 мм 40,8 мм 45,9 мм 51,0 мм
РОЗПОДІЛ ПОКАЗНИКІВ МШОЕ В ДІАПАЗОНАХ МОЖЛИВИХ ЗНАЧЕНЬ
ПРИ ЧМС ТА ГЛІОМАХ II СТ.
Показники МШОЕ знаходять-
ся поза інтервалом можливих
значень
0
Кількість показників МШОЕ, що по-
трапляють в інтервал можливих зна-
чень (дорівнює 2)
2
Інтервали, в які показники МШОЕ після додавання аміназину не пот-
рапляють за максимального значення МШОЕ відповідного діагнозу
ГЛІОМИ II СТ. (крок розбиття діапазону можливих значень від 0 до 45,0 мм — 5,1 мм)
3
4
6
5
8
2
3
0
1
Кількість аналізів — 32. Розпізнавання глі-
ом II ст. — 90,62 %. Показники МШОЕ —
різниці між показниками на 55- та 15-й хв
Кількість аналізів — 19. Розпізнавання ЧМС —
89,47 %. Показники МШОЕ — різниці між по-
казниками МШОЕ на 55- та 15-й хв
Міжнародний науково-технічний журнал
Проблеми керування та інформатики, 2025, № 3 101
умови кількість правильно розпізнаних показників для ЧМС збільшується на .jN
Показники МШОЕ для гліом ІІ ст. не впливають на визначення ефективності роз-
пізнавання при ЧМС.
Таблиця
№
ЧМС
(кількість досліджень — 19)
№
Гліоми II ст.
(кількість досліджень — 32)
1 (0 – 5,1)* 0** ****** ****** 1 (0 – 5,1)* 3** 3 – 1 > 0*** 3****
2 (5,1 – 10,2)* 1** 1 – 1 > 4*** 0**** 2 (5,1 – 10,2)* 4** 4 – 1 > 1*** 4****
3 (10,2 – 15,3)* 0** ****** ****** 3 (10,2 – 15,3)* 6** 6 – 1 > 0*** 6****
4 (15,3 – 20,4)* 0** ****** ****** 4 (15,3 – 20,4)* 5** 5 – 1 > 0** 5****
5 (20,4 – 25,5)* 1** 1 – 1 > 8*** 0**** 5 (20,4 – 25,5)* 8** 8 – 1 > 0*** 8****
6 (25,5 – 30,6)* 5** 5 – 1 > 2*** 5**** 6 (25,5 – 30,6)* 2** 2 – 1 > 5*** 0****
7 (30,6 – 35,7)* 0** ****** ****** 7 (30,6 – 35,7)* 3** 3 – 1 > 0*** 3****
8 (35,7 – 40,8)* 4** 4 – 1 > 0*** 4**** 8 (35,7 – 40,8)* 0** ****** ******
9 (40,8 – 45,9)* 6** 6 – 1 > 1*** 6**** 9 (40,8 – 45,9)* 1** 1 – 1 > 6*** 0****
10 (45,9 – 51,0)* 2** 2 – 1 = 1*** 2**** ****** ****** ****** ****** ******
Кількість розпізнаних показників
МШОЕ
17***** Кількість розпізнаних показників МШОЕ 29*****
Розпізнавання
ЧМС
17 / 19 = 89,47 % Розпізнавання гліом II ст. 29 / 32 = 90,62 %
*Діапазон інтервалу в міліметрах відповідно до рис. 3.
**Кількість показників МШОЕ, що потрапили у відповідні інтервали на
рис. 3.
***Розрахунок розпізнавання діагнозів базується на зменшенні кількості по-
казників МШОЕ, що потрапили в інтервал, на одне значення. На 8-му інтервалі
для ЧМС проведено чотири дослідження (див. рис. 3). Після зменшення маємо
три дослідження. Ця різниця більша за незмінне значення (нуль показників)
МШОЕ 8-го інтервалу для гліом II ст., тобто чотири дослідження ЧМС розпізна-
но. Аналогічні позитивні результати для ЧМС маємо для 6- та 8–10-го інтервалів.
****Кількість показників позитивного розпізнавання відповідного діагнозу.
*****Сума числових значень для 10 рядків, що більші за нуль.
******Розпізнавання розподілів показників МШОЕ в інтервалах відповідних
діагнозів неможливе.
На рис. 3 крок розбиття діапазону можливих значень ЧМС (0–50,2 мм) та глі-
ом II ст. (0–45 мм) становить 5,1 мм. Перше значення кроку розбиття (див. рис. 3)
залежить від максимального значення для ЧМС, поділеного на два інтервали
(50,2 мм / 2 мм = 25,1 мм). Інші кроки розбиття зменшуються на 0,1 мм, тому що
точність вимірювання МШОЕ обмежується першим знаком після коми для дійс-
ного значення цієї швидкості.
Перша рекомендація така: для оптимізації розпізнавання БПР слід визначити
кроки розбиття діапазонів можливих значень МШОЕ, використання яких доціль-
но для отримання результатів розпізнавання з високою точністю. Це може значно
скоротити кількість відповідних розподілів (див. рис. 3), необхідних для розпізна-
вання БПР (якщо перебирати всі кроки розбиття з 25,1 до 0,1 мм, загальна кіль-
кість розподілів становитиме 251, тому зменшення такої кількості ітерацій до-
цільне при вивченні ефективності розпізнавання 251 розподілу).
102 ISSN 2786-6491
З рис. 3 та таблиці видно, що розподіли показників МШОЕ при ЧМС у 2- та 5-му
інтервалах мають по одному дослідженню. Кількість досліджень показників МШОЕ
при ЧМС або гліомах II ст., як описано вище, зменшується на одиницю, тобто роз-
пізнавання щонайменше двох досліджень ЧМС неможливе (розподіл показників
МШОЕ пацієнтів з ЧМС набуває для 2- та 5-го інтервалів нульових значень, і засто-
сування формули (3) недоцільне). Інакше кажучи, максимальне можливе розпізна-
вання розподілів показників МШОЕ при ЧМС становить (19 – 2) / 19 = = 89,47 %
(19 — загальна кількість досліджень з додаванням аміназину при ЧМС). У цьому
разі (див. рис. 3 та таблицю) максимально можливе розпізнавання ЧМС досягнуто
та дорівнює розрахунковому значенню БПР у таблиці. Для гліом II ст. є лише од-
не дослідження, яке потрапило в 9-й інтервал (див. рис. 3). Тому максимально
можливе розпізнавання гліом II ст. не перевищує (32–1) / 32 = 96,87 % (32 — за-
гальна кількість досліджень з додаванням аміназину при гліомах II ст.). Відповід-
но до рис. 3 та таблиці розпізнавання гліом II ст. становить 90,62 %.
Розглянемо другу рекомендацію щодо оптимізації БПР. Наприклад, після деся-
ти ітерацій розпізнавання (кожна така ітерація має крок розбиття діапазону можли-
вих показників МШОЕ, який не повторюється на інших ітераціях розпізнавань) від
кроку розбиття 25,1 мм до 26,2 мм якась з десяти ітерацій, наприклад 8-ма, проде-
монструвала ефективність розпізнавання ЧМС та гліом II ст., не нижчу за 45 %.
При наступній, 11-й, ітерації з кроком розбиття 26,1 мм з’ясувалося, напри-
клад, що максимально можливе розпізнавання ЧМС з використанням інтерва-
лів з одним показником МШОЕ не перевищує 40 %, а для гліом II ст. — 48 %.
Тобто розпізнавання розподілів 11-ї ітерації не перевищує 40 % (вибирається
найменше з двох: 40 % менше за 48 %). Водночас ефективність розпізнавання
ітерації в 45 % більша за 40 %, тобто розпізнавання за розподілами, подібни-
ми представленим на рис. 3, недоцільне. Отже, слід виконати перехід до на-
ступної ітерації з меншим кроком розбиття діапазону можливих показників
МШОЕ. Ця рекомендація ефективна для будь-якої кількості незалежних ознак
у формулі (1).
Третя рекомендація щодо оптимізації БПР — починати розрахунок розпізна-
вань з діагнозів, щодо яких проведено менше досліджень, як показано на рис. 3,
тобто спочатку робити розрахунок для ЧМС (19 досліджень), а потім — для глі-
ом II ст. Це доцільно, тому що зазвичай діагнози, визначені за меншої кількості
досліджень, мають нижчу ефективність розпізнавання, ніж діагнози за більшої
кількості досліджень. При дотриманні цієї рекомендації одночасно з другою швид-
кість роботи БПР підвищується.
Четверта рекомендація зумовить значне підвищення швидкості обчислень
БПР, якщо друга доцільна для розпізнавання поточної ітерації при виконанні
третьої рекомендації — починати визначення діагнозів за меншої кількості до-
сліджень. Якщо, наприклад, ефективність розпізнавання ЧМС на одній з ітерацій
становить 44 %, а на іншій — 45 %, то розпізнавання гліом II ст. за більшої кіль-
кості досліджень недоцільне. Внаслідок цього відбувається перехід до наступної
ітерації з кроком розбиття діапазону можливих показників МШОЕ, меншим на
0,1 мм за показник поточної ітерації. Єдина умова дотримання третьої та четвер-
тої рекомендацій — разове сортування діагнозів зі зростанням кількості їх до-
сліджень до початку першої ітерації розпізнавання.
П’ята рекомендація щодо зменшення використовуваної пам’яті комп’ютера
стосується формування масивів, в яких зберігаються розподіли показників МШОЕ
Міжнародний науково-технічний журнал
Проблеми керування та інформатики, 2025, № 3 103
діагнозів, на основі максимального значення відповідного діагнозу (на рис. 3 мак-
симальний показник МШОЕ при ЧМС становить 50,2 мм, при гліомах II ст. —
45 мм). Довжина масивів, у яких накопичуються розподіли показників МШОЕ
(див. рис. 3), визначається за формулою
1
2
int []
int
int [(int)(
50,2 / 5,1) 1];
int[(int)(4 [] 5,0 / 5,1 1]; )
1
2
arrayDistributio
ar D
n new
n newray istributio
= +
= +
(4)
Пам’ять для масивів виділяється тільки за допомогою натуральних чисел (це
обмеження мов програмування). У формулі (4) використовується поділ макси-
мальних дійсних значень на крок розбиття 5,1 мм. Після поділу в формулі (4)
формується натуральне число, зведене до найменшого натурального числа поділу,
тому отриманий результат збільшується на одне значення і масив має можливість
формувати розподіли показників МШОЕ, які більші за розраховане найменше на-
туральне значення поділу.
Шоста рекомендація — замість дійсних чисел в обчисленнях використовува-
ти типи даних, що містять натуральні числа.
1
2
i
int [502 /
,
]
nt (int)(10 decimal ); показник МШОЕ має тип int
int []
int
51 1 ;
int [450 / 51 1]; []
(int) ci en (d imat l / 5
data data
data
1
2
arrayDistributio
arrayDistributio
in o
n ne
dexInDitribut
w
n new
i n
= +
=
=
+
=
1);
int int / 510;
[ ]
dataindexInDitribution
arrayDistributio indexInDitrn ibution
=
+ +
(5)
Час визначення інтервалу, в який потрапляє показник МШОЕ в 5-му рядку фор-
мули (5), що базується на типі натуральних чисел int, менший за відповідний по-
казник з 4-го рядка, що базується на типі дійсних чисел decimal.
Відповідно до формули (5) показник МШОЕ типу int у першому рядку
отримується перед початком застосування БПР та зберігається в оперативній
пам’яті розробленого ПЗ. Пам’ять для масивів розподілів показників МШОЕ на
основі типу int виділяється швидше, тому що обчислення цілих чисел викону-
ються швидше за обчислення дійсних чисел і для типу int не потрібне зведення
отриманого значення довжини масиву, як для типу decimal з формули (4):
1int[(int)(50,2 /5,1) 1].new + Тому індекс масиву, в який потрапляє показник
МШОЕ, визначається швидше для типу int, ніж decimal (визначення змінної
indexInDitribution у 4- та 5-му рядках формули (5)). Шостий рядок формули (5)
відповідає збільшеному на одиницю елементу масиву ,arrayDistr butioni тому
що показник МШОЕ потрапив у елемент масиву з індексом .indexInDitribution
У 6-му рядку формули (5) показник МШОЕ потрапляє у відповідний інтервал
на рис. 3 (зазначимо, що індексація масивів у мові C# починається з нуля, а не
з одиниці, як у розподілах показників МШОЕ в таблиці).
Сьома, остання, рекомендація стосується використання незалежних ознак
з низькими результатами розпізнавання. В роботі [6], присвяченій клінічним до-
слідженням гематологічних захворювань (вторинного еритроцитозу та справж-
ньої поліцитемії), показано, що після врахування показника «рівень еритропоети-
ну в нормальних межах» разом з деякими іншими показниками стало можливим
i — ЧМС
i — Гліоми II ст.
i — ЧМС
i — Гліоми II ст.
.
104 ISSN 2786-6491
стовідсоткове розпізнавання двох вказаних гематологічних захворювань, хоча са-
ме це клінічне дослідження має ефективність розпізнавання, не нижчу за 64,14 %
для вторинного еритроцитозу.
Крім того, під час БПР цікаво дослідити використання й інших типів даних
мови C# [7], відмінних від decimal (зберігає дійсні числа; насамперед орієнтова-
ний на розрахунки у фінансовій сфері, що потребують високої точності) та int
(зберігає цілі дані у діапазоні від – (2
32
/2) до (2
32
/2 – 1)).
1. double та float — дійсні числа можуть зберігатися майже так, як у decimal.
2. long, short та byte — зберігаються цілі числа.
Таке дослідження доцільне для проведення розрахунків у майбутньому,
тому що ці типи даних мають як переваги перед decimal та int, так і недоліки.
Наприклад, розробники бібліотеки ML.NET для машинного навчання часто
використовують тип float, тому що для зберігання великих обсягів даних се-
ред усіх типів даних платформи .NET, що можуть працювати з дійсними чис-
лами, тип float використовує 4 байти, double — 8 байтів (серед дійсних чисел
математичні обчислення на основі типу double платформи .NET найшвидші),
а decimal — 16 байтів.
Висновок
У роботі дано рекомендації щодо оптимізації методів розпізнавання показни-
ків об’єктів досліджень за однією ознакою на прикладі показників МШОЕ при
розпізнаванні ЧМС та гліом II ст. через вимірювання ШОЕ з додаванням в забра-
ну кров аміназину. Запропоновані рекомендації можна використовувати для
отримання показників ППР і БС за допомогою лазерного спектрографа та для клі-
нічних досліджень пацієнтів з вторинним еритроцитозом та справжньою поліци-
темією. Цих рекомендацій слід дотримуватися під час розробки відповідного ПЗ
для всіх вищезазначених методів досліджень, висвітлених у роботах [1, 3–6, 8].
Отримані дані необхідно ретельно вивчити, щоб зрозуміти, як покращити резуль-
тати розпізнавання. Дотримуючись усіх рекомендацій, імовірно, можна підвищи-
ти швидкість роботи ПЗ та зменшити використання оперативної пам’яті
комп’ютера розробленим ПЗ. Також можна виявити помилки в розробленому
раніше ПЗ.
Покращення результатів розпізнавання за допомогою однієї ознаки під
час БПР малоймовірне порівняно з раніше отриманими результатами, але за-
вдяки отриманим даним можна надати рекомендації щодо більш ефективного
застосування цієї процедури, коли за декількома незалежними ознаками мож-
на побудувати більш ефективні БПР. Рекомендації, що будуть висвітлені в на-
ступних роботах, найімовірніше, теж дадуть можливість підвищити швидкість
роботи БПР та оптимізувати використання пам’яті розрахункових засобів.
У [1–6, 8] не вказано час, витрачений на отримання наведених результатів, але
іноді їх доводилося чекати три-чотири тижні. Це не відповідає розпізнаванню,
що ґрунтується на одному показнику дослідження, бо було застосовано багато
інших незалежних показників. З цієї причини, вивчивши результати роботи
ПЗ з урахуванням рекомендацій цієї статті, можна значно скоротити час роз-
пізнавання та підвищити ефективність встановлення діагнозів, особливо зі
збільшенням кількості діагнозів, що визначаються одразу (більше двох). У всіх
дослідженнях авторів із застосуванням БПР зі збільшенням кількості діагнозів ефек-
тивність значно знижується навіть після додавання одного діагнозу, наприклад для
Міжнародний науково-технічний журнал
Проблеми керування та інформатики, 2025, № 3 105
трьох діагнозів. Для фахівців, що працюють з гліомами, пріоритетним є розпі-
знавання одразу чотирьох станів: гліоми II, ІІІ, IV ст. і метастази в головному
мозку. Це зумовлено тим, що остаточний діагноз пацієнту з цими захворюван-
нями можна визначити тільки після дослідження фрагмента хірургічно вида-
леної пухлини, тобто лише після хірургічного втручання. До операції за наяв-
ності інформації щодо остаточного діагнозу можна провести певні види ліку-
вання ще до видалення пухлини. У роботі [4] показано, що наразі найкращий
результат розпізнавання гліом II, ІІІ, IV ст. отримано із застосуванням БПР
для показників БС крові, які вивчаються за допомогою лазерного спектрогра-
фа та не нижчі за 65,71 % (див. табл. 3). Гліоми II, ІІІ, IV ст. та метастази у го-
ловному мозку розпізнано з використанням БПР для показників МШОЕ, що не
нижчі за 51,61 %. Отже, завдання підвищення ефективності розпізнавання й
досі актуальне.
A. Gupal, A. Tarasov
NEW RECOMMENDATIONS
ON THE APPLICATION
OF A SINGLE-CHARACTER
BAYESIAN APPROACH TO STUDIES
OF ONCOLOGICAL INDICATIONS
Anatolii Gupal
V.M. Glushkov Institute of Cybernetics of the NAS of Ukraine, Kyiv,
gupalanatol@gmail.com
Andrii Tarasov
V.M. Glushkov Institute of Cybernetics of the NAS of Ukraine, Kyiv,
freearcher@ukr.net
New approaches for software development using the Bayesian approach are
described, which have not been used for one research indicator in the study
of inflammatory processes in brain tumors using modified erythrocyte sedi-
mentation rate, surface plasmon resonance in the study of blood plasma
properties, and laser spectrograph indicators for indicators of plasma protein
structures. New approaches are expedient to use for hematological diseases —
secondary erythrocytosis and polycythemia vera. An increase in the speed of
calculations is expected, which will make it possible to increase the total
number of calculations performed. It will be necessary to evaluate what in-
creases the speed of calculations, what optimizes the use of RAM. After re-
ceiving positive conclusions, it will become clear how best to use the Bayes-
ian recognition approach based on several research indicators in recognizing
diagnoses. The modified erythrocyte sedimentation rate method records the
sedimentation of erythrocytes over time, the measurement of blood plasma
protein structures using a laser spectrograph depends on the wave range of
0–1000 nm and has approximately 10 measurements per study. For both re-
search methods, new approaches can be proposed to use the Bayesian ap-
proach when using Markov chains, Bayesian trees or other algorithms that
consider the dynamics of measuring indicators of such studies. In the next
work the relevant conclusions regarding the indicated new approaches for
one research indicator and new advice on further improvements will be pro-
vided.
106 ISSN 2786-6491
Keywords: software development improvement tips, Bayesian recognition procedure,
modified erythrocyte sedimentation rate, surface plasmon resonance, plasma protein
structures, laser spectrograph, secondary erythrocytosis, polycythemia vera.
ПОСИЛАННЯ
1. Тарасов А.Л., Гупал А.М., Гридіна Н.Я. Модифікація використання байєсівських процедур
розпізнавання до запальних процесів при гліомах, метастазах та менінгіомах за показника-
ми швидкості осідання еритроцитів. Кібернетика та комп’ютерні технології. 2021. № 2.
С. 57–62. DOI: https://doi.org/10.34229/2707-451X.21.2.5
2. Тарасов А.Л. Використання байєсівських процедур розпізнавання з незалежними ознаками
до запальних процесів при гліомах, метастазах та менінгіомах за показниками швидкості
осідання еритроцитів. Кібернетика та комп’ютерні технології. 2021. № 3. С. 34–42. DOI:
https://doi.org/10.34229/2707-451X.21.3.3
3. Тарасов А.Л. Аналіз показників поверхневого плазмонного резонансу з використанням
байєсівських процедур розпізнавання з незалежними ознаками при гліомах, метастазах та
менінгіомах. Кібернетика та комп’ютерні технології. 2021. № 4. С. 35–42. DOI: https://
doi.org/10.34229/2707-451X.21.4.4
4. Gupal A.M., Tarasov A.L. Bayesian recognition procedures in the analysis of blood plasma pro-
tein structures according to laser spectrograph measurements in brain tumors. Cybernetics and
Systems Analysis. 2022. Vol. 58. P. 354–357. DOI: https://doi.org/10.1007/s10559-022-00467-w
5. Analysis of neurosurgical pathologies using bayesian recognition procedures for indicators
of surface plasmon resonance in the aggregation of blood cells / N.Ya. Gridina, A.M. Gupal ,
A.L. Tarasov, Yu.V. Ushenin. Cybernetics and Systems Analysis. 2020. Vol. 56. P. 550–558.
DOI: https://doi.org/10.1007/s10559-020-00271-4
6. Гупал А.М., Тарасов А.Л. Байєсівський підхід при розпізнаванні вторинного еритроцитозу
та справжньої поліцитемії. Міжнародний науково-технічний журнал Проблеми керування
та інформатики. 2024. № 3. С. 104–109. DOI: https://doi.org/10.34229/1028-0979-2024-3-8
7. Richter J. CLR via C#. Fourth Edition. Redmond : Microsoft Press, 2012. 896 p.
8. Gridina N.Ja., Gupal A.M., Tarasov A.L. Bayesian recognition of inflammatory processes in
brain gliomas. Cybernetics and Systems Analysis. 2017. Vol. 53. P. 366–372. DOI: https://
doi.org/10.1007/s10559-017-9936-4
Отримано 25.05.2025
https://doi.org/10.34229/2707-451X.21.2.5
https://doi.org/10.34229/2707-451X.21.3.3
https://doi.org/10.1007/s10559-022-00467-w
https://doi.org/10.1007/s10559-020-00271-4
https://doi.org/10.34229/1028-0979-2024-3-8
https://doi.org/10.1007/s10559-017-9936-4
https://doi.org/10.1007/s10559-017-9936-4
|
| id | nasplib_isofts_kiev_ua-123456789-211405 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 0572-2691 |
| language | Ukrainian |
| last_indexed | 2026-03-17T12:01:38Z |
| publishDate | 2025 |
| publisher | Інститут кібернетики ім. В.М. Глушкова НАН України |
| record_format | dspace |
| spelling | Гупал, А.М. Тарасов, А.Л. 2026-01-01T19:49:27Z 2025 Нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих / А.М. Гупал, А.Л. Тарасов // Проблемы управления и информатики. — 2025. — № 3. — С. 96-106. — Бібліогр.: 8 назв. — укр. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/211405 519.217.2+616.006 10.34229/1028-0979-2025-3-9 Представлено нові методи розробки програмного забезпечення для байєсівського підходу, які раніше при дослідженні запальних процесів у разі пухлин головного мозку не застосовувалися до таких показників, як модифікована швидкість осідання еритроцитів; поверхневий плазмонний резонанс; властивості плазми крові; та результати роботи лазерного спектрографа щодо визначення структури білків плазми крові. Надано рекомендації щодо оптимізації байєсівської процедури розпізнавання за однією ознакою. New approaches for software development using the Bayesian approach are described, which have not been used for one research indicator in the study of inflammatory processes in brain tumors using modified erythrocyte sedimentation rate, surface plasmon resonance in the study of blood plasma properties, and laser spectrograph indicators for indicators of plasma protein structures. New approaches are expedient to use for hematological diseases — secondary erythrocytosis and polycythemia vera. uk Інститут кібернетики ім. В.М. Глушкова НАН України Проблеми керування та інформатики Керування в технічних, економічних та біологічних системах Нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих New recommendations on the application of a single-character Bayesian approach to studies of oncological indications Article published earlier |
| spellingShingle | Нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих Гупал, А.М. Тарасов, А.Л. Керування в технічних, економічних та біологічних системах |
| title | Нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих |
| title_alt | New recommendations on the application of a single-character Bayesian approach to studies of oncological indications |
| title_full | Нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих |
| title_fullStr | Нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих |
| title_full_unstemmed | Нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих |
| title_short | Нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих |
| title_sort | нові рекомендації щодо застосування байєсівського підходу за однією ознакою відносно досліджень показників онкохворих |
| topic | Керування в технічних, економічних та біологічних системах |
| topic_facet | Керування в технічних, економічних та біологічних системах |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/211405 |
| work_keys_str_mv | AT gupalam novírekomendacííŝodozastosuvannâbaiêsívsʹkogopídhoduzaodníêûoznakoûvídnosnodoslídženʹpokaznikívonkohvorih AT tarasoval novírekomendacííŝodozastosuvannâbaiêsívsʹkogopídhoduzaodníêûoznakoûvídnosnodoslídženʹpokaznikívonkohvorih AT gupalam newrecommendationsontheapplicationofasinglecharacterbayesianapproachtostudiesofoncologicalindications AT tarasoval newrecommendationsontheapplicationofasinglecharacterbayesianapproachtostudiesofoncologicalindications |