Neuro-symbolic approach for the biological systems and processes research

The current state and prospects for the application of neural network technology and systems built based on neural networks for studying biological systems and processes (in particular, the processes of virus-cell interaction) were considered in the article. In particular, the concept of the neuro-s...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2024
Автори: Letychevskyi, O.O., Tarasich, Yu.H.
Формат: Стаття
Мова:Ukrainian
Опубліковано: PROBLEMS IN PROGRAMMING 2024
Теми:
Онлайн доступ:https://pp.isofts.kiev.ua/index.php/ojs1/article/view/646
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Problems in programming
Завантажити файл: Pdf

Репозитарії

Problems in programming
id pp_isofts_kiev_ua-article-646
record_format ojs
resource_txt_mv ppisoftskievua/b6/77ebc3b1c4ab12957df806b7095ec8b6.pdf
spelling pp_isofts_kiev_ua-article-6462025-02-15T13:47:42Z Neuro-symbolic approach for the biological systems and processes research Нейро-символьний підхід у дослідженні біологічних процесів та систем Letychevskyi, O.O. Tarasich, Yu.H. neuro-symbolic approach; neural networks; molecular modelling; algebraic modelling; virus-cell interaction UDC 519.85 нейро-символьний підхід; нейронні мережі; молекулярне моделювання; алгебраїчне моделювання; вірус-клітинна взаємодія УДК 519.85 The current state and prospects for the application of neural network technology and systems built based on neural networks for studying biological systems and processes (in particular, the processes of virus-cell interaction) were considered in the article. In particular, the concept of the neuro-symbolic approach, which combines the use of neural networks and algebraic modelling, was described. The use of an algebraic approach in combination with neural networks allows us to obtain an effective formal proof of biological objects' properties (for example, cells' and viruses' properties) or processes, as well as to search for objects or the necessary values of their parameters that correspond to the specified properties. One of the experiments that we consider is applying the proposed approach to modelling and studying the process of programmed cell death (apoptosis) caused by certain types of viruses and considering the possibility of using the obtained results in medical practice (particularly in the treatment of oncological diseases). The main task of such experiments is to analyze and identify the properties of viruses capable of triggering tumour cell apoptosis and, in fact, to determine the possibility of reaching the final stage of this process under the given parameters of the virus and the cell.Prombles in programming 2024; 2-3: 271-279 У статті розглядається сучасний стан та перспективи застосування технології нейронних мереж та побудованих на їхній базі систем для дослідження біологічних процесів та систем, зокрема, процесів вірус-клітинної взаємодії. Зокрема, авторами розглянуто поняття нейро-символьного підходу, як такого, що поєднує використання нейронних мереж та алгебраїчного моделювання. Застосування алгебраїчного підходу у поєднанні з нейронними мережами дозволяє виконати ефективне формальне доведення певних властивостей об’єктів (наприклад, властивостей клітин та вірусів) або процесів, а також реалізувати пошук об’єктів чи необхідних значень їхніх параметрів, які відповідають заданим властивостям. Одним із експериментів, що розглядається, є застосування запропонованого підходу до моделювання та дослідження процесу програмованої загибелі клітини (апоптозу), викликаного певними видами вірусів, та можливості використання отриманих результатів у медичній практиці (зокрема, в лікуванні онкологічних захворювань). Основним завданням таких експериментів є аналіз та виявлення властивостей вірусів здатних запускати процес апоптозу пухлинної клітини, та, власне, визначення можливості досягнення кінцевої стадії цього процесу за заданих параметрів вірусу та клітини.Prombles in programming 2024; 2-3: 271-279  PROBLEMS IN PROGRAMMING ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ ПРОБЛЕМИ ПРОГРАМУВАННЯ 2024-12-17 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/646 10.15407/pp2024.02-03.271 PROBLEMS IN PROGRAMMING; No 2-3 (2024); 271-279 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 2-3 (2024); 271-279 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 2-3 (2024); 271-279 1727-4907 10.15407/pp2024.02-03 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/646/698 Copyright (c) 2024 PROBLEMS IN PROGRAMMING
institution Problems in programming
baseUrl_str https://pp.isofts.kiev.ua/index.php/ojs1/oai
datestamp_date 2025-02-15T13:47:42Z
collection OJS
language Ukrainian
topic neuro-symbolic approach
neural networks
molecular modelling
algebraic modelling
virus-cell interaction
UDC 519.85
spellingShingle neuro-symbolic approach
neural networks
molecular modelling
algebraic modelling
virus-cell interaction
UDC 519.85
Letychevskyi, O.O.
Tarasich, Yu.H.
Neuro-symbolic approach for the biological systems and processes research
topic_facet neuro-symbolic approach
neural networks
molecular modelling
algebraic modelling
virus-cell interaction
UDC 519.85
нейро-символьний підхід
нейронні мережі
молекулярне моделювання
алгебраїчне моделювання
вірус-клітинна взаємодія
УДК 519.85
format Article
author Letychevskyi, O.O.
Tarasich, Yu.H.
author_facet Letychevskyi, O.O.
Tarasich, Yu.H.
author_sort Letychevskyi, O.O.
title Neuro-symbolic approach for the biological systems and processes research
title_short Neuro-symbolic approach for the biological systems and processes research
title_full Neuro-symbolic approach for the biological systems and processes research
title_fullStr Neuro-symbolic approach for the biological systems and processes research
title_full_unstemmed Neuro-symbolic approach for the biological systems and processes research
title_sort neuro-symbolic approach for the biological systems and processes research
title_alt Нейро-символьний підхід у дослідженні біологічних процесів та систем
description The current state and prospects for the application of neural network technology and systems built based on neural networks for studying biological systems and processes (in particular, the processes of virus-cell interaction) were considered in the article. In particular, the concept of the neuro-symbolic approach, which combines the use of neural networks and algebraic modelling, was described. The use of an algebraic approach in combination with neural networks allows us to obtain an effective formal proof of biological objects' properties (for example, cells' and viruses' properties) or processes, as well as to search for objects or the necessary values of their parameters that correspond to the specified properties. One of the experiments that we consider is applying the proposed approach to modelling and studying the process of programmed cell death (apoptosis) caused by certain types of viruses and considering the possibility of using the obtained results in medical practice (particularly in the treatment of oncological diseases). The main task of such experiments is to analyze and identify the properties of viruses capable of triggering tumour cell apoptosis and, in fact, to determine the possibility of reaching the final stage of this process under the given parameters of the virus and the cell.Prombles in programming 2024; 2-3: 271-279
publisher PROBLEMS IN PROGRAMMING
publishDate 2024
url https://pp.isofts.kiev.ua/index.php/ojs1/article/view/646
work_keys_str_mv AT letychevskyioo neurosymbolicapproachforthebiologicalsystemsandprocessesresearch
AT tarasichyuh neurosymbolicapproachforthebiologicalsystemsandprocessesresearch
AT letychevskyioo nejrosimvolʹnijpídhídudoslídženníbíologíčnihprocesívtasistem
AT tarasichyuh nejrosimvolʹnijpídhídudoslídženníbíologíčnihprocesívtasistem
first_indexed 2025-07-17T10:08:01Z
last_indexed 2025-07-17T10:08:01Z
_version_ 1850411912481734656
fulltext 271 Машинне навчання та нейронні мережі УДК 519.85 http://doi.org/10.15407/pp2024.02-03.271 О.О. Летичевський, Ю.Г. Тарасіч НЕЙРО-СИМВОЛЬНИЙ ПІДХІД У ДОСЛІДЖЕННІ БІОЛОГІЧНИХ ПРОЦЕСІВ ТА СИСТЕМ У статті розглядається сучасний стан та перспективи застосування технології нейронних мереж та побудованих на їхній базі систем для дослідження біологічних процесів та систем, зокрема, процесів вірус-клітинної взаємодії. Зокрема, авторами розглянуто поняття нейро-символьного підходу, як та- кого, що поєднує використання нейронних мереж та алгебраїчного моделювання. Застосування алгебраїчного підходу у поєднанні з нейронними мережами дозволяє виконати ефекти - вне формальне доведення певних властивостей об’єктів (наприклад, властивостей клітин та вірусів) або процесів, а також реалізувати пошук об’єктів чи необхідних значень їхніх параметрів, які відпо- відають заданим властивостям. Одним із експериментів, що розглядається, є застосування запропо- нованого підходу до моделювання та дослідження процесу програмованої загибелі клітини (апопто- зу), викликаного певними видами вірусів, та можливості використання отриманих результатів у ме- дичній практиці (зокрема, в лікуванні онкологічних захворювань). Основним завданням таких експе- риментів є аналіз та виявлення властивостей вірусів здатних запускати процес апоптозу пухлинної клітини, та, власне, визначення можливості досягнення кінцевої стадії цього процесу за заданих па- раметрів вірусу та клітини. Ключові слова: нейро-символьний підхід, нейронні мережі, молекулярне моделювання, алгебраїчне моделювання, вірус-клітинна взаємодія. O.O. Letychevskyi, Yu. H. Tarasich NEURO-SYMBOLIC APPROACH FOR THE BIOLOGICAL SYSTEMS AND PROCESSES RESEARCH The current state and prospects for the application of neural network technology and systems built based on neural networks for studying biological systems and processes (in particular, the processes of virus-cell interaction) were considered in the article. In particular, the concept of the neuro-symbolic approach, which combines the use of neural networks and algebraic modelling, was described. The use of an algebraic approach in combination with neural networks allows us to obtain an effective formal proof of biological objects' properties (for example, cells' and viruses' properties) or processes, as well as to search for objects or the necessary values of their parameters that correspond to the specified properties. One of the experiments that we consider is applying the proposed approach to modelling and studying the process of programmed cell death (apoptosis) caused by certain types of viruses and considering the possibility of using the obtained results in medical practice (particularly in the treatment of oncological diseases). The main task of such experiments is to analyze and identify the properties of viruses capable of triggering tumour cell apoptosis and, in fact, to determine the possibility of reaching the final stage of this process under the given parameters of the virus and the cell. Key words: neuro-symbolic approach, neural networks, molecular modelling, algebraic modelling, virus-cell interaction. Вступ Основними викликами сучасних досліджень із використанням математич- них методів в біології, вірусології та меди- цині є удосконалення методів комп’ютерного молекулярного моделю- вання та застосування методів машинного навчання для визначення потенційних препаратів-кандидатів з метою боротьби з віру-сами та онкологічними захворюван- нями, вивчення можливих мутацій вірусів, про-гнозування поширення епідемій, ви- вчення можливих варіантів взаємодії віру- сів та лі-ків з клітинами людини, обробка даних клінічних експериментів тощо. На сьогодні розроблено досить ве- лику кількість підходів, алгоритмів та за- собів побудови моделей, що розглядають міжатомні та міжмолекулярні взаємодії, © О.О. Летичевський, Ю.Г. Тарасіч, 2024 ISSN 1727-4907. Проблеми програмування. 2024. №2-3 272 Машинне навчання та нейронні мережі біофізичні та біохімічні процеси з викори- станням математичних методів моделю- вання та аналізу [1]. Одним із потужних інструментів, що набуває сьогодні широ- кого застосування у біологічних дослі- дженнях, є нейронні мережі [2-4,8,9]. Ос- новними напрямками таких досліджень є дослідження білок-білкових взаємодій ві- русів та клітини-хазяїна, дослідження мік- роскопічних даних з метою аналізу та ви- вчення перебігу процесів міжклітинної та вірус-клітинної взаємодії, пошук речовин із заданими властивостями тощо [5-14]. Для розробки інструментів прогнозування білок-білкової взаємодії вірус-хазяїн, та- ких як DeNovo, HOPITOR, VHPPI, InterSPPI-HVPPI та інші, розглядаються можливості застосування різних моделей машинного навчання, зокрема, машини опорних векторів, випадковий ліс, система градієнтного підсилювання та ін. [5-7]. Широкого застосування для аналізу міжк- літинних та внутрішньоклітинних процесів набуває і застосування моделей глибокого навчання у флуоресцентній мікроскопії як одного з ефективних засобів вилучення знань із отриманих зображень [8,9]. Проте, не зважаючи на можливості існуючих ін- струментів та методів молекулярного мо- делювання, вчені визначають і низку недо- ліків, серед яких - низька точність деяких методів, обмеження рамками біологічних експериментів, наявність помилок у стру- ктурах молекул, з якими працюють про- грамні засоби тощо. Найбільш поширени- ми проблемами для реалізації та ефектив- ної роботи нейронних мереж та систем штучного інтелекту є обмеження даних бі- ологічних експериментів, серйозні розбіж- ності між розподілами навчальних та реа- льних тестових даних, труднощі аналізу та інтерпретації результатів, вплив на ефек- тивність навчання, зростання кількості да- них тощо. Відповідно застосування ней- ронних мереж/систем штучного інтелекту у більшості випадків не може гарантувати стовідсоткової достовірності ре-зультатів, хоча дійсно звужує пошук об’єктів у дос- лідженнях. Підвищення продуктивності та точності прогнозних моделей учені вбача- ють за рахунок так званого нейро- символьного підходу, який поєднує підхо- ди, засновані на штучних нейронних ме- режах, та підходи, що спираються на явне представлення знань за допомогою форма- льних мов із можливістю застосування ме- тодів символьних обчислень. Не зважаючи на наявність вагомих здобутків у цьому напрямі [10-14], проблема роз-робки від- повідних систем та методів за-лишається відкритою. Наше бачення розв'язання пробле- ми продуктивності та точності інструмен- тів моделювання біологічних процесів і систем полягає у синергії методів нейрон- них мереж та алгебраїчного підходу, ефек- тивність якого доведена в інших наукових сферах [15,16]. Загальну схему запропо- нованого підходу, а також приклади фор- мального представлення моделі вірус- клітинної взаємодії алгебраїчною мовою представлено у наступних розділах статті. Нейро-символьний підхід. Загальна схема дослідження Запропонований у статті нейро- символьний підхід передбачає комбінацію формальних методів, зокрема, алгебраїч- них, та властивостей нейронної мережі. Таке поєднання дозволяє використати си- льні та взаємодоповнюючі сторони обох технологій – точність для алгебраїчного підходу та швидкість класифікації або ге- нерації для нейронних мереж. Тим самим ми усуваємо відповідні недоліки – трива- лість застосування формальних методів в умовах комбінаторного вибуху та можли- вість помилок у класифікації нейронних мереж. Ми розглядаємо два основні напрями та, відповідно, дві методики поєднання ал- гебраїчного моделювання та нейронних мереж: 1. Застосування нейро-символьного підходу для прискорення пошуку так зва- них «кандидатів». Дані експерименти спрямовані на пошук речовин із заданими властивостями або визначення наявності протягом експерименту певної події, що має виникнути під впливом визначених факторів середовища. Наприклад, пошук речовини-кандидата у вакцину проти віру- су, або визначення можливості проник- 273 Машинне навчання та нейронні мережі нення вірусу у клітину та запуску її про- грамованої загибелі за встановлених поча- ткових характеристик взаємодіючих аген- тів та середовища (температура, кислот- ність, наявність/відсутність електромагні- тного поля тощо). У даному випадку, зва- жаючи на складність та масштабність мо- делей/експериментів, що розглядаються, використання виключно алгебраїчного мо- делювання може призвести до експонен- ційного вибуху та необмеженого часу по- шуку, який може не закінчитись. Для усу- нення цього недоліку пропонується вико- ристовувати наступні нейронні мережі: − Нейронні мережі, що базуються на історичних даних експерименту та пе- редбачають результати сценарію взаємодії компонент експерименту. − Нейронні мережі, створені на основі згенерованих сценаріїв у середови- щі алгебраїчної бази знань. Дані типи нейронних мереж розгля- даються як класифікатор визначеної пове- дінки та прогнозують властивості середо- вища за сценарію, що розглядається. На- приклад, можливість активації рецепторів загибелі клітини обраною речовиною та вплив стану середовища клітини після ак- тивації рецепторів загибелі на блокування або запуск процесу апоптозу. Тут власти- вості речовини, наприклад, наявність елек- тромагнітних властивостей у наночастинок після проникнення у клітину та із наведен- ням магнітного поля може провокувати зміну температури всередині клітини, впливаючи на зміну кількості та структури її компонент (активація та блокування пе- вних ферментів, білків, зміна у кількості іонів кальцію, натрію, активних форм кис- ню (АФК), тощо). За підказки нейронної мережі неба- жані напрями пошуку можуть відкидатись і швидкість моделювання та ймовірність успішного пошуку зростають. Ми додат- ково можемо аналізувати, наскільки бли- зько підійшли до шуканої властивості. За- гальну схему застосування даного підходу до пошуку деякого середовища із певною властивістю відображено на Рисунку 1. Рис. 1. Пошук властивостей 2. Застосування алгебраїчного підхо- ду для доведення або спростування ре- зультатів класифікації або генерації ней- ронних мереж. Даний напрям нейро- символьного підходу стосується експери- менту, коли речовина із шуканою власти- вістю вже згенерована нейронною мере- жею та треба перевірити, чи дійсно вона відповідає цій властивості (Рис.2). Для цього ми використовуємо формальне до- ведення або алгебраїчне моделювання. Рис.2. Доведення або спростування властивостей речовини Наприклад, ми маємо речовину, зге- неровану нейронною мережею, визначену як потенційний кандидат на активацію ре- цепторів смерті клітини. У нашому підході ми використовуємо дану речовину, тобто дані про її молекулярну структуру та мож- ливі властивості як частину вхідних даних та проводимо алгебраїчне моделювання експерименту на їхній основі. У даному випадку ми використовуємо нейронну ме- режу для першого етапу пошуку речовин із заданими властивостями, або вивчення ал- горитму взаємодії даної речовини з кліти- ною (за рахунок обробки мікроскопічних зображень). А вже потім застосовуємо ал- 274 Машинне навчання та нейронні мережі гебраїчне моделювання для підтвердження властивостей даної речовини. Дана процедура дуже важлива для досліджень. Сьогодні за допомогою ней- ронних мереж синтезовано понад 300 000 різних речовин із шуканими властивостя- ми [17]. Проте кожен із «кандидатів» має бути перевірений експериментально – в лабораторних умовах, що значно сповіль- нює дослідження. Надання ж доказового підтвердження або спростування на рівні моделювання дасть змогу скоротити час та витрати для досягнення результату. Для обох методик основним інстру- ментом є моделювання поведінки середо- вища та об’єктів, що в ньому взаємодіють. Таким середовищем, наприклад, є клітина із «зануреним» у неї вірусом, де взаємодія відбувається між вірусом або його складо- вими та складовими клітини (органели, ферменти, наявні у клітині іони тощо). А властивістю, що перевіряється, може бути фінальна стадія програмованої загибелі клітини. Таким чином, визначивши в алге- браїчному вигляді властивість середовища, яку ми шукаємо, за допомогою моделю- вання буде визначено сценарій, який при- водить до появи цієї властивості. Відпо- відно вхідними даними для алгебраїчного моделювання є формальне представлення (представлення в алгебраїчному вигляді) середовища, що моделюється, та формалі- зовані властивості, яких треба досягти у процесі моделювання. Для вивчення пове- дінки, забезпечення багаторівневості та точності моделювання ми формуємо алге- браїчну базу знань, що представляє не ли- ше повний формальний опис моделей, що розглядаються, а й формалізовані правила та закони фізики, хімії, біології, що дозво- ляє виконувати моделювання експеримен- тів на різних рівнях абстракції – від кван- тових взаємодій до взаємодій між біологі- чними об’єктами. Ми використовуємо як конкретне ал- гебраїчне моделювання так і символьне. У символьних моделях ми використовуємо не конкретні значення змінних та атрибу- тів середовища, що моделюється, а форму- ли над ними. Наприклад, ми можемо вка- зати, що температура всередині клітини може бути від до (36 <= cellTemperature <= 37.5). У такому випадку буде виконано символьне алгебраїчне мо- делювання, кінцевим результатом якого буде не один сценарій, що досягає шуканої властивості, а саме всі сценарії із початко- вої формули, в яких ця властивість досяж- на, що є основною відмінністю алгебраїч- ного моделювання від конкретного або імітаційного. За інструмент моделювання вико- ристовуємо Систему створення інсерцій- них моделей [15,16], яка складається з ін- терфейсу для формалізації предметної об- ласті та створення моделі задачі, яка буде досліджуватись у термінах формальних теорій та алгебраїчного серверу, що поєд- нує в собі формалізовані математичні тео- рії та відповідні методи, які працюють із моделями та розв’язують задачі. Основною використовуваною теорією є теорія агентів та середовищ, започаткована українським академіком О.А. Летичевським та британ- ським науковцем Д. Гілбертом [18]. Алгебраїчна база знань молекулярних та квантових взаємодій Для моделювання біологічних процесів та систем ми формуємо алгебраїчну базу знань, яка містить формалізовані специфі- кації знань з фундаментальних законів фі- зики, хімії та біології та алгебраїчне пред- ставлення теорій на різних рівнях абстрак- ції – рівень квантових та атомних взаємо- дій, рівень молекулярних взаємодій, рівень хімічних реакцій та білкових з’єднань то- що. База знань представляє собою рівнян- ня в алгебрі поведінок, що включає послі- довності дій, які описують усі можливі взаємодії агентів та середовищ. За агентів ми визначаємо віруси, клітини, клітинні структури, білки, молекули тощо. Кожен агент має відповідні характеристики, що визначаються так званими атрибутами, які можуть приймати числові, символьні та ін. значення, тобто атрибут має відповідний тип. Сукупність значень усіх атрибутів ви- значають стан агента, який може змінюва- тись згідно з взаємодіями, можливими для заданого середовища. Агент вищого рівня 275 Машинне навчання та нейронні мережі абстракції може, у свою чергу, виступати середовищем для взаємодії інших агентів. Як приклад розглянемо формальне представлення агента типу ВІРУС. Атри- бути агента типу ВІРУС представлені зна- ченнями наступних величин: функціона- льний атрибут, що відображає набір білків, які входять до складу вірусу (атрибут proteins), атрибут ribonucleicAcid, що ви- значає (за наявності) молекулу РНК, та ат- рибут deoxyribonucleicAcid, що визначає (за наявності) молекулу ДНК, функціона- льний атрибут, що відображає набір жирів, які входять до складу вірусу (атрибут lipids), функціональний атрибут, що відо- бражає набір вуглеводів, які входять до складу вірусу (атрибут carbohydrates), ат- рибути дійсного типу, що визначають масу (mass), розмір (size) вірусу, атрибут status перелічуваного типу для визначення пото- чного «статусу» агента ("In Cell", "Connected to Cell" та "Virion"). Взаємодії агентів визначаються за допомогою формальних дій, які визнача- ють зміну стану агенту або зміну значень його атрибутів. До таких дій належать, на- приклад, утворення зв’язків між амінокис- лотами, формування білкових структур, взаємодії білків з іншими білками та речо- винами. Дії визначаються в мові алгебри поведінки, що представляє собою алгебра- їчні специфікації. Кожна дія має переду- мову її виконання та постумову, де відбу- вається зміна значень атрибутів агентів та середовища. Як приклад розглянемо дію CreatePeptideBond, яка визначає утворення пептидного зв’язку між двома амінокисло- тами: CreatePeptideBond = (Forall(n1:int, k1:int, n2:int, k2:int,) ((1<= n1 <= aminoasids(i).atomsNum) && (1<= k1 <= aminoasids(i).atomsNum) && (1<= n2 <= aminoasids(j).atomsNum) && (1<= k2 <= aminoasids(j).atomsNum) && n1 != k1 && n2 != k2 && aminoasids(i).MolOrbital(n1,k1,-1,1)==2 && aminoasids(i).atoms(n1).Name == O && aminoasids(i).atoms(k1).Name == H && aminoasids(j).MolOrbital(n2,k2,-1,1)==2 && aminoasids(j).atoms(n2).Name == N && aminoasids(j).atoms(k2).Name == H) -> (Protein1.aminoAcids(1,1) = i; Protein2.aminoAcids(1,2) =j) У передумові дії виконується переві- рка того, що один з амінокислотних зали- шків має вільну аміногрупу, а інший - має вільну α-карбоксильну групу. Якщо дана передумова виконається, між амінокисло- тами буде утворено зв’язок, і ми «запише- мо» їх у відповідний поліпептидний лан- цюг. Першим записуємо амінокислотний залишок з вільною аміногрупою, другим – амінокислотний залишок з вільною α- карбоксильною групою. Аналогічним чи- ном до ланцюжка додаються інші аміноки- слоти. Усі можливі взаємодії агентів у середо- вищі визначаються поведінкою. Поведін- ковий вираз є формулою, побудованою із дій та поведінок за допомогою операцій алгебри поведінки: префіксинг «.», недете- рмінований вибір «+» та композиції пове- дінок – послідовна («;») та паралельна («||») [18]. Як приклад, рівняння поведінки, що описує взаємодію вірусу та клітини на верхньому рівні, буде записано наступним чином: VIRUS_CELL_INTERACTION = ((attachmentToCellReceptors ; ((penetration- IntoCells ; VIRUS_IN_CELL) + !penetration- IntoCells)) + !attachmentToCellReceptors)), де attachmentToCellReceptors – дія, що описує приєднання вірусу до клітини, pen- etrationIntoCells – дія, що описує проник- нення вірусу в клітину, !attach- mentToCellReceptors – вказує на те, що ві- рус до клітини не приєднався, !penetration- IntoCells –проникнення вірусу до клітини не відбувається, VIRUS_IN_CELL – пове- дінка, яка, складатиметься із дій, які опи- сують процеси, що відбуваються із вірусом всередині клітини. Відповідно, представивши усі струк- турні одиниці клітини та зовнішніх факто- рів у вигляді агентів та атрибутів середо- вища, ми отримуємо формальне представ- лення моделі, що розглядається. За раху- нок формалізації усіх можливих взаємодій між агентами та задання різних значень атрибутів агентів та середовища, ми мо- жемо розглядати різні сценарії поведінки агентів. Під час моделювання буде викона- но усі можливі дії агентів, тобто всі мож- ливі комбінації дій для досягнення цілі моделювання. Такою ціллю, наприклад, може бути знаходження кількісних та які- сних показників вакцин/ліків, які можуть 276 Машинне навчання та нейронні мережі заблокувати вірус у клітині або заблокува- ти клітинні рецептори для перешкоджання проникнення вірусу до клітини; визначен- ня можливості досягнення клітиною пев- ного стану, наприклад, загибелі клітини внаслідок взаємодії з вірусом тощо. Алгебраїчне моделювання експерименту Завдання та формальний опис експе- рименту визначаються переліком агентів, взаємодію яких має бути розглянуто, зада- ними значеннями початкового стану вка- заних агентів та середовища, а також влас- тивостями, яких ми маємо досягнути. Як приклад, одним із таких експериментів є дослідження взаємодії вірусу везикулярно- го стоматиту з пухлинною клітиною, як такої, що здатна викликати активацію про- цесу її програмованої загибелі. Для моде- лювання даного експерименту ми викори- стовуємо знання про біохімічні процеси всередині клітини, молекулярну будову речовин та біологічних систем, зокрема, вірусів та клітин, формалізовані правила білок-білкових, міжмолекулярних взаємо- дій тощо. У моделі на даному рівні врахо- вуємо якісні та кількісні характеристики таких елементів клітини та міжклітинного середовища, як білків TRADD, FADD, RIP, TRAF2, APAF-1, NF-kb, clAP1,2, білків родини Вcl-2 (ті, що беруть участь у роз- витку або блокуванні апоптозу), каспаз 2,3,8,9, цитохрому, АФК, іонів Са, Na то- що. Саме дані елементи, а також вірус, що розглядається, і виступають у ролі агентів, середовищем взаємодії яких є сама кліти- на. Додатково враховуються такі парамет- ри середовища – температура, кислотність тощо. Як дії агентів розглядаємо усі мож- ливі взаємодії між складовими вірусу та складовими клітини, формалізовані відпо- відно до правил визначених біологічними експериментами. Можливі взаємодії між клітинними білками та ферментами моде- люються на верхньому рівні – тобто на рі- вні аналізу відповідності білкових доменів. Метою алгебраїчного моделювання у да- ному випадку є визначення можливих сце- наріїв розвитку, або блокування процесу апоптозу за різних початкових значень ат- рибутів агентів та середовища (наявність або відсутність певних типів каспаз або бі- лків у клітині, тип та характеристики віру- су, зміна температури середовища тощо). Як приклад, рівняння поведінки мо- делі, що враховує можливі взаємодії вірусу з клітиною та відповідно різні шляхи запу- ску процесу апоптозу клітини буде запи- сано у такому вигляді: APOPTOSIS_PROCESS = (CONNECTION_VIRUS_TO_CELL + PENETRATION_VIRUS_INTO_CELL), CONNECTION_VIRUS_TO_CELL = (BINDINGtoTNF + BINDINGtoFAS)), … У першій частині рівняння ми опису- ємо два можливі варіанти взаємодії вірусу з клітиною – поведінка CONNECTION_VI- RUS_TO_CELL (послідовність дій та по- ведінок, що описують зовнішній шлях ак- тивації процесу апоптозу), або поведінка PENETRATION_VIRUS_INTO_CELL (по- слідовність дій та поведінок, що описують внутрішній шлях активації процесу апоп- тозу). Далі ми визначаємо усі набори дій та поведінок, які описують можливі взаємодії агентів та зміни стану середовища залеж- но від «обраного» шляху. Так, наприклад, ми вказуємо на можливі з’єднання з рецеп- торами смерті клітини (TNF або FAS) – поведінки BINDINGtoTNF та BINDINGtoFAS та визначаємо можливі взаємодії агентів для кожної з них. У результаті моделювання, відповід- но до заданих початкових даних експери- менту, якщо, наприклад, ми маємо вірус, який активує рецептори смерті клітини TNF, буде обрано шлях, що відповідатиме поведінці CONNECTION_VIRUS_TO_ CELL, і далі поведінці BINDINGtoTNF, що, у свою чергу, складається із множини дій та поведінок, які описують можливі взаємодії білків та ферментів клітини: BINDINGtoTNF = (bindingVirusToTNFR1receptor . bindingTNFR1withTRADD;(bindingTRADDwithRIP ; ((APOPTOSIS_INHIBITION) + (CASPASE_CYCLE_ACTIVATION))) + (bindingTRADDwithFADD ; (bindingFADDwithсFLIP; ApoptosisInhibition + CASPASE_CYCLE_ACTIVATION))) ), Оскільки зазначена поведінка також містить недетермінізми (наприклад, дія bindingTNF-R1withTRADD визначає взає- 277 Машинне навчання та нейронні мережі модію адаптерного білка TRADD із доме- ном загибелі TNF-R1 і далі можуть розгля- датися набори дій, що призводять до блоку- вання або запуску апоптозу), або дія bindingTRADDwithFADD (зв’язок адаптер- ного білка TRADD з білками FADD (також активують сигнальний комплекс загибелі клітини ((поведінка CASPASE_CY- CLE_ACTIVATION)) або блокують процес апоптозу з’єднуючись із білком с-FLIP (дія binding FADDwithсFLIP))), то вибір подаль- шого сценарію залежить від початкових да- них експерименту та від стану середовища (значень атрибутів агентів та середовища), отриманого після виконання кожної дії. Отож, розглядаючи різні співвідно- шення між факторами активації та блоку- вання процесу апоптозу та різні значення параметрів середовища, здатні впливати на перебіг відповідних реакцій – температура, концентрація АФК та іонів Са2+ у клітині та, абстрагуючись від інших факторів впливу залежно від співвідношення кіль- кості прокаспаз та білків, які блокують їх- ню активацію, ми бачимо різні варіанти поведінки системи. Відповідно в результа- ті моделювання ми отримуємо саме ту по- слідовність дій, яка за умови заданого по- чаткового стану середовища приводить до підтвердження або спростування досяг- нення кінцевої стадії апоптозу клітини (зростання концентрації у ядрі клітини Са2+ та наявність у ядрі клітини залежних протеаз (DFF, АІF, ЕndoGin, та ін), під ді- єю яких відбувається фрагментація ДНК), що визначається відповідною формулою властивості: (ConcentrationСа2>NormalConcentration && ((АІFinNucleus==1) || (DFFinNucleus==1) || (ЕndoGinNucleus==1))) && DNAfragmentation==1 Зважаючи на складність та можливу циклічність клітинних процесів, ми зішто- вхуємось із проблемою виникнення неде- термінізмів, і пошук може бути нескінче- ним або вимагати великих обчислюваль- них потужностей. Саме у таких випадках постає необхідність у використанні ней- ронних мереж, які, аналізуючи поточний стан середовища, визначать найбільш ефе- ктивний напрямок або дію, яку треба за- стосовувати, або відкинуть напрямки, які ведуть до небажаного результату. Нейронні мережі в моделюванні експерименту Як було визначено у попередніх ро- зділах, одним із основних завдань, що пот- ребує розробки нейронних мереж та їх по- єднання з алгебраїчним підходом, є забез- печення ефективності та швидкості пошу- ків сценаріїв взаємодії агентів, що розгля- даються в межах експерименту. Як прик- лад, ми розглядаємо необхідність розробки нейромережі, що дозволить виконувати ефективний пошук сценаріїв досягнення фінальної стадії апоптозу клітини за зада- них початкових станів агентів та середо- вища. Дана нейромережа має бути натре- нована для визначення так званого відно- шення «близькості до властивості». Властивість речовини може визна- чатись формулою над її атрибутами та змі- стовно представляти такі поняття, як «ток- сичність», «кислотність», «розчинність», «теплопровідність», «електропровідність» та інші, що визначається молекулярною структурою речовини та множиною зна- чень її характеристик, визначених відпові- дною алгебраїчною формулою. Для тренування нейромережі, за- вданням якої є класифікація рівня відпо- відності властивостей речовини заданим, розглядається множина формул, що пред- ставляють дані властивості, та здійснюєть- ся моделювання, що приводить до визна- ченого експериментом результату шляхом виконання заданих перетворень певної по- чаткової речовини. Для цього використо- вуються алгебраїчні рівняння зі створеної бази знань, що описують процеси на рівні молекулярних або квантових взаємодій. У загальному вигляді відношення близькості може представляти число, що дорівнює кі- лькості перетворень, які необхідно викона- ти з використанням рівнянь взаємодій. Та- ким чином, маючи відповідну нейронну мережу глибокого навчання, яка є класи- фікатором та визначає відношення близь- кості між речовинами, можна на кожному кроці моделювання пошуку вибирати таке перетворення, яке дає результат найбільш близький до властивості. Наприклад, ми можемо визначати наявність магнітних властивостей наночастинок або композитів 278 Машинне навчання та нейронні мережі наночастинок та розглядати модулювання фармакокінетичних процесів у пухлинній клітині. Наявність заданої властивості буде підтверджено, якщо за заданих початкових характеристик наночастинок за рахунок їхніх можливих взаємодій із ключовими металовмісними білками та ферментами клітини, а також під дією магнітного поля буде підвищено температуру в середині клітини та активовано процес її програмо- ваної загибелі. Висновки та перспективи подальших розвідок На даному етапі досліджень нами ро- зроблено методологію застосування нейро- символьного підходу до моделювання екс- периментів, спрямованих на пошук та ви- вчення властивостей біологічних систем, органічних та неорганічних речовин, хімі- чних процесів та реакцій, що послугову- ються формалізованими знаннями та зако- нами квантової хімії, фізики, біології. Можливі взаємодії між клітинними білками та ферментами у моделях вірус- клітинної взаємодії для поточних експери- ментів розглядаються на верхньому рівні абстракції, тобто на рівні визначення мож- ливості взаємодії за рахунок наявності або відсутності певних білкових доменів від- повідно до правил визначених біологічни- ми експериментами. Окрім того, ми розг- лядаємо і моделі. в яких правила взаємодій між об’єктами верхніх рівнів абстракції (білок-білкові, міжмолекулярні взаємодії, тощо) є такими, що виводяться із правил міжатомних та квантових взаємодій. Хоча дослідження застосування запропоновано- го підходу для моделювання біологіч- них/біохімічних процесів та систем пере- бувають на стадії випробування, і наразі ми працюємо над розширенням бази фор- малізованих знань, перші отримані резуль- тати застосування нейро-символьного під- ходу до моделювання міжатомних та між- молекулярних взаємодій, внутрішньоклі- тинних процесів вказують на те, що ефек- тивність спільного використання алгебраї- чного моделювання та нейронних мереж на порядок пришвидшує виконання відпо- відних біологічних досліджень. Наступними кроками є дослідження необхідних початкових значень атрибутів агентів та модельованого середовища, ро- зширення та ускладнення бази знань та моделей експериментів, навчання нейрон- ної мережі на історичних даних результа- тів біологічних та біохімічних експериме- нтів, розміщених у світових базах даних, проведення прямого конкретного алгебра- їчного моделювання (для порівняння отриманих результатів з даними біологіч- них експериментів) та оберненого моде- лювання на отриманих моделях, як такого, що дозволить визначити необхідні параме- три атрибутів агентів та середовища, необ- хідних для досягнення заданих властивос- тей. Зокрема, передбачається застосування нейро-символьного підходу до моделю- вання експериментів, пов’язаних із ви- вченням властивостей речовин, здатних впливати на ініціацію програмованої заги- белі ракових клітин: дослідження взаємодії вірусу везикулярного стоматиту з пухлин- ною та здоровою клітинами; дослідження ефектів застосування наночастинок для контрольованого продукування АФК та фототермії, направлених на індукцію оки- сного стресу та вибіркову загибель пух- линних клітин. Література 1. S. Pirhadi, J. Sunseri, D. Koes, Open source molecular modeling, Journal of Molecular Graphics and Modelling, 2016. № 69, С. 127-143. 2. B. Das, M. Kutsal, R. Das, Effective prediction of drug–target interaction on HIV using deep graph neural networks, Chemometrics and Intelligent Laboratory Systems, 2022. № 230. 3. J. Pineda, B. Midtvedt, H. Bachimanchi, et al, Geometric deep learning reveals the spatiotemporal features of microscopic motion. Nat Mach Intell, 2023. № 5, С. 71–82. 4. M. Sharma, S. Deswal, Drugs–Protein affinity‐score prediction using deep convolutional neural network. Expert Systems, 2022. № 39(10). 5. A. Basit, W. Abbasi, A. Asif, S. Gull, F. Minhas, Training Host-Pathogen Protein-Protein Interaction Predictors, J. Bioinform. Comput. Biol, 2018. № 16. 6. S. Alguwaizani, B. Park, X. Zhou, D. Huang, K. Han, Predicting Interactions between Virus and Host Proteins Using Repeat Patterns and Composition of Amino Acids, J. Healthc. Eng, 2018, № 2018. 279 Машинне навчання та нейронні мережі 7. X. Yang, S. Yang, Q. Li, S. Wuchty, Z. Zhang, Prediction of Human-Virus Protein-Protein Interactions through a Sequence Embedding-Based Machine Learning Method, Comput. Struct. Biotechnol. J., 2020. № 18, С. 153–161. 8. E. Moen, D. Bannon, T. Kudo, W. Graf, M. Covert, D. Van Valen, Deep learning for cellular image analysis, Nat. Methods, 2019. № 16, С. 1233-1246. 9. M. Suomalainen, U.F. Greber, Virus Infection Variability by Single-Cell Profiling Viruses, 2021. № 13, С. 1568. 10. M. Alshahrani, M. Khan, O. Maddouri, A. Kinjo, N. Queralt-Rosinach, R. Hoehndorf, Neuro- symbolic representation learning on biological knowledge graphs, Bioinformatics, 2017. № 33(17), С. 2723–2730. 11. A. Chowdhury, J. Kubricht, A. Sood, P. Tu, A. Santamaria-Pang, Escell: Emergent Symbolic Cellular Language, 2020 IEEE 17th International Symposium on Biomedical Imaging (ISBI), 2020, С. 1604-1607. 12. A. Agibetov, S. Matthias, Fast and scalable learning of neuro-symbolic representations of biomedical knowledge, arXiv preprint, 2018. 1804.11105. 13. A. Rivas, D. Collarana, M. Torrente, M. Vidal, A Neuro-symbolic System over Knowledge Graphs for Link Prediction, Semantic Web, 2023. С. 1 – 25. 14. M. Glauer, F. Neuhaus, T. Mossakowski, A. Memariani, J. Hastings, P. Hitzler, A. Eberhart, Neuro-symbolic semantic learning for chemistry. Compendium of Neurosymbolic Artificial Intelligence. Frontiers in Artificial Intelligence and Applications, 2023. С. 460-484. 15. O. Letychevskyi, V. Peschanenko, V. Volkov, Algebraic Virtual Machine and Its Applications. Communications in Computer and Information Science, 2022. № 1698, С. 23–41. 16. O. Letychevskyi, V. Peschanenko, Applying Algebraic Virtual Machine to Cybersecurity Tasks, IEEE 9th International Conference on Sciences of Electronics, Technologies of Information and Telecommunications, 2022, С. 161–169. 17. A. Merchant, S. Batzner, S. Schoenholz, et al, Scaling deep learning for materials discovery, Nature, 2023. № 624, С. 80–85. 18. A. Letichevsky, D. Gilbert, A Model for Interaction of Agents and Environments, Recent Trends in Algebraic Development Techniques, WADT 1999, 2000, № 1827, С.311-328. Одержано: 10.04.2024 Внутрішня рецензія отримана: 19.04.2024 Зовнішня рецензія отримана: 26.04.2024 Про авторів: 1Летичевський Олександр Олександрович, Доктор фізико-математичних наук, старший науковий співробiтник. https://orcid.org/0000-0003-0856-9771. 2Тарасіч Юлія Геннадіївна, Доктор філософії (Інформаційні технології), докторант. https://orcid.org/0000-0002-6201-4569. Місце роботи авторів: 1,2Інститут кібернетики ім. В.М. Глушкова НАН України, Тел. (+38) (044) 526-20-08 E-mail: incyb@incyb.kiev.ua, www.incyb.kiev.ua