Modeling of heat transfer processes on hybrid architecture computers

The paper is devoted to the development of methods and algorithms for computer simulation of heat transfer processes, which play a significant role in the field of continuum mechanics. Finding the temperature fields during welding to determine the kinetics of temperature stresses and deformations he...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2024
Hauptverfasser: Duchenko, O.S., Nesterenko, A.N., Popov, О.V.
Format: Artikel
Sprache:Ukrainian
Veröffentlicht: PROBLEMS IN PROGRAMMING 2024
Schlagworte:
Online Zugang:https://pp.isofts.kiev.ua/index.php/ojs1/article/view/622
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Problems in programming
Завантажити файл: Pdf

Institution

Problems in programming
id pp_isofts_kiev_ua-article-622
record_format ojs
resource_txt_mv ppisoftskievua/c8/f85e79924444503ee92b300ed9884ac8.pdf
spelling pp_isofts_kiev_ua-article-6222025-02-14T11:16:24Z Modeling of heat transfer processes on hybrid architecture computers Моделювання процесів теплопереносу на комп’ютерах гібридної архітектури Duchenko, O.S. Nesterenko, A.N. Popov, О.V. thermal conductivity equation; temperature field; Cauchy problems for systems of ordinary differential equations UDC 518:517.944 519.6 рівняння теплопровідності; температурне поле; задачі Коші для систем звичайних диференціальних рівнянь УДК 518:517.944 519.6 The paper is devoted to the development of methods and algorithms for computer simulation of heat transfer processes, which play a significant role in the field of continuum mechanics. Finding the temperature fields during welding to determine the kinetics of temperature stresses and deformations helps to increase the technological and operational indicators of welded structures. This paper proposes a method of determining temperature fields during welding of thin-sheet elements of structures. This paper proposes a method of determining temperature fields during welding of thin-sheet elements of structures. A non-stationary thermal problem was obtained as a result of the simulation of the heat transfer process, taking into account the nonuniformity of the heating of the welded elements during the welding process. A discrete problem was obtained for the numerical solution of this problem by the finite element method – a first-order system of ordinary differential equations, that is, the Cauchy problem. This paper proposes a high-performance fourthorder Runge-Kutta computer algorithm for solving the Cauchy problem. The algorithm is developed for modern supercomputers built on new multi-core processors. The proposed algorithm is based on a multilevel model of parallel computing. At the upper level of parallelism, calculations performs in form of parallel processes, memory is distributed between them, also ensures synchronization of calculations and information exchanges. Parallelization at this level is expedient to be carried out by means of MPI. At the second level of parallelism, calculations performs using OpenMP directives or Intel MKL library software modules using shared memory. The third level of parallelism involves data processing with vector arithmetic and logic devices, which are included in the program automatically with the help of the compiler. The developed algorithm was tested on solving the problem of determining the temperature field, which arises during the study of the life cycle of welded structures. Such calculations are used, in particular, in the problem of determining the kinetics of temperature deformations and stresses during welding of thin plates. Some results of testing the proposed method and the developed algorithm on the SKIT supercomputer of the V.M. Glushkov Institute of Cybernetics of the National Academy of Sciences of Ukraine are presented.Prombles in programming 2024; 2-3: 78-83  Робота присвячена розробленню методів і алгоритмів комп’ютерного моделювання процесів теплопереносу, які відіграють суттєву роль в галузі механіки суцільних середовищ. Знаходження температурних полів у процесі зварювання для визначення кінетики температурних напружень і деформацій сприяє підвищенню технолого-експлуатаційних показників зварних конструкцій. У роботі запропоновано методику визначення температурних полів під час зварювання тонколистових елементів конструкцій. В результаті моделювання процесу теплопереносу, враховуючи нерівномірність нагрівання зварюваних елементів у процесі зварювання, отримано нестаціонарну теплову задачу. Для чисельного розв’язання цієї задачі методом скінченних елементів отримано дискретну задачу – систему звичайних диференціальних рівнянь першого порядку, тобто задачу Коші. В роботі запропоновано високопродуктивний комп’ютерний алгоритм методу Рунге-Кутта четвертого порядку для розв’язування задачі Коші. Алгоритм розроблено для сучасних суперкомп’ютерів, побудованих на нових багатоядерних процесорах. Запропонований алгоритм базується на багаторівневій моделі паралельних обчислень. На верхньому рівні паралелізму обчислення проводяться у вигляді паралельних процесів, між якими розподіляється пам’ять, забезпечується синхронізація обчислень та обмін інформацією. Розпаралелювання на цьому рівні доцільно здійснювати засобами MPI. На другому рівні паралелізму обчислення проводяться за допомогою директив OpenMP або програмних модулів бібліотеки Intel MKL з використанням спільної пам’яті. Третій рівень паралелізму передбачає обробку даних векторними арифметико-логічними пристроями, включення яких до програми відбувається автоматично за допомогою компілятора. Розроблений алгоритм апробовано на розв’язанні задачі визначення поля температур, яка виникає під час дослідження життєвого циклу зварних конструкцій. Такі розрахунки використовуються, зокрема, в задачі визначення кінетики температурних деформацій та напружень у процесі зварювання тонких пластин. Наведено деякі результати тестування запропонованого методу та розробленого алгоритму на суперкомп’ютері Інституту кібернетик імені В.М. Глушкова НАН України СКІТ.Prombles in programming 2024; 2-3: 78-83  PROBLEMS IN PROGRAMMING ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ ПРОБЛЕМИ ПРОГРАМУВАННЯ 2024-12-17 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/622 10.15407/pp2024.02-03.078 PROBLEMS IN PROGRAMMING; No 2-3 (2024); 78-83 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 2-3 (2024); 78-83 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 2-3 (2024); 78-83 1727-4907 10.15407/pp2024.02-03 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/622/674 Copyright (c) 2024 PROBLEMS IN PROGRAMMING
institution Problems in programming
baseUrl_str https://pp.isofts.kiev.ua/index.php/ojs1/oai
datestamp_date 2025-02-14T11:16:24Z
collection OJS
language Ukrainian
topic thermal conductivity equation
temperature field
Cauchy problems for systems of ordinary differential equations
UDC 518:517.944 519.6
spellingShingle thermal conductivity equation
temperature field
Cauchy problems for systems of ordinary differential equations
UDC 518:517.944 519.6
Duchenko, O.S.
Nesterenko, A.N.
Popov, О.V.
Modeling of heat transfer processes on hybrid architecture computers
topic_facet thermal conductivity equation
temperature field
Cauchy problems for systems of ordinary differential equations
UDC 518:517.944 519.6
рівняння теплопровідності
температурне поле
задачі Коші для систем звичайних диференціальних рівнянь
УДК 518:517.944 519.6
format Article
author Duchenko, O.S.
Nesterenko, A.N.
Popov, О.V.
author_facet Duchenko, O.S.
Nesterenko, A.N.
Popov, О.V.
author_sort Duchenko, O.S.
title Modeling of heat transfer processes on hybrid architecture computers
title_short Modeling of heat transfer processes on hybrid architecture computers
title_full Modeling of heat transfer processes on hybrid architecture computers
title_fullStr Modeling of heat transfer processes on hybrid architecture computers
title_full_unstemmed Modeling of heat transfer processes on hybrid architecture computers
title_sort modeling of heat transfer processes on hybrid architecture computers
title_alt Моделювання процесів теплопереносу на комп’ютерах гібридної архітектури
description The paper is devoted to the development of methods and algorithms for computer simulation of heat transfer processes, which play a significant role in the field of continuum mechanics. Finding the temperature fields during welding to determine the kinetics of temperature stresses and deformations helps to increase the technological and operational indicators of welded structures. This paper proposes a method of determining temperature fields during welding of thin-sheet elements of structures. This paper proposes a method of determining temperature fields during welding of thin-sheet elements of structures. A non-stationary thermal problem was obtained as a result of the simulation of the heat transfer process, taking into account the nonuniformity of the heating of the welded elements during the welding process. A discrete problem was obtained for the numerical solution of this problem by the finite element method – a first-order system of ordinary differential equations, that is, the Cauchy problem. This paper proposes a high-performance fourthorder Runge-Kutta computer algorithm for solving the Cauchy problem. The algorithm is developed for modern supercomputers built on new multi-core processors. The proposed algorithm is based on a multilevel model of parallel computing. At the upper level of parallelism, calculations performs in form of parallel processes, memory is distributed between them, also ensures synchronization of calculations and information exchanges. Parallelization at this level is expedient to be carried out by means of MPI. At the second level of parallelism, calculations performs using OpenMP directives or Intel MKL library software modules using shared memory. The third level of parallelism involves data processing with vector arithmetic and logic devices, which are included in the program automatically with the help of the compiler. The developed algorithm was tested on solving the problem of determining the temperature field, which arises during the study of the life cycle of welded structures. Such calculations are used, in particular, in the problem of determining the kinetics of temperature deformations and stresses during welding of thin plates. Some results of testing the proposed method and the developed algorithm on the SKIT supercomputer of the V.M. Glushkov Institute of Cybernetics of the National Academy of Sciences of Ukraine are presented.Prombles in programming 2024; 2-3: 78-83 
publisher PROBLEMS IN PROGRAMMING
publishDate 2024
url https://pp.isofts.kiev.ua/index.php/ojs1/article/view/622
work_keys_str_mv AT duchenkoos modelingofheattransferprocessesonhybridarchitecturecomputers
AT nesterenkoan modelingofheattransferprocessesonhybridarchitecturecomputers
AT popovov modelingofheattransferprocessesonhybridarchitecturecomputers
AT duchenkoos modelûvannâprocesívteploperenosunakompûterahgíbridnoíarhítekturi
AT nesterenkoan modelûvannâprocesívteploperenosunakompûterahgíbridnoíarhítekturi
AT popovov modelûvannâprocesívteploperenosunakompûterahgíbridnoíarhítekturi
first_indexed 2025-07-17T10:02:31Z
last_indexed 2025-07-17T10:02:31Z
_version_ 1850410737312202752
fulltext Комп’ютерне моделювання 78 УДК 518:517.944 519.6 http://doi.org/10.15407/pp2024.02-03.078 О.С. Дученко, А.Н. Нестеренко, О.В. Попов МОДЕЛЮВАННЯ ПРОЦЕСІВ ТЕПЛОПЕРЕНОСУ НА КОМП’ЮТЕРАХ ГІБРИДНОЇ АРХІТЕКТУРИ Робота присвячена розробленню методів і алгоритмів комп’ютерного моделювання процесів тепло- переносу, які відіграють суттєву роль в галузі механіки суцільних середовищ. Знаходження темпера- турних полів у процесі зварювання для визначення кінетики температурних напружень і деформацій сприяє підвищенню технолого-експлуатаційних показників зварних конструкцій. У роботі запропо- новано методику визначення температурних полів під час зварювання тонколистових елементів кон- струкцій. В результаті моделювання процесу теплопереносу, враховуючи нерівномірність нагрівання зварюваних елементів у процесі зварювання, отримано нестаціонарну теплову задачу. Для чисельно- го розв’язання цієї задачі методом скінченних елементів отримано дискретну задачу – систему зви- чайних диференціальних рівнянь першого порядку, тобто задачу Коші. В роботі запропоновано ви- сокопродуктивний комп’ютерний алгоритм методу Рунге-Кутта четвертого порядку для розв’язування задачі Коші. Алгоритм розроблено для сучасних суперкомп’ютерів, побудованих на нових багатоядерних процесорах. Запропонований алгоритм базується на багаторівневій моделі па- ралельних обчислень. На верхньому рівні паралелізму обчислення проводяться у вигляді паралель- них процесів, між якими розподіляється пам’ять, забезпечується синхронізація обчислень та обмін інформацією. Розпаралелювання на цьому рівні доцільно здійснювати засобами MPI. На другому рі- вні паралелізму обчислення проводяться за допомогою директив OpenMP або програмних модулів бібліотеки Intel MKL з використанням спільної пам’яті. Третій рівень паралелізму передбачає оброб- ку даних векторними арифметико-логічними пристроями, включення яких до програми відбувається автоматично за допомогою компілятора. Розроблений алгоритм апробовано на розв’язанні задачі ви- значення поля температур, яка виникає під час дослідження життєвого циклу зварних конструкцій. Такі розрахунки використовуються, зокрема, в задачі визначення кінетики температурних деформа- цій та напружень у процесі зварювання тонких пластин. Наведено деякі результати тестування за- пропонованого методу та розробленого алгоритму на суперкомп’ютері Інституту кібернетик імені В.М. Глушкова НАН України СКІТ. Ключові слова: рівняння теплопровідності, температурне поле, задачі Коші для систем звичайних диференціальних рівнянь. O.S. Duchenko, A.N. Nesterenko, О.V. Popov MODELING OF HEAT TRANSFER PROCESSES ON HYBRID ARCHITECTURE COMPUTERS The paper is devoted to the development of methods and algorithms for computer simulation of heat transfer processes, which play a significant role in the field of continuum mechanics. Finding the temperature fields during welding to determine the kinetics of temperature stresses and deformations helps to increase the technological and operational indicators of welded structures. This paper proposes a method of determining temperature fields during welding of thin-sheet elements of structures. This paper proposes a method of de- termining temperature fields during welding of thin-sheet elements of structures. A non-stationary thermal problem was obtained as a result of the simulation of the heat transfer process, taking into account the non- uniformity of the heating of the welded elements during the welding process. A discrete problem was ob- tained for the numerical solution of this problem by the finite element method – a first-order system of ordi- nary differential equations, that is, the Cauchy problem. This paper proposes a high-performance fourth- order Runge-Kutta computer algorithm for solving the Cauchy problem. The algorithm is developed for modern supercomputers built on new multi-core processors. The proposed algorithm is based on a multi- level model of parallel computing. At the upper level of parallelism, calculations performs in form of paral- lel processes, memory is distributed between them, also ensures synchronization of calculations and infor- mation exchanges. Parallelization at this level is expedient to be carried out by means of MPI. At the second level of parallelism, calculations performs using OpenMP directives or Intel MKL library software modules using shared memory. The third level of parallelism involves data processing with vector arithmetic and log- ic devices, which are included in the program automatically with the help of the compiler. The developed algorithm was tested on solving the problem of determining the temperature field, which arises during the © А.Н. Нестеренко, О.С. Дученко, О.В. Попов, 2024 ISSN 1727-4907. Проблеми програмування. 2024. №2-3 Комп’ютерне моделювання 79 study of the life cycle of welded structures. Such calculations are used, in particular, in the problem of de- termining the kinetics of temperature deformations and stresses during welding of thin plates. Some results of testing the proposed method and the developed algorithm on the SKIT supercomputer of the V.M. Glushkov Institute of Cybernetics of the National Academy of Sciences of Ukraine are presented. Key words: thermal conductivity equation, temperature field, Cauchy problems for systems of ordinary dif- ferential equations. Вступ Комп’ютерне моделювання проце- сів теплопереносу відіграє суттєву роль в галузі механіки суцільних середовищ. Так термодеформаційні процеси та перетво- рення в металах визначають технологічну міцність зварного шва та зони термічного впливу. Тому знаходження температурних полів під час зварювання для визначення кінетики температурних напружень і де- формацій сприяє підвищенню технолого- експлуатаційних показників зварних конс- трукцій. В результаті моделювання проце- су теплопереносу, враховуючи нерівномі- рність нагрівання зварюваних елементів в процесі зварювання, отримано нестаціона- рну теплову задачу. Для чисельного розв’язання цієї не- стаціонарної задачі методом скінченних елементів отримано дискретну задачу – задачу Коші для системи звичайних дифе- ренціальних рівнянь першого порядку. Як правило такі розрахункові задачі мають дуже велику кількість рівнянь – від десят- ків тисяч до мільйонів. Тому для комп’ютерного моделювання процесів те- плопереносу доцільно використовувати високопродуктивні обчислювальні систе- ми. В [1] запропоновано методи та парале- льні алгоритми розв’язування задач Коші на комп’ютерах MIMD-архітектури. Су- часні суперкомп’ютери, побудовані на но- вих багатоядерних процесорах, дають мо- жливість підвищення продуктивності за рахунок використання багаторівневої мо- делі паралельних обчислень. Верхній рівень багаторівневої мо- делі паралельних обчислень − паралелізм рівня обчислювальних вузлів (process level parallelism − PLP), який дає можливість проводити обчислення у вигляді паралель- них процесів, передбачає використання розподіленої між паралельними процесами пам’яті, забезпечує синхронізацію обчис- лень та обмін інформацією між процесами. Другий рівень − паралелізм рівня потоків (thread level parallelism − TLP) передбачає використання потоків, які працюють із за- гальною пам'яттю. Наступний рівень − па- ралелізм обробки даних векторними ариф- метико-логічними пристроями (data level parallelism − DLP) дає можливість автома- тичного включення паралелізму до програ- ми за допомогою компілятора. Таким чином для отримання ефек- тивних алгоритмів необхідно: 1. розділити задачу на підзадачі так, щоб оптимізувати комунікаційні ви- трати; 2. вибрати архітектуру паралель- ного комп’ютера; 3. врахувати структуру пам’яті процесорних пристроїв; 4. розподілити дані та обчислення між процесами, забезпечивши рівномірне завантаження обчислювальних вузлів комп’ютера. Вихідна задача. Розглянемо задачу знаходження нестаціонарного поля темпе- ратур для тонкої пластини. У загальному вигляді температурне поле описується нестаціонарним неліній- ним рівнянням теплопровідності. Для тон- кої пластини можна знехтувати нерівномі- рністю поля температур по товщині плас- тини. Тоді тривимірне рівняння теплопро- відності зводиться до двовимірного: w,+           +           =   y T yx T xt Tc (1) де c – питома теплоємність (в Дж/см3), λ – теплопровідність матеріалу (в Дж/(смс) ), w – об'ємна потужність джерела тепла (в Дж/(см3с) ). Теплофізичні характеристики (c і λ) багатьох матеріалів у широкій обла- сті температур відомі з довідників. Оскільки процес плавлення та за- твердіння в багатьох випадках відбуваєть- ся в інтервалі температур від TS (темпера- Комп’ютерне моделювання 80 тура твердої фази) до TL (температура рід- кої фази) і виділення прихованої теплоти плавлення здійснюється шляхом збіль- шення питомої теплоємності в області фа- зового перетворення, то питома теплоєм- ність визначається наступним чином:         − +  = ,),( ,,)( ,),( LL LS SL ск S S TTTc TTT TT qTc TTTc c де qск – прихована теплота плавлення (в Дж/(K∙см3) ). В околі місцезнаходження джерела тепла утворюється рідка ванна розплаву, де процес переносу тепла відбувається як за рахунок теплопровідності, так і за раху- нок перемішування. Для врахування впли- ву перемішування в цій ділянці використо- вують ефективний коефіцієнт теплопро- відності:    =  = ).53(),( ,),( nTTTn TTT SS S За граничні умови приймається за- кон конвективного теплообміну тіла з на- вколишнім середовищем: )( 0TT n T −=   − , (2) де α – коефіцієнт конвективного теплооб- міну, T0 – температура навколишнього се- редовища, похідна температури береться по зовнішній нормалі до контуру пласти- ни. Як початкова умова приймається рівність температури тіла і навколишнього середовища в початковий момент часу t0: 00 )( TtT = . (3) Таким чином, з урахуванням конве- ктивного потоку тепла з поверхні рівняння теплопровідності (1) має вигляд: w)T-(T2 0 +   − −           +           =   y T yx T xt Tc (4) де δ – товщина пластини. Будемо вважати, що об’ємна поту- жність джерела за товщиною розподіля- ється рівномірно. Якщо початок координат розмістити у точці розташування цього джерела, то об’ємна потужність джерела обчислюється за формулою: ( ), 22 0 yKxK yxeqw +−= де Kx, Ky − коефіцієнти зосередженості те- плового потоку, а  = yxKK Qq0 (Q – ефективна потужність джерела). Початково-крайова задача (2)-(4) може бути сформульована для функції ],[)( 00 fttUu  у варіаційній формі: ( ) ,0)( ),,(),(, 0 0 = =+ tu vwlvuavudUv (5) де u = T – T0, u – перша похідна функції u за часом t,   = czvdxvzd ),( , =),( vua +        +          +     =   dxvu x u x v x u x v 2 2211 ,+   dvu   = vwdxvwl ),( – лінійні по фу- нкції v функціонали. Дискретна задача. Для розв’язання варіаційної задачі (5) можна використати метод скінчених елементів (МСЕ). Якщо 00 UU h  – скінченновимірний підпростір МСЕ, і ( ) hh Uxv 0 , то дискретна варіаційна нестаціонарна задача має вигляд: hh Uv 0 ( ) .0)( ),,(),(,)( 0 = =+ tu vwlvuavud h hhhhh (6) Запишемо ( ) ( )  n =i ii h xtU=txu 1 )(, і, ( ) ( )  n =i ii h xV=xv 1 , де n ii 1}{ = – множина ба- зисних функцій підпростору hU0 . Тоді UMVvud Thh = ),)(( , KUVvua Thh =),( , WVvwl Th =),( і замість задачі (6) отриму- ємо задачу Коші для системи звичайних диференціальних рівнянь (СЗДР) Комп’ютерне моделювання 81 0)(,0 0 ==−+ tUYKU dt dUM (7) або 0)(, 0 11 =+−= −− tUWMKUM dt dU . (8) Тут матриця M – зазвичай діаго- нальна, а матриця K – стрічкова. Постановка задачі Коші для СЗДР. Задачу Коші для СЗДР на інтерва- лі [ Tt ,0 ] розглядатимемо у вигляді: ),,( ytf dt dy = (9) ,)( 00 yty = (10) де ( )Tnyyyy ,,, 21 = – шуканий вектор розв’язку. В багатьох практичних задачах (9) можна записати у матричній формі (8) з діагональною матрицею M і матрицею K розрідженої структури (причому часто стрічкової). Для розв’язання зазначеної СЗДР використаємо метод Рунге-Кутта 4-го по- рядку, який є найбільш розповсюдженим методом чисельного розв’язування задач з початковими умовами для СЗДР та реалі- зується за формулами: ,6/)22( 4321 )()1( kkkkyy ii ++++=+ (11) де ),,( )( 1 i ii ytfhk = ),5,0,2/( 1 )( 2 kyhtfhk i iii ++= (12) ),5,0,2/( 2 )( 3 kyhtfhk i iii ++= ),,( 3 )( 4 kyhtfhk i iii ++= i = 0,1,2,… верхній індекс – номер точки, нижній індекс – номер компоненти вектора. Отже, для знаходження розв’язку СЗДР (9)-(10) методом Рунге-Кутта 4-го порядку з автоматичним вибором кроку інтегрування для досягнення заданої точ- ності розв’язку можна виділити наступні підзадачі [2]: 1) обчислення вектор-функції ( )ytf , для знаходження векторів ,1k ,2k 3k , 4k за формулами (12); 2) обчислення вектора розв’язку ( )Tnyyyy ,,, 21 = у наступній точці інте- грування за формулою (11); 3) обчислення похибки отриманого розв’язку, перевірка умови досягнення за- даної точності та корекція кроку інтегру- вання, якщо задана точність не досягнута; 4) обчислення константи Ліпшиця. Паралельний алгоритм методу Рунге-Кутта 4-го порядку точності. Реа- лізація методу Рунге-Кутта 4-го порядку для розв’язування СЗДР з використанням багаторівневого паралелізму передбачає автоматичний розподіл вихідних даних та компонент векторів правих частин і розв’язків у локальній пам'яті ядер кожно- го процесора, а також автоматичний вибір довжини машинного слова та кроку інтег- рування для отримання заданої точності розв’язку. Для збалансованого завантаження обчисленнями процесорів використовуєть- ся одновимірний блочний розподіл даних та обчислень. Водночас розмір блоків об- числюється за формулою:         , /,/ /,1/    − −+ = pnpnqpn pnpnqpn sq де n − порядок СЗДР, p – кількість проце- сів, q = 0, 1, …, p–1 – логічний номер про- цесу, значення a дорівнює цілій частині числа a. За цією схемою розподіляються компоненти векторів y та ),( ytf . Така схема дозволяє виконувати автоматичний розподіл обчислень компонент вектор- функції СЗДР між p процесорами [3,4]. Ще однією перевагою такої схеми розподілу є те, що в багатьох випадках об- міни даними здійснюються лише між про- цесорами, які містять сусідні блоки. Запропонований паралельний алго- ритм методу Рунге-Кутта 4-го порядку ре- алізується наступним чином. 1. На рівні паралелізму обчислю- вальних вузлів із розподіленою пам’яттю (І-й рівень), використовуючи p MPI- процесів, реалізуються підзадачі 1–3 на кожному кроці інтегрування алгоритму, а підзадача 4 – по завершенні процесу інтег- рування. Для підзадач 1–3 виконуються обміни даними, використовуючи стандар- тні функції MPI. Комп’ютерне моделювання 82 2. Кожна з підзадач 1–3, як правило, зводиться до виконання однорідних опера- цій над великим обсягом даних (переважно це множення розрідженої матриці на вектор та додавання векторів). Тому тут доцільно використати спільну пам'ять, реалізувавши рівень паралелізму потоків (ІІ-й рівень) в середовищі OpenMP. Тут для виконання ко- жної з підзадач 1–3 виконується розпарале- лення між деякою кількістю потоків (threads). Слід зауважити, що обчислення значень компонент вектор-функції ( )ytf , (підзадача 1), як правило, через достатньо високий порядок векторів потребує значно більшої кількості арифметичних опера- цій – лише у такому випадку застосування другого рівня паралелізму має сенс. З ін- шого боку, якщо для збереження даних і виконання обчислень достатньо одного вузла із спільною пам’яттю, то доцільно перший рівень не використовувати. 3. На рівні паралелізму обробки да- них (ІІІ-й рівень) розпаралелення викону- ється за рахунок використання опцій компі- лятора. Слід зазначити, що кількість ариф- метичних операцій, необхідних для обчис- лення компонент правої частини СЗДР (вектор-функції ( )ytf , ) істотно впливає на ефективність і прискорення обчислень. Тому поряд із розпаралеленням обчислен- ня правої частини СЗДР для підвищення ефективності алгоритму і забезпечення не- обхідного рівня похибок доцільно для цих операцій використати змішану розряд- ність. Тобто залежно від властивостей оператора задачі здійснити обчислення або на одинарній розрядності (float), або на подвійній (double), або на ще вищій розря- дності. В таблиці 1 представлено час розв’язання теплової задачі на супер- комп’ютері СКІТ Інституту кібернетики імені В.М. Глушкова НАН України. СЗДР порядку n = 28 471 (nx=400; ny=70; n=nx×ny ) розв’язувалась на інтервалі [0,1]. У другій колонці таблиці наведено часи розв’язування задачі з використанням ли- ше першого рівня паралелізму; у третій – першого та другого рівнів; у четвертій – усіх трьох рівнів паралелізму. Результати, наведені у таблиці, свід- чать, що розроблений паралельний алгоритм дозволяє значно зменшити час розв’язування задачі (у 7,67 раз у порівнянні з однопроцесорним варіантом). Крім того, зростання часу розв’язування задачі на два- надцяти процесах свідчить, що оптималь- ною архітектура комп’ютера для розв’язування СЗДР порядку n = 28 471 є вісім процесів. Таблиця 1 Часи розв’язування теплової задачі Кількість MPI- процесів Час (сек) І рівень І і ІІ рів- ні Три рів- ні 1 1,84 1,5 0,77 2 0,96 0,78 0,42 4 0,48 0,43 0,29 8 0,32 0,32 0,22 12 0,29 0,31 0,24 Висновки Використовуючи багаторівневу мо- дель паралельних обчислень з урахуван- ням особливостей архітектури комп’ютера та структури даних задачі розроблено ефе- ктивний алгоритм розв’язування СЗДР, який програмно реалізовано на паралель- них комп’ютерах гібридної архітектури. Водночас час розв’язання задач суттєво скорочується, що дає можливість розв’язувати задачі високих порядків у ре- альному часі, які висуває сучасне життя перед наукою. Література 1. А.Н. Химич, И.Н. Молчанов, А.В. Попов, Т.В. Чистякова, М.Ф. Яковлев, Параллель- ные алгоритмы решения задач вычислите- льной математики, Наукова думка, Киев, 2008. 2. М.Ф. Яковлев, В.М. Бруснікін, Т.О. Гера- симова, Розв’язування задач з початковими умовами для систем звичайних диференці- альних рівнянь на багатоядерному комп’ютері з графічними прискорювачами Інпарком, Математичні машини і систе- ми, 2015. №2. С. 20–27. 3. М.Ф. Яковлев, Т.О. Герасимова, А.Н. Нес- теренко, Особливості розв’язування систем Комп’ютерне моделювання 83 нелінійних та диференціальних рівнянь на паралельних комп’ютерах, Питання оп- тимізації обчислень (ПОО – XXXV). Праці міжнародного симпозіуму. – Київ: Інсти- тут кібернетики ім. В.М. Глушкова НАН України, 2009. № 2. С. 435–439. 4. А.Н. Химич, М.Ф. Яковлев, Т.А. Гераси- мова, Некоторые вопросы решения систем обыкновенных дифференциальных урав- нений на MIMD-компьютерах, Киберне- тика и системный аналіз, 2007. № 2. С. 175-182. https://doi.org/10.1007/s10559-007-0049-3 References 1. A.N. Khimich, I.N. Molchanov, A V. Popov, T.V. Chistyakova, and M.F. Yakovlev, Parallel Algorithms for the Solving of Computational Mathematics Problems. [in Russian], Naukova Dumka, Kyiv, 2008. 2. M. Yakovlev, V. Brusnikin, T. Gerasymova, The solving of initial-value problems for systems of ordinary differential equations on multi-core computer with graphic accelerators Inparcom, in: Mathematical machines and systems, 2015, pp. 20–27. 3. M. Yakovlev, T. Gerasymova, A. Nesterenko, Characteristic features of the solving both of non-linear systems and systems of ordinary differential equations on parallel computers, in: Proceedings of the international symposium “Optimization problems of computations” (OPC – XXXV). Kyiv: V.M. Glushkov Institute of cybernetics of NAS of Ukraine, 2009, Kyiv: Vol. 2. pp. 435-439. 4. A. Khimich, M. Yakovlev, T. Gerasymova, Some questions related to the solving of systems of ordinary differential equations on MIMD computers, in Cybernetics and system analysis. 2007, (2). pp. 175-182. https://doi.org/10.1007/s10559-007-0049-3 Одержано: 10.04.2024 Внутрішня рецензія отримана: 21.04.2024 Зовнішня рецензія отримана: 29.04.2024 Про авторів: 1Дученко Олександр Сергійович, молодший науковий співробітник. http://orcid.org/0009-0009-4157-1743. 2Нестеренко Алла Никифорівна, молодший науковий співробітник. http://orcid.org/0000-0001-6174-1812. 3Попов Олександр Володимирович, доктор фізико-математичних наук, старший науковий співробітник, провідний науковий співробітник, http://orcid.org/0000-0002-1217-2534. alex50popov@gmail.com тел. (067)-234-12-08 Місце роботи авторів: 1Інститут кібернетики ім. В.М. Глушкова НАН України Тел. (+38) (044) 526-20-08 E-mail: incyb@incyb.kiev.ua, https:\\www.incyb.kiev.ua 2Інститут кібернетики ім. В.М. Глушкова НАН України, Тел. (+38) (044) 526-20-08 E-mail: incyb@incyb.kiev.ua, https:\\www.incyb.kiev.ua 3Інститут кібернетики ім. В.М. Глушкова НАН України, Тел. (+38) (044) 526-20-08 E-mail: incyb@incyb.kiev.ua, https:\\www.incyb.kiev.ua