Про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури
Розглянуто особливості реалізації ефективного паралельного гібрид-ного алгоритму розв’язування часткової узагальненої алгебраїчної проблеми власних значень із стрічковими симетричними матрицями. Представлено оцінку ефективності алгоритму та проведено апробацію на тестових задачах. Рассмотрены особен...
Збережено в:
| Опубліковано в: : | Теорія оптимальних рішень |
|---|---|
| Дата: | 2019 |
| Автор: | |
| Формат: | Стаття |
| Мова: | Українська |
| Опубліковано: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2019
|
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/169042 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури / О.В. Чистяков // Теорія оптимальних рішень: Зб. наук. пр. — 2019. — № 18. — С. 3-12. — Бібліогр.: 5 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859994041953812480 |
|---|---|
| author | Чистяков, О.В. |
| author_facet | Чистяков, О.В. |
| citation_txt | Про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури / О.В. Чистяков // Теорія оптимальних рішень: Зб. наук. пр. — 2019. — № 18. — С. 3-12. — Бібліогр.: 5 назв. — укр. |
| collection | DSpace DC |
| container_title | Теорія оптимальних рішень |
| description | Розглянуто особливості реалізації ефективного паралельного гібрид-ного алгоритму розв’язування часткової узагальненої алгебраїчної проблеми власних значень із стрічковими симетричними матрицями. Представлено оцінку ефективності алгоритму та проведено апробацію на тестових задачах.
Рассмотрены особенности реализации эффективных алгоритмов для компьютеров гибридной архитектуры, предложен эффективный гибридный алгоритм решения частичной обобщенной алгебраической проблемы собственных значений с ленточными симметричными матрицами, представлена оценка коэффициента ускорения алгоритма. Приведены результаты апробации разработанного алгоритма.
The features of the implementation of efficient algorithms for computers of hybrid architecture are considered, an efficient hybrid algorithm for solving a partial generalized algebraic eigenvalue problem with tape symmetric matrices is proposed, and an estimate of the acceleration coefficient of the algorithm is presented. The results of testing the developed algorithm are given.
|
| first_indexed | 2025-12-07T16:33:41Z |
| format | Article |
| fulltext |
ISSN 2616-5619. Теорія оптимальних рішень. 2019, № 18 3
ТЕОРІЯ
ОПТИМАЛЬНИХ
РІШЕНЬ
Розглянуто особливості реалізації
ефективного паралельного гібрид-
ного алгоритму розв’язування
часткової узагальненої алгебраїч-
ної проблеми власних значень
із стрічковими симетричними
матрицями. Представлено оцін-
ку ефективності алгоритму та
проведено апробацію на тестових
задачах.
© О.В. Чистяков, 2019
УДК 519.6
О.В. ЧИСТЯКОВ
ПРО ЕФЕКТИВНІСТЬ
ОБЧИСЛЮВАЛЬНИХ АЛГОРИТМІВ
ДЛЯ КОМП’ЮТЕРІВ ГІБРИДНОЇ
АРХІТЕКТУРИ
Вступ. Математичне моделювання – це акту-
альний напрямок у різних предметних обла-
стях: аеродинаміка, ядерна енергетика,
економіка, медицина, будівництво тощо.
Безперервне зростання параметрів задач, не-
обхідність комп’ютерних досліджень більш
повних моделей об’єктів і процесів – могут-
ній стимул зростання продуктивності ком-
п’ютерів. На сьогодні такими комп’ютерами
є паралельні комп’ютери різної архітектури,
зокрема суперкомп’ютери гібридної архітек-
тури, що поєднують обчислення на багато-
ядерних комп’ютерах MIMD-ахітектури
(CPU) з прискоренням обчислень на гра-
фічних процесорах (GPU).
Для ефективного розв’язування обчислю-
вальних задач на цих комп’ютерах необхідно
створювати алгоритми та програми, які
враховують як властивості математичної
моделі, так і архітектурні та технологічні
особливості комп’ютера. Наприклад, ефек-
тивність алгоритму можна значно покращити
за рахунок багатопоточного виконання
матрично-векторних операцій з великими
обсягами даних на графічних процесорах
синхронно з копіюванням масивів даних від
CPU до GPU та назад.
Крім того, час розв’язування задач знач-
ною мірою залежить від правильності обра-
них параметрів запуску програм, що реалізу-
ють розроблені алгоритми.
Архітектурні особливості гібридного ком-
п’ютера. Розглядаємо гібридний комп’ютер,
до складу якого входить багатоядерний та
багатовузловий комп’ютер MIMD-архітек-
тури з декількома графічними процесорами
О.В. ЧИСТЯКОВ
4 ISSN 2616-5619. Теорія оптимальних рішень. 2019, № 18
SIMD-архітектури, кожен з яких має окрему пам’ять, а зв’язки між процесорами
CPU здійснюються через деякі комунікаційні засоби [1].
Дворівнева організація пам’яті гібридного комп’ютера передбачає дворів-
неву MPI+CUDA паралельну реалізацію обчислень. На верхньому рівні розпара-
лелення здійснюється між розподіленою пам’яттю обчислювальних вузлів,
використовуючи міжпроцесорні обміни за допомогою системи розпаралелення
MPI, а на нижньому рівні − на GPU за допомогою технології CUDA.
На основі проведеного аналізу архітектурних та технологічних особливо-
стей багатоядерних комп’ютерів з графічними прискорювачами можна
визначити такі вимоги щодо розробки ефективних гібридних алгоритмів:
− розподіл вихідної задачі на частини (підзадачі), які можуть бути реалізо-
вані в значній мірі незалежно одна від одної;
− визначення які підзадачі доцільніше виконувати на CPU, а які − на GPU
та встановлення інформаційних залежностей між ними;
− створення ефективної топології MIMD-комп’ютера з необхідної кіль-
кості процесорних ядер CPU, тобто з виконуваних на них MPI-процесів;
− рівномірне завантаження процесів CPU, що використовуються, та син-
хронізація обмінів між ними;
− виконання підзадач (математичних операцій), які потребують найбіль-
ших затрат комп’ютерного часу, на GPU;
− мінімізація обмінів між процесами CPU та між СPU і GPU;
− масштабованість алгоритму – забезпечення можливості ефективно роз-
в’язувати задачі з використанням різної кількості процесів.
Особливості створення алгоритмів для розв’язування обчислювальних
задач на гібридних комп’ютерах. Розглянемо деякі способи підвищення
ефективності паралельних алгоритмів для комп’ютерів з графічними проце-
сорами на прикладі чисельного розв’язування задач часткової узагальненої
алгебраїчної проблеми власних значень методом ітерацій на підпросторі. Задачі
цього класу є одними з фундаментальних ресурсномістких задач, які виникають
при математичному моделюванні процесів різної фізичної природи. Ефек-
тивним алгоритмом вважаємо алгоритм, що забезпечує розв’язування задачі
з гарантованою точністю результатів при мінімальному використанні обчи-
слювальних ресурсів та часу.
Обчислювальна схема алгоритму методу ітерацій на підпросторі. Розгля-
немо метод ітерацій на підпросторі для обчислення r мінімальних власних
значень і відповідних їм власних векторів задачі [2]
,Ax Bx (1)
де A, B – симетричні стрічкові додатно визначені матриці порядку n.
Цей метод – узагальнення методу обернених ітерацій і полягає у побудові
для задачі (1) послідовності підпросторів Et (t = 1, 2, ...), яка збігається до
підпростору E∞, що містить шукані власні вектори [2].
ПРО ЕФЕКТИВНІСТЬ ОБЧИСЛЮВАЛЬНИХ АЛГОРИТМІВ ДЛЯ КОМПЬЮТЕРІВ …
ISSN 2616-5619. Теорія оптимальних рішень. 2019, № 18 5
На t-ій ітерації обчислюється ортогональний базис підпростору Et і, якщо
досягнута необхідна точність наближеного розв’язку, визначаються шукані
власні пари.
Таким чином, реалізація методу ітерацій на підпросторі задачі (1) із
стрічковими матрицями зводиться до виконання для t = 1, 2, ..., таких
кроків [3, 4]:
− знаходження розв’язку СЛАP
1;t tAX Y (2)
− обчислення проекції матриці А на підпростір tE
t
T
tt
T
tt AXXYXA 1 ; (3)
− обчислення прямокутної матриці
tt BXW ; (4)
− обчислення проекції матриці B на підпростір tE
t
T
tt
T
tt BXXWXB ; (5)
− розв’язування повної проблеми власних значень для проекцій
ttttt ZBZA ; (6)
− обчислення наближення
ttt ZWY . (7)
Якщо після c ітерацій виконуються умови закінчення ітераційного процесу,
наприклад,
( ) ( 1)
( )
,
c c
i i
t
i
то проводиться додаткова ітерація і наближеними
розв’язками задачі (1) вважаються )c(
i
*
i
1 λλ , (i = 1, 2, …, r) та перші r стовп-
чиків матриці 11 cc
* ZXX (мається на увазі, що власні значення упорядковані
за зростанням ......0 21 r ).
З роботи [2] відомо, що ітераційний процес збігається лінійно, причому
швидкість збіжності i визначається відношенням 1λλq , де q − розмір підпро-
стору Eq, що ітерується. В послідовних реалізаціях алгоритму рекомендується
вибирати min(2 , 8).q r r
Аналізуючи схему реалізації методу ітерацій на підпросторі (2)–(7) можна
зазначити, що найбільш затратною щодо використання обчислювальних ресур-
сів та комп’ютерного часу є підзадача розв’язування СЛАР алгоритмом методу
Холецького [3] на основі LLT-розвинення. Оскільки на кожній ітерації викону-
ється розв’язування СЛАР (2) з однією і тією ж матрицею A, то LLT-розвинення
виконується до початку ітераційного процесу.
Тоді на кожній ітерації розв’язується задача (2) з факторизованою
матрицею.
О.В. ЧИСТЯКОВ
6 ISSN 2616-5619. Теорія оптимальних рішень. 2019, № 18
Схема декомпозиції даних між процесорами. Для розв’язування задачі (1) на
гібридному комп’ютері з декількома GPU матриця A розділяється на квадратні
блоки J,IA порядку s. Елементи головної діагоналі та нижнього або верхнього
трикутника (в залежності від використаних схем алгоритмів) ненульових блоків
стрічкової симетричної матриці розподіляються між процесорами у відпо-
відності з одномірною блочно-циклічною схемою [4, 5].
За цією схемою блок J,IA зберігається в процесі з логічним номером
( )modI l p (результат операції modk j – залишок від ділення k на j,
21 pl – зсув, зазвичай 1l ).
В результаті виконання LLT-розвинення матриці A задачі (1) блоки нижньої
трикутної матриці L або верхньої трикутної матриці TL будуть розподілені
аналогічно.
Така ж блочно-циклічна схема розподілу використовується для елементів
матриці B та прямокутних матриць ітерованих векторів Xt, Yt, Wt на етапах (3 – 7)
обчислювальної схеми. При цьому достатньо розподіляти та зберігати лише
ненульові елементи матриці B у такій послідовності: піддіагональні, діагональні
та наддіагональні. Це значно спрощує алгоритм перемноження такої матриці на
прямокутну матрицю, не суттєво збільшуючи загальний об’єм даних.
Реалізація гібридного алгоритму методу ітерацій на підпросторі. На основі
проведеного аналізу методу ітерацій на підпросторі та з метою ефективного
використання архітектурних і технологічних особливостей гібридного комп’ю-
тера етапи розв’язування задачі (1) розділимо на чотири підзадачі різної обчи-
слювальної складності:
1) формування розподіленої між задіяними процесами на CPU матриці Y0
початкових векторів, що ітеруються, таких, щоб матриця Bt була додатно
визначеною. Оскільки підматриці Et ітерованих векторів розподілені між проце-
сами блоками рядків, то цю операцію можна виконати в кожному з них без
обмінів, наприклад, за алгоритмом, який описано в [2];
2) LLT-факторизація стрічкової симетричної додатно визначеної матриці A,
використовуючи, наприклад, гібридний блочний алгоритм з [3];
3) виконання ітераційного процесу (2) – (7), за яким на кожній ітерації
( 1,2,...t ) обчислення виконуються на процесах CPU за наступною схемою:
а) розв’язування гібридними алгоритмами [4] системи лінійних рівнянь (2)
з трикутними матрицями, використовуючи отримане на попередньому кроці
LLT-розвинення матриці A;
б) обчислення прямокутної матриці ,t tW BX тобто добутку прямокутної
матриці на стрічкову матрицю (4), що виконується в такому порядку:
− пересилка в кожний процес CPU з процесу, де вони постійно
розташовані, елементів (рядків) прямокутної матриці, що використовуються для
обчислення чергових kp рядків матриці ;tW
ПРО ЕФЕКТИВНІСТЬ ОБЧИСЛЮВАЛЬНИХ АЛГОРИТМІВ ДЛЯ КОМПЬЮТЕРІВ …
ISSN 2616-5619. Теорія оптимальних рішень. 2019, № 18 7
− обчислення процесами, на відповідних процесорах GPU, часткових сум
для елементів чергових kp рядків матриці ;tW
− мультиобмін чергових kp рядків матриці ,tW тобто мультизбирання
рядків часткових сум елементів, яке можна поєднати з їх розподілом між
процесами CPU з відповідністю із схемою зберігання.
в) обчислення добутків (3) та (5) прямокутних матриць для формування
проекцій матриць A та B на підпростір. Виконуються кожним процесом на
відповідних GPU, після чого здійснюється збір результуючих матриць проекцій.
Причому обчислення добутків прямокутних матриць можна виконувати
асинхронно з іншими обчислювальними операціями або обмінами на CPU;
г) розв’язування повної узагальненої АПВЗ (6) методом Якобі, враховуючи
порівняно невеликий порядок матриць проекцій підзадачі, виконуються проце-
сами на CPU без обмінів даними;
д) перевірка умов закінчення ітераційного процесу в кожному процесі CPU;
е) обчислення (7) нової матриці ітерованих векторів Yt (або матриці
наближених власних векторів X*) виконується на процесорах GPU у
відповідності з розподілом даних (обчислюється підматриця матриці Yt або X*),
причому немає необхідності в обмінах даними між процесорними пристроями;
4) аналіз отриманих результатів за технологією з [5].
Дослідження ефективності гібридного алгоритму методу ітерацій на
підпросторі. Визначимо коефіцієнт прискорення розробленого алгоритму.
Час розв’язування задачі за розробленим алгоритмом при використанні
одного CPU та відповідного йому GPU становить
,111 cGcGoGoGoGGC tOtOntOtOT
а час розв’язання тієї ж задачі при використанні p CPU та p GPU є
,cGcGccoGoGoooGpGCpp tOtOtOtOntOtOT
де 1O , pO – кількість операцій, що виконуються на CPU, GO1 , pGO – кількість
операцій, що виконуються на GPU, відповідно послідовною та паралельною
версією алгоритму; Ct , Gt – середній час виконання однієї арифметичної
операції з плаваючою комою на CPU та GPU відповідно; on – кількість опера-
цій, які можуть бути одночасно виконані на GPU; ot , oGt – час, необхідний для
обміну одним машинним словом між процесами на CPU або між CPU та GPU
відповідно; oO , oGO – обсяг обмінів (кількість машинних слів), що викону-
ються одним CPU та GPU відповідно; tc, tcG – час, необхідний для синхронізації
двох CPU або CPU та його GPU відповідно; cO , cGO – кількість синхронізацій,
що виконуються одним CPU та GPU відповідно.
О.В. ЧИСТЯКОВ
8 ISSN 2616-5619. Теорія оптимальних рішень. 2019, № 18
При виконанні дослідження та розв’язування часткової узагальненої АПВЗ
для симетричних стрічкових матриць частина етапів (формування матриці
початкових ітерованих векторів, LLT-розвинення матриці A, обчислення оцінок
наближеного розв’язку) має фіксовану кількість арифметичних операцій, а для
ітераційного процесу (2) – (7) кількість арифметичних операцій пропорційна
кількості виконаних ітерацій.
Кількість ітерацій, необхідна для знаходження r мінімальних власних
значень, як правило, є величина O(r), причому вона чим менше, тим більший
розмір q ітерованого підпростору.
Таким чином,
)1()( I
pI
F
pp TcTT , а коефіцієнт прискорення запропонова-
ного алгоритму можна представити у вигляді
)(
)1(
)(
)(
1 It
p
p
I
pIF
p
p
F
p
p
p S
T
Tc
S
T
T
T
T
S ,
де Ic – кількість ітерацій,
)(F
pT ,
)1( I
pT – відповідно час розв’язування підзадач
з фіксованою кількістю арифметичних операцій та час виконання однієї ітерації
на архітектурі з використанням p CPU та p GPU,
)(F
pS та
)1( I
pS – коефіцієнти
прискорення алгоритмів відповідних підзадач.
Далі введемо такі позначення:
)(LLT
pT – час виконання LLT-розвинення ма-
триці A; )()( kT SS
p – час розв’язування СЛАР виду (2) з k правими частинами
(використовуючи обчислене раніше LLT-розвинення матриці); )(, )()( kTT Io
p
Fo
p –
відповідно час виконання інших операцій при розв’язуванні підзадач з фік-
сованою кількістю арифметичних операцій та час виконання однієї ітерації.
Тоді
)(F
pT ,
)1( I
pT можна записати у вигляді:
.)()(,)( )()()1()()()()( qTqTTTqTTT Io
p
SS
p
I
p
Fo
p
SS
p
LLT
p
F
p (8)
Ми розглядаємо гібридний алгоритм розв’язування часткової проблеми
власних значень стрічкових матриць, тому введемо додаткові позначення:
,A Bm m – напівширина стрічки матриць A та B відповідно, ηB – середня кіль-
кість ненульових елементів у одному рядку матриці B, oс
E
C dttdt )(
)(
та oGсG
E
G dttdt )(
)(
часи обміну масивом з d подвійних слів між двома CPU
та CPU + GPU відповідно.
Лема 1. Для розв’язування СЛАР із стрічковою симетричною додатно
визначеною матрицею A розміру rqn , spmA гібридним алгоритмом на
основі LLT-розвинення на комунікаційній мережі «гіперкуб» при використанні
p CPU та p GPU справедливі такі оцінки часових характеристик:
ПРО ЕФЕКТИВНІСТЬ ОБЧИСЛЮВАЛЬНИХ АЛГОРИТМІВ ДЛЯ КОМПЬЮТЕРІВ …
ISSN 2616-5619. Теорія оптимальних рішень. 2019, № 18 9
2
( ) 2 ( ) ( )
2max , ( ) log 2 ( ) ,
3
LLT E EG G
p C A C A A G A
o o
n s t p t p
T pt m t sm p psm t sm
p n s n s
( ) ( ) ( )
2 2
2
( ) log (4 2 ) ( ( )log 2 ( )) .SS E EG
p C A C G
o
n t p
T k kt p p m ps k t sk p t sk
p n s
Тут s – розмір блоку матриці A, k – кількість шуканих власних значень.
Лема 2. Для гібридного алгоритму методу ітерацій на підпросторі
розв’язування АПВЗ для стрічкових симетричних матриць, за умов ,n q r
BA mm , BB m1 , час виконання обчислень з фіксованою кількістю
арифметичних операцій –
)(Fo
pT та час виконання однієї ітерації – )()( kT Io
p
оцінюються за формулами:
( ) ( ) ( )2
2
2( 2) log
(2 6) 2 ( )log 2 ( ) ,Fo E EG
p C B C G
o
n n n p p t n
T qt q t sq p t sq
p n n s
2
( ) 2( 2 )log ( )
( ) (2 4 )Io G
p C B
o
n n k p O k t
T k pkt k k
p n n
( ) ( )
2( )log 2 ( ) .E E
C G
n
t sk p t sk
s
Теорема. Для гібридного алгоритму методу ітерацій на підпросторі,
за умов qn , BA mm , qmA , spmA , BB m та )()(
)()(
A
E
C
m
G smtst ,
для коефіцієнта прискорення справедлива наступна оцінка:
( ) ( ) ( ) (1 )
1 1
( ) (1 ) ( )
1
,
SLAE SLAE F I
p I p
p SLAE I F
p I p p
T T c T T
S
T c T T
де
)()()( SS
p
LLT
p
SLAE
p TTT ,
,)()()()( Fo
p
SS
p
LLT
p
F
p TTTT )()()1( Io
p
SS
p
I
p TTT ,
o
C
E
GAoGAAGSLAE
p
n
tstmpkpnpsktkpsmmt
p
n
T
))4((2)42( 2)(
)( ,
О.В. ЧИСТЯКОВ
10 ISSN 2616-5619. Теорія оптимальних рішень. 2019, № 18
)(2)2(
)42(
3
)()(
22
)( nttqmnqpt
n
kmpsmmt
pt
s
p
n
T
E
CCA
E
G
o
AAAG
C
F
p ,
o
E
GoAG
E
CCCI
p
n
npktnkpsmkt
n
tnktntppk
p
n
T
)()(2
2)1( 22)22()(2log
.
На рис. 1 показано залежність прискорення гібридного алгоритму від
напівширини стрічки матриці та кількості використаних GPU, що отримано при
розв’язуванні АПВЗ для стрічкових симетричних матриць порядку 250 000
з різною напівшириною стрічки, побудованих шляхом дискретизації методом
скінченних елементів змішаної крайової задачі для оператора Лапласа в прямо-
кутному паралелепіпеді.
Дослідження проведено на інтелектуальній робочій станції гібридної
архітектури Інпарком_g такими технічними характеристиками: CPU – серії
Intel(R) Xeon(R) E5606; тактова частота 2.13 GHz; швидкість 4,8 GT/s; кеш-
пам’ять 8 Mb; у вузлі – 2 CPU по 4 ядра, Max Memory Size 288 Gb; графічні
процесори – Nvidia Tesla M2090; пам’ять 6 Gb.
РИС. 1. Залежність прискорення алгоритму від напівширини стрічки матриці
На рисунку ми бачимо, що при збільшенні напівширини стрічки вихідної
матриці від 3000 і більше прискорення гібридного алгоритму зростає (кількість
використаних GPU – більше двох). При використанні матриці з меншою
напівшириною стрічки отримане прискорення набагато менше. Це пов’язано
з недостатньою завантаженістю обчислювальних пристроїв та великою кількі-
стю міжпроцесорних обмінів.
ПРО ЕФЕКТИВНІСТЬ ОБЧИСЛЮВАЛЬНИХ АЛГОРИТМІВ ДЛЯ КОМПЬЮТЕРІВ …
ISSN 2616-5619. Теорія оптимальних рішень. 2019, № 18 11
На рис. 2 показано результати дослідження алгоритму на Інпарком_g при
розв’язуванні АПВЗ для матриці з напівшириною стрічки 10000, використо-
вуючи блоки різного порядку.
РИС. 2. Залежність прискорення алгоритму від порядку блоків
З представлених графіків на рисунку видно, що при збільшенні розміру
блоку до 1024 на гібридному комп’ютері отримано найбільше прискорення. При
використанні блоків меншого розміру отримане прискорення набагато менше.
Це пов’язано зі збільшенням кількості міжпроцесорних обмінів, неефективним
використанням кеш-пам’яті центрального процесора, а також збільшенням кіль-
кості викликів програмних функцій матрично-векторних обчислень.
Результати проведених експериментів узгоджуються з теоретичними оцінками
коефіцієнтів прискорення та ефективності розробленого гібридного алгоритму.
Висновки. В роботі розглянуто деякі особливості ефективного створення та
використання паралельних алгоритмів на комп’ютерах гібридної архітектури,
на прикладі запропонованого гібридного алгоритму методу ітерацій, на під-
просторі розв’язання часткової узагальненої алгебраїчної проблеми власних
значень для симетричних додатно визначених стрічкових матриць.
Проведено теоретичне дослідження ефективності розробленого алгоритму
та експериментальна апробація при розв’язуванні тестових задач різного
порядку та з різними параметрами запуску. Встановлено залежність резуль-
туючої продуктивності від ефективного використання архітектурних особливо-
стей гібридного комп’ютера, схеми декомпозиції даних між процесорами, а
також багатопоточного виконання матрично-векторних операцій з великими
обсягами даних на графічних процесорах синхронно з копіюванням масивів
даних від CPU до GPU та назад.
О.В. ЧИСТЯКОВ
12 ISSN 2616-5619. Теорія оптимальних рішень. 2019, № 18
А.В. Чистяков
ОБ ЭФФЕКТИВНОСТИ ВЫЧИСЛИТЕЛЬНИХ АЛГОРИТМОВ ДЛЯ КОМПЬЮТЕРОВ
ГИБРИДНОЙ АРХИТЕКТУРЫ
Рассмотрены особенности реализации эффективных алгоритмов для компьютеров гибридной
архитектуры, предложен эффективный гибридный алгоритм решения частичной обобщенной
алгебраической проблемы собственных значений с ленточными симметричными матрицами,
представлена оценка коефициента ускорения алгоритма. Приведены результаты апробации
разработанного алгоритма.
A.V. Chistyakov
ABOUT EFFICIENCY OF COMPUTING ALGORITHMS FOR COMPUTERS OF HYBRID
ARCHITECTURE
The features of the implementation of efficient algorithms for computers of hybrid architecture are
considered, an efficient hybrid algorithm for solving a partial generalized algebraic eigenvalue
problem with tape symmetric matrices is proposed, and an estimate of the acceleration coefficient of
the algorithm is presented. The results of testing the developed algorithm are given.
Список літератури
1. Немнюгин С.А. Параллельное программирование для многопроцессорных вычислитель-
ных систем. СПб.: БХВ-Петербург. 2002. 400 с.
2. Парлет Б. Симметричная проблема собственных значений. М.: Мир, 1983. 318 с.
3. Хіміч О.М., Попов О.В., Баранов А.Ю., Чистяков О.В. Гібридний алгоритм розв’язування
задач на власні значення для стрічкових матриць Теорія оптимальних рішень. К: Ін-т
кібернетики імені В.М. Глушкова НАН України. 2016. С. 86 – 94.
4. Khimich A.N., Popov A.V., Chistyakov O.V. Hybrid algorithms for solving the algebraic
eigenvalue problem with sparse matrix. Суbernetics and Systems Analysis. 2017. Vol. 53, N 6.
Р. 132 – 146.
5. Химич А.Н., Молчанов И.Н., Попов А.В., Чистякова Т.В., Яковлев М.Ф. Параллельные
алгоритмы решения задач вычислительной математики. Киев: Наук. думка, 2008. 247 с.
Одержано 21.02.2019
|
| id | nasplib_isofts_kiev_ua-123456789-169042 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 2616-5619 |
| language | Ukrainian |
| last_indexed | 2025-12-07T16:33:41Z |
| publishDate | 2019 |
| publisher | Інститут кібернетики ім. В.М. Глушкова НАН України |
| record_format | dspace |
| spelling | Чистяков, О.В. 2020-06-03T08:43:45Z 2020-06-03T08:43:45Z 2019 Про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури / О.В. Чистяков // Теорія оптимальних рішень: Зб. наук. пр. — 2019. — № 18. — С. 3-12. — Бібліогр.: 5 назв. — укр. 2616-5619 https://nasplib.isofts.kiev.ua/handle/123456789/169042 519.6 Розглянуто особливості реалізації ефективного паралельного гібрид-ного алгоритму розв’язування часткової узагальненої алгебраїчної проблеми власних значень із стрічковими симетричними матрицями. Представлено оцінку ефективності алгоритму та проведено апробацію на тестових задачах. Рассмотрены особенности реализации эффективных алгоритмов для компьютеров гибридной архитектуры, предложен эффективный гибридный алгоритм решения частичной обобщенной алгебраической проблемы собственных значений с ленточными симметричными матрицами, представлена оценка коэффициента ускорения алгоритма. Приведены результаты апробации разработанного алгоритма. The features of the implementation of efficient algorithms for computers of hybrid architecture are considered, an efficient hybrid algorithm for solving a partial generalized algebraic eigenvalue problem with tape symmetric matrices is proposed, and an estimate of the acceleration coefficient of the algorithm is presented. The results of testing the developed algorithm are given. uk Інститут кібернетики ім. В.М. Глушкова НАН України Теорія оптимальних рішень Про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури Об эффективности вычислительных алгоритмов для компьютеров гибридной архитектуры About efficiency of computing algorithms for computers of hybrid architecture Article published earlier |
| spellingShingle | Про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури Чистяков, О.В. |
| title | Про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури |
| title_alt | Об эффективности вычислительных алгоритмов для компьютеров гибридной архитектуры About efficiency of computing algorithms for computers of hybrid architecture |
| title_full | Про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури |
| title_fullStr | Про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури |
| title_full_unstemmed | Про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури |
| title_short | Про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури |
| title_sort | про ефективність обчислювальних алгоритмів для комп’ютерів гібридної архітектури |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/169042 |
| work_keys_str_mv | AT čistâkovov proefektivnístʹobčislûvalʹnihalgoritmívdlâkompûterívgíbridnoíarhítekturi AT čistâkovov obéffektivnostivyčislitelʹnyhalgoritmovdlâkompʹûterovgibridnoiarhitektury AT čistâkovov aboutefficiencyofcomputingalgorithmsforcomputersofhybridarchitecture |