Performance analysis of massively parallel programs for graphics processing units

Any modern Graphics Processing Unit (graphics card) is a good platform to run massively parallel programs. Still, we lack tools to observe and measure performance characteristics of GPU-based software. We state that due to complex memory hierarchy and thousands of execution threads the all performan...

Full description

Saved in:
Bibliographic Details
Published in:Проблеми програмування
Date:2022
Main Author: Rahozin, D.V.
Format: Article
Language:English
Published: Інститут програмних систем НАН України 2022
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/188628
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Performance analysis of massively parallel programs for graphics processing units / D.V. Rahozin // Проблеми програмування. — 2022. — № 3-4. — С. 51-58. — Бібліогр.: 10 назв. — англ.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-188628
record_format dspace
spelling Rahozin, D.V.
2023-03-10T18:04:26Z
2023-03-10T18:04:26Z
2022
Performance analysis of massively parallel programs for graphics processing units / D.V. Rahozin // Проблеми програмування. — 2022. — № 3-4. — С. 51-58. — Бібліогр.: 10 назв. — англ.
1727-4907
DOI: https://doi.org/10.15407/pp2022.03-04.051
https://nasplib.isofts.kiev.ua/handle/123456789/188628
681.3
Any modern Graphics Processing Unit (graphics card) is a good platform to run massively parallel programs. Still, we lack tools to observe and measure performance characteristics of GPU-based software. We state that due to complex memory hierarchy and thousands of execution threads the all performance issues are about efficient use of graphics card memory hierarchy. We propose to use GPGPUSim simulator, previously used mostly for graphics card architecture validation, for performance validation for CUDA-based program. We provide examples which show how to use the simulation for performance analysis of massively parallel programs.
Будь-яка сучасна графічна карта є цікавою платформою для запуску масивно паралельних програм. Проте, у нас дуже мало засобів для вимірювання та аналізу швидкодії такого програмного забезпечення. До того ж графічні карти мають складну ієрархію підсистеми пам’яті та тисячі потоків, що виконуються, тому всі питання швидкодії зводяться до ефективного використання ієрархії пам’яті графічної карти. Ми пропонуємо використовувати GPGPUSim — симулятор, розроблений для валідації архітектурних мрделей графічних карт — для аналізу швидкодії CUDA-програм. Наведено приклади аналізу результатів симуляції і визначення характеристик масивно паралельної програми.
en
Інститут програмних систем НАН України
Проблеми програмування
Паралельне програмування. Розподілені системи і мережі
Performance analysis of massively parallel programs for graphics processing units
Аналіз швидкодії масивно паралельних програм для графічних процесорів
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Performance analysis of massively parallel programs for graphics processing units
spellingShingle Performance analysis of massively parallel programs for graphics processing units
Rahozin, D.V.
Паралельне програмування. Розподілені системи і мережі
title_short Performance analysis of massively parallel programs for graphics processing units
title_full Performance analysis of massively parallel programs for graphics processing units
title_fullStr Performance analysis of massively parallel programs for graphics processing units
title_full_unstemmed Performance analysis of massively parallel programs for graphics processing units
title_sort performance analysis of massively parallel programs for graphics processing units
author Rahozin, D.V.
author_facet Rahozin, D.V.
topic Паралельне програмування. Розподілені системи і мережі
topic_facet Паралельне програмування. Розподілені системи і мережі
publishDate 2022
language English
container_title Проблеми програмування
publisher Інститут програмних систем НАН України
format Article
title_alt Аналіз швидкодії масивно паралельних програм для графічних процесорів
description Any modern Graphics Processing Unit (graphics card) is a good platform to run massively parallel programs. Still, we lack tools to observe and measure performance characteristics of GPU-based software. We state that due to complex memory hierarchy and thousands of execution threads the all performance issues are about efficient use of graphics card memory hierarchy. We propose to use GPGPUSim simulator, previously used mostly for graphics card architecture validation, for performance validation for CUDA-based program. We provide examples which show how to use the simulation for performance analysis of massively parallel programs. Будь-яка сучасна графічна карта є цікавою платформою для запуску масивно паралельних програм. Проте, у нас дуже мало засобів для вимірювання та аналізу швидкодії такого програмного забезпечення. До того ж графічні карти мають складну ієрархію підсистеми пам’яті та тисячі потоків, що виконуються, тому всі питання швидкодії зводяться до ефективного використання ієрархії пам’яті графічної карти. Ми пропонуємо використовувати GPGPUSim — симулятор, розроблений для валідації архітектурних мрделей графічних карт — для аналізу швидкодії CUDA-програм. Наведено приклади аналізу результатів симуляції і визначення характеристик масивно паралельної програми.
issn 1727-4907
url https://nasplib.isofts.kiev.ua/handle/123456789/188628
citation_txt Performance analysis of massively parallel programs for graphics processing units / D.V. Rahozin // Проблеми програмування. — 2022. — № 3-4. — С. 51-58. — Бібліогр.: 10 назв. — англ.
work_keys_str_mv AT rahozindv performanceanalysisofmassivelyparallelprogramsforgraphicsprocessingunits
AT rahozindv analízšvidkodíímasivnoparalelʹnihprogramdlâgrafíčnihprocesorív
first_indexed 2025-12-07T16:18:00Z
last_indexed 2025-12-07T16:18:00Z
_version_ 1850866957791789056