Performance analysis of massively parallel programs for graphics processing units

Any modern Graphics Processing Unit (graphics card) is a good platform to run massively parallel programs. Still, we lack tools to observe and measure performance characteristics of GPU-based software. We state that due to complex memory hierarchy and thousands of execution threads the all performan...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Проблеми програмування
Дата:2022
Автор: Rahozin, D.V.
Формат: Стаття
Мова:Англійська
Опубліковано: Інститут програмних систем НАН України 2022
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/188628
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Performance analysis of massively parallel programs for graphics processing units / D.V. Rahozin // Проблеми програмування. — 2022. — № 3-4. — С. 51-58. — Бібліогр.: 10 назв. — англ.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1862692173209665536
author Rahozin, D.V.
author_facet Rahozin, D.V.
citation_txt Performance analysis of massively parallel programs for graphics processing units / D.V. Rahozin // Проблеми програмування. — 2022. — № 3-4. — С. 51-58. — Бібліогр.: 10 назв. — англ.
collection DSpace DC
container_title Проблеми програмування
description Any modern Graphics Processing Unit (graphics card) is a good platform to run massively parallel programs. Still, we lack tools to observe and measure performance characteristics of GPU-based software. We state that due to complex memory hierarchy and thousands of execution threads the all performance issues are about efficient use of graphics card memory hierarchy. We propose to use GPGPUSim simulator, previously used mostly for graphics card architecture validation, for performance validation for CUDA-based program. We provide examples which show how to use the simulation for performance analysis of massively parallel programs. Будь-яка сучасна графічна карта є цікавою платформою для запуску масивно паралельних програм. Проте, у нас дуже мало засобів для вимірювання та аналізу швидкодії такого програмного забезпечення. До того ж графічні карти мають складну ієрархію підсистеми пам’яті та тисячі потоків, що виконуються, тому всі питання швидкодії зводяться до ефективного використання ієрархії пам’яті графічної карти. Ми пропонуємо використовувати GPGPUSim — симулятор, розроблений для валідації архітектурних мрделей графічних карт — для аналізу швидкодії CUDA-програм. Наведено приклади аналізу результатів симуляції і визначення характеристик масивно паралельної програми.
first_indexed 2025-12-07T16:18:00Z
format Article
fulltext
id nasplib_isofts_kiev_ua-123456789-188628
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1727-4907
language English
last_indexed 2025-12-07T16:18:00Z
publishDate 2022
publisher Інститут програмних систем НАН України
record_format dspace
spelling Rahozin, D.V.
2023-03-10T18:04:26Z
2023-03-10T18:04:26Z
2022
Performance analysis of massively parallel programs for graphics processing units / D.V. Rahozin // Проблеми програмування. — 2022. — № 3-4. — С. 51-58. — Бібліогр.: 10 назв. — англ.
1727-4907
DOI: https://doi.org/10.15407/pp2022.03-04.051
https://nasplib.isofts.kiev.ua/handle/123456789/188628
681.3
Any modern Graphics Processing Unit (graphics card) is a good platform to run massively parallel programs. Still, we lack tools to observe and measure performance characteristics of GPU-based software. We state that due to complex memory hierarchy and thousands of execution threads the all performance issues are about efficient use of graphics card memory hierarchy. We propose to use GPGPUSim simulator, previously used mostly for graphics card architecture validation, for performance validation for CUDA-based program. We provide examples which show how to use the simulation for performance analysis of massively parallel programs.
Будь-яка сучасна графічна карта є цікавою платформою для запуску масивно паралельних програм. Проте, у нас дуже мало засобів для вимірювання та аналізу швидкодії такого програмного забезпечення. До того ж графічні карти мають складну ієрархію підсистеми пам’яті та тисячі потоків, що виконуються, тому всі питання швидкодії зводяться до ефективного використання ієрархії пам’яті графічної карти. Ми пропонуємо використовувати GPGPUSim — симулятор, розроблений для валідації архітектурних мрделей графічних карт — для аналізу швидкодії CUDA-програм. Наведено приклади аналізу результатів симуляції і визначення характеристик масивно паралельної програми.
en
Інститут програмних систем НАН України
Проблеми програмування
Паралельне програмування. Розподілені системи і мережі
Performance analysis of massively parallel programs for graphics processing units
Аналіз швидкодії масивно паралельних програм для графічних процесорів
Article
published earlier
spellingShingle Performance analysis of massively parallel programs for graphics processing units
Rahozin, D.V.
Паралельне програмування. Розподілені системи і мережі
title Performance analysis of massively parallel programs for graphics processing units
title_alt Аналіз швидкодії масивно паралельних програм для графічних процесорів
title_full Performance analysis of massively parallel programs for graphics processing units
title_fullStr Performance analysis of massively parallel programs for graphics processing units
title_full_unstemmed Performance analysis of massively parallel programs for graphics processing units
title_short Performance analysis of massively parallel programs for graphics processing units
title_sort performance analysis of massively parallel programs for graphics processing units
topic Паралельне програмування. Розподілені системи і мережі
topic_facet Паралельне програмування. Розподілені системи і мережі
url https://nasplib.isofts.kiev.ua/handle/123456789/188628
work_keys_str_mv AT rahozindv performanceanalysisofmassivelyparallelprogramsforgraphicsprocessingunits
AT rahozindv analízšvidkodíímasivnoparalelʹnihprogramdlâgrafíčnihprocesorív