Performance analysis of massively parallel programs for graphics processing units
Any modern Graphics Processing Unit (graphics card) is a good platform to run massively parallel programs. Still, we lack tools to observe and measure performance characteristics of GPU-based software. We state that due to complex memory hierarchy and thousands of execution threads the all performan...
Збережено в:
| Опубліковано в: : | Проблеми програмування |
|---|---|
| Дата: | 2022 |
| Автор: | |
| Формат: | Стаття |
| Мова: | Англійська |
| Опубліковано: |
Інститут програмних систем НАН України
2022
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/188628 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Performance analysis of massively parallel programs for graphics processing units / D.V. Rahozin // Проблеми програмування. — 2022. — № 3-4. — С. 51-58. — Бібліогр.: 10 назв. — англ. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1862692173209665536 |
|---|---|
| author | Rahozin, D.V. |
| author_facet | Rahozin, D.V. |
| citation_txt | Performance analysis of massively parallel programs for graphics processing units / D.V. Rahozin // Проблеми програмування. — 2022. — № 3-4. — С. 51-58. — Бібліогр.: 10 назв. — англ. |
| collection | DSpace DC |
| container_title | Проблеми програмування |
| description | Any modern Graphics Processing Unit (graphics card) is a good platform to run massively parallel programs. Still, we lack tools to observe and measure performance characteristics of GPU-based software. We state that due to complex memory hierarchy and thousands of execution threads the all performance issues are about efficient use of graphics card memory hierarchy. We propose to use GPGPUSim simulator, previously used mostly for graphics card architecture validation, for performance validation for CUDA-based program. We provide examples which show how to use the simulation for performance analysis of massively parallel programs.
Будь-яка сучасна графічна карта є цікавою платформою для запуску масивно паралельних програм. Проте, у нас дуже мало засобів для вимірювання та аналізу швидкодії такого програмного забезпечення. До того ж графічні карти мають складну ієрархію підсистеми пам’яті та тисячі потоків, що виконуються, тому всі питання швидкодії зводяться до ефективного використання ієрархії пам’яті графічної карти. Ми пропонуємо використовувати GPGPUSim — симулятор, розроблений для валідації архітектурних мрделей графічних карт — для аналізу швидкодії CUDA-програм. Наведено приклади аналізу результатів симуляції і визначення характеристик масивно паралельної програми.
|
| first_indexed | 2025-12-07T16:18:00Z |
| format | Article |
| fulltext | |
| id | nasplib_isofts_kiev_ua-123456789-188628 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1727-4907 |
| language | English |
| last_indexed | 2025-12-07T16:18:00Z |
| publishDate | 2022 |
| publisher | Інститут програмних систем НАН України |
| record_format | dspace |
| spelling | Rahozin, D.V. 2023-03-10T18:04:26Z 2023-03-10T18:04:26Z 2022 Performance analysis of massively parallel programs for graphics processing units / D.V. Rahozin // Проблеми програмування. — 2022. — № 3-4. — С. 51-58. — Бібліогр.: 10 назв. — англ. 1727-4907 DOI: https://doi.org/10.15407/pp2022.03-04.051 https://nasplib.isofts.kiev.ua/handle/123456789/188628 681.3 Any modern Graphics Processing Unit (graphics card) is a good platform to run massively parallel programs. Still, we lack tools to observe and measure performance characteristics of GPU-based software. We state that due to complex memory hierarchy and thousands of execution threads the all performance issues are about efficient use of graphics card memory hierarchy. We propose to use GPGPUSim simulator, previously used mostly for graphics card architecture validation, for performance validation for CUDA-based program. We provide examples which show how to use the simulation for performance analysis of massively parallel programs. Будь-яка сучасна графічна карта є цікавою платформою для запуску масивно паралельних програм. Проте, у нас дуже мало засобів для вимірювання та аналізу швидкодії такого програмного забезпечення. До того ж графічні карти мають складну ієрархію підсистеми пам’яті та тисячі потоків, що виконуються, тому всі питання швидкодії зводяться до ефективного використання ієрархії пам’яті графічної карти. Ми пропонуємо використовувати GPGPUSim — симулятор, розроблений для валідації архітектурних мрделей графічних карт — для аналізу швидкодії CUDA-програм. Наведено приклади аналізу результатів симуляції і визначення характеристик масивно паралельної програми. en Інститут програмних систем НАН України Проблеми програмування Паралельне програмування. Розподілені системи і мережі Performance analysis of massively parallel programs for graphics processing units Аналіз швидкодії масивно паралельних програм для графічних процесорів Article published earlier |
| spellingShingle | Performance analysis of massively parallel programs for graphics processing units Rahozin, D.V. Паралельне програмування. Розподілені системи і мережі |
| title | Performance analysis of massively parallel programs for graphics processing units |
| title_alt | Аналіз швидкодії масивно паралельних програм для графічних процесорів |
| title_full | Performance analysis of massively parallel programs for graphics processing units |
| title_fullStr | Performance analysis of massively parallel programs for graphics processing units |
| title_full_unstemmed | Performance analysis of massively parallel programs for graphics processing units |
| title_short | Performance analysis of massively parallel programs for graphics processing units |
| title_sort | performance analysis of massively parallel programs for graphics processing units |
| topic | Паралельне програмування. Розподілені системи і мережі |
| topic_facet | Паралельне програмування. Розподілені системи і мережі |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/188628 |
| work_keys_str_mv | AT rahozindv performanceanalysisofmassivelyparallelprogramsforgraphicsprocessingunits AT rahozindv analízšvidkodíímasivnoparalelʹnihprogramdlâgrafíčnihprocesorív |