Modern Videoadapter Architectures. GPGPU Technology (Part 2)
General principles of a shared and distributed memory are described in detail for NVidia CUDA technology. Basic patterns of the thread interaction and globals synchronization problems are analyzed. A comparative analysis of the main GPGPU technologies — Nvidia CUDA, OpenCL, Direct Compute — has been...
Збережено в:
Дата: | 2013 |
---|---|
Автори: | , , |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
Інститут проблем реєстрації інформації НАН України
2013
|
Теми: | |
Онлайн доступ: | http://drsp.ipri.kiev.ua/article/view/103367 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Data Recording, Storage & Processing |
Репозитарії
Data Recording, Storage & Processingid |
drspiprikievua-article-103367 |
---|---|
record_format |
ojs |
spelling |
drspiprikievua-article-1033672020-12-30T22:57:49Z Modern Videoadapter Architectures. GPGPU Technology (Part 2) Новейшие архитектуры видеоадаптеров. Технология GPGPU (Часть 2) Новітні архітектури відеоадаптерів. Технологія GPGPU. Частина 2 Pogorilyy, S. D. Vitel, D. Yu. Vereshchynsky, O. A. General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instruction Multiple Data (SIMD) Single In¬struction Multiple Threads (SIMT) shaders Message Passing Interface (MPI) hierarchical thread organi¬zation synchronization model memory model heterogeneous distributed systems dynamical parallelism dynamical memory allocation videoadapter architectures (Tesla Fermi Kepler) General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instruction Multiple Data (SIMD) Single Instruction Multiple Threads (SIMT) шейдеры Message Passing Interface (MPI) иерархическая организация потоков модель синхронизации модель памяти гетерогенные распределенные системы динамический параллелизм динамическое выделение памяти архитектуры видеоадаптеров (Tesla Fermi Kepler) General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instraction Multile Data (SIMD) Single Instraction Multiple Threads (SIMT) шейдери Message Passing Interface (MPI) ієрархічна організація потоків модель синхронізації модель пам’яті гетерогенні розподілені системи динамічний паралелізм динамічне виділення пам’яті архітектури відеоадаптерів (Tesla Fermi Kepler) General principles of a shared and distributed memory are described in detail for NVidia CUDA technology. Basic patterns of the thread interaction and globals synchronization problems are analyzed. A comparative analysis of the main GPGPU technologies — Nvidia CUDA, OpenCL, Direct Compute — has been provided. Tabl.: 3. Fig.: 3. Refs: 9 titles. Подробно рассмотрены основные принципы работы с обтей и распределенной памятью в технологии NVidia CUDA. Описаны шаблоны взаимодействия потоков и проблемы глобальной синхнронизации. Проведен сравнительный анализ основных технологий, используемых в подходе GPGPU — Nvidia CUDA, OpenCL, Direct Compute. Табл.: 3. Іл.: 3. Бібліогр.: 9 найм. Детально розглянуто основні принципи роботи зі спільною та розподіленою пам’яттю в технології NVidia CUDA. Описано шаблони взаємодії потоків і проблеми глобальної синхронізації. Проведено порівняльний аналіз основних технологій, що використовуються в підході GPGPU — Nvidia CUDA, OpenCL, Direct Compute. Інститут проблем реєстрації інформації НАН України 2013-04-04 Article Article Рецензована Стаття application/pdf http://drsp.ipri.kiev.ua/article/view/103367 10.35681/1560-9189.2013.15.1.103367 Data Recording, Storage & Processing; Vol. 15 No. 1 (2013); 71-81 Регистрация, хранение и обработка данных; Том 15 № 1 (2013); 71-81 Реєстрація, зберігання і обробка даних; Том 15 № 1 (2013); 71-81 1560-9189 uk http://drsp.ipri.kiev.ua/article/view/103367/98513 Авторське право (c) 2013 Реєстрація, зберігання і обробка даних |
institution |
Data Recording, Storage & Processing |
collection |
OJS |
language |
Ukrainian |
topic |
General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instruction Multiple Data (SIMD) Single In¬struction Multiple Threads (SIMT) shaders Message Passing Interface (MPI) hierarchical thread organi¬zation synchronization model memory model heterogeneous distributed systems dynamical parallelism dynamical memory allocation videoadapter architectures (Tesla Fermi Kepler) General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instruction Multiple Data (SIMD) Single Instruction Multiple Threads (SIMT) шейдеры Message Passing Interface (MPI) иерархическая организация потоков модель синхронизации модель памяти гетерогенные распределенные системы динамический параллелизм динамическое выделение памяти архитектуры видеоадаптеров (Tesla Fermi Kepler) General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instraction Multile Data (SIMD) Single Instraction Multiple Threads (SIMT) шейдери Message Passing Interface (MPI) ієрархічна організація потоків модель синхронізації модель пам’яті гетерогенні розподілені системи динамічний паралелізм динамічне виділення пам’яті архітектури відеоадаптерів (Tesla Fermi Kepler) |
spellingShingle |
General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instruction Multiple Data (SIMD) Single In¬struction Multiple Threads (SIMT) shaders Message Passing Interface (MPI) hierarchical thread organi¬zation synchronization model memory model heterogeneous distributed systems dynamical parallelism dynamical memory allocation videoadapter architectures (Tesla Fermi Kepler) General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instruction Multiple Data (SIMD) Single Instruction Multiple Threads (SIMT) шейдеры Message Passing Interface (MPI) иерархическая организация потоков модель синхронизации модель памяти гетерогенные распределенные системы динамический параллелизм динамическое выделение памяти архитектуры видеоадаптеров (Tesla Fermi Kepler) General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instraction Multile Data (SIMD) Single Instraction Multiple Threads (SIMT) шейдери Message Passing Interface (MPI) ієрархічна організація потоків модель синхронізації модель пам’яті гетерогенні розподілені системи динамічний паралелізм динамічне виділення пам’яті архітектури відеоадаптерів (Tesla Fermi Kepler) Pogorilyy, S. D. Vitel, D. Yu. Vereshchynsky, O. A. Modern Videoadapter Architectures. GPGPU Technology (Part 2) |
topic_facet |
General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instruction Multiple Data (SIMD) Single In¬struction Multiple Threads (SIMT) shaders Message Passing Interface (MPI) hierarchical thread organi¬zation synchronization model memory model heterogeneous distributed systems dynamical parallelism dynamical memory allocation videoadapter architectures (Tesla Fermi Kepler) General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instruction Multiple Data (SIMD) Single Instruction Multiple Threads (SIMT) шейдеры Message Passing Interface (MPI) иерархическая организация потоков модель синхронизации модель памяти гетерогенные распределенные системы динамический параллелизм динамическое выделение памяти архитектуры видеоадаптеров (Tesla Fermi Kepler) General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instraction Multile Data (SIMD) Single Instraction Multiple Threads (SIMT) шейдери Message Passing Interface (MPI) ієрархічна організація потоків модель синхронізації модель пам’яті гетерогенні розподілені системи динамічний паралелізм динамічне виділення пам’яті архітектури відеоадаптерів (Tesla Fermi Kepler) |
format |
Article |
author |
Pogorilyy, S. D. Vitel, D. Yu. Vereshchynsky, O. A. |
author_facet |
Pogorilyy, S. D. Vitel, D. Yu. Vereshchynsky, O. A. |
author_sort |
Pogorilyy, S. D. |
title |
Modern Videoadapter Architectures. GPGPU Technology (Part 2) |
title_short |
Modern Videoadapter Architectures. GPGPU Technology (Part 2) |
title_full |
Modern Videoadapter Architectures. GPGPU Technology (Part 2) |
title_fullStr |
Modern Videoadapter Architectures. GPGPU Technology (Part 2) |
title_full_unstemmed |
Modern Videoadapter Architectures. GPGPU Technology (Part 2) |
title_sort |
modern videoadapter architectures. gpgpu technology (part 2) |
title_alt |
Новейшие архитектуры видеоадаптеров. Технология GPGPU (Часть 2) Новітні архітектури відеоадаптерів. Технологія GPGPU. Частина 2 |
description |
General principles of a shared and distributed memory are described in detail for NVidia CUDA technology. Basic patterns of the thread interaction and globals synchronization problems are analyzed. A comparative analysis of the main GPGPU technologies — Nvidia CUDA, OpenCL, Direct Compute — has been provided. Tabl.: 3. Fig.: 3. Refs: 9 titles. |
publisher |
Інститут проблем реєстрації інформації НАН України |
publishDate |
2013 |
url |
http://drsp.ipri.kiev.ua/article/view/103367 |
work_keys_str_mv |
AT pogorilyysd modernvideoadapterarchitecturesgpgputechnologypart2 AT viteldyu modernvideoadapterarchitecturesgpgputechnologypart2 AT vereshchynskyoa modernvideoadapterarchitecturesgpgputechnologypart2 AT pogorilyysd novejšiearhitekturyvideoadapterovtehnologiâgpgpučastʹ2 AT viteldyu novejšiearhitekturyvideoadapterovtehnologiâgpgpučastʹ2 AT vereshchynskyoa novejšiearhitekturyvideoadapterovtehnologiâgpgpučastʹ2 AT pogorilyysd novítníarhítekturivídeoadapterívtehnologíâgpgpučastina2 AT viteldyu novítníarhítekturivídeoadapterívtehnologíâgpgpučastina2 AT vereshchynskyoa novítníarhítekturivídeoadapterívtehnologíâgpgpučastina2 |
first_indexed |
2024-04-21T19:33:23Z |
last_indexed |
2024-04-21T19:33:23Z |
_version_ |
1796974055431077888 |