Modern Videoadapter Architectures. GPGPU Technology (Part 2)

General principles of a shared and distributed memory are described in detail for NVidia CUDA technology. Basic patterns of the thread interaction and globals synchronization problems are analyzed. A comparative analysis of the main GPGPU technologies — Nvidia CUDA, OpenCL, Direct Compute — has been...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2013
Автори: Pogorilyy, S. D., Vitel, D. Yu., Vereshchynsky, O. A.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут проблем реєстрації інформації НАН України 2013
Теми:
Онлайн доступ:http://drsp.ipri.kiev.ua/article/view/103367
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Data Recording, Storage & Processing

Репозитарії

Data Recording, Storage & Processing
id drspiprikievua-article-103367
record_format ojs
spelling drspiprikievua-article-1033672020-12-30T22:57:49Z Modern Videoadapter Architectures. GPGPU Technology (Part 2) Новейшие архитектуры видеоадаптеров. Технология GPGPU (Часть 2) Новітні архітектури відеоадаптерів. Технологія GPGPU. Частина 2 Pogorilyy, S. D. Vitel, D. Yu. Vereshchynsky, O. A. General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instruction Multiple Data (SIMD) Single In¬struction Multiple Threads (SIMT) shaders Message Passing Interface (MPI) hierarchical thread organi¬zation synchronization model memory model heterogeneous distributed systems dynamical parallelism dynamical memory allocation videoadapter architectures (Tesla Fermi Kepler) General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instruction Multiple Data (SIMD) Single Instruction Multiple Threads (SIMT) шейдеры Message Passing Interface (MPI) иерархическая организация потоков модель синхронизации модель памяти гетерогенные распределенные системы динамический параллелизм динамическое выделение памяти архитектуры видеоадаптеров (Tesla Fermi Kepler) General-purpose graphics processing units (GPGPU) NVidia Compute Unified Device Architecture (CUDA) DirectCompute OpenCL Single Instraction Multile Data (SIMD) Single Instraction Multiple Threads (SIMT) шейдери Message Passing Interface (MPI) ієрархічна організація потоків модель синхронізації модель пам’яті гетерогенні розподілені системи динамічний паралелізм динамічне виділення пам’яті архітектури відеоадаптерів (Tesla Fermi Kepler) General principles of a shared and distributed memory are described in detail for NVidia CUDA technology. Basic patterns of the thread interaction and globals synchronization problems are analyzed. A comparative analysis of the main GPGPU technologies — Nvidia CUDA, OpenCL, Direct Compute — has been provided. Tabl.: 3. Fig.: 3. Refs: 9 titles. Подробно рассмотрены основные принципы работы с обтей и распределенной памятью в технологии NVidia CUDA. Описаны шаблоны взаимодействия потоков и проблемы глобальной синхнронизации. Проведен сравнительный анализ основных технологий, используемых в подходе GPGPU — Nvidia CUDA, OpenCL, Direct Compute. Табл.: 3. Іл.: 3. Бібліогр.: 9 найм. Детально розглянуто основні принципи роботи зі спільною та розподіленою пам’яттю в технології NVidia CUDA. Описано шаблони взаємодії потоків і проблеми глобальної синхронізації. Проведено порівняльний аналіз основних технологій, що використовуються в підході GPGPU — Nvidia CUDA, OpenCL, Direct Compute. Інститут проблем реєстрації інформації НАН України 2013-04-04 Article Article Рецензована Стаття application/pdf http://drsp.ipri.kiev.ua/article/view/103367 10.35681/1560-9189.2013.15.1.103367 Data Recording, Storage & Processing; Vol. 15 No. 1 (2013); 71-81 Регистрация, хранение и обработка данных; Том 15 № 1 (2013); 71-81 Реєстрація, зберігання і обробка даних; Том 15 № 1 (2013); 71-81 1560-9189 uk http://drsp.ipri.kiev.ua/article/view/103367/98513 Авторське право (c) 2013 Реєстрація, зберігання і обробка даних
institution Data Recording, Storage & Processing
collection OJS
language Ukrainian
topic General-purpose graphics processing units (GPGPU)
NVidia Compute Unified Device Architecture (CUDA)
DirectCompute
OpenCL
Single Instruction Multiple Data (SIMD)
Single In¬struction Multiple Threads (SIMT)
shaders
Message Passing Interface (MPI)
hierarchical thread organi¬zation
synchronization model
memory model
heterogeneous distributed systems
dynamical parallelism
dynamical memory allocation
videoadapter architectures (Tesla
Fermi
Kepler)
General-purpose graphics processing units (GPGPU)
NVidia Compute Unified Device Architecture (CUDA)
DirectCompute
OpenCL
Single Instruction Multiple Data (SIMD)
Single Instruction Multiple Threads (SIMT)
шейдеры
Message Passing Interface (MPI)
иерархическая организация потоков
модель синхронизации
модель памяти
гетерогенные распределенные системы
динамический параллелизм
динамическое выделение памяти
архитектуры видеоадаптеров (Tesla
Fermi
Kepler)
General-purpose graphics processing units (GPGPU)
NVidia Compute Unified Device Architecture (CUDA)
DirectCompute
OpenCL
Single Instraction Multile Data (SIMD)
Single Instraction Multiple Threads (SIMT)
шейдери
Message Passing Interface (MPI)
ієрархічна організація потоків
модель синхронізації
модель пам’яті
гетерогенні розподілені системи
динамічний паралелізм
динамічне виділення пам’яті
архітектури відеоадаптерів (Tesla
Fermi
Kepler)
spellingShingle General-purpose graphics processing units (GPGPU)
NVidia Compute Unified Device Architecture (CUDA)
DirectCompute
OpenCL
Single Instruction Multiple Data (SIMD)
Single In¬struction Multiple Threads (SIMT)
shaders
Message Passing Interface (MPI)
hierarchical thread organi¬zation
synchronization model
memory model
heterogeneous distributed systems
dynamical parallelism
dynamical memory allocation
videoadapter architectures (Tesla
Fermi
Kepler)
General-purpose graphics processing units (GPGPU)
NVidia Compute Unified Device Architecture (CUDA)
DirectCompute
OpenCL
Single Instruction Multiple Data (SIMD)
Single Instruction Multiple Threads (SIMT)
шейдеры
Message Passing Interface (MPI)
иерархическая организация потоков
модель синхронизации
модель памяти
гетерогенные распределенные системы
динамический параллелизм
динамическое выделение памяти
архитектуры видеоадаптеров (Tesla
Fermi
Kepler)
General-purpose graphics processing units (GPGPU)
NVidia Compute Unified Device Architecture (CUDA)
DirectCompute
OpenCL
Single Instraction Multile Data (SIMD)
Single Instraction Multiple Threads (SIMT)
шейдери
Message Passing Interface (MPI)
ієрархічна організація потоків
модель синхронізації
модель пам’яті
гетерогенні розподілені системи
динамічний паралелізм
динамічне виділення пам’яті
архітектури відеоадаптерів (Tesla
Fermi
Kepler)
Pogorilyy, S. D.
Vitel, D. Yu.
Vereshchynsky, O. A.
Modern Videoadapter Architectures. GPGPU Technology (Part 2)
topic_facet General-purpose graphics processing units (GPGPU)
NVidia Compute Unified Device Architecture (CUDA)
DirectCompute
OpenCL
Single Instruction Multiple Data (SIMD)
Single In¬struction Multiple Threads (SIMT)
shaders
Message Passing Interface (MPI)
hierarchical thread organi¬zation
synchronization model
memory model
heterogeneous distributed systems
dynamical parallelism
dynamical memory allocation
videoadapter architectures (Tesla
Fermi
Kepler)
General-purpose graphics processing units (GPGPU)
NVidia Compute Unified Device Architecture (CUDA)
DirectCompute
OpenCL
Single Instruction Multiple Data (SIMD)
Single Instruction Multiple Threads (SIMT)
шейдеры
Message Passing Interface (MPI)
иерархическая организация потоков
модель синхронизации
модель памяти
гетерогенные распределенные системы
динамический параллелизм
динамическое выделение памяти
архитектуры видеоадаптеров (Tesla
Fermi
Kepler)
General-purpose graphics processing units (GPGPU)
NVidia Compute Unified Device Architecture (CUDA)
DirectCompute
OpenCL
Single Instraction Multile Data (SIMD)
Single Instraction Multiple Threads (SIMT)
шейдери
Message Passing Interface (MPI)
ієрархічна організація потоків
модель синхронізації
модель пам’яті
гетерогенні розподілені системи
динамічний паралелізм
динамічне виділення пам’яті
архітектури відеоадаптерів (Tesla
Fermi
Kepler)
format Article
author Pogorilyy, S. D.
Vitel, D. Yu.
Vereshchynsky, O. A.
author_facet Pogorilyy, S. D.
Vitel, D. Yu.
Vereshchynsky, O. A.
author_sort Pogorilyy, S. D.
title Modern Videoadapter Architectures. GPGPU Technology (Part 2)
title_short Modern Videoadapter Architectures. GPGPU Technology (Part 2)
title_full Modern Videoadapter Architectures. GPGPU Technology (Part 2)
title_fullStr Modern Videoadapter Architectures. GPGPU Technology (Part 2)
title_full_unstemmed Modern Videoadapter Architectures. GPGPU Technology (Part 2)
title_sort modern videoadapter architectures. gpgpu technology (part 2)
title_alt Новейшие архитектуры видеоадаптеров. Технология GPGPU (Часть 2)
Новітні архітектури відеоадаптерів. Технологія GPGPU. Частина 2
description General principles of a shared and distributed memory are described in detail for NVidia CUDA technology. Basic patterns of the thread interaction and globals synchronization problems are analyzed. A comparative analysis of the main GPGPU technologies — Nvidia CUDA, OpenCL, Direct Compute — has been provided. Tabl.: 3. Fig.: 3. Refs: 9 titles.
publisher Інститут проблем реєстрації інформації НАН України
publishDate 2013
url http://drsp.ipri.kiev.ua/article/view/103367
work_keys_str_mv AT pogorilyysd modernvideoadapterarchitecturesgpgputechnologypart2
AT viteldyu modernvideoadapterarchitecturesgpgputechnologypart2
AT vereshchynskyoa modernvideoadapterarchitecturesgpgputechnologypart2
AT pogorilyysd novejšiearhitekturyvideoadapterovtehnologiâgpgpučastʹ2
AT viteldyu novejšiearhitekturyvideoadapterovtehnologiâgpgpučastʹ2
AT vereshchynskyoa novejšiearhitekturyvideoadapterovtehnologiâgpgpučastʹ2
AT pogorilyysd novítníarhítekturivídeoadapterívtehnologíâgpgpučastina2
AT viteldyu novítníarhítekturivídeoadapterívtehnologíâgpgpučastina2
AT vereshchynskyoa novítníarhítekturivídeoadapterívtehnologíâgpgpučastina2
first_indexed 2024-04-21T19:33:23Z
last_indexed 2024-04-21T19:33:23Z
_version_ 1796974055431077888