Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений
Рассмотрена задача моделирования переноса загрязнений в атмосфере на основе нестационарного уравнения конвективной диффузии в двух- и трехмерной постановке. Для вычислительной схемы, базирующейся на методах расщепления с использованием явных разностных схем бегущего счета, разработаны параллельные а...
Saved in:
| Published in: | Управляющие системы и машины |
|---|---|
| Date: | 2014 |
| Main Authors: | , |
| Format: | Article |
| Language: | Russian |
| Published: |
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
2014
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/83535 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений / А.В. Гладкий, В.А. Богаенко // Управляющие системы и машины. — 2014. — № 6. — С. 18-26. — Бібліогр.: 18 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859809632113917952 |
|---|---|
| author | Гладкий, А.В. Богаенко, В.А. |
| author_facet | Гладкий, А.В. Богаенко, В.А. |
| citation_txt | Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений / А.В. Гладкий, В.А. Богаенко // Управляющие системы и машины. — 2014. — № 6. — С. 18-26. — Бібліогр.: 18 назв. — рос. |
| collection | DSpace DC |
| container_title | Управляющие системы и машины |
| description | Рассмотрена задача моделирования переноса загрязнений в атмосфере на основе нестационарного уравнения конвективной диффузии в двух- и трехмерной постановке. Для вычислительной схемы, базирующейся на методах расщепления с использованием явных разностных схем бегущего счета, разработаны параллельные алгоритмы для графических процессоров и получены теоретические оценки времени их работы.
Modelling of pollution transfer in atmosphere has been considered on the base of unsteady convection-diffusion equation in two- and three-dimensional formulation. Parallel algorithms for graphical processors have been developed for computational scheme based on explicit finite-difference splitting methods. Theoretical estimations of algorithms execution time have been obtained.
Розглянуто задачу моделювання переносу забруднень в атмосфері на основі нестаціонарного рівняння конвективної дифузії у дво- та тривимірній постановці. Для обчислювальної схеми, що базується на методах розщеплення з використанням явних різницевих схем біжучої хвилі, розроблено паралельні алгоритми для графічних процесорів та отримано теоретичні оцінки часу їх роботи.
|
| first_indexed | 2025-12-07T15:17:54Z |
| format | Article |
| fulltext |
18 УСиМ, 2014, № 6
Новые методы в информатике
УДК 517:519.6
А.В. Гладкий, В.А. Богаенко
Моделирование переноса загрязнений в атмосфере
с использованием параллельных вычислений
Рассмотрена задача моделирования переноса загрязнений в атмосфере на основе нестационарного уравнения конвективной диффу-
зии в двух- и трехмерной постановке. Для вычислительной схемы, базирующейся на методах расщепления с использованием явных
разностных схем бегущего счета, разработаны параллельные алгоритмы для графических процессоров и получены теоретические
оценки времени их работы.
Modelling of pollution transfer in atmosphere has been considered on the base of unsteady convection-diffusion equation in two- and
three-dimensional formulation. Parallel algorithms for graphical processors have been developed for computational scheme based on
explicit finite-difference splitting methods. Theoretical estimations of algorithms execution time have been obtained.
Розглянуто задачу моделювання переносу забруднень в атмосфері на основі нестаціонарного рівняння конвективної дифузії у дво- та
тривимірній постановці. Для обчислювальної схеми, що базується на методах розщеплення з використанням явних різницевих схем
біжучої хвилі, розроблено паралельні алгоритми для графічних процесорів та отримано теоретичні оцінки часу їх роботи.
Введение. Математическое моделирование и
вычислительный эксперимент становятся ос-
новными способами изучения процессов пере-
носа загрязняющих веществ в экосистемах [1–
6]. Компьютерная реализация математических
моделей, включающих многомерные уравнения
конвективной диффузии, основана на приме-
нении нетривиальных вычислительных алго-
ритмов и требует использования высокопроиз-
водительных вычислительных средств, в част-
ности, многопроцессорных кластерных систем
и систем с графическими процессорами.
Постановка задачи
Целью статьи – построение параллельных
алгоритмов расщепления для решения задач
переноса загрязнений в атмосфере с использо-
ванием метеорологических данных или модели
потенциального течения перемещения воз-
душных масс. Вычислительная схема решения
многомерных задач основана на методах рас-
щепления [7, 8] с использованием явных раз-
ностных схем бегущего счета, что позволяет
существенно снизить сложность дискретных
алгоритмов и применять технологию парал-
лельных вычислений для их реализации на
ЭВМ.
Кроме того, разработаны параллельные ал-
горитмы для графических процессоров (GPU),
получены теоретические оценки времени их
работы, позволяющие выбирать оптимальную
с учетом быстродействия схему организации
вычислений. Отметим, что большинство па-
раллельных (в том числе для GPU) алгоритмов
разработаны для неявных схем расщепления
[9–14], а существующие параллельные алго-
ритмы для явных схем разработаны преиму-
щественно для систем с распределенной памя-
тью [15].
Математическая модель переноса и транс-
формации примесей
Для моделирования нестационарного про-
цесса конвективно-диффузионного распростра-
нения вредных веществ в атмосфере, произ-
водственных помещениях, на промплощадках и
других объектах будем использовать уравнение
миграции примеси [1, 2, 6, 8]
C
z
C
w
y
C
v
x
C
u
t
C
)()()( 321 z
C
zy
C
yx
C
x
(1)
),,,( tzyxf , ,),,( Gzyx ],0( Tt ,
где ),,( zyxx – декартовы координаты,
),,,( tzyxC – концентрация примеси, ( ),(xu
)(),( xx wv ) – компоненты вектора скорости воз-
УСиМ, 2014, № 6 19
душных масс ),,( wvuV , ),,( 321 – коэф-
фициенты турбулентной диффузии, – коэф-
фициент трансформации примеси, ),,,( tzyxf –
функция, характеризующая распределение ис-
точников загрязнения, G – область с цилинд-
рической поверхностью G, состоящей из бо-
ковой поверхности , нижнего основания
0 (при )0z и верхнего основания H (при
)Hz .
Компоненты вектора скорости воздушного
потока ),,( wvuV удовлетворяют уравнению
неразрывности (условию несжимаемости среды)
0div
z
w
y
v
x
u
V . (2)
В случае постоянно действующих точечных
источников загрязнения или залповых аэро-
зольных выбросов в атмосферу в моменты
времени Niti ,1, правую часть уравнений (1),
(3) целесообразно представить в виде
N
i
iiii zzyyxxQzyxf
1
),,( ,
N
i
iiiii ttzzyyxxQ
tzyxf
1
)(
),,,(
соответственно, где iQ – интенсивность выброса
вредного вещества от i-го источника; () – дель-
та-функция Дирака; Nizyx iii ,1),,,( – коор-
динаты точечных источников примеси.
Уравнение (1) следует дополнить началь-
ным и граничными условиями [1, 8].
При исследовании переноса и рассеивания
загрязнений в промышленных зонах с учетом
влияния рельефа местности возникает необ-
ходимость расчета компонентов вектора ско-
рости перемещения воздушных масс. Про-
стейшая модель для описания поля скоростей
есть модель потенциального течения, тогда
pgradV , где ),,( zyxpp – потенциал ско-
рости. В результате, с учетом уравнения (2),
для p получаем уравнение Лапласа
0
2
2
2
2
2
2
z
p
y
p
x
p
p . (3)
Для однозначного решения уравнения (3)
задаются следующие граничные условия. На
твердых стенках производная потенциала по
направлению единичной внешней нормали n
равняется нулю, поэтому 0/ np . На грани-
це попадания воздушного потока значение
нормальной компоненты его скорости nV из-
вестно, поэтому nVnp / . На участке выте-
кания воздуха задают значение потенциала
скорости зpp .
Двухшаговая схема расщепления для рас-
чета потенциального течения
Следуя идее установления [16], для решения
(3) в области ,0,0 21 lylxGG
30 lz рассмотрим схему расщепления для
неоднородного нестационарного уравнения
),,( zyxfAp
t
p
, pAp (4)
с граничным условием первого рода и произ-
вольным начальным условием. Представим опе-
ратор A в виде 2,1,5,0,21 iAAAA i .
Тогда, в результате последовательного реше-
ния двух вспомогательных задач
),,,(),,,(,5,0 111
1 tzyxptzyxpfpA
t
p
, (5)
)ˆ,,,(),,,(,5,0 1222
2 tzyxptzyxpfpA
t
p
, (6)
получаем решение уравнения (4) в момент
времени tt̂ с погрешностью )( 2O [17].
Для численного исследования нестационар-
ных уравнений (5), (6) в области G введем про-
странственную равномерную сетку ( ji yihx ,1
32, khzjh k ). Во внутренних узлах ),,( kji zyx
в момент времени ntt n уравнениям (5),
(6) поставим в соответствие неявную разност-
ную схему
fn
zz
n
yy
n
xxt 5,05,0 111 , (7)
где – сеточная функция, и используются
общепринятые обозначения теории разност-
ных схем [8, 16]. На первом шаге явную схему
бегущего счета
20 УСиМ, 2014, № 6
f
hh
h
n
z
n
z
n
y
n
y
n
x
n
xt
5,0
11
1
2
1
1
3
1
2
1
1
(8)
можно получить, заменяя в уравнении (7)
операторы 111 ,, n
z
n
y
n
x их соответствую-
щими в предыдущий момент времени t = tn.
На втором шаге разностную схему получим,
заменяя в (7) операторы 111 ,, n
z
n
y
n
x выра-
жениями n
z
n
y
n
x ,, :
.5,0
11
1
2
1
1
3
1
2
1
1
f
hh
h
n
z
n
z
n
y
n
y
n
x
n
xt
(9)
При этом решение уравнения (8) при t = tn+1 –
стартовое для разностного уравнения (9).
Расщепляя интервал между точками tn и
tn+1 на две равные части с промежуточной точ-
кой tn+1/2, двуxшаговую схему можно записать
в виде
,5,0
11
1
2
11
2/1
3
2/1
2
2/1
1
2/1
f
hh
h
n
z
n
z
n
y
n
y
n
x
n
x
nn
(10)
.5,0
11
1
2
11
2/11
3
2/11
2
2/11
1
2/11
f
hh
h
n
z
n
z
n
y
n
y
n
x
n
x
nn
(11)
В совокупности они составляют разностную
схему бегущего счета, аппроксимирующую ис-
ходную дифференциальную задачу с погрешно-
стью O(h
2
+ 2
+ 2
/ h
2). Поэтому точность
получаемых результатов зависит от соотноше-
ния шагов сетки.
Двухшаговая схема расщепления для за-
дачи конвекции–диффузии
Эту схему рассмотрим в области GG
={0 x l1, 0 y l2} на примере двумерного
уравнения конвективной диффузии
),(
2
2
2
2
yxf
y
C
x
C
C
y
C
v
x
C
u
t
C
(12)
с начальным условием и однородным гра-
ничным условием первого рода. Представим
компоненты вектора скорости воздушного
потока ),( yxuu и ),( yxvv в виде u
uu , vvv , где ,05,0 uuu
u 05,0 uu , ,05,0 vvv v
05,0 vv .
Пусть – временной интервал между точ-
ками tn и tn+1. Аналогично предыдущему, схема
расщепления на дифференциальном уровне
принимает вид
,5,011
1 fCA
t
C
),,(1 n
nn tyxCCC ,
,5,022
2 fCA
t
C
1
2
11
12 , nnnn CCCC ,
где CC
y
C
v
x
C
uCA
221 , CA2
CC
y
C
v
x
C
u
22
.
Дифференциальные операторы 21, iAi во
внутренних узлах (xi, yj) h двумерной сетки
;,0,:),{( 11 Niihxxyx ihhh
}2,1,/;,0, 22 NlhNjjhyy j ап-
проксимируем, используя для этого конвек-
тивные слагаемые схемы с направленными
разностями [8]. В результате явную разност-
ную схему расщепления бегущего счета для
решения уравнения (12) можно получить в сле-
дующем виде
.
2
11
)1(
1
)1(
2
2
1
2
2
1
1
1
111
nn
y
n
y
n
x
n
x
nn
y
n
xt
f
h
R
h
R
vu
(13)
УСиМ, 2014, № 6 21
,
2
11
)1(
1
)1(
2
2
1
2
2
1
1
1
111
nn
y
n
y
n
x
n
x
nn
y
n
xt
f
h
R
h
R
vu
(14)
где
v
hR
u
hR 2211 , ,
211 , R
u
hR
v
h2 . При этом решение уравнения (13) в
момент времени 1 ntt – стартовое для урав-
нения (14).
Введя обозначения
,
1
)1(
1
)1(
2
2
1
2
2
1
1
1
1111
1
n
y
n
y
n
x
n
x
nn
y
n
x
n
h
R
h
R
vuL
1 1 1 1
2
1
1
1
1
2
2
2
1
(1 )
2
1
(1 ) ,
n n n n
x y
n n
x x
n n
y y
L u v
R
h
R
h
для реализации явной двухшаговой схемы
расщепления (13), (14) можно воспользовать-
ся следующим алгоритмом [17]:
0
2
11
1
1
1
nnn
t fL , ),,(
1
n
nn tyx , (15)
0
2
11
2
2
2
nnn
t fL , 1
2
11
12
, nnnn . (16)
Параллельные алгоритмы
Разностные схемы содержат естественный
параллелизм, который может быть использо-
ван при их реализации на GPU. Суть подхода
состоит в том, что к схемам бегущего счета
(10), (11) и (15), (16), алгоритмически предста-
вимым в виде двух вложенных циклов в кото-
рых для каждого узла сетки последовательно
проводятся вычисления, возможно применение
процедуры скашивания (loop skewing) [18]. По-
сле этого вычисления, проводимые во внут-
реннем цикле, становятся независимыми.
Разностные схемы бегущего счета позволя-
ют рассчитывать решение в узлах сетки рекур-
рентно через известные значения сеточной
функции в соседних узлах. При варьировании
размеров элементов геометрической декомпо-
зиции алгоритмические свойства не изменяют-
ся. Отмеченные свойства положены в основу
параллельных алгоритмов для систем с общей
памятью, в частности GPU. К недостаткам та-
ких параллельных алгоритмов можно отнести
неполное задействование вычислительных ре-
сурсов.
Алгоритм решения двумерных задач для
графических процессоров. Графические про-
цессоры (GPU) – высокопродуктивные парал-
лельные вычислительные системы, имеющие
ряд архитектурных особенностей, которые не-
обходимо учитывать при разработке парал-
лельных алгоритмов.
В рамках GPU блоки программного кода,
именуемые GPU-ядрами (kernel), исполняются
в массово-многопоточной среде, где каждый
поток – код, исполняемый последовательно и
обрабатывающий элементы данных согласно
своему номеру. Количество потоков, испол-
няющих GPU-kernel, обычно превышает коли-
чество потоков, которое GPU может испол-
нить параллельно. Это приводит к невозмож-
ности проводить глобальную синхронизацию
их исполнения и к необходимости декомпози-
ции алгоритма на фрагменты, которые воз-
можно выполнить параллельно без этой опера-
ции. При этом, однако, потоки могут органи-
зовываться в группы, в рамках которых реали-
зована операция барьерной синхронизации.
При распараллеливании рассматриваемых
вычислительных схем на GPU также возникает
необходимость учета специфики организации
памяти современных графических процессоров
– разделения ее на сравнительно медленную
глобальную и существенно более быструю ло-
кальную, для эффективного использования ко-
22 УСиМ, 2014, № 6
торой необходима совместная работа групп
потоков.
Без ограничения общности рассмотрим ал-
горитм для разностной схемы (15), распарал-
леливающий один ее шаг и применяемый как к
двух-, так и к четырехшаговым схемам.
1. Множество внутренних узлов hji yx ),(
двумерной сетки h разбивается на квадрат-
ные, кроме, возможно, граничных, блоки фик-
сированного размера LL , где 1L – целое.
2. Пусть NNNM ),1,1(max 21 min(N1 – 1,
N2 – 1), тогда на каждом из 1// LMLN
шагов ( x – операция округления веществен-
ного числа x до меньшего целого) выполня-
ются независимые вычисления по схеме (15) в
от единицы до LN / блоках узлов сетки. При
12 NN координаты узлов блоков лежат в
диапазоне от (iL + 1, (j – i)L + 1) до ((i + 1)L,
))1( Lij включительно, где j LN /,...,0
2/ LM – номер шага, i 1/,...,0 LN –
номер блока. В случае когда 21 NN , коорди-
наты узлов блоков будут лежать в диапазоне
от )1,1)(( iLLij до ))1(,)1(( LiLij .
Вычисления проводятся, если блок находит-
ся в пределах сетки, чем объясняется разное
количество обрабатываемых блоков в зави-
симости от номера шага. На каждом шаге уп-
равляющая программа, выполняемая на цен-
тральном процессоре, задает входные пара-
метры и запускает на GPU соответствующее
ядро (kernel).
3. GPU-kernel, отвечающий за исполнение
одного шага вычислений в п. 2, обрабатывает
данные построчно: каждый поток отвечает за
одну строку узлов в пределах блока. Потоки,
обрабатывающие строки в одном блоке, объ-
единяются в группу для ускорения вычисле-
ний путем использования локальной памяти.
Перед началом вычислений все необходимые
данные, используя возможности по объеди-
нению запросов к памяти, параллельно за-
гружаются в локальную память, а затем – в
глобальную.
4. При вычислениях в пределах каждой груп-
пы потоков используется схема, аналогичная
п. 2. Проводится 22,...,0 Lj шагов, на каж-
дом из которых поток 1,...,0 Li обрабаты-
вает узел ),( iji блока размера LL , после
чего проводится операция барьерной синхро-
низации.
Оценим время работы предложенного алго-
ритма (здесь и в дальнейшем без учета проце-
дур инициализации и сбора результатов).
Время, затраченное L -потоками на обра-
ботку блока размера LL , можно оценить как
)13)(12()165()(1 bclg tttLtLLT , (17)
где gt и lt – время исполнения всеми потоками
операций чтения или записи в глобальную и
локальную память соответственно, ct – время
обработки данных в одном узле сетки, bt –
время исполнения операции барьерной син-
хронизации.
В случае когда локальная память не исполь-
зуется, оценка (17) принимает вид
)13)(12()(1 bcgg tttLLT .
Пусть GPU позволяет параллельно испол-
нять bL потоков, где b – известное положи-
тельное целое. Тогда общее время работы
можно оценить как
).(1
/
1
12),,(
1
/
1
LT
b
LN
L
N
L
M
b
i
LMNT
LN
i
(18)
Оценка (18) упрощается
))(12()16
5(1/2),(
bcg ttLt
LLNLNT
(19)
при следующих допущениях: время доступа к
локальной памяти существенно меньше вре-
мени доступа к глобальной, и тогда значением
lt можно пренебречь; GPU исполняет все соз-
данные потоки одновременно, т.е. LNb / ;
M = N.
Функция ),( LNT при ],...,1[ NL имеет
один максимум, а ее минимум достигается при
УСиМ, 2014, № 6 23
1L или NL . Локальный минимум при
13N будет достигаться в точке NL и рав-
няться ))(12()45( bcg ttNtN . Так как зна-
чение L ограничено количеством вычислитель-
ных ресурсов видеокарты, а условие 13N
всегда выполняется для задач, требующих рас-
параллеливания, наилучшей стратегией выбо-
ра L будет его максимально возможное уве-
личение.
Алгоритмы решения трехмерных задач на
GPU. В случае таких задач в сеточной области
NlhNkkhzNj
jhyNiihx
j
jihhh
/;,0,;,0
,;,0,(:
332
211
предлагается два алгоритма организации вы-
числений:
разностная схема рассматривается как три
вложенных цикла, внутренние два из которых
могут быть распараллелены, используя алго-
ритмы для двумерных задач (алгоритм 1);
разностная схема рассматривается как три
вложенных цикла, к двум из которых применя-
ется операция скашивания (алгоритм 2).
Пусть ),1,1,1(max 321 NNNK N =
),1,1,1min( 321 NNN
).()(,1
),()(,1
),()(,1
1322313
1233212
2133121
NNNNNNN
NNNNNNN
NNNNNNN
M
Тогда, в первом случае, алгоритм для дву-
мерных задач модифицируется следующим
образом:
для трехмерной сетки размера N M K,
единицей вычислений в п. 2 алгоритма реше-
ния двумерных задач будут блоки размера
L L K;
вычисления в п. 4 проводятся последова-
тельно для слоев размера L L трехмерного
блока узлов сетки размера L L K с локаль-
ными координатами узлов от ),0,0( k до
),1,1( kLL , 1,...,0 Kk .
Время, затраченное L -потоками на обработку
блока размера LL в рамках блока размера
,KLL в этом случае можно оценить как
)14)(12()4815()(21 bclg tttLtLLT ,
а общее время работы (если GPU позволяет
параллельно исполнять bL потоков) как
.)(1
/
1
12),,,(
21
/
1
22
LT
b
LN
L
N
L
M
b
i
KLKMNT
LN
i
(20)
Если GPU способен исполнить все создан-
ные потоки одновременно, а KNM , оценка
(20) приобретает вид LNNLNT /2),(22
)(1– 21 LT .
Во втором случае, алгоритм, по аналогии с
двумерным, принимает следующий вид:
1. Множество внутренних узлов (xi, yj zk) h
разбивается на кубические (кроме, возможно,
граничных) блоки фиксированного размера
L L L.
2. На каждом из LKLMLN ///
2 шагов выполняются независимые вычис-
ления от единицы до LMLN // блоках.
При N1 N2 N3 координаты узлов блоков бу-
дут находиться в диапазоне от ,1,1( jLiL
)1)( Ljik до ,)1(,)1(( LjLi ))1( Ljik
включительно, где ,...,0k LMLN //
3/ LK – номер шага п. 2, ),( ji , ,...0i
1/..., LN , ,...,0j 1/ LM – номер бло-
ка. Вычисления проводятся только если блок
находится в пределах сетки. Для других случа-
ев п. 2 алгоритма может быть легко модифи-
цирован.
3. Для обработки каждого блока запускается
группа из L2 потоков.
4. При вычислениях в пределах каждой груп-
пы потоков используется схема, аналогичная
п. 2. На каждом шаге Lk 3,...,0 3, поток ),,( ji
1,...,0,1,...,0 LjLi обрабатывает узел ,,( ji
))( jik блока размера L L L, после чего
проводится операция барьерной синхронизации.
Время, затраченное L2-потоками на обра-
ботку блока размера LLL , можно оценить
как
24 УСиМ, 2014, № 6
)13)(13()165()(31 bclg tttLtLLT ,
а общее время работы, если GPU позволяет
параллельно исполнять 2bL потоков, как:
).(1
//
1
1
2/)1()2/)1/(//)//(
1
2/)1/(//
2
1
2/)1(
2(),,,(
31
/
1
//
1
/
1
32
LT
b
LNLM
L
M
L
K
b
iLNLNLNLNLM
b
LNLNLNi
b
ii
LKMNT
LN
i
LNLM
i
LN
i
(21)
Если GPU способен исполнить все создан-
ные потоки одновременно, а KMN , оценка
(21) принимает вид )(1/3),( 3132 LTLNLNT .
Тестирование быстродействия параллель-
ных алгоритмов для двумерных задач
Алгоритмы тестировались на задачах разно-
го размера на кластере СКІТ-4 Института ки-
бернетики им. В.М. Глушкова НАНУ (12 узлов
с 4 Intel Xeon E5-2600 и 3 NVidia Tesla M2075
на каждом; CentOS 5.9, Cuda toolkit 4.2, Open-
MPI 1.6.5).
При решении двумерного уравнения кон-
векции–диффузии с использованием одного
GPU для задачи размера (3600×1800) макси-
мальное ускорение составило 9,6. Рассчитан-
ная средняя погрешность оценивания времени
обработки одного блока по формуле (17) со-
ставила ~12 процентов. Время обработки оце-
нивалось используя информацию о количестве
вычислительных ресурсов видеокарты NVidia
Tesla M2075, а максимальный размер блока
ограничивался объемом локальной памяти.
В соответствии с теоретическими оценками,
полученное время работы незначительно зави-
сит от размера обрабатываемой сетки и линей-
но зависит от размера блока. Считая, что на
вспомогательные операции при запуске каждо-
го ядра (kernel) тратится фиксированное время
5,0kct мс, построены линейные зависимости
для алгоритма с и без использования локаль-
ной памяти в виде 1032,01855,0)(1 LLt мс и
5408,01664,0)(1 LLt мс соответственно. На
основе этих зависимостей получены значения
коэффициентов, входящих в формулу (17), и
оценки времени обработки одного блока со-
гласно этой формуле.
Полученные результаты показывают, что
использование локальной памяти приводит к
увеличению ускорения при уменьшении раз-
мера блока. Это может быть объяснено мень-
шим количеством объединенных операций
доступа к памяти при больших размерах бло-
ка, что не учитывается в оценках (17), (18) и
приводит к увеличению погрешности оцени-
вания.
Минимальное время работы получено для
алгоритма с использованием локальной памяти
при 16L , а для алгоритма без ее использова-
ния – при 32L . В оптимальной ситуации
второй алгоритм на шесть процентов быстрее
первого.
Тестирование быстродействия параллель-
ных алгоритмов для трехмерных задач
Алгоритмы с распараллеливанием одного
цикла (алгоритм 1) и двух циклов (алгоритм 2)
были реализованы и тестировались для урав-
нения Пуассона и уравнения конвекции–диф-
фузии. Размер блока во всех случаях был равен
восьми и все алгоритмы реализованы по схе-
мам, использующим локальную память GPU.
Максимальное ускорение, в сравнении с вы-
числениями на центральном процессоре CPU,
полученное при решении алгоритмом 1 трех-
мерных задач, ниже, чем в случае двумерных:
4,72 для уравнения конвекции–диффузии и 4,39
для уравнения Пуассона, тогда как при исполь-
зовании алгоритма 2 – 28,53 для уравнения Пу-
ассона и 30,66 – для уравнения конвекции–
диффузии. Отметим, что увеличение ускорения
при решении более сложной задачи.
В случае алгоритма 2 существенный вклад в
общее время вычислений вносит операция
учета краевых условий. Эта операция была ре-
ализована как GPU-kernel, каждый поток кото-
рого обрабатывает один узел сетки путем по-
лучения значения маркера из массива–маски
краевых условий и внесения изменений в мас-
сив значений искомой функции. Такая опера-
ция есть плохо распараллеливаемой на GPU в
силу того, что количество операций с памятью
существенно превышает количество арифме-
тических операций.
УСиМ, 2014, № 6 25
Были рассчитаны оценки времени работы
(согласно схемам расщепления) по формулам
(20), (21) и относительные погрешности оце-
нивания, которые, в целом, находятся в прием-
лемом диапазоне ~15 процентов. Факторы,
влияющие на точность оценок, могут быть вы-
явлены при анализе времени работы GPU-
kernel на отдельных шагах алгоритмов.
Время обработки одного слоя размера LL
в рамках блока размера KLL на шагах п. 2
алгоритма 1 для различных задач приведено на
рис. 1.
Рис. 1. Время исполнения шагов п. 2 алгоритма 1
В рамках описанных процедур оценки вре-
мени работы алгоритмов время обработки од-
ного слоя размера LL принято постоянным,
исходя из допущения о постоянности времени
доступа к глобальной памяти. Однако, как сле-
дует из рис. 1, это время не есть постоянным.
Временные вариации увеличиваются при ре-
шении уравнения конвенции–диффузии, тре-
бующего большего количества операций об-
ращения к глобальной памяти в сравнении с
решением уравнения Пуассона.
Время исполнения шагов п. 2 алгоритма 2
для задачи размера 320×320×240 при решении
уравнения Пуассона приведено на рис. 2.
На рис. 2 наблюдаются участки, соответ-
ствующие слагаемым формулы (21): с квадра-
тичным (шаги 1–30 и 81–110), линейным рос-
том количества обрабатываемых блоков (шаги
31–40 и 71–80), а также неизменным их коли-
чеством (шаги 41–70). Однако различные фак-
торы, в частности кэширование, приводят к не-
точному оцениванию согласно формуле. Кро-
ме того, результаты экспериментов показали,
что время обработки одного блока, в соответ-
ствии с исходными допущениями, не зависит
от размера сетки.
Рис. 2. Время исполнения шагов п. 2 алгоритма 2
Заключение. В работе для разностных схем
расщепления с явной организацией вычисле-
ний применительно к дву- и трехмерным зада-
чам моделирования распространения загрязне-
ний в атмосфере разработаны параллельные
алгоритмы для графических процессоров. По-
лучены теоретические оценки времени работы
алгоритмов, позволяющие выбирать оптималь-
ную с помощью быстродействия схему орга-
низации вычислений. Результаты тестирования
показали высокую эффективность алгоритмов
для GPU: ускорение для двумерных задач со-
ставило ~10, а для трехмерных – ~30.
1. Марчук Г.И. Математическое моделирование в про-
блеме окружающей среды. – М.: Наука, 1982. – 320 с.
2. Численное моделирование распространения за-
грязнения в окружающей среде / М.З. Згуровский,
В.В. Скопецкий, В.К. Хрущ и др. – К.: Наук. думка,
1997. – 368 с.
3. Аргучинцев В.К., Аргучинцева А.В. Модели и мето-
ды для решения задач охраны атмосферы, гидро-
сферы и подстилающей поверхности. – Иркутск:
ИГУ, 2001. – 114 с.
4. Алоян А.Е., Пененко В.В., Козодеров В.В. Матема-
тическое моделирование в проблеме окружающей
среды // Современные проблемы вычислительной
математики и математического моделирования. –
2005. – Т. 2. – С. 279–351.
5. Алоян А.Е. Моделирование динамики и кинетики
газовых примесей и аэрозолей в атмосфере. – М.:
Наука, 2008. – 415 с.
26 УСиМ, 2014, № 6
6. Основи математичного моделювання в екології /
А.В. Гладкий, І.В. Сергієнко, В.В. Скопецький та
ін. – К.: НТУУ «КПІ», 2009. – 240 с.
7. Марчук Г.И. Методы расщепления. – М.: Наука,
1988. – 264 c.
8. Самарский А.А., Вабищевич П.Н. Численные мето-
ды решения задач конвекции–диффузии. – М.:
Эдиториал УРСС, 2004. – 248 с.
9. Zhang Y., Cohen J., Owens J. Fast tridiagonal solvers
on the GPU // PPoPP '10 Proc. of the 15th ACM
SIGPLAN Symp. on Principles and Practice of Parallel
Program., Bangalor, Ind., Jan. 9–14 2010. – P. 127–
136.
10. Davidson A., Zhang Y., Owens J. An auto-tuned
method for solving large tridiagonal systems on the
GPU // Proc. of the 25th IEEE Intern. Parallel and Dis-
tributed Processing Symp., May 2011. – P. 956–965,
11. Goddeke D., Strzodka R. Cyclic reduction tridiagonal
solvers on GPUs applied to mixed precision multigrid
// IEEE Trans. Parallel Dist. Syst. – 2010. – 21. –
P. 22–32.
12. GPGPU-based ADE-FDTD method for fast electro-
magnetic field simulation and its estimation / Y. Inoue,
M. Unno, S. Aono et al. // Microwave Conf. Proc.
(APMC), 2011 Asia-Pacific. – P. 733–736.
13. Автоматично налагоджуваний паралельний алго-
ритм чисельного розв’язання багатовимірної задачі
моделювання навколишнього середовища / П.А. Ів-
аненко, А.Ю. Дорошенко, Л.М. Суслова та ін. //
Пробл. програм. – 2010. – № 2–3. – С. 202–208.
14. Черниш Р.І., Тирчак Ю.М., Іваненко П.А. Побудова
паралельного алгоритму чисельного розв’язання
багатовимірної задачі моделювання навколишньо-
го середовища // Там же. – 2009. – № 1. – С. 85–91
15. Скопецкий В.В., Богаенко В.А. Моделирование пря-
мых и обратных задач распространения загрязне-
ний в воздушной среде с помощью кластерной си-
стемы СКИТ // УСиМ. – 2007. – № 5. – С. 86–92.
16. Самарский А.А., Николаев Е.С. Методы решения
сеточных уравнений. – М.: Наука, 1987. – 588 с.
17. Гладкий А.В. Об исследовании алгоритмов расще-
пления в задачах конвекции–диффузии // Киберне-
тика и системный анализ. – 2014. – № 4. – С. 76–88.
18. David F. Bacon, Susan L. Graham, Oliver J. Sharp.
Compiler transformations for high-performance com-
puting // ACM Comp. Surveys (CSUR), Dec. 1994. –
26, Issue 4, – P. 345–420.
Поступила 29.09.2014
Тел. для справок: +38 044 526-4167, 067 134-7585,
425-6472 (Киев)
E-mail: gladky@ukr.net, sevab@ukr.net
© А.В. Гладкий, В.А. Богаенко, 2014
<<
/ASCII85EncodePages false
/AllowTransparency false
/AutoPositionEPSFiles true
/AutoRotatePages /None
/Binding /Left
/CalGrayProfile (Dot Gain 20%)
/CalRGBProfile (sRGB IEC61966-2.1)
/CalCMYKProfile (U.S. Web Coated \050SWOP\051 v2)
/sRGBProfile (sRGB IEC61966-2.1)
/CannotEmbedFontPolicy /Error
/CompatibilityLevel 1.4
/CompressObjects /Tags
/CompressPages true
/ConvertImagesToIndexed true
/PassThroughJPEGImages true
/CreateJobTicket false
/DefaultRenderingIntent /Default
/DetectBlends true
/DetectCurves 0.0000
/ColorConversionStrategy /CMYK
/DoThumbnails false
/EmbedAllFonts true
/EmbedOpenType false
/ParseICCProfilesInComments true
/EmbedJobOptions true
/DSCReportingLevel 0
/EmitDSCWarnings false
/EndPage -1
/ImageMemory 1048576
/LockDistillerParams false
/MaxSubsetPct 100
/Optimize true
/OPM 1
/ParseDSCComments true
/ParseDSCCommentsForDocInfo true
/PreserveCopyPage true
/PreserveDICMYKValues true
/PreserveEPSInfo true
/PreserveFlatness true
/PreserveHalftoneInfo false
/PreserveOPIComments true
/PreserveOverprintSettings true
/StartPage 1
/SubsetFonts true
/TransferFunctionInfo /Apply
/UCRandBGInfo /Preserve
/UsePrologue false
/ColorSettingsFile ()
/AlwaysEmbed [ true
]
/NeverEmbed [ true
]
/AntiAliasColorImages false
/CropColorImages true
/ColorImageMinResolution 300
/ColorImageMinResolutionPolicy /OK
/DownsampleColorImages true
/ColorImageDownsampleType /Bicubic
/ColorImageResolution 300
/ColorImageDepth -1
/ColorImageMinDownsampleDepth 1
/ColorImageDownsampleThreshold 1.50000
/EncodeColorImages true
/ColorImageFilter /DCTEncode
/AutoFilterColorImages true
/ColorImageAutoFilterStrategy /JPEG
/ColorACSImageDict <<
/QFactor 0.15
/HSamples [1 1 1 1] /VSamples [1 1 1 1]
>>
/ColorImageDict <<
/QFactor 0.15
/HSamples [1 1 1 1] /VSamples [1 1 1 1]
>>
/JPEG2000ColorACSImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 30
>>
/JPEG2000ColorImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 30
>>
/AntiAliasGrayImages false
/CropGrayImages true
/GrayImageMinResolution 300
/GrayImageMinResolutionPolicy /OK
/DownsampleGrayImages true
/GrayImageDownsampleType /Bicubic
/GrayImageResolution 300
/GrayImageDepth -1
/GrayImageMinDownsampleDepth 2
/GrayImageDownsampleThreshold 1.50000
/EncodeGrayImages true
/GrayImageFilter /DCTEncode
/AutoFilterGrayImages true
/GrayImageAutoFilterStrategy /JPEG
/GrayACSImageDict <<
/QFactor 0.15
/HSamples [1 1 1 1] /VSamples [1 1 1 1]
>>
/GrayImageDict <<
/QFactor 0.15
/HSamples [1 1 1 1] /VSamples [1 1 1 1]
>>
/JPEG2000GrayACSImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 30
>>
/JPEG2000GrayImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 30
>>
/AntiAliasMonoImages false
/CropMonoImages true
/MonoImageMinResolution 1200
/MonoImageMinResolutionPolicy /OK
/DownsampleMonoImages true
/MonoImageDownsampleType /Bicubic
/MonoImageResolution 1200
/MonoImageDepth -1
/MonoImageDownsampleThreshold 1.50000
/EncodeMonoImages true
/MonoImageFilter /CCITTFaxEncode
/MonoImageDict <<
/K -1
>>
/AllowPSXObjects false
/CheckCompliance [
/None
]
/PDFX1aCheck false
/PDFX3Check false
/PDFXCompliantPDFOnly false
/PDFXNoTrimBoxError true
/PDFXTrimBoxToMediaBoxOffset [
0.00000
0.00000
0.00000
0.00000
]
/PDFXSetBleedBoxToMediaBox true
/PDFXBleedBoxToTrimBoxOffset [
0.00000
0.00000
0.00000
0.00000
]
/PDFXOutputIntentProfile ()
/PDFXOutputConditionIdentifier ()
/PDFXOutputCondition ()
/PDFXRegistryName ()
/PDFXTrapped /False
/CreateJDFFile false
/Description <<
/ARA <FEFF06270633062A062E062F0645002006470630064700200627064406250639062F0627062F0627062A002006440625064606340627062100200648062B062706260642002000410064006F00620065002000500044004600200645062A064806270641064206290020064406440637062806270639062900200641064A00200627064406450637062706280639002006300627062A0020062F0631062C0627062A002006270644062C0648062F0629002006270644063906270644064A0629061B0020064A06450643064600200641062A062D00200648062B0627062606420020005000440046002006270644064506460634062306290020062806270633062A062E062F062706450020004100630072006F0062006100740020064800410064006F006200650020005200650061006400650072002006250635062F0627063100200035002E0030002006480627064406250635062F062706310627062A0020062706440623062D062F062B002E0635062F0627063100200035002E0030002006480627064406250635062F062706310627062A0020062706440623062D062F062B002E>
/BGR <FEFF04180437043f043e043b043704320430043904420435002004420435043704380020043d0430044104420440043e0439043a0438002c00200437043000200434043000200441044a0437043404300432043004420435002000410064006f00620065002000500044004600200434043e043a0443043c0435043d04420438002c0020043c0430043a04410438043c0430043b043d043e0020043f044004380433043e04340435043d04380020043704300020043204380441043e043a043e043a0430044704350441044204320435043d0020043f04350447043004420020043704300020043f044004350434043f0435044704300442043d04300020043f043e04340433043e0442043e0432043a0430002e002000200421044a04370434043004340435043d043804420435002000500044004600200434043e043a0443043c0435043d044204380020043c043e0433043004420020043404300020044104350020043e0442043204300440044f0442002004410020004100630072006f00620061007400200438002000410064006f00620065002000520065006100640065007200200035002e00300020043800200441043b0435043404320430044904380020043204350440044104380438002e>
/CHS <FEFF4f7f75288fd94e9b8bbe5b9a521b5efa7684002000410064006f006200650020005000440046002065876863900275284e8e9ad88d2891cf76845370524d53705237300260a853ef4ee54f7f75280020004100630072006f0062006100740020548c002000410064006f00620065002000520065006100640065007200200035002e003000204ee553ca66f49ad87248672c676562535f00521b5efa768400200050004400460020658768633002>
/CHT <FEFF4f7f752890194e9b8a2d7f6e5efa7acb7684002000410064006f006200650020005000440046002065874ef69069752865bc9ad854c18cea76845370524d5370523786557406300260a853ef4ee54f7f75280020004100630072006f0062006100740020548c002000410064006f00620065002000520065006100640065007200200035002e003000204ee553ca66f49ad87248672c4f86958b555f5df25efa7acb76840020005000440046002065874ef63002>
/CZE <FEFF005400610074006f0020006e006100730074006100760065006e00ed00200070006f0075017e0069006a007400650020006b0020007600790074007600e101590065006e00ed00200064006f006b0075006d0065006e0074016f002000410064006f006200650020005000440046002c0020006b00740065007200e90020007300650020006e0065006a006c00e90070006500200068006f006400ed002000700072006f0020006b00760061006c00690074006e00ed0020007400690073006b00200061002000700072006500700072006500730073002e002000200056007900740076006f01590065006e00e900200064006f006b0075006d0065006e007400790020005000440046002000620075006400650020006d006f017e006e00e90020006f007400650076015900ed007400200076002000700072006f006700720061006d0065006300680020004100630072006f00620061007400200061002000410064006f00620065002000520065006100640065007200200035002e0030002000610020006e006f0076011b006a016100ed00630068002e>
/DAN <FEFF004200720075006700200069006e0064007300740069006c006c0069006e006700650072006e0065002000740069006c0020006100740020006f007000720065007400740065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e007400650072002c0020006400650072002000620065006400730074002000650067006e006500720020007300690067002000740069006c002000700072006500700072006500730073002d007500640073006b007200690076006e0069006e00670020006100660020006800f8006a0020006b00760061006c0069007400650074002e0020004400650020006f007000720065007400740065006400650020005000440046002d0064006f006b0075006d0065006e0074006500720020006b0061006e002000e50062006e00650073002000690020004100630072006f00620061007400200065006c006c006500720020004100630072006f006200610074002000520065006100640065007200200035002e00300020006f00670020006e0079006500720065002e>
/DEU <FEFF00560065007200770065006e00640065006e0020005300690065002000640069006500730065002000450069006e007300740065006c006c0075006e00670065006e0020007a0075006d002000450072007300740065006c006c0065006e00200076006f006e002000410064006f006200650020005000440046002d0044006f006b0075006d0065006e00740065006e002c00200076006f006e002000640065006e0065006e002000530069006500200068006f006300680077006500720074006900670065002000500072006500700072006500730073002d0044007200750063006b0065002000650072007a0065007500670065006e0020006d00f60063006800740065006e002e002000450072007300740065006c006c007400650020005000440046002d0044006f006b0075006d0065006e007400650020006b00f6006e006e0065006e0020006d006900740020004100630072006f00620061007400200075006e0064002000410064006f00620065002000520065006100640065007200200035002e00300020006f0064006500720020006800f600680065007200200067006500f600660066006e00650074002000770065007200640065006e002e>
/ESP <FEFF005500740069006c0069006300650020006500730074006100200063006f006e0066006900670075007200610063006900f3006e0020007000610072006100200063007200650061007200200064006f00630075006d0065006e0074006f00730020005000440046002000640065002000410064006f0062006500200061006400650063007500610064006f00730020007000610072006100200069006d0070007200650073006900f3006e0020007000720065002d0065006400690074006f007200690061006c00200064006500200061006c00740061002000630061006c0069006400610064002e002000530065002000700075006500640065006e00200061006200720069007200200064006f00630075006d0065006e0074006f00730020005000440046002000630072006500610064006f007300200063006f006e0020004100630072006f006200610074002c002000410064006f00620065002000520065006100640065007200200035002e003000200079002000760065007200730069006f006e0065007300200070006f00730074006500720069006f007200650073002e>
/ETI <FEFF004b00610073007500740061006700650020006e0065006900640020007300e4007400740065006900640020006b00760061006c006900740065006500740073006500200074007200fc006b006900650065006c007300650020007000720069006e00740069006d0069007300650020006a0061006f006b007300200073006f00620069006c0069006b0065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e00740069006400650020006c006f006f006d006900730065006b0073002e00200020004c006f006f0064007500640020005000440046002d0064006f006b0075006d0065006e00740065002000730061006100740065002000610076006100640061002000700072006f006700720061006d006d006900640065006700610020004100630072006f0062006100740020006e0069006e0067002000410064006f00620065002000520065006100640065007200200035002e00300020006a00610020007500750065006d006100740065002000760065007200730069006f006f006e00690064006500670061002e000d000a>
/FRA <FEFF005500740069006c006900730065007a00200063006500730020006f007000740069006f006e00730020006100660069006e00200064006500200063007200e900650072002000640065007300200064006f00630075006d0065006e00740073002000410064006f00620065002000500044004600200070006f0075007200200075006e00650020007100750061006c0069007400e90020006400270069006d007000720065007300730069006f006e00200070007200e9007000720065007300730065002e0020004c0065007300200064006f00630075006d0065006e00740073002000500044004600200063007200e900e90073002000700065007500760065006e0074002000ea0074007200650020006f007500760065007200740073002000640061006e00730020004100630072006f006200610074002c002000610069006e00730069002000710075002700410064006f00620065002000520065006100640065007200200035002e0030002000650074002000760065007200730069006f006e007300200075006c007400e90072006900650075007200650073002e>
/GRE <FEFF03a703c103b703c303b903bc03bf03c003bf03b903ae03c303c403b5002003b103c503c403ad03c2002003c403b903c2002003c103c503b803bc03af03c303b503b903c2002003b303b903b1002003bd03b1002003b403b703bc03b903bf03c503c103b303ae03c303b503c403b5002003ad03b303b303c103b103c603b1002000410064006f006200650020005000440046002003c003bf03c5002003b503af03bd03b103b9002003ba03b103c42019002003b503be03bf03c703ae03bd002003ba03b103c403ac03bb03bb03b703bb03b1002003b303b903b1002003c003c103bf002d03b503ba03c403c503c003c903c403b903ba03ad03c2002003b503c103b303b103c303af03b503c2002003c503c803b703bb03ae03c2002003c003bf03b903cc03c403b703c403b103c2002e0020002003a403b10020005000440046002003ad03b303b303c103b103c603b1002003c003bf03c5002003ad03c703b503c403b5002003b403b703bc03b903bf03c503c103b303ae03c303b503b9002003bc03c003bf03c103bf03cd03bd002003bd03b1002003b103bd03bf03b903c703c403bf03cd03bd002003bc03b5002003c403bf0020004100630072006f006200610074002c002003c403bf002000410064006f00620065002000520065006100640065007200200035002e0030002003ba03b103b9002003bc03b503c403b103b303b503bd03ad03c303c403b503c103b503c2002003b503ba03b403cc03c303b503b903c2002e>
/HEB <FEFF05D405E905EA05DE05E905D5002005D105D405D205D305E805D505EA002005D005DC05D4002005DB05D305D9002005DC05D905E605D505E8002005DE05E105DE05DB05D9002000410064006F006200650020005000440046002005D405DE05D505EA05D005DE05D905DD002005DC05D405D305E405E105EA002005E705D305DD002D05D305E405D505E1002005D005D905DB05D505EA05D905EA002E002005DE05E105DE05DB05D90020005000440046002005E905E005D505E605E805D5002005E005D905EA05E005D905DD002005DC05E405EA05D905D705D4002005D105D005DE05E605E205D505EA0020004100630072006F006200610074002005D5002D00410064006F00620065002000520065006100640065007200200035002E0030002005D505D205E805E105D005D505EA002005DE05EA05E705D305DE05D505EA002005D905D505EA05E8002E05D005DE05D905DD002005DC002D005000440046002F0058002D0033002C002005E205D905D905E005D5002005D105DE05D305E805D905DA002005DC05DE05E905EA05DE05E9002005E905DC0020004100630072006F006200610074002E002005DE05E105DE05DB05D90020005000440046002005E905E005D505E605E805D5002005E005D905EA05E005D905DD002005DC05E405EA05D905D705D4002005D105D005DE05E605E205D505EA0020004100630072006F006200610074002005D5002D00410064006F00620065002000520065006100640065007200200035002E0030002005D505D205E805E105D005D505EA002005DE05EA05E705D305DE05D505EA002005D905D505EA05E8002E>
/HRV (Za stvaranje Adobe PDF dokumenata najpogodnijih za visokokvalitetni ispis prije tiskanja koristite ove postavke. Stvoreni PDF dokumenti mogu se otvoriti Acrobat i Adobe Reader 5.0 i kasnijim verzijama.)
/HUN <FEFF004b0069007600e1006c00f30020006d0069006e0151007300e9006701710020006e0079006f006d00640061006900200065006c0151006b00e90073007a00ed007401510020006e0079006f006d00740061007400e100730068006f007a0020006c006500670069006e006b00e1006200620020006d0065006700660065006c0065006c0151002000410064006f00620065002000500044004600200064006f006b0075006d0065006e00740075006d006f006b0061007400200065007a0065006b006b0065006c0020006100200062006500e1006c006c00ed007400e10073006f006b006b0061006c0020006b00e90073007a00ed0074006800650074002e0020002000410020006c00e90074007200650068006f007a006f00740074002000500044004600200064006f006b0075006d0065006e00740075006d006f006b00200061007a0020004100630072006f006200610074002000e9007300200061007a002000410064006f00620065002000520065006100640065007200200035002e0030002c0020007600610067007900200061007a002000610074007400f3006c0020006b00e9007301510062006200690020007600650072007a006900f3006b006b0061006c0020006e00790069007400680061007400f3006b0020006d00650067002e>
/ITA <FEFF005500740069006c0069007a007a006100720065002000710075006500730074006500200069006d0070006f007300740061007a0069006f006e00690020007000650072002000630072006500610072006500200064006f00630075006d0065006e00740069002000410064006f00620065002000500044004600200070006900f900200061006400610074007400690020006100200075006e00610020007000720065007300740061006d0070006100200064006900200061006c007400610020007100750061006c0069007400e0002e0020004900200064006f00630075006d0065006e007400690020005000440046002000630072006500610074006900200070006f00730073006f006e006f0020006500730073006500720065002000610070006500720074006900200063006f006e0020004100630072006f00620061007400200065002000410064006f00620065002000520065006100640065007200200035002e003000200065002000760065007200730069006f006e006900200073007500630063006500730073006900760065002e>
/JPN <FEFF9ad854c18cea306a30d730ea30d730ec30b951fa529b7528002000410064006f0062006500200050004400460020658766f8306e4f5c6210306b4f7f75283057307e305930023053306e8a2d5b9a30674f5c62103055308c305f0020005000440046002030d530a130a430eb306f3001004100630072006f0062006100740020304a30883073002000410064006f00620065002000520065006100640065007200200035002e003000204ee5964d3067958b304f30533068304c3067304d307e305930023053306e8a2d5b9a306b306f30d530a930f330c8306e57cb30818fbc307f304c5fc59808306730593002>
/KOR <FEFFc7740020c124c815c7440020c0acc6a9d558c5ec0020ace0d488c9c80020c2dcd5d80020c778c1c4c5d00020ac00c7a50020c801d569d55c002000410064006f0062006500200050004400460020bb38c11cb97c0020c791c131d569b2c8b2e4002e0020c774b807ac8c0020c791c131b41c00200050004400460020bb38c11cb2940020004100630072006f0062006100740020bc0f002000410064006f00620065002000520065006100640065007200200035002e00300020c774c0c1c5d0c11c0020c5f40020c2180020c788c2b5b2c8b2e4002e>
/LTH <FEFF004e006100750064006f006b0069007400650020016100690075006f007300200070006100720061006d006500740072007500730020006e006f0072011700640061006d00690020006b0075007200740069002000410064006f00620065002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b00750072006900650020006c0061006200690061007500730069006100690020007000720069007400610069006b007900740069002000610075006b01610074006f00730020006b006f006b007900620117007300200070006100720065006e006700740069006e00690061006d00200073007000610075007300640069006e0069006d00750069002e0020002000530075006b0075007200740069002000500044004600200064006f006b0075006d0065006e007400610069002000670061006c006900200062016b007400690020006100740069006400610072006f006d00690020004100630072006f006200610074002000690072002000410064006f00620065002000520065006100640065007200200035002e0030002000610072002000760117006c00650073006e0117006d00690073002000760065007200730069006a006f006d00690073002e>
/LVI <FEFF0049007a006d0061006e0074006f006a00690065007400200161006f00730020006900650073007400610074012b006a0075006d00750073002c0020006c0061006900200076006500690064006f00740075002000410064006f00620065002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b006100730020006900720020012b00700061016100690020007000690065006d01130072006f00740069002000610075006700730074006100730020006b00760061006c0069007401010074006500730020007000690072006d007300690065007300700069006501610061006e006100730020006400720075006b00610069002e00200049007a0076006500690064006f006a006900650074002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b006f002000760061007200200061007400760113007200740020006100720020004100630072006f00620061007400200075006e002000410064006f00620065002000520065006100640065007200200035002e0030002c0020006b0101002000610072012b00200074006f0020006a00610075006e0101006b0101006d002000760065007200730069006a0101006d002e>
/NLD (Gebruik deze instellingen om Adobe PDF-documenten te maken die zijn geoptimaliseerd voor prepress-afdrukken van hoge kwaliteit. De gemaakte PDF-documenten kunnen worden geopend met Acrobat en Adobe Reader 5.0 en hoger.)
/NOR <FEFF004200720075006b00200064006900730073006500200069006e006e007300740069006c006c0069006e00670065006e0065002000740069006c002000e50020006f0070007000720065007400740065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e00740065007200200073006f006d00200065007200200062006500730074002000650067006e0065007400200066006f00720020006600f80072007400720079006b006b0073007500740073006b00720069006600740020006100760020006800f800790020006b00760061006c0069007400650074002e0020005000440046002d0064006f006b0075006d0065006e00740065006e00650020006b0061006e002000e50070006e00650073002000690020004100630072006f00620061007400200065006c006c00650072002000410064006f00620065002000520065006100640065007200200035002e003000200065006c006c00650072002000730065006e006500720065002e>
/POL <FEFF0055007300740061007700690065006e0069006100200064006f002000740077006f0072007a0065006e0069006100200064006f006b0075006d0065006e007400f300770020005000440046002000700072007a0065007a006e00610063007a006f006e00790063006800200064006f002000770079006400720075006b00f30077002000770020007700790073006f006b00690065006a0020006a0061006b006f015b00630069002e002000200044006f006b0075006d0065006e0074007900200050004400460020006d006f017c006e00610020006f007400770069006500720061010700200077002000700072006f006700720061006d006900650020004100630072006f00620061007400200069002000410064006f00620065002000520065006100640065007200200035002e0030002000690020006e006f00770073007a0079006d002e>
/PTB <FEFF005500740069006c0069007a006500200065007300730061007300200063006f006e00660069006700750072006100e700f50065007300200064006500200066006f0072006d00610020006100200063007200690061007200200064006f00630075006d0065006e0074006f0073002000410064006f0062006500200050004400460020006d00610069007300200061006400650071007500610064006f00730020007000610072006100200070007200e9002d0069006d0070007200650073007300f50065007300200064006500200061006c007400610020007100750061006c00690064006100640065002e0020004f007300200064006f00630075006d0065006e0074006f00730020005000440046002000630072006900610064006f007300200070006f00640065006d0020007300650072002000610062006500720074006f007300200063006f006d0020006f0020004100630072006f006200610074002000650020006f002000410064006f00620065002000520065006100640065007200200035002e0030002000650020007600650072007300f50065007300200070006f00730074006500720069006f007200650073002e>
/RUM <FEFF005500740069006c0069007a00610163006900200061006300650073007400650020007300650074010300720069002000700065006e007400720075002000610020006300720065006100200064006f00630075006d0065006e00740065002000410064006f006200650020005000440046002000610064006500630076006100740065002000700065006e0074007200750020007400690070010300720069007200650061002000700072006500700072006500730073002000640065002000630061006c006900740061007400650020007300750070006500720069006f006100720103002e002000200044006f00630075006d0065006e00740065006c00650020005000440046002000630072006500610074006500200070006f00740020006600690020006400650073006300680069007300650020006300750020004100630072006f006200610074002c002000410064006f00620065002000520065006100640065007200200035002e00300020015f00690020007600650072007300690075006e0069006c006500200075006c0074006500720069006f006100720065002e>
/RUS <FEFF04180441043f043e043b044c04370443043904420435002004340430043d043d044b04350020043d0430044104420440043e0439043a043800200434043b044f00200441043e043704340430043d0438044f00200434043e043a0443043c0435043d0442043e0432002000410064006f006200650020005000440046002c0020043c0430043a04410438043c0430043b044c043d043e0020043f043e04340445043e0434044f04490438044500200434043b044f00200432044b0441043e043a043e043a0430044704350441044204320435043d043d043e0433043e00200434043e043f0435044704300442043d043e0433043e00200432044b0432043e04340430002e002000200421043e043704340430043d043d044b04350020005000440046002d0434043e043a0443043c0435043d0442044b0020043c043e0436043d043e0020043e0442043a0440044b043204300442044c002004410020043f043e043c043e0449044c044e0020004100630072006f00620061007400200438002000410064006f00620065002000520065006100640065007200200035002e00300020043800200431043e043b043504350020043f043e04370434043d043804450020043204350440044104380439002e>
/SKY <FEFF0054006900650074006f0020006e006100730074006100760065006e0069006100200070006f0075017e0069007400650020006e00610020007600790074007600e100720061006e0069006500200064006f006b0075006d0065006e0074006f0076002000410064006f006200650020005000440046002c0020006b0074006f007200e90020007300610020006e0061006a006c0065007001610069006500200068006f0064006900610020006e00610020006b00760061006c00690074006e00fa00200074006c0061010d00200061002000700072006500700072006500730073002e00200056007900740076006f00720065006e00e900200064006f006b0075006d0065006e007400790020005000440046002000620075006400650020006d006f017e006e00e90020006f00740076006f00720069016500200076002000700072006f006700720061006d006f006300680020004100630072006f00620061007400200061002000410064006f00620065002000520065006100640065007200200035002e0030002000610020006e006f0076016100ed00630068002e>
/SLV <FEFF005400650020006e006100730074006100760069007400760065002000750070006f0072006100620069007400650020007a00610020007500730074007600610072006a0061006e006a006500200064006f006b0075006d0065006e0074006f0076002000410064006f006200650020005000440046002c0020006b006900200073006f0020006e0061006a007000720069006d00650072006e0065006a016100690020007a00610020006b0061006b006f0076006f00730074006e006f0020007400690073006b0061006e006a00650020007300200070007200690070007200610076006f0020006e00610020007400690073006b002e00200020005500730074007600610072006a0065006e006500200064006f006b0075006d0065006e0074006500200050004400460020006a00650020006d006f0067006f010d00650020006f0064007000720065007400690020007a0020004100630072006f00620061007400200069006e002000410064006f00620065002000520065006100640065007200200035002e003000200069006e0020006e006f00760065006a01610069006d002e>
/SUO <FEFF004b00e40079007400e40020006e00e40069007400e4002000610073006500740075006b007300690061002c0020006b0075006e0020006c0075006f00740020006c00e400680069006e006e00e4002000760061006100740069007600610061006e0020007000610069006e006100740075006b00730065006e002000760061006c006d0069007300740065006c00750074007900f6006800f6006e00200073006f00700069007600690061002000410064006f0062006500200050004400460020002d0064006f006b0075006d0065006e007400740065006a0061002e0020004c0075006f0064007500740020005000440046002d0064006f006b0075006d0065006e00740069007400200076006f0069006400610061006e0020006100760061007400610020004100630072006f0062006100740069006c006c00610020006a0061002000410064006f00620065002000520065006100640065007200200035002e0030003a006c006c00610020006a006100200075007500640065006d006d0069006c006c0061002e>
/SVE <FEFF0041006e007600e4006e00640020006400650020006800e4007200200069006e0073007400e4006c006c006e0069006e006700610072006e00610020006f006d002000640075002000760069006c006c00200073006b006100700061002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e007400200073006f006d002000e400720020006c00e4006d0070006c0069006700610020006600f60072002000700072006500700072006500730073002d007500740073006b00720069006600740020006d006500640020006800f600670020006b00760061006c0069007400650074002e002000200053006b006100700061006400650020005000440046002d0064006f006b0075006d0065006e00740020006b0061006e002000f600700070006e00610073002000690020004100630072006f0062006100740020006f00630068002000410064006f00620065002000520065006100640065007200200035002e00300020006f00630068002000730065006e006100720065002e>
/TUR <FEFF005900fc006b00730065006b0020006b0061006c006900740065006c0069002000f6006e002000790061007a006401310072006d00610020006200610073006b013100730131006e006100200065006e0020006900790069002000750079006100620069006c006500630065006b002000410064006f006200650020005000440046002000620065006c00670065006c0065007200690020006f006c0075015f007400750072006d0061006b0020006900e70069006e00200062007500200061007900610072006c0061007201310020006b0075006c006c0061006e0131006e002e00200020004f006c0075015f0074007500720075006c0061006e0020005000440046002000620065006c00670065006c0065007200690020004100630072006f006200610074002000760065002000410064006f00620065002000520065006100640065007200200035002e003000200076006500200073006f006e0072006100730131006e00640061006b00690020007300fc007200fc006d006c00650072006c00650020006100e70131006c006100620069006c00690072002e>
/UKR <FEFF04120438043a043e0440043804410442043e043204430439044204350020044604560020043f043004400430043c043504420440043800200434043b044f0020044104420432043e04400435043d043d044f00200434043e043a0443043c0435043d044204560432002000410064006f006200650020005000440046002c0020044f043a04560020043d04300439043a04400430044904350020043f045604340445043e0434044f0442044c00200434043b044f0020043204380441043e043a043e044f043a04560441043d043e0433043e0020043f0435044004350434043404400443043a043e0432043e0433043e0020043404400443043a0443002e00200020042104420432043e04400435043d045600200434043e043a0443043c0435043d0442043800200050004400460020043c043e0436043d04300020043204560434043a0440043804420438002004430020004100630072006f006200610074002004420430002000410064006f00620065002000520065006100640065007200200035002e0030002004300431043e0020043f04560437043d04560448043e04570020043204350440044104560457002e>
/ENU (Use these settings to create Adobe PDF documents best suited for high-quality prepress printing. Created PDF documents can be opened with Acrobat and Adobe Reader 5.0 and later.)
>>
/Namespace [
(Adobe)
(Common)
(1.0)
]
/OtherNamespaces [
<<
/AsReaderSpreads false
/CropImagesToFrames true
/ErrorControl /WarnAndContinue
/FlattenerIgnoreSpreadOverrides false
/IncludeGuidesGrids false
/IncludeNonPrinting false
/IncludeSlug false
/Namespace [
(Adobe)
(InDesign)
(4.0)
]
/OmitPlacedBitmaps false
/OmitPlacedEPS false
/OmitPlacedPDF false
/SimulateOverprint /Legacy
>>
<<
/AddBleedMarks false
/AddColorBars false
/AddCropMarks false
/AddPageInfo false
/AddRegMarks false
/ConvertColors /ConvertToCMYK
/DestinationProfileName ()
/DestinationProfileSelector /DocumentCMYK
/Downsample16BitImages true
/FlattenerPreset <<
/PresetSelector /MediumResolution
>>
/FormElements false
/GenerateStructure false
/IncludeBookmarks false
/IncludeHyperlinks false
/IncludeInteractive false
/IncludeLayers false
/IncludeProfiles false
/MultimediaHandling /UseObjectSettings
/Namespace [
(Adobe)
(CreativeSuite)
(2.0)
]
/PDFXOutputIntentProfileSelector /DocumentCMYK
/PreserveEditing true
/UntaggedCMYKHandling /LeaveUntagged
/UntaggedRGBHandling /UseDocumentProfile
/UseDocumentBleed false
>>
]
>> setdistillerparams
<<
/HWResolution [2400 2400]
/PageSize [612.000 792.000]
>> setpagedevice
|
| id | nasplib_isofts_kiev_ua-123456789-83535 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 0130-5395 |
| language | Russian |
| last_indexed | 2025-12-07T15:17:54Z |
| publishDate | 2014 |
| publisher | Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України |
| record_format | dspace |
| spelling | Гладкий, А.В. Богаенко, В.А. 2015-06-20T10:46:10Z 2015-06-20T10:46:10Z 2014 Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений / А.В. Гладкий, В.А. Богаенко // Управляющие системы и машины. — 2014. — № 6. — С. 18-26. — Бібліогр.: 18 назв. — рос. 0130-5395 https://nasplib.isofts.kiev.ua/handle/123456789/83535 517:519.6 Рассмотрена задача моделирования переноса загрязнений в атмосфере на основе нестационарного уравнения конвективной диффузии в двух- и трехмерной постановке. Для вычислительной схемы, базирующейся на методах расщепления с использованием явных разностных схем бегущего счета, разработаны параллельные алгоритмы для графических процессоров и получены теоретические оценки времени их работы. Modelling of pollution transfer in atmosphere has been considered on the base of unsteady convection-diffusion equation in two- and three-dimensional formulation. Parallel algorithms for graphical processors have been developed for computational scheme based on explicit finite-difference splitting methods. Theoretical estimations of algorithms execution time have been obtained. Розглянуто задачу моделювання переносу забруднень в атмосфері на основі нестаціонарного рівняння конвективної дифузії у дво- та тривимірній постановці. Для обчислювальної схеми, що базується на методах розщеплення з використанням явних різницевих схем біжучої хвилі, розроблено паралельні алгоритми для графічних процесорів та отримано теоретичні оцінки часу їх роботи. ru Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України Управляющие системы и машины Новые методы в информатике Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений Modelling of Pollution Transfer in Atmosphere Using Parallel Computation Моделювання переносу забруднень в атмосфері з використанням паралельних обчислень Article published earlier |
| spellingShingle | Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений Гладкий, А.В. Богаенко, В.А. Новые методы в информатике |
| title | Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений |
| title_alt | Modelling of Pollution Transfer in Atmosphere Using Parallel Computation Моделювання переносу забруднень в атмосфері з використанням паралельних обчислень |
| title_full | Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений |
| title_fullStr | Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений |
| title_full_unstemmed | Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений |
| title_short | Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений |
| title_sort | моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений |
| topic | Новые методы в информатике |
| topic_facet | Новые методы в информатике |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/83535 |
| work_keys_str_mv | AT gladkiiav modelirovanieperenosazagrâzneniivatmosferesispolʹzovaniemparallelʹnyhvyčislenii AT bogaenkova modelirovanieperenosazagrâzneniivatmosferesispolʹzovaniemparallelʹnyhvyčislenii AT gladkiiav modellingofpollutiontransferinatmosphereusingparallelcomputation AT bogaenkova modellingofpollutiontransferinatmosphereusingparallelcomputation AT gladkiiav modelûvannâperenosuzabrudnenʹvatmosferízvikoristannâmparalelʹnihobčislenʹ AT bogaenkova modelûvannâperenosuzabrudnenʹvatmosferízvikoristannâmparalelʹnihobčislenʹ |