Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений

Рассмотрена задача моделирования переноса загрязнений в атмосфере на основе нестационарного уравнения конвективной диффузии в двух- и трехмерной постановке. Для вычислительной схемы, базирующейся на методах расщепления с использованием явных разностных схем бегущего счета, разработаны параллельные а...

Full description

Saved in:
Bibliographic Details
Published in:Управляющие системы и машины
Date:2014
Main Authors: Гладкий, А.В., Богаенко, В.А.
Format: Article
Language:Russian
Published: Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України 2014
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/83535
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений / А.В. Гладкий, В.А. Богаенко // Управляющие системы и машины. — 2014. — № 6. — С. 18-26. — Бібліогр.: 18 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859809632113917952
author Гладкий, А.В.
Богаенко, В.А.
author_facet Гладкий, А.В.
Богаенко, В.А.
citation_txt Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений / А.В. Гладкий, В.А. Богаенко // Управляющие системы и машины. — 2014. — № 6. — С. 18-26. — Бібліогр.: 18 назв. — рос.
collection DSpace DC
container_title Управляющие системы и машины
description Рассмотрена задача моделирования переноса загрязнений в атмосфере на основе нестационарного уравнения конвективной диффузии в двух- и трехмерной постановке. Для вычислительной схемы, базирующейся на методах расщепления с использованием явных разностных схем бегущего счета, разработаны параллельные алгоритмы для графических процессоров и получены теоретические оценки времени их работы. Modelling of pollution transfer in atmosphere has been considered on the base of unsteady convection-diffusion equation in two- and three-dimensional formulation. Parallel algorithms for graphical processors have been developed for computational scheme based on explicit finite-difference splitting methods. Theoretical estimations of algorithms execution time have been obtained. Розглянуто задачу моделювання переносу забруднень в атмосфері на основі нестаціонарного рівняння конвективної дифузії у дво- та тривимірній постановці. Для обчислювальної схеми, що базується на методах розщеплення з використанням явних різницевих схем біжучої хвилі, розроблено паралельні алгоритми для графічних процесорів та отримано теоретичні оцінки часу їх роботи.
first_indexed 2025-12-07T15:17:54Z
format Article
fulltext 18 УСиМ, 2014, № 6 Новые методы в информатике УДК 517:519.6 А.В. Гладкий, В.А. Богаенко Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений Рассмотрена задача моделирования переноса загрязнений в атмосфере на основе нестационарного уравнения конвективной диффу- зии в двух- и трехмерной постановке. Для вычислительной схемы, базирующейся на методах расщепления с использованием явных разностных схем бегущего счета, разработаны параллельные алгоритмы для графических процессоров и получены теоретические оценки времени их работы. Modelling of pollution transfer in atmosphere has been considered on the base of unsteady convection-diffusion equation in two- and three-dimensional formulation. Parallel algorithms for graphical processors have been developed for computational scheme based on explicit finite-difference splitting methods. Theoretical estimations of algorithms execution time have been obtained. Розглянуто задачу моделювання переносу забруднень в атмосфері на основі нестаціонарного рівняння конвективної дифузії у дво- та тривимірній постановці. Для обчислювальної схеми, що базується на методах розщеплення з використанням явних різницевих схем біжучої хвилі, розроблено паралельні алгоритми для графічних процесорів та отримано теоретичні оцінки часу їх роботи. Введение. Математическое моделирование и вычислительный эксперимент становятся ос- новными способами изучения процессов пере- носа загрязняющих веществ в экосистемах [1– 6]. Компьютерная реализация математических моделей, включающих многомерные уравнения конвективной диффузии, основана на приме- нении нетривиальных вычислительных алго- ритмов и требует использования высокопроиз- водительных вычислительных средств, в част- ности, многопроцессорных кластерных систем и систем с графическими процессорами. Постановка задачи Целью статьи – построение параллельных алгоритмов расщепления для решения задач переноса загрязнений в атмосфере с использо- ванием метеорологических данных или модели потенциального течения перемещения воз- душных масс. Вычислительная схема решения многомерных задач основана на методах рас- щепления [7, 8] с использованием явных раз- ностных схем бегущего счета, что позволяет существенно снизить сложность дискретных алгоритмов и применять технологию парал- лельных вычислений для их реализации на ЭВМ. Кроме того, разработаны параллельные ал- горитмы для графических процессоров (GPU), получены теоретические оценки времени их работы, позволяющие выбирать оптимальную с учетом быстродействия схему организации вычислений. Отметим, что большинство па- раллельных (в том числе для GPU) алгоритмов разработаны для неявных схем расщепления [9–14], а существующие параллельные алго- ритмы для явных схем разработаны преиму- щественно для систем с распределенной памя- тью [15]. Математическая модель переноса и транс- формации примесей Для моделирования нестационарного про- цесса конвективно-диффузионного распростра- нения вредных веществ в атмосфере, произ- водственных помещениях, на промплощадках и других объектах будем использовать уравнение миграции примеси [1, 2, 6, 8]             C z C w y C v x C u t C                    )()()( 321 z C zy C yx C x (1) ),,,( tzyxf , ,),,( Gzyx  ],0( Tt  , где ),,( zyxx – декартовы координаты, ),,,( tzyxC – концентрация примеси, ( ),(xu )(),( xx wv ) – компоненты вектора скорости воз- УСиМ, 2014, № 6 19 душных масс ),,( wvuV , ),,( 321  – коэф- фициенты турбулентной диффузии,  – коэф- фициент трансформации примеси, ),,,( tzyxf – функция, характеризующая распределение ис- точников загрязнения, G – область с цилинд- рической поверхностью G, состоящей из бо- ковой поверхности , нижнего основания 0 (при )0z и верхнего основания H (при )Hz  . Компоненты вектора скорости воздушного потока ),,( wvuV удовлетворяют уравнению неразрывности (условию несжимаемости среды) 0div           z w y v x u V . (2) В случае постоянно действующих точечных источников загрязнения или залповых аэро- зольных выбросов в атмосферу в моменты времени Niti ,1,  правую часть уравнений (1), (3) целесообразно представить в виде         N i iiii zzyyxxQzyxf 1 ),,( ,          N i iiiii ttzzyyxxQ tzyxf 1 )( ),,,( соответственно, где iQ – интенсивность выброса вредного вещества от i-го источника; () – дель- та-функция Дирака; Nizyx iii ,1),,,(  – коор- динаты точечных источников примеси. Уравнение (1) следует дополнить началь- ным и граничными условиями [1, 8]. При исследовании переноса и рассеивания загрязнений в промышленных зонах с учетом влияния рельефа местности возникает необ- ходимость расчета компонентов вектора ско- рости перемещения воздушных масс. Про- стейшая модель для описания поля скоростей есть модель потенциального течения, тогда pgradV , где ),,( zyxpp  – потенциал ско- рости. В результате, с учетом уравнения (2), для p получаем уравнение Лапласа 0 2 2 2 2 2 2           z p y p x p p . (3) Для однозначного решения уравнения (3) задаются следующие граничные условия. На твердых стенках производная потенциала по направлению единичной внешней нормали n равняется нулю, поэтому 0/  np . На грани- це попадания воздушного потока значение нормальной компоненты его скорости nV из- вестно, поэтому nVnp  / . На участке выте- кания воздуха задают значение потенциала скорости зpp  . Двухшаговая схема расщепления для рас- чета потенциального течения Следуя идее установления [16], для решения (3) в области  ,0,0 21 lylxGG   30 lz  рассмотрим схему расщепления для неоднородного нестационарного уравнения ),,( zyxfAp t p    , pAp  (4) с граничным условием первого рода и произ- вольным начальным условием. Представим опе- ратор A в виде 2,1,5,0,21  iAAAA i . Тогда, в результате последовательного реше- ния двух вспомогательных задач ),,,(),,,(,5,0 111 1 tzyxptzyxpfpA t p    , (5) )ˆ,,,(),,,(,5,0 1222 2 tzyxptzyxpfpA t p    , (6) получаем решение уравнения (4) в момент времени  tt̂ с погрешностью )( 2O [17]. Для численного исследования нестационар- ных уравнений (5), (6) в области G введем про- странственную равномерную сетку (  ji yihx ,1 32, khzjh k  ). Во внутренних узлах ),,( kji zyx в момент времени ntt n  уравнениям (5), (6) поставим в соответствие неявную разност- ную схему   fn zz n yy n xxt 5,05,0 111   , (7) где  – сеточная функция, и используются общепринятые обозначения теории разност- ных схем [8, 16]. На первом шаге явную схему бегущего счета 20 УСиМ, 2014, № 6       f hh h n z n z n y n y n x n xt 5,0 11 1 2 1 1 3 1 2 1 1           (8) можно получить, заменяя в уравнении (7) операторы 111 ,,   n z n y n x их соответствую- щими в предыдущий момент времени t = tn. На втором шаге разностную схему получим, заменяя в (7) операторы 111 ,,   n z n y n x выра- жениями n z n y n x  ,, :       .5,0 11 1 2 1 1 3 1 2 1 1 f hh h n z n z n y n y n x n xt           (9) При этом решение уравнения (8) при t = tn+1 – стартовое для разностного уравнения (9). Расщепляя интервал  между точками tn и tn+1 на две равные части с промежуточной точ- кой tn+1/2, двуxшаговую схему можно записать в виде         ,5,0 11 1 2 11 2/1 3 2/1 2 2/1 1 2/1 f hh h n z n z n y n y n x n x nn            (10)         .5,0 11 1 2 11 2/11 3 2/11 2 2/11 1 2/11 f hh h n z n z n y n y n x n x nn            (11) В совокупности они составляют разностную схему бегущего счета, аппроксимирующую ис- ходную дифференциальную задачу с погрешно- стью O(h 2 + 2 + 2 / h 2). Поэтому точность получаемых результатов зависит от соотноше- ния шагов сетки. Двухшаговая схема расщепления для за- дачи конвекции–диффузии Эту схему рассмотрим в области  GG ={0  x  l1, 0  y  l2} на примере двумерного уравнения конвективной диффузии ),( 2 2 2 2 yxf y C x C C y C v x C u t C                      (12) с начальным условием и однородным гра- ничным условием первого рода. Представим компоненты вектора скорости воздушного потока ),( yxuu  и ),( yxvv  в виде u   uu ,   vvv , где   ,05,0  uuu u   05,0  uu ,   ,05,0  vvv v   05,0  vv . Пусть  – временной интервал между точ- ками tn и tn+1. Аналогично предыдущему, схема расщепления на дифференциальном уровне принимает вид ,5,011 1 fCA t C    ),,(1 n nn tyxCCC  , ,5,022 2 fCA t C    1 2 11 12 ,   nnnn CCCC , где CC y C v x C uCA                  221 , CA2 CC y C v x C u                  22 . Дифференциальные операторы 21, iAi во внутренних узлах (xi, yj)  h двумерной сетки ;,0,:),{( 11 Niihxxyx ihhh   }2,1,/;,0, 22   NlhNjjhyy j ап- проксимируем, используя для этого конвек- тивные слагаемые схемы с направленными разностями [8]. В результате явную разност- ную схему расщепления бегущего счета для решения уравнения (12) можно получить в сле- дующем виде     . 2 11 )1( 1 )1( 2 2 1 2 2 1 1 1 111 nn y n y n x n x nn y n xt f h R h R vu                 (13) УСиМ, 2014, № 6 21     , 2 11 )1( 1 )1( 2 2 1 2 2 1 1 1 111 nn y n y n x n x nn y n xt f h R h R vu                 (14) где         v hR u hR 2211 , ,       211 , R u hR   v h2 . При этом решение уравнения (13) в момент времени 1 ntt – стартовое для урав- нения (14). Введя обозначения     , 1 )1( 1 )1( 2 2 1 2 2 1 1 1 1111 1                 n y n y n x n x nn y n x n h R h R vuL     1 1 1 1 2 1 1 1 1 2 2 2 1 (1 ) 2 1 (1 ) , n n n n x y n n x x n n y y L u v R h R h                                  для реализации явной двухшаговой схемы расщепления (13), (14) можно воспользовать- ся следующим алгоритмом [17]: 0 2 11 1 1 1   nnn t fL , ),,( 1 n nn tyx , (15) 0 2 11 2 2 2   nnn t fL , 1 2 11 12 ,   nnnn . (16) Параллельные алгоритмы Разностные схемы содержат естественный параллелизм, который может быть использо- ван при их реализации на GPU. Суть подхода состоит в том, что к схемам бегущего счета (10), (11) и (15), (16), алгоритмически предста- вимым в виде двух вложенных циклов в кото- рых для каждого узла сетки последовательно проводятся вычисления, возможно применение процедуры скашивания (loop skewing) [18]. По- сле этого вычисления, проводимые во внут- реннем цикле, становятся независимыми. Разностные схемы бегущего счета позволя- ют рассчитывать решение в узлах сетки рекур- рентно через известные значения сеточной функции в соседних узлах. При варьировании размеров элементов геометрической декомпо- зиции алгоритмические свойства не изменяют- ся. Отмеченные свойства положены в основу параллельных алгоритмов для систем с общей памятью, в частности GPU. К недостаткам та- ких параллельных алгоритмов можно отнести неполное задействование вычислительных ре- сурсов. Алгоритм решения двумерных задач для графических процессоров. Графические про- цессоры (GPU) – высокопродуктивные парал- лельные вычислительные системы, имеющие ряд архитектурных особенностей, которые не- обходимо учитывать при разработке парал- лельных алгоритмов. В рамках GPU блоки программного кода, именуемые GPU-ядрами (kernel), исполняются в массово-многопоточной среде, где каждый поток – код, исполняемый последовательно и обрабатывающий элементы данных согласно своему номеру. Количество потоков, испол- няющих GPU-kernel, обычно превышает коли- чество потоков, которое GPU может испол- нить параллельно. Это приводит к невозмож- ности проводить глобальную синхронизацию их исполнения и к необходимости декомпози- ции алгоритма на фрагменты, которые воз- можно выполнить параллельно без этой опера- ции. При этом, однако, потоки могут органи- зовываться в группы, в рамках которых реали- зована операция барьерной синхронизации. При распараллеливании рассматриваемых вычислительных схем на GPU также возникает необходимость учета специфики организации памяти современных графических процессоров – разделения ее на сравнительно медленную глобальную и существенно более быструю ло- кальную, для эффективного использования ко- 22 УСиМ, 2014, № 6 торой необходима совместная работа групп потоков. Без ограничения общности рассмотрим ал- горитм для разностной схемы (15), распарал- леливающий один ее шаг и применяемый как к двух-, так и к четырехшаговым схемам. 1. Множество внутренних узлов hji yx ),( двумерной сетки h разбивается на квадрат- ные, кроме, возможно, граничных, блоки фик- сированного размера LL , где 1L – целое. 2. Пусть  NNNM ),1,1(max 21 min(N1 – 1, N2 – 1), тогда на каждом из     1//  LMLN шагов (  x – операция округления веществен- ного числа x до меньшего целого) выполня- ются независимые вычисления по схеме (15) в от единицы до  LN / блоках узлов сетки. При 12 NN  координаты узлов блоков лежат в диапазоне от (iL + 1, (j – i)L + 1) до ((i + 1)L, ))1( Lij  включительно, где j   LN /,...,0   2/  LM – номер шага, i   1/,...,0  LN – номер блока. В случае когда 21 NN  , коорди- наты узлов блоков будут лежать в диапазоне от )1,1)((  iLLij до ))1(,)1(( LiLij  . Вычисления проводятся, если блок находит- ся в пределах сетки, чем объясняется разное количество обрабатываемых блоков в зави- симости от номера шага. На каждом шаге уп- равляющая программа, выполняемая на цен- тральном процессоре, задает входные пара- метры и запускает на GPU соответствующее ядро (kernel). 3. GPU-kernel, отвечающий за исполнение одного шага вычислений в п. 2, обрабатывает данные построчно: каждый поток отвечает за одну строку узлов в пределах блока. Потоки, обрабатывающие строки в одном блоке, объ- единяются в группу для ускорения вычисле- ний путем использования локальной памяти. Перед началом вычислений все необходимые данные, используя возможности по объеди- нению запросов к памяти, параллельно за- гружаются в локальную память, а затем – в глобальную. 4. При вычислениях в пределах каждой груп- пы потоков используется схема, аналогичная п. 2. Проводится 22,...,0  Lj шагов, на каж- дом из которых поток 1,...,0  Li обрабаты- вает узел ),( iji  блока размера LL , после чего проводится операция барьерной синхро- низации. Оценим время работы предложенного алго- ритма (здесь и в дальнейшем без учета проце- дур инициализации и сбора результатов). Время, затраченное L -потоками на обра- ботку блока размера LL , можно оценить как )13)(12()165()(1 bclg tttLtLLT  , (17) где gt и lt – время исполнения всеми потоками операций чтения или записи в глобальную и локальную память соответственно, ct – время обработки данных в одном узле сетки, bt – время исполнения операции барьерной син- хронизации. В случае когда локальная память не исполь- зуется, оценка (17) принимает вид )13)(12()(1 bcgg tttLLT  . Пусть GPU позволяет параллельно испол- нять bL потоков, где b – известное положи- тельное целое. Тогда общее время работы можно оценить как   ).(1 / 1 12),,( 1 / 1 LT b LN L N L M b i LMNT LN i                                          (18) Оценка (18) упрощается    ))(12()16 5(1/2),( bcg ttLt LLNLNT   (19) при следующих допущениях: время доступа к локальной памяти существенно меньше вре- мени доступа к глобальной, и тогда значением lt можно пренебречь; GPU исполняет все соз- данные потоки одновременно, т.е.  LNb / ; M = N. Функция ),( LNT при ],...,1[ NL  имеет один максимум, а ее минимум достигается при УСиМ, 2014, № 6 23 1L или NL  . Локальный минимум при 13N будет достигаться в точке NL  и рав- няться ))(12()45( bcg ttNtN  . Так как зна- чение L ограничено количеством вычислитель- ных ресурсов видеокарты, а условие 13N всегда выполняется для задач, требующих рас- параллеливания, наилучшей стратегией выбо- ра L будет его максимально возможное уве- личение. Алгоритмы решения трехмерных задач на GPU. В случае таких задач в сеточной области     NlhNkkhzNj jhyNiihx j jihhh /;,0,;,0 ,;,0,(: 332 211 предлагается два алгоритма организации вы- числений:  разностная схема рассматривается как три вложенных цикла, внутренние два из которых могут быть распараллелены, используя алго- ритмы для двумерных задач (алгоритм 1);  разностная схема рассматривается как три вложенных цикла, к двум из которых применя- ется операция скашивания (алгоритм 2). Пусть ),1,1,1(max 321  NNNK N = ),1,1,1min( 321  NNN          ).()(,1 ),()(,1 ),()(,1 1322313 1233212 2133121 NNNNNNN NNNNNNN NNNNNNN M Тогда, в первом случае, алгоритм для дву- мерных задач модифицируется следующим образом:  для трехмерной сетки размера N  M K, единицей вычислений в п. 2 алгоритма реше- ния двумерных задач будут блоки размера L  L K;  вычисления в п. 4 проводятся последова- тельно для слоев размера L  L трехмерного блока узлов сетки размера L  L K с локаль- ными координатами узлов от ),0,0( k до ),1,1( kLL  , 1,...,0  Kk . Время, затраченное L -потоками на обработку блока размера LL в рамках блока размера ,KLL  в этом случае можно оценить как )14)(12()4815()(21 bclg tttLtLLT  , а общее время работы (если GPU позволяет параллельно исполнять bL потоков) как   .)(1 / 1 12),,,( 21 / 1 22 LT b LN L N L M b i KLKMNT LN i                                          (20) Если GPU способен исполнить все создан- ные потоки одновременно, а KNM  , оценка (20) приобретает вид    LNNLNT /2),(22  )(1– 21 LT . Во втором случае, алгоритм, по аналогии с двумерным, принимает следующий вид: 1. Множество внутренних узлов (xi, yj zk)  h разбивается на кубические (кроме, возможно, граничных) блоки фиксированного размера L  L L. 2. На каждом из        LKLMLN /// 2 шагов выполняются независимые вычис- ления от единицы до    LMLN // блоках. При N1  N2  N3 координаты узлов блоков бу- дут находиться в диапазоне от ,1,1(  jLiL )1)(  Ljik до ,)1(,)1(( LjLi  ))1( Ljik  включительно, где ,...,0k      LMLN //   3/  LK – номер шага п. 2, ),( ji , ,...0i   1/..., LN , ,...,0j   1/ LM – номер бло- ка. Вычисления проводятся только если блок находится в пределах сетки. Для других случа- ев п. 2 алгоритма может быть легко модифи- цирован. 3. Для обработки каждого блока запускается группа из L2 потоков. 4. При вычислениях в пределах каждой груп- пы потоков используется схема, аналогичная п. 2. На каждом шаге  Lk 3,...,0 3, поток ),,( ji 1,...,0,1,...,0  LjLi обрабатывает узел ,,( ji ))( jik  блока размера L  L L, после чего проводится операция барьерной синхронизации. Время, затраченное L2-потоками на обра- ботку блока размера LLL  , можно оценить как 24 УСиМ, 2014, № 6 )13)(13()165()(31 bclg tttLtLLT  , а общее время работы, если GPU позволяет параллельно исполнять 2bL потоков, как:                          ).(1 // 1 1 2/)1()2/)1/(//)//( 1 2/)1/(// 2 1 2/)1( 2(),,,( 31 / 1 // 1 / 1 32 LT b LNLM L M L K b iLNLNLNLNLM b LNLNLNi b ii LKMNT LN i LNLM i LN i                                                                         (21) Если GPU способен исполнить все создан- ные потоки одновременно, а KMN  , оценка (21) принимает вид    )(1/3),( 3132 LTLNLNT  . Тестирование быстродействия параллель- ных алгоритмов для двумерных задач Алгоритмы тестировались на задачах разно- го размера на кластере СКІТ-4 Института ки- бернетики им. В.М. Глушкова НАНУ (12 узлов с 4 Intel Xeon E5-2600 и 3 NVidia Tesla M2075 на каждом; CentOS 5.9, Cuda toolkit 4.2, Open- MPI 1.6.5). При решении двумерного уравнения кон- векции–диффузии с использованием одного GPU для задачи размера (3600×1800) макси- мальное ускорение составило 9,6. Рассчитан- ная средняя погрешность оценивания времени обработки одного блока по формуле (17) со- ставила ~12 процентов. Время обработки оце- нивалось используя информацию о количестве вычислительных ресурсов видеокарты NVidia Tesla M2075, а максимальный размер блока ограничивался объемом локальной памяти. В соответствии с теоретическими оценками, полученное время работы незначительно зави- сит от размера обрабатываемой сетки и линей- но зависит от размера блока. Считая, что на вспомогательные операции при запуске каждо- го ядра (kernel) тратится фиксированное время 5,0kct мс, построены линейные зависимости для алгоритма с и без использования локаль- ной памяти в виде 1032,01855,0)(1  LLt мс и 5408,01664,0)(1  LLt мс соответственно. На основе этих зависимостей получены значения коэффициентов, входящих в формулу (17), и оценки времени обработки одного блока со- гласно этой формуле. Полученные результаты показывают, что использование локальной памяти приводит к увеличению ускорения при уменьшении раз- мера блока. Это может быть объяснено мень- шим количеством объединенных операций доступа к памяти при больших размерах бло- ка, что не учитывается в оценках (17), (18) и приводит к увеличению погрешности оцени- вания. Минимальное время работы получено для алгоритма с использованием локальной памяти при 16L , а для алгоритма без ее использова- ния – при 32L . В оптимальной ситуации второй алгоритм на шесть процентов быстрее первого. Тестирование быстродействия параллель- ных алгоритмов для трехмерных задач Алгоритмы с распараллеливанием одного цикла (алгоритм 1) и двух циклов (алгоритм 2) были реализованы и тестировались для урав- нения Пуассона и уравнения конвекции–диф- фузии. Размер блока во всех случаях был равен восьми и все алгоритмы реализованы по схе- мам, использующим локальную память GPU. Максимальное ускорение, в сравнении с вы- числениями на центральном процессоре CPU, полученное при решении алгоритмом 1 трех- мерных задач, ниже, чем в случае двумерных: 4,72 для уравнения конвекции–диффузии и 4,39 для уравнения Пуассона, тогда как при исполь- зовании алгоритма 2 – 28,53 для уравнения Пу- ассона и 30,66 – для уравнения конвекции– диффузии. Отметим, что увеличение ускорения при решении более сложной задачи. В случае алгоритма 2 существенный вклад в общее время вычислений вносит операция учета краевых условий. Эта операция была ре- ализована как GPU-kernel, каждый поток кото- рого обрабатывает один узел сетки путем по- лучения значения маркера из массива–маски краевых условий и внесения изменений в мас- сив значений искомой функции. Такая опера- ция есть плохо распараллеливаемой на GPU в силу того, что количество операций с памятью существенно превышает количество арифме- тических операций. УСиМ, 2014, № 6 25 Были рассчитаны оценки времени работы (согласно схемам расщепления) по формулам (20), (21) и относительные погрешности оце- нивания, которые, в целом, находятся в прием- лемом диапазоне ~15 процентов. Факторы, влияющие на точность оценок, могут быть вы- явлены при анализе времени работы GPU- kernel на отдельных шагах алгоритмов. Время обработки одного слоя размера LL в рамках блока размера KLL  на шагах п. 2 алгоритма 1 для различных задач приведено на рис. 1. Рис. 1. Время исполнения шагов п. 2 алгоритма 1 В рамках описанных процедур оценки вре- мени работы алгоритмов время обработки од- ного слоя размера LL принято постоянным, исходя из допущения о постоянности времени доступа к глобальной памяти. Однако, как сле- дует из рис. 1, это время не есть постоянным. Временные вариации увеличиваются при ре- шении уравнения конвенции–диффузии, тре- бующего большего количества операций об- ращения к глобальной памяти в сравнении с решением уравнения Пуассона. Время исполнения шагов п. 2 алгоритма 2 для задачи размера 320×320×240 при решении уравнения Пуассона приведено на рис. 2. На рис. 2 наблюдаются участки, соответ- ствующие слагаемым формулы (21): с квадра- тичным (шаги 1–30 и 81–110), линейным рос- том количества обрабатываемых блоков (шаги 31–40 и 71–80), а также неизменным их коли- чеством (шаги 41–70). Однако различные фак- торы, в частности кэширование, приводят к не- точному оцениванию согласно формуле. Кро- ме того, результаты экспериментов показали, что время обработки одного блока, в соответ- ствии с исходными допущениями, не зависит от размера сетки. Рис. 2. Время исполнения шагов п. 2 алгоритма 2 Заключение. В работе для разностных схем расщепления с явной организацией вычисле- ний применительно к дву- и трехмерным зада- чам моделирования распространения загрязне- ний в атмосфере разработаны параллельные алгоритмы для графических процессоров. По- лучены теоретические оценки времени работы алгоритмов, позволяющие выбирать оптималь- ную с помощью быстродействия схему орга- низации вычислений. Результаты тестирования показали высокую эффективность алгоритмов для GPU: ускорение для двумерных задач со- ставило ~10, а для трехмерных – ~30. 1. Марчук Г.И. Математическое моделирование в про- блеме окружающей среды. – М.: Наука, 1982. – 320 с. 2. Численное моделирование распространения за- грязнения в окружающей среде / М.З. Згуровский, В.В. Скопецкий, В.К. Хрущ и др. – К.: Наук. думка, 1997. – 368 с. 3. Аргучинцев В.К., Аргучинцева А.В. Модели и мето- ды для решения задач охраны атмосферы, гидро- сферы и подстилающей поверхности. – Иркутск: ИГУ, 2001. – 114 с. 4. Алоян А.Е., Пененко В.В., Козодеров В.В. Матема- тическое моделирование в проблеме окружающей среды // Современные проблемы вычислительной математики и математического моделирования. – 2005. – Т. 2. – С. 279–351. 5. Алоян А.Е. Моделирование динамики и кинетики газовых примесей и аэрозолей в атмосфере. – М.: Наука, 2008. – 415 с. 26 УСиМ, 2014, № 6 6. Основи математичного моделювання в екології / А.В. Гладкий, І.В. Сергієнко, В.В. Скопецький та ін. – К.: НТУУ «КПІ», 2009. – 240 с. 7. Марчук Г.И. Методы расщепления. – М.: Наука, 1988. – 264 c. 8. Самарский А.А., Вабищевич П.Н. Численные мето- ды решения задач конвекции–диффузии. – М.: Эдиториал УРСС, 2004. – 248 с. 9. Zhang Y., Cohen J., Owens J. Fast tridiagonal solvers on the GPU // PPoPP '10 Proc. of the 15th ACM SIGPLAN Symp. on Principles and Practice of Parallel Program., Bangalor, Ind., Jan. 9–14 2010. – P. 127– 136. 10. Davidson A., Zhang Y., Owens J. An auto-tuned method for solving large tridiagonal systems on the GPU // Proc. of the 25th IEEE Intern. Parallel and Dis- tributed Processing Symp., May 2011. – P. 956–965, 11. Goddeke D., Strzodka R. Cyclic reduction tridiagonal solvers on GPUs applied to mixed precision multigrid // IEEE Trans. Parallel Dist. Syst. – 2010. – 21. – P. 22–32. 12. GPGPU-based ADE-FDTD method for fast electro- magnetic field simulation and its estimation / Y. Inoue, M. Unno, S. Aono et al. // Microwave Conf. Proc. (APMC), 2011 Asia-Pacific. – P. 733–736. 13. Автоматично налагоджуваний паралельний алго- ритм чисельного розв’язання багатовимірної задачі моделювання навколишнього середовища / П.А. Ів- аненко, А.Ю. Дорошенко, Л.М. Суслова та ін. // Пробл. програм. – 2010. – № 2–3. – С. 202–208. 14. Черниш Р.І., Тирчак Ю.М., Іваненко П.А. Побудова паралельного алгоритму чисельного розв’язання багатовимірної задачі моделювання навколишньо- го середовища // Там же. – 2009. – № 1. – С. 85–91 15. Скопецкий В.В., Богаенко В.А. Моделирование пря- мых и обратных задач распространения загрязне- ний в воздушной среде с помощью кластерной си- стемы СКИТ // УСиМ. – 2007. – № 5. – С. 86–92. 16. Самарский А.А., Николаев Е.С. Методы решения сеточных уравнений. – М.: Наука, 1987. – 588 с. 17. Гладкий А.В. Об исследовании алгоритмов расще- пления в задачах конвекции–диффузии // Киберне- тика и системный анализ. – 2014. – № 4. – С. 76–88. 18. David F. Bacon, Susan L. Graham, Oliver J. Sharp. Compiler transformations for high-performance com- puting // ACM Comp. Surveys (CSUR), Dec. 1994. – 26, Issue 4, – P. 345–420. Поступила 29.09.2014 Тел. для справок: +38 044 526-4167, 067 134-7585, 425-6472 (Киев) E-mail: gladky@ukr.net, sevab@ukr.net © А.В. Гладкий, В.А. Богаенко, 2014  << /ASCII85EncodePages false /AllowTransparency false /AutoPositionEPSFiles true /AutoRotatePages /None /Binding /Left /CalGrayProfile (Dot Gain 20%) /CalRGBProfile (sRGB IEC61966-2.1) /CalCMYKProfile (U.S. Web Coated \050SWOP\051 v2) /sRGBProfile (sRGB IEC61966-2.1) /CannotEmbedFontPolicy /Error /CompatibilityLevel 1.4 /CompressObjects /Tags /CompressPages true /ConvertImagesToIndexed true /PassThroughJPEGImages true /CreateJobTicket false /DefaultRenderingIntent /Default /DetectBlends true /DetectCurves 0.0000 /ColorConversionStrategy /CMYK /DoThumbnails false /EmbedAllFonts true /EmbedOpenType false /ParseICCProfilesInComments true /EmbedJobOptions true /DSCReportingLevel 0 /EmitDSCWarnings false /EndPage -1 /ImageMemory 1048576 /LockDistillerParams false /MaxSubsetPct 100 /Optimize true /OPM 1 /ParseDSCComments true /ParseDSCCommentsForDocInfo true /PreserveCopyPage true /PreserveDICMYKValues true /PreserveEPSInfo true /PreserveFlatness true /PreserveHalftoneInfo false /PreserveOPIComments true /PreserveOverprintSettings true /StartPage 1 /SubsetFonts true /TransferFunctionInfo /Apply /UCRandBGInfo /Preserve /UsePrologue false /ColorSettingsFile () /AlwaysEmbed [ true ] /NeverEmbed [ true ] /AntiAliasColorImages false /CropColorImages true /ColorImageMinResolution 300 /ColorImageMinResolutionPolicy /OK /DownsampleColorImages true /ColorImageDownsampleType /Bicubic /ColorImageResolution 300 /ColorImageDepth -1 /ColorImageMinDownsampleDepth 1 /ColorImageDownsampleThreshold 1.50000 /EncodeColorImages true /ColorImageFilter /DCTEncode /AutoFilterColorImages true /ColorImageAutoFilterStrategy /JPEG /ColorACSImageDict << /QFactor 0.15 /HSamples [1 1 1 1] /VSamples [1 1 1 1] >> /ColorImageDict << /QFactor 0.15 /HSamples [1 1 1 1] /VSamples [1 1 1 1] >> /JPEG2000ColorACSImageDict << /TileWidth 256 /TileHeight 256 /Quality 30 >> /JPEG2000ColorImageDict << /TileWidth 256 /TileHeight 256 /Quality 30 >> /AntiAliasGrayImages false /CropGrayImages true /GrayImageMinResolution 300 /GrayImageMinResolutionPolicy /OK /DownsampleGrayImages true /GrayImageDownsampleType /Bicubic /GrayImageResolution 300 /GrayImageDepth -1 /GrayImageMinDownsampleDepth 2 /GrayImageDownsampleThreshold 1.50000 /EncodeGrayImages true /GrayImageFilter /DCTEncode /AutoFilterGrayImages true /GrayImageAutoFilterStrategy /JPEG /GrayACSImageDict << /QFactor 0.15 /HSamples [1 1 1 1] /VSamples [1 1 1 1] >> /GrayImageDict << /QFactor 0.15 /HSamples [1 1 1 1] /VSamples [1 1 1 1] >> /JPEG2000GrayACSImageDict << /TileWidth 256 /TileHeight 256 /Quality 30 >> /JPEG2000GrayImageDict << /TileWidth 256 /TileHeight 256 /Quality 30 >> /AntiAliasMonoImages false /CropMonoImages true /MonoImageMinResolution 1200 /MonoImageMinResolutionPolicy /OK /DownsampleMonoImages true /MonoImageDownsampleType /Bicubic /MonoImageResolution 1200 /MonoImageDepth -1 /MonoImageDownsampleThreshold 1.50000 /EncodeMonoImages true /MonoImageFilter /CCITTFaxEncode /MonoImageDict << /K -1 >> /AllowPSXObjects false /CheckCompliance [ /None ] /PDFX1aCheck false /PDFX3Check false /PDFXCompliantPDFOnly false /PDFXNoTrimBoxError true /PDFXTrimBoxToMediaBoxOffset [ 0.00000 0.00000 0.00000 0.00000 ] /PDFXSetBleedBoxToMediaBox true /PDFXBleedBoxToTrimBoxOffset [ 0.00000 0.00000 0.00000 0.00000 ] /PDFXOutputIntentProfile () /PDFXOutputConditionIdentifier () /PDFXOutputCondition () /PDFXRegistryName () /PDFXTrapped /False /CreateJDFFile false /Description << /ARA <FEFF06270633062A062E062F0645002006470630064700200627064406250639062F0627062F0627062A002006440625064606340627062100200648062B062706260642002000410064006F00620065002000500044004600200645062A064806270641064206290020064406440637062806270639062900200641064A00200627064406450637062706280639002006300627062A0020062F0631062C0627062A002006270644062C0648062F0629002006270644063906270644064A0629061B0020064A06450643064600200641062A062D00200648062B0627062606420020005000440046002006270644064506460634062306290020062806270633062A062E062F062706450020004100630072006F0062006100740020064800410064006F006200650020005200650061006400650072002006250635062F0627063100200035002E0030002006480627064406250635062F062706310627062A0020062706440623062D062F062B002E0635062F0627063100200035002E0030002006480627064406250635062F062706310627062A0020062706440623062D062F062B002E> /BGR <FEFF04180437043f043e043b043704320430043904420435002004420435043704380020043d0430044104420440043e0439043a0438002c00200437043000200434043000200441044a0437043404300432043004420435002000410064006f00620065002000500044004600200434043e043a0443043c0435043d04420438002c0020043c0430043a04410438043c0430043b043d043e0020043f044004380433043e04340435043d04380020043704300020043204380441043e043a043e043a0430044704350441044204320435043d0020043f04350447043004420020043704300020043f044004350434043f0435044704300442043d04300020043f043e04340433043e0442043e0432043a0430002e002000200421044a04370434043004340435043d043804420435002000500044004600200434043e043a0443043c0435043d044204380020043c043e0433043004420020043404300020044104350020043e0442043204300440044f0442002004410020004100630072006f00620061007400200438002000410064006f00620065002000520065006100640065007200200035002e00300020043800200441043b0435043404320430044904380020043204350440044104380438002e> /CHS <FEFF4f7f75288fd94e9b8bbe5b9a521b5efa7684002000410064006f006200650020005000440046002065876863900275284e8e9ad88d2891cf76845370524d53705237300260a853ef4ee54f7f75280020004100630072006f0062006100740020548c002000410064006f00620065002000520065006100640065007200200035002e003000204ee553ca66f49ad87248672c676562535f00521b5efa768400200050004400460020658768633002> /CHT <FEFF4f7f752890194e9b8a2d7f6e5efa7acb7684002000410064006f006200650020005000440046002065874ef69069752865bc9ad854c18cea76845370524d5370523786557406300260a853ef4ee54f7f75280020004100630072006f0062006100740020548c002000410064006f00620065002000520065006100640065007200200035002e003000204ee553ca66f49ad87248672c4f86958b555f5df25efa7acb76840020005000440046002065874ef63002> /CZE <FEFF005400610074006f0020006e006100730074006100760065006e00ed00200070006f0075017e0069006a007400650020006b0020007600790074007600e101590065006e00ed00200064006f006b0075006d0065006e0074016f002000410064006f006200650020005000440046002c0020006b00740065007200e90020007300650020006e0065006a006c00e90070006500200068006f006400ed002000700072006f0020006b00760061006c00690074006e00ed0020007400690073006b00200061002000700072006500700072006500730073002e002000200056007900740076006f01590065006e00e900200064006f006b0075006d0065006e007400790020005000440046002000620075006400650020006d006f017e006e00e90020006f007400650076015900ed007400200076002000700072006f006700720061006d0065006300680020004100630072006f00620061007400200061002000410064006f00620065002000520065006100640065007200200035002e0030002000610020006e006f0076011b006a016100ed00630068002e> /DAN <FEFF004200720075006700200069006e0064007300740069006c006c0069006e006700650072006e0065002000740069006c0020006100740020006f007000720065007400740065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e007400650072002c0020006400650072002000620065006400730074002000650067006e006500720020007300690067002000740069006c002000700072006500700072006500730073002d007500640073006b007200690076006e0069006e00670020006100660020006800f8006a0020006b00760061006c0069007400650074002e0020004400650020006f007000720065007400740065006400650020005000440046002d0064006f006b0075006d0065006e0074006500720020006b0061006e002000e50062006e00650073002000690020004100630072006f00620061007400200065006c006c006500720020004100630072006f006200610074002000520065006100640065007200200035002e00300020006f00670020006e0079006500720065002e> /DEU <FEFF00560065007200770065006e00640065006e0020005300690065002000640069006500730065002000450069006e007300740065006c006c0075006e00670065006e0020007a0075006d002000450072007300740065006c006c0065006e00200076006f006e002000410064006f006200650020005000440046002d0044006f006b0075006d0065006e00740065006e002c00200076006f006e002000640065006e0065006e002000530069006500200068006f006300680077006500720074006900670065002000500072006500700072006500730073002d0044007200750063006b0065002000650072007a0065007500670065006e0020006d00f60063006800740065006e002e002000450072007300740065006c006c007400650020005000440046002d0044006f006b0075006d0065006e007400650020006b00f6006e006e0065006e0020006d006900740020004100630072006f00620061007400200075006e0064002000410064006f00620065002000520065006100640065007200200035002e00300020006f0064006500720020006800f600680065007200200067006500f600660066006e00650074002000770065007200640065006e002e> /ESP <FEFF005500740069006c0069006300650020006500730074006100200063006f006e0066006900670075007200610063006900f3006e0020007000610072006100200063007200650061007200200064006f00630075006d0065006e0074006f00730020005000440046002000640065002000410064006f0062006500200061006400650063007500610064006f00730020007000610072006100200069006d0070007200650073006900f3006e0020007000720065002d0065006400690074006f007200690061006c00200064006500200061006c00740061002000630061006c0069006400610064002e002000530065002000700075006500640065006e00200061006200720069007200200064006f00630075006d0065006e0074006f00730020005000440046002000630072006500610064006f007300200063006f006e0020004100630072006f006200610074002c002000410064006f00620065002000520065006100640065007200200035002e003000200079002000760065007200730069006f006e0065007300200070006f00730074006500720069006f007200650073002e> /ETI <FEFF004b00610073007500740061006700650020006e0065006900640020007300e4007400740065006900640020006b00760061006c006900740065006500740073006500200074007200fc006b006900650065006c007300650020007000720069006e00740069006d0069007300650020006a0061006f006b007300200073006f00620069006c0069006b0065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e00740069006400650020006c006f006f006d006900730065006b0073002e00200020004c006f006f0064007500640020005000440046002d0064006f006b0075006d0065006e00740065002000730061006100740065002000610076006100640061002000700072006f006700720061006d006d006900640065006700610020004100630072006f0062006100740020006e0069006e0067002000410064006f00620065002000520065006100640065007200200035002e00300020006a00610020007500750065006d006100740065002000760065007200730069006f006f006e00690064006500670061002e000d000a> /FRA <FEFF005500740069006c006900730065007a00200063006500730020006f007000740069006f006e00730020006100660069006e00200064006500200063007200e900650072002000640065007300200064006f00630075006d0065006e00740073002000410064006f00620065002000500044004600200070006f0075007200200075006e00650020007100750061006c0069007400e90020006400270069006d007000720065007300730069006f006e00200070007200e9007000720065007300730065002e0020004c0065007300200064006f00630075006d0065006e00740073002000500044004600200063007200e900e90073002000700065007500760065006e0074002000ea0074007200650020006f007500760065007200740073002000640061006e00730020004100630072006f006200610074002c002000610069006e00730069002000710075002700410064006f00620065002000520065006100640065007200200035002e0030002000650074002000760065007200730069006f006e007300200075006c007400e90072006900650075007200650073002e> /GRE <FEFF03a703c103b703c303b903bc03bf03c003bf03b903ae03c303c403b5002003b103c503c403ad03c2002003c403b903c2002003c103c503b803bc03af03c303b503b903c2002003b303b903b1002003bd03b1002003b403b703bc03b903bf03c503c103b303ae03c303b503c403b5002003ad03b303b303c103b103c603b1002000410064006f006200650020005000440046002003c003bf03c5002003b503af03bd03b103b9002003ba03b103c42019002003b503be03bf03c703ae03bd002003ba03b103c403ac03bb03bb03b703bb03b1002003b303b903b1002003c003c103bf002d03b503ba03c403c503c003c903c403b903ba03ad03c2002003b503c103b303b103c303af03b503c2002003c503c803b703bb03ae03c2002003c003bf03b903cc03c403b703c403b103c2002e0020002003a403b10020005000440046002003ad03b303b303c103b103c603b1002003c003bf03c5002003ad03c703b503c403b5002003b403b703bc03b903bf03c503c103b303ae03c303b503b9002003bc03c003bf03c103bf03cd03bd002003bd03b1002003b103bd03bf03b903c703c403bf03cd03bd002003bc03b5002003c403bf0020004100630072006f006200610074002c002003c403bf002000410064006f00620065002000520065006100640065007200200035002e0030002003ba03b103b9002003bc03b503c403b103b303b503bd03ad03c303c403b503c103b503c2002003b503ba03b403cc03c303b503b903c2002e> /HEB <FEFF05D405E905EA05DE05E905D5002005D105D405D205D305E805D505EA002005D005DC05D4002005DB05D305D9002005DC05D905E605D505E8002005DE05E105DE05DB05D9002000410064006F006200650020005000440046002005D405DE05D505EA05D005DE05D905DD002005DC05D405D305E405E105EA002005E705D305DD002D05D305E405D505E1002005D005D905DB05D505EA05D905EA002E002005DE05E105DE05DB05D90020005000440046002005E905E005D505E605E805D5002005E005D905EA05E005D905DD002005DC05E405EA05D905D705D4002005D105D005DE05E605E205D505EA0020004100630072006F006200610074002005D5002D00410064006F00620065002000520065006100640065007200200035002E0030002005D505D205E805E105D005D505EA002005DE05EA05E705D305DE05D505EA002005D905D505EA05E8002E05D005DE05D905DD002005DC002D005000440046002F0058002D0033002C002005E205D905D905E005D5002005D105DE05D305E805D905DA002005DC05DE05E905EA05DE05E9002005E905DC0020004100630072006F006200610074002E002005DE05E105DE05DB05D90020005000440046002005E905E005D505E605E805D5002005E005D905EA05E005D905DD002005DC05E405EA05D905D705D4002005D105D005DE05E605E205D505EA0020004100630072006F006200610074002005D5002D00410064006F00620065002000520065006100640065007200200035002E0030002005D505D205E805E105D005D505EA002005DE05EA05E705D305DE05D505EA002005D905D505EA05E8002E> /HRV (Za stvaranje Adobe PDF dokumenata najpogodnijih za visokokvalitetni ispis prije tiskanja koristite ove postavke. Stvoreni PDF dokumenti mogu se otvoriti Acrobat i Adobe Reader 5.0 i kasnijim verzijama.) /HUN <FEFF004b0069007600e1006c00f30020006d0069006e0151007300e9006701710020006e0079006f006d00640061006900200065006c0151006b00e90073007a00ed007401510020006e0079006f006d00740061007400e100730068006f007a0020006c006500670069006e006b00e1006200620020006d0065006700660065006c0065006c0151002000410064006f00620065002000500044004600200064006f006b0075006d0065006e00740075006d006f006b0061007400200065007a0065006b006b0065006c0020006100200062006500e1006c006c00ed007400e10073006f006b006b0061006c0020006b00e90073007a00ed0074006800650074002e0020002000410020006c00e90074007200650068006f007a006f00740074002000500044004600200064006f006b0075006d0065006e00740075006d006f006b00200061007a0020004100630072006f006200610074002000e9007300200061007a002000410064006f00620065002000520065006100640065007200200035002e0030002c0020007600610067007900200061007a002000610074007400f3006c0020006b00e9007301510062006200690020007600650072007a006900f3006b006b0061006c0020006e00790069007400680061007400f3006b0020006d00650067002e> /ITA <FEFF005500740069006c0069007a007a006100720065002000710075006500730074006500200069006d0070006f007300740061007a0069006f006e00690020007000650072002000630072006500610072006500200064006f00630075006d0065006e00740069002000410064006f00620065002000500044004600200070006900f900200061006400610074007400690020006100200075006e00610020007000720065007300740061006d0070006100200064006900200061006c007400610020007100750061006c0069007400e0002e0020004900200064006f00630075006d0065006e007400690020005000440046002000630072006500610074006900200070006f00730073006f006e006f0020006500730073006500720065002000610070006500720074006900200063006f006e0020004100630072006f00620061007400200065002000410064006f00620065002000520065006100640065007200200035002e003000200065002000760065007200730069006f006e006900200073007500630063006500730073006900760065002e> /JPN <FEFF9ad854c18cea306a30d730ea30d730ec30b951fa529b7528002000410064006f0062006500200050004400460020658766f8306e4f5c6210306b4f7f75283057307e305930023053306e8a2d5b9a30674f5c62103055308c305f0020005000440046002030d530a130a430eb306f3001004100630072006f0062006100740020304a30883073002000410064006f00620065002000520065006100640065007200200035002e003000204ee5964d3067958b304f30533068304c3067304d307e305930023053306e8a2d5b9a306b306f30d530a930f330c8306e57cb30818fbc307f304c5fc59808306730593002> /KOR <FEFFc7740020c124c815c7440020c0acc6a9d558c5ec0020ace0d488c9c80020c2dcd5d80020c778c1c4c5d00020ac00c7a50020c801d569d55c002000410064006f0062006500200050004400460020bb38c11cb97c0020c791c131d569b2c8b2e4002e0020c774b807ac8c0020c791c131b41c00200050004400460020bb38c11cb2940020004100630072006f0062006100740020bc0f002000410064006f00620065002000520065006100640065007200200035002e00300020c774c0c1c5d0c11c0020c5f40020c2180020c788c2b5b2c8b2e4002e> /LTH <FEFF004e006100750064006f006b0069007400650020016100690075006f007300200070006100720061006d006500740072007500730020006e006f0072011700640061006d00690020006b0075007200740069002000410064006f00620065002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b00750072006900650020006c0061006200690061007500730069006100690020007000720069007400610069006b007900740069002000610075006b01610074006f00730020006b006f006b007900620117007300200070006100720065006e006700740069006e00690061006d00200073007000610075007300640069006e0069006d00750069002e0020002000530075006b0075007200740069002000500044004600200064006f006b0075006d0065006e007400610069002000670061006c006900200062016b007400690020006100740069006400610072006f006d00690020004100630072006f006200610074002000690072002000410064006f00620065002000520065006100640065007200200035002e0030002000610072002000760117006c00650073006e0117006d00690073002000760065007200730069006a006f006d00690073002e> /LVI <FEFF0049007a006d0061006e0074006f006a00690065007400200161006f00730020006900650073007400610074012b006a0075006d00750073002c0020006c0061006900200076006500690064006f00740075002000410064006f00620065002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b006100730020006900720020012b00700061016100690020007000690065006d01130072006f00740069002000610075006700730074006100730020006b00760061006c0069007401010074006500730020007000690072006d007300690065007300700069006501610061006e006100730020006400720075006b00610069002e00200049007a0076006500690064006f006a006900650074002000500044004600200064006f006b0075006d0065006e007400750073002c0020006b006f002000760061007200200061007400760113007200740020006100720020004100630072006f00620061007400200075006e002000410064006f00620065002000520065006100640065007200200035002e0030002c0020006b0101002000610072012b00200074006f0020006a00610075006e0101006b0101006d002000760065007200730069006a0101006d002e> /NLD (Gebruik deze instellingen om Adobe PDF-documenten te maken die zijn geoptimaliseerd voor prepress-afdrukken van hoge kwaliteit. De gemaakte PDF-documenten kunnen worden geopend met Acrobat en Adobe Reader 5.0 en hoger.) /NOR <FEFF004200720075006b00200064006900730073006500200069006e006e007300740069006c006c0069006e00670065006e0065002000740069006c002000e50020006f0070007000720065007400740065002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e00740065007200200073006f006d00200065007200200062006500730074002000650067006e0065007400200066006f00720020006600f80072007400720079006b006b0073007500740073006b00720069006600740020006100760020006800f800790020006b00760061006c0069007400650074002e0020005000440046002d0064006f006b0075006d0065006e00740065006e00650020006b0061006e002000e50070006e00650073002000690020004100630072006f00620061007400200065006c006c00650072002000410064006f00620065002000520065006100640065007200200035002e003000200065006c006c00650072002000730065006e006500720065002e> /POL <FEFF0055007300740061007700690065006e0069006100200064006f002000740077006f0072007a0065006e0069006100200064006f006b0075006d0065006e007400f300770020005000440046002000700072007a0065007a006e00610063007a006f006e00790063006800200064006f002000770079006400720075006b00f30077002000770020007700790073006f006b00690065006a0020006a0061006b006f015b00630069002e002000200044006f006b0075006d0065006e0074007900200050004400460020006d006f017c006e00610020006f007400770069006500720061010700200077002000700072006f006700720061006d006900650020004100630072006f00620061007400200069002000410064006f00620065002000520065006100640065007200200035002e0030002000690020006e006f00770073007a0079006d002e> /PTB <FEFF005500740069006c0069007a006500200065007300730061007300200063006f006e00660069006700750072006100e700f50065007300200064006500200066006f0072006d00610020006100200063007200690061007200200064006f00630075006d0065006e0074006f0073002000410064006f0062006500200050004400460020006d00610069007300200061006400650071007500610064006f00730020007000610072006100200070007200e9002d0069006d0070007200650073007300f50065007300200064006500200061006c007400610020007100750061006c00690064006100640065002e0020004f007300200064006f00630075006d0065006e0074006f00730020005000440046002000630072006900610064006f007300200070006f00640065006d0020007300650072002000610062006500720074006f007300200063006f006d0020006f0020004100630072006f006200610074002000650020006f002000410064006f00620065002000520065006100640065007200200035002e0030002000650020007600650072007300f50065007300200070006f00730074006500720069006f007200650073002e> /RUM <FEFF005500740069006c0069007a00610163006900200061006300650073007400650020007300650074010300720069002000700065006e007400720075002000610020006300720065006100200064006f00630075006d0065006e00740065002000410064006f006200650020005000440046002000610064006500630076006100740065002000700065006e0074007200750020007400690070010300720069007200650061002000700072006500700072006500730073002000640065002000630061006c006900740061007400650020007300750070006500720069006f006100720103002e002000200044006f00630075006d0065006e00740065006c00650020005000440046002000630072006500610074006500200070006f00740020006600690020006400650073006300680069007300650020006300750020004100630072006f006200610074002c002000410064006f00620065002000520065006100640065007200200035002e00300020015f00690020007600650072007300690075006e0069006c006500200075006c0074006500720069006f006100720065002e> /RUS <FEFF04180441043f043e043b044c04370443043904420435002004340430043d043d044b04350020043d0430044104420440043e0439043a043800200434043b044f00200441043e043704340430043d0438044f00200434043e043a0443043c0435043d0442043e0432002000410064006f006200650020005000440046002c0020043c0430043a04410438043c0430043b044c043d043e0020043f043e04340445043e0434044f04490438044500200434043b044f00200432044b0441043e043a043e043a0430044704350441044204320435043d043d043e0433043e00200434043e043f0435044704300442043d043e0433043e00200432044b0432043e04340430002e002000200421043e043704340430043d043d044b04350020005000440046002d0434043e043a0443043c0435043d0442044b0020043c043e0436043d043e0020043e0442043a0440044b043204300442044c002004410020043f043e043c043e0449044c044e0020004100630072006f00620061007400200438002000410064006f00620065002000520065006100640065007200200035002e00300020043800200431043e043b043504350020043f043e04370434043d043804450020043204350440044104380439002e> /SKY <FEFF0054006900650074006f0020006e006100730074006100760065006e0069006100200070006f0075017e0069007400650020006e00610020007600790074007600e100720061006e0069006500200064006f006b0075006d0065006e0074006f0076002000410064006f006200650020005000440046002c0020006b0074006f007200e90020007300610020006e0061006a006c0065007001610069006500200068006f0064006900610020006e00610020006b00760061006c00690074006e00fa00200074006c0061010d00200061002000700072006500700072006500730073002e00200056007900740076006f00720065006e00e900200064006f006b0075006d0065006e007400790020005000440046002000620075006400650020006d006f017e006e00e90020006f00740076006f00720069016500200076002000700072006f006700720061006d006f006300680020004100630072006f00620061007400200061002000410064006f00620065002000520065006100640065007200200035002e0030002000610020006e006f0076016100ed00630068002e> /SLV <FEFF005400650020006e006100730074006100760069007400760065002000750070006f0072006100620069007400650020007a00610020007500730074007600610072006a0061006e006a006500200064006f006b0075006d0065006e0074006f0076002000410064006f006200650020005000440046002c0020006b006900200073006f0020006e0061006a007000720069006d00650072006e0065006a016100690020007a00610020006b0061006b006f0076006f00730074006e006f0020007400690073006b0061006e006a00650020007300200070007200690070007200610076006f0020006e00610020007400690073006b002e00200020005500730074007600610072006a0065006e006500200064006f006b0075006d0065006e0074006500200050004400460020006a00650020006d006f0067006f010d00650020006f0064007000720065007400690020007a0020004100630072006f00620061007400200069006e002000410064006f00620065002000520065006100640065007200200035002e003000200069006e0020006e006f00760065006a01610069006d002e> /SUO <FEFF004b00e40079007400e40020006e00e40069007400e4002000610073006500740075006b007300690061002c0020006b0075006e0020006c0075006f00740020006c00e400680069006e006e00e4002000760061006100740069007600610061006e0020007000610069006e006100740075006b00730065006e002000760061006c006d0069007300740065006c00750074007900f6006800f6006e00200073006f00700069007600690061002000410064006f0062006500200050004400460020002d0064006f006b0075006d0065006e007400740065006a0061002e0020004c0075006f0064007500740020005000440046002d0064006f006b0075006d0065006e00740069007400200076006f0069006400610061006e0020006100760061007400610020004100630072006f0062006100740069006c006c00610020006a0061002000410064006f00620065002000520065006100640065007200200035002e0030003a006c006c00610020006a006100200075007500640065006d006d0069006c006c0061002e> /SVE <FEFF0041006e007600e4006e00640020006400650020006800e4007200200069006e0073007400e4006c006c006e0069006e006700610072006e00610020006f006d002000640075002000760069006c006c00200073006b006100700061002000410064006f006200650020005000440046002d0064006f006b0075006d0065006e007400200073006f006d002000e400720020006c00e4006d0070006c0069006700610020006600f60072002000700072006500700072006500730073002d007500740073006b00720069006600740020006d006500640020006800f600670020006b00760061006c0069007400650074002e002000200053006b006100700061006400650020005000440046002d0064006f006b0075006d0065006e00740020006b0061006e002000f600700070006e00610073002000690020004100630072006f0062006100740020006f00630068002000410064006f00620065002000520065006100640065007200200035002e00300020006f00630068002000730065006e006100720065002e> /TUR <FEFF005900fc006b00730065006b0020006b0061006c006900740065006c0069002000f6006e002000790061007a006401310072006d00610020006200610073006b013100730131006e006100200065006e0020006900790069002000750079006100620069006c006500630065006b002000410064006f006200650020005000440046002000620065006c00670065006c0065007200690020006f006c0075015f007400750072006d0061006b0020006900e70069006e00200062007500200061007900610072006c0061007201310020006b0075006c006c0061006e0131006e002e00200020004f006c0075015f0074007500720075006c0061006e0020005000440046002000620065006c00670065006c0065007200690020004100630072006f006200610074002000760065002000410064006f00620065002000520065006100640065007200200035002e003000200076006500200073006f006e0072006100730131006e00640061006b00690020007300fc007200fc006d006c00650072006c00650020006100e70131006c006100620069006c00690072002e> /UKR <FEFF04120438043a043e0440043804410442043e043204430439044204350020044604560020043f043004400430043c043504420440043800200434043b044f0020044104420432043e04400435043d043d044f00200434043e043a0443043c0435043d044204560432002000410064006f006200650020005000440046002c0020044f043a04560020043d04300439043a04400430044904350020043f045604340445043e0434044f0442044c00200434043b044f0020043204380441043e043a043e044f043a04560441043d043e0433043e0020043f0435044004350434043404400443043a043e0432043e0433043e0020043404400443043a0443002e00200020042104420432043e04400435043d045600200434043e043a0443043c0435043d0442043800200050004400460020043c043e0436043d04300020043204560434043a0440043804420438002004430020004100630072006f006200610074002004420430002000410064006f00620065002000520065006100640065007200200035002e0030002004300431043e0020043f04560437043d04560448043e04570020043204350440044104560457002e> /ENU (Use these settings to create Adobe PDF documents best suited for high-quality prepress printing. Created PDF documents can be opened with Acrobat and Adobe Reader 5.0 and later.) >> /Namespace [ (Adobe) (Common) (1.0) ] /OtherNamespaces [ << /AsReaderSpreads false /CropImagesToFrames true /ErrorControl /WarnAndContinue /FlattenerIgnoreSpreadOverrides false /IncludeGuidesGrids false /IncludeNonPrinting false /IncludeSlug false /Namespace [ (Adobe) (InDesign) (4.0) ] /OmitPlacedBitmaps false /OmitPlacedEPS false /OmitPlacedPDF false /SimulateOverprint /Legacy >> << /AddBleedMarks false /AddColorBars false /AddCropMarks false /AddPageInfo false /AddRegMarks false /ConvertColors /ConvertToCMYK /DestinationProfileName () /DestinationProfileSelector /DocumentCMYK /Downsample16BitImages true /FlattenerPreset << /PresetSelector /MediumResolution >> /FormElements false /GenerateStructure false /IncludeBookmarks false /IncludeHyperlinks false /IncludeInteractive false /IncludeLayers false /IncludeProfiles false /MultimediaHandling /UseObjectSettings /Namespace [ (Adobe) (CreativeSuite) (2.0) ] /PDFXOutputIntentProfileSelector /DocumentCMYK /PreserveEditing true /UntaggedCMYKHandling /LeaveUntagged /UntaggedRGBHandling /UseDocumentProfile /UseDocumentBleed false >> ] >> setdistillerparams << /HWResolution [2400 2400] /PageSize [612.000 792.000] >> setpagedevice
id nasplib_isofts_kiev_ua-123456789-83535
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 0130-5395
language Russian
last_indexed 2025-12-07T15:17:54Z
publishDate 2014
publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
record_format dspace
spelling Гладкий, А.В.
Богаенко, В.А.
2015-06-20T10:46:10Z
2015-06-20T10:46:10Z
2014
Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений / А.В. Гладкий, В.А. Богаенко // Управляющие системы и машины. — 2014. — № 6. — С. 18-26. — Бібліогр.: 18 назв. — рос.
0130-5395
https://nasplib.isofts.kiev.ua/handle/123456789/83535
517:519.6
Рассмотрена задача моделирования переноса загрязнений в атмосфере на основе нестационарного уравнения конвективной диффузии в двух- и трехмерной постановке. Для вычислительной схемы, базирующейся на методах расщепления с использованием явных разностных схем бегущего счета, разработаны параллельные алгоритмы для графических процессоров и получены теоретические оценки времени их работы.
Modelling of pollution transfer in atmosphere has been considered on the base of unsteady convection-diffusion equation in two- and three-dimensional formulation. Parallel algorithms for graphical processors have been developed for computational scheme based on explicit finite-difference splitting methods. Theoretical estimations of algorithms execution time have been obtained.
Розглянуто задачу моделювання переносу забруднень в атмосфері на основі нестаціонарного рівняння конвективної дифузії у дво- та тривимірній постановці. Для обчислювальної схеми, що базується на методах розщеплення з використанням явних різницевих схем біжучої хвилі, розроблено паралельні алгоритми для графічних процесорів та отримано теоретичні оцінки часу їх роботи.
ru
Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України
Управляющие системы и машины
Новые методы в информатике
Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений
Modelling of Pollution Transfer in Atmosphere Using Parallel Computation
Моделювання переносу забруднень в атмосфері з використанням паралельних обчислень
Article
published earlier
spellingShingle Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений
Гладкий, А.В.
Богаенко, В.А.
Новые методы в информатике
title Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений
title_alt Modelling of Pollution Transfer in Atmosphere Using Parallel Computation
Моделювання переносу забруднень в атмосфері з використанням паралельних обчислень
title_full Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений
title_fullStr Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений
title_full_unstemmed Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений
title_short Моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений
title_sort моделирование переноса загрязнений в атмосфере с использованием параллельных вычислений
topic Новые методы в информатике
topic_facet Новые методы в информатике
url https://nasplib.isofts.kiev.ua/handle/123456789/83535
work_keys_str_mv AT gladkiiav modelirovanieperenosazagrâzneniivatmosferesispolʹzovaniemparallelʹnyhvyčislenii
AT bogaenkova modelirovanieperenosazagrâzneniivatmosferesispolʹzovaniemparallelʹnyhvyčislenii
AT gladkiiav modellingofpollutiontransferinatmosphereusingparallelcomputation
AT bogaenkova modellingofpollutiontransferinatmosphereusingparallelcomputation
AT gladkiiav modelûvannâperenosuzabrudnenʹvatmosferízvikoristannâmparalelʹnihobčislenʹ
AT bogaenkova modelûvannâperenosuzabrudnenʹvatmosferízvikoristannâmparalelʹnihobčislenʹ