Метод Галеркина. Способ параллельной реализации задач математической физики в едином вычислительном потоке

Развивается идея применения метода Галеркина как разновидности метода взвешенных невязок в создании единого технологического потока в организации вычислений. Предложен способ параллельной обработки информации на уровне сложных структур данных и описан 
 на конкретном примере решения нелинейн...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Математичні машини і системи
Дата:2012
Автор: Ледянкин, Ю.Я.
Формат: Стаття
Мова:Російська
Опубліковано: Інститут проблем математичних машин і систем НАН України 2012
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/60006
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Метод Галеркина. Способ параллельной реализации задач математической физики в едином вычислительном потоке / Ю.Я. Ледянкин // Мат. машини і системи. — 2012. — № 3. — С. 69-80. — Бібліогр.: 4 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1860080749623902208
author Ледянкин, Ю.Я.
author_facet Ледянкин, Ю.Я.
citation_txt Метод Галеркина. Способ параллельной реализации задач математической физики в едином вычислительном потоке / Ю.Я. Ледянкин // Мат. машини і системи. — 2012. — № 3. — С. 69-80. — Бібліогр.: 4 назв. — рос.
collection DSpace DC
container_title Математичні машини і системи
description Развивается идея применения метода Галеркина как разновидности метода взвешенных невязок в создании единого технологического потока в организации вычислений. Предложен способ параллельной обработки информации на уровне сложных структур данных и описан 
 на конкретном примере решения нелинейной задачи методом Галеркина. Статья представляет 
 интерес для специалистов в области математики и разработчиков методов и структур спецпроцессоров для решения задач математической физики и других задач. Розвивається ідея застосування методу Гальоркіна як різновиду методу зважених нев'язок у створенні єдиного технологічного потоку в організації обчислень. Запропоновано спосіб 
 паралельної обробки інформації на рівні складних структур даних і описано на конкретному прикладі рішення нелінійної задачі методом Гальоркіна. Стаття представляє інтерес для спеціалістів 
 у галузі математики і розробників методів і структур спецпроцесорів для розв'язання задач математичної фізики та інших завдань. The idea of using the Galerkin method develops as a form of the weighted residuals method to 
 create a single technological flow in calculating organization. A way of parallel information processing at 
 the level of complex data structures is proposed and it described by the specific example of solving the 
 nonlinear problem by the Galerkin method. This article is useful for mathematicians and developers of 
 methods and structures of specially designed processor for solving problems of mathematical physics and 
 other problems.
first_indexed 2025-12-07T17:16:25Z
format Article
fulltext © Ледянкин Ю.Я., 2012 69 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 УДК 681.3 Ю.Я. ЛЕДЯНКИН МЕТОД ГАЛЕРКИНА. СПОСОБ ПАРАЛЛЕЛЬНОЙ РЕАЛИЗАЦИИ ЗАДАЧ МАТЕМАТИЧЕСКОЙ ФИЗИКИ В ЕДИНОМ ВЫЧИСЛИТЕЛЬНОМ ПОТОКЕ Анотація. Розвивається ідея застосування методу Гальоркіна як різновиду методу зважених не- в'язок у створенні єдиного технологічного потоку в організації обчислень. Запропоновано спосіб паралельної обробки інформації на рівні складних структур даних і описано на конкретному прик- ладі рішення нелінійної задачі методом Гальоркіна. Стаття представляє інтерес для спеціалістів у галузі математики і розробників методів і структур спецпроцесорів для розв'язання задач ма- тематичної фізики та інших завдань. Ключові слова: метод Гальоркіна, паралельні обчислення, складні структури даних, скалярний по- множувач, завдання математичної фізики, єдиний обчислювальний потік. Аннотация. Развивается идея применения метода Галеркина как разновидности метода взве- шенных невязок в создании единого технологического потока в организации вычислений. Предло- жен способ параллельной обработки информации на уровне сложных структур данных и описан на конкретном примере решения нелинейной задачи методом Галеркина. Статья представляет интерес для специалистов в области математики и разработчиков методов и структур спецпро- цессоров для решения задач математической физики и других задач. Ключевые слова: метод Галеркина, параллельные вычисления, сложные структуры данных, ска- лярный умножитель, задачи математической физики, единый вычислительный поток. Abstract. The idea of using the Galerkin method develops as a form of the weighted residuals method to create a single technological flow in calculating organization. A way of parallel information processing at the level of complex data structures is proposed and it described by the specific example of solving the nonlinear problem by the Galerkin method. This article is useful for mathematicians and developers of methods and structures of specially designed processor for solving problems of mathematical physics and other problems. Keywords: Galerkin method, parallel computing, complex data structures, scalar multiplier, problems of mathematical physics, single computational flow. 1. Введение Решение задач математической физики (МФ) связано с аппроксимацией с различной точ- ностью дифференциальных и интегральных уравнений и систем, приводя их к линейным алгебраическим уравнениям (СЛАУ). Успешно решая СЛАУ с помощью средств вычисли- тельной техники, в итоге получают некоторое псевдорешение задачи. Степень точности и суммарные затраты на получение псевдорешения определяются в большой степени при- меняемыми методами аппроксимации. Последние десятилетия отмечены бурным ростом (и внедрением) группы методов под общим названием “методы взвешенных невязок” (МВН). К этой группе относят и метод Галеркина (МГ) как частный случай, в котором ве- совые функции совпадают с базисными. Применение метода Галеркина в сочетании с методом конечных элементов (МКЭ) особенно эффективно за счет кусочно-гладкой полиномиальной аппроксимации. Считают, что МГ позволяет выбрать такие пробные функции, которые позволяют с их минимально возможным набором получить решение с высокой точностью. Кроме этого, следует заме- тить, что МГ практически не имеет ограничений относительно типа задач, в то время как другие (метод наименьших квадратов (МНК) и др.) не подходят к использованию при ре- шении задач с начальными и граничными условиями, задач на собственные значения. А в целом МВН имеют преимущества перед вариационным подходом решения задач МФ с помощью МКЭ. 70 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 Рассмотрение метода в сочетании с регулярным матричным представлением (РМП) показывает возможность его применения при решении задач МФ в едином технологиче- ском (вычислительном) потоке (ЕТП) в спецпроцессорах (СП) параллельного типа, по- строенных на базе процессорного элемента (ПЭ) со скалярным умножителем (СУ) в их ос- нове. Это расширяет набор задач, которые могут быть решены на СП такого типа. Важно, что применение метода в сочетании с его аппаратурной реализацией позволяет перейти к обработке сложных структур данных (ССД) в ЕТП решения всей задачи. Это упрощает устройство и технологию изготовления (а, следовательно, и стоимость) его, повышая в це- лом эффективность устройства, ориентированного на решение класса важных для про- мышленности и науки задач. Следует сказать, что сделана еще одна попытка трансформировать стандартные численные методы. В целом они разработаны под конкретные задачи, но решаются на ЭВМ с последовательной числовой обработкой информации и часто не учитывают специ- фику технических средств, на которых впоследствии будут реализованы. А современные требования к решению задач (время решения, точность, размерность,...) предполагают пе- реход к обработке информации в виде ССД с широким распараллеливанием вычислитель- ного процесса. И для этого имеется современная техническая (технологическая) база. 2. Суть метода Галеркина Если заданы системы [1] уравнений 0)( =− puL , (1) 0)( =− quF и аппроксимирующая (базисная) функция u =∑ = N k 1 ka kф , (2) которая удовлетворяет граничным условиям F )(u = q ( S ), x ∈ S , (3) а невязка ε = L (∑ ka ф k ) p− (4) ортогонализуется по отношению к базисным функциям ф i <ε , 0>=iф , Ni ,...,2,1= , (5) то ∫ { L (∑ ka ф k – p }ф i dv =0, Ni ,...,2,1= (5 а) для линейного оператора L система (5) переходит в систему линейных уравнений относи- тельно коэффициентов ka . 3. Способ параллельного решения нелинейных задач МГ Решение нелинейных задач (НЗ) сложнее, чем линейных и, естественно, занимает больше времени и ресурсов. Но мир в целом нелинейный. Поэтому к решению НЗ требуется серь- ёзный подход. Для получения псевдорешения процедуру несколько упрощают. Берут аппроксими- рующие функции с линейными членами и итерационно уточняют линейное псевдореше- ISSN 1028-9763. Математичні машини і системи, 2012, № 3 71 ние до тех пор, пока ошибка аппроксимации станет приемлемой. Решение двух- и трех- мерных задач МФ процесс трудоемкий, но в описательном плане он достаточно однотип- ный. Поскольку применение МКЭ при решении задач МФ (в ЕТП с вариационным подхо- дом к решению) ранее рассмотрено в [2], ниже ограничимся рассмотрением одномерного варианта задачи. 4. Линейный случай В уравнении, взятом из [1] в качестве примера, kuxuDxuV −∂∂=∂∂ 22 // . (6) (Замечание. Значения нижеприводимых коэффициентов также взяты из [1]. Это обеспечит корректность при сравнении численных значений, получаемых и приводимых автором в статье, с численными значениями, приведенными в [1]), где V – скорость жидкости, u – концентрация, D – коэффициент диффузии, k , s – параметры затухания. Положив 2=s и определив граничные условия (ГУ), u =u при 0=x , dxdu / =0 при x = l , аппроксимиро- вав искомую функцию u )(x выражением u =u (1+ 1a x + 2a 2x ) (7) с ГУ u =u при x =0, x = l , получим dxdu / | lx= = − u ( 1a +2 2a l )=0, 2a = 1a /2 l , (8) откуда подстановкой в (7) значения 2a обеспечивается переход к функции с одной неиз- вестной: u = − u (1+ ax –( 2ax /2 l )). (9) 5. Рассмотрим уравнение равновесия Запишем его в соответствии с представлением по Галеркину: ∫ l 0 { v ∗ xu ∂∂ / – D ∗ 2∂ u / 2x∂ + k ∗ u } uδ ∗ 0=dx , (10) где uδ – произвольное приращение функции )(xu . После подстановки в (10) уравнения (9), а также вычисления нами значений первой и второй производной, приведения подобных членов в подынтегральном выражении, уравнение (10) принимает следующий вид: ∫ 1 0 {( v a ∗ l + k ∗ l + a ∗ D )∗ x / l –( v ∗ a ∗ l + a ∗ D + k ∗ l )∗ 2x /2 2l + ( ) ( ) 0}4/2/2// 243232 =∗∗+∗∗−∗∗−∗+∗−∗∗+ dxlxaklxaklxlakavlxavlak . (11) 6. Обработка исходных данных в виде ССД В соответствии с правилами записи в виде РМП, приведенными в [2, 3], и с учетом, что матрица для интегрирования ][A равна 72 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 =][A                     ...5/10000 ...04/1000 ...003/100 ...0002/10 ...00001 ...00000 dx , (12) а также с учетом записи матрицы, определенной (там же) в виде ( )xf ∗ , интегральное уравнение (11) принимает вид ][A ∗                 ∗ ∗−∗∗−∗ ∗−∗∗+∗+∗+∗∗− ∗+∗+∗∗ )4/( 2/2/)( ]/)(2/)([ /)( 0 24 323 222 laxk laxklxlakav lxavlaklxDalklav lxDalklav dx = =                       ∗∗ ∗−∗∗−∗ ∗−∗∗+∗+∗+∗∗− ∗+∗+∗∗ 5/4/[( 4/]2/2/)[ 3/]/)(2/)([ 2/]/)[( 0 0 25 424 323 2 lxak laxklxlakav lxavlaklxlkDalav llxDalklav 0 1 =0� f * ( x ). (13) Замечание. Следует помнить, что количество столбцов )(m матрицы ][A должно быть равно количеству строк )(m вектора столбца ( )xf ∗ , а результирующая матрица (вектор столбец) – размерность )( Rm на единицу больше ( )1+= mmR . В уравнении (13) вектор-столбец в соответствии с правилом записи в виде РМП [2, 3, 4] равен первой строке верхней треугольной матрицы. Подставив в вычисленное значе- ние интеграла (13) пределы интегрирования, выполним приведение подобных членов и получим: ( v ∗ a ∗ l + k ∗ l + a ∗ D ∗ l )/2–( v ∗ a ∗ l + a ∗ D ∗ l + k • l )/6 l +( k ∗ a ∗ l – – v ∗ a )∗ l 3 /3 l +( v ∗ a – k ∗ a ∗ l )∗ l /8 l 2 – k ∗ a ∗ l /2 l + k ∗ l /20∗ l = = v ∗ a ∗ l (1/2–1/6–1/3+1/8)+ a ∗ D ∗ l (1/2–1/6)+1/2 k ∗ l 2 -1/6 k ∗ l 2 + + k ∗ a ∗ l 3 (1/3–1/8+1/20)=0. (14) В результате находим v ∗ a ∗ 2l /8+ a ∗ D ∗ l /3+ k ∗ 2l /3 +2 k ∗ a ∗ 3l /15 = 0, (14 а) a =40 k ∗ l /(15 v ∗ l +40 D +16 k ∗ l ). (15) Замечание. В (14) каждая составляющая левой части уравнения вычисляется в спецпроцес- соре параллельного типа с помощью СУ, заложенного в структуру каждого ПЭ. Следует обратить внимание, что: ISSN 1028-9763. Математичні машини і системи, 2012, № 3 73 – это полином, то есть каждая группа коэффициентов является множителем (что видно из уравнения (13)) при неизвестном значении x в соответствующей степени; – пределы интегрирования (“0”–“1”) в значительной степени “комфортны“ для применения, так как сокращают и упрощают вычислительный процесс в целом. Для решения уравнения (10) в записи РМП операцию интегрирования выполняем путем умножения матрицы ][A на вектор-столбец (23). Но эту же операцию можно распи- сать и выполнить в виде набора сумм произведений матрицы ][A на составляющие ком- поненты глобального вектора столбца (13): ][A ∗                 ∗ ∗−∗∗−∗ ∗−∗∗∗−∗−∗∗− ∗∗∗∗ 00004/ 002/2/2/ //2/2/2/ 00/ 00000 2 22 222 lak lakllaklav lavllakllklDallav lDalklav 4 3 2 1 0 x x x x x dx = = ][A ∗                 ∗ ∗ ∗− ∗∗ 2 2 2 4/ 2/ 2/ / 0 lak lav lav llav 4 3 2 1 0 x x x x x dx + ][A ∗                 ∗∗− ∗− ∗ 0 2/ 2/ / 0 2 2 llak lDa llk 4 3 2 1 0 x x x x x dx + ][A ∗                 ∗− ∗− ∗ 0 2/ 2/ / 0 lak llk lDa 4 3 2 1 0 x x x x x dx + + ][A ∗                 ∗∗ 0 0 / 0 0 llak 4 3 2 1 0 x x x x x dx + ][A ∗                 ∗− 0 0 / 0 0 lav 4 3 2 1 0 x x x x x 0=dx . (16) Замечания. 1. Интегрирование по частям (16) даст в итоге результат, аналогичный с (13)–(14). Смысл в записи вектора из (13) в виде (16) состоит в том, что реализация матричного произведения в спецпроцессоре, построенном на ЕТП, в матричном варианте позволит одновременно задействовать 5 линеек из СУ. Такое распараллеливание повысит производительность по сравнению с вариантом, когда вычисление будет выполнять один СУ. 2. Если значения коэффициентов v , D , k и проч. известны заранее или же не требуется повторного вычисления уравнения (когда они могут быть рассчитаны и записаны в виде одного числа каждой из строк (13)), смысл в записи (16) теряется, так как она преобразует- ся в вектор-столбец с одним числом в строке. 3. Операции по вычислению сумм парных произведений в работе не описываются, по- скольку являются известными [2], для чего в общем случае они и предназначены. Поэтому описание этих операций опускаем. 4. Вычисление дифференциалов и интегралов от функций вносит в вычисления численные значения показателей степени неизвестных функций, а это целые числа и они больше еди- ницы. Для устройств с плавающей запятой (ПЗ) это не является проблемой. Для ПЭ со скалярными умножителями, в которых числа представлены в форме фиксированной запя- той (ФЗ) , числа в знаменателе могут быть подняты в числитель в виде обратного дробного значения. Эта процедура требует согласованных операций в ПЭ. Важно иметь в виду, что 74 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 основной поток по обработке ССД будет выполняться в СУ с широким распараллеливани- ем вычислительного процесса. 7. Нелинейный случай Получив линейное приближение, приступают [1] к решению нелинейного уравнения. При рассмотрении (6) с целью упрощения принимается k = v =D= l = u =1. (17) Тогда, положив в уравнении (15) ( ) aa =1 , вычисляется ( )1a =-0,564. (18) Замечание. Ниже с целью упрощения записи и чтения индекс (1) над ( )1a будет опущен в местах, где его наличие или отсутствие не вызывает разночтения, а практически до его за- мены на (2) в конце статьи, когда будет введено новое значение ( )( )2a . После вычисления ( )1a подставляем его значение в уравнение равновесия (6): ∫ 1 0 { dxdu / – 2d u / 2dx + 2u } uδ ∗ dx =0. (19) При аппроксимации u из выражения (19) определяется функция ψ , характеризую- щая состояние равновесия, ψ )1( = ∫ 1 0 { ( )1a ( x−1 )+ ( )1a +[1+ ( )1a ( x – 2x /2)]}( x – 2x /2) dx = =-0,333+0,725 )1(a +0,057( ( )1a ) 2 =-0,059. (20) Далее, поскольку для состояния равновесия должно выполняться 0=ψ , следуя ме- тоду Ньютона-Рафсона, применяют рекурсию: d ψψ −= (21) или ( d ψ / d a ) ∆ a =-ψ , (22) где d ψ / d a =0,725–0,114 .a После подстановки в (22) значения a из ( )1a имеют величину ( d ( )1ψ / d a )=0,725+0,114 ( )1a =0,661. (23) Полученное значение ( d ( )1ψ / d a ) позволяет вычислить ∆ ( )1a = ( )1ψ− /( d ( )1ψ / d a )=0,059/0,661=0,088 (24) и затем уточнить величину ( )1a : ( )2a = ( )1a + ∆ ( )1a =-0,564+0,088=-0,476, (25) в итоге вычислить функцию ψ : ( )2ψ =0,333+0,725 ( )1a +0,057 ( )2a =0,001. (26) Величина ( )2ψ уже показывает, что вычисления близки к решению. ISSN 1028-9763. Математичні машини і системи, 2012, № 3 75 Покажем, как этот процесс можно продолжить с помощью предложенного способа. 8. Вычисления с записью полиномов в виде РМП Представим интеграл (20) следующим образом: ( )1ψ = ∫ 1 0 {[ f 1 ( x )+ f 2 ( x )]( f 3 ( x )} dx , (27) где f ( x )=[ a (1– x )+ a ]=2 a - a x =[ f 1 ( x )]�           − − a aa aa 2 2 02 . Вычислим f 2 2 ( x )=[ f 2 ( x )] 2 , помня, что { m = 1m + 2m +1=2+2+1=5}, (28) f 2 2 ( x )={1+ a ( x – x 2 /2)} 2 =(1+ a x – a x 2 /2)∗ (1+ a x – a x 2 /2)�[ f * 2 ( x )] 2 � �           − 1 1 2/1 a aa ∗           − 1 1 2/1 a aa =                 − − − 12/00 12/0 12/ 1 1 aa aa aa a                 − 0 0 2/ 1 a a = =                 −−− −+− + 4/ )2/2/( 2/2/ )( 1 2 222 2 a aaa aaa aa 4 3 2 1 0 x x x x x �( f * 2 ( x )). (29) Запишем ( )xf3 : ( )xf3 =( x – 2x /2)�           − 0 10 2/110           − 2/1 1 0 �[ f * 3 ( x )], (30) а также произведение ( )xf1 ∗ ( )xf3 в виде РМП: [ ( )xf1 ]∗ [ ( )xf3 ]� �           − − a aa aa 2 2 02           − ∗ 0 10 2/110 =             − − − aa aa aa a 200 20 2 2 ∗             − 0 2/1 1 0 =             − 2/ 2 2 0 a a a 3 2 1 0 x x x x . (31) [ f 2 2 ( x )] T ∗ f * 3 ( x )� 76 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 �                       −− −− −− −− − 12)(4/00 12)(4/0 12)(4/ 12)( 12)( 12 1 222 222 222 22 2 aaaaa aaaaa aaaaa aaaa aaa a                       − 0 0 0 0 2/1 1 0 = =                       − + −−− −− − )8/( )2/4/( )2/)(( ))(( )2/12( 1 0 2 22 22 2 a aa aaa aaa a 6 5 4 3 2 1 0 x x x x x x x . (32) Помня, что матрица для интегрирования определена в (12), вычисляем интеграл (27) по частям следующим образом: ∫ 1 0 ( f 2 ( x )) 2 ∗ f 3 ( x ) dx =[ A ]∗ [ f 2 ( x ) 2 ] T ∗ [ f * 3 ( f )] dx� � ][A ∗                           −− −− −− −− −− − 12)(4/000 12)(4/00 12)(4/0 12)(4/ 12)( 12)( 12 1 2 222 222 222 222 22 2 aaaaa aaaaa aaaaa aaaaa aaaa aaa a ∗ ∗                           − 0 0 0 0 0 2/1 1 0 dx =[ A ]∗                           + −−− −− − )8/( )2/4/( ))2/(( ))(( )2/12( 1 0 2 22 22 2 a aa aaa aaa a dx =                           − +− − 6/)8/( 5/)4/3( 4/)2/2/3( 3/)2( 2/1 0 0 2 2 2 a a aa aa 6 5 4 3 2 1 0 x x x x x x x 0 1 = =(1/2) 2x +1/3( 2a -2 a ) 3x +3/8( 42xa )+1/8( a 4x )+3/20( a 5x )-1/48( 6ax ) = =1/2+ a (-13 /24)+ 2a (402/480)= =0,5+0,5417 a +0,8375 2a . (33) ISSN 1028-9763. Математичні машини і системи, 2012, № 3 77 и, учитывая ранее полученное произведение (31) функций, вычислим интеграл ∫ 1 0 f 1 (x)∗ f 3 ( x ) dx =[ A ]∗ {[ f 1 ( x )]∗ [ f 3 ( x )] T } dx� �[ A ]∗                 − 0 2/ 2 2 0 a a a 4 3 2 1 0 x x x x x dx =                 − 8/ 3/2 0 0 a a a 4 3 2 1 0 x x x x x 0 1 = =( a 2x - a 3x 2/3+ a 4x 1/8)= a 11/24=0,4583 a . (34) ∫ 1 0 ( f 2 ( x )) 2 ∗ f 3 ( x ) dx�[ A ]∗ [ f 2 ( x )] 2 [ f * 3 ( x )] dx� � ][A                           − +− − − 0 )8/( )4/3( )2/2/3( )2( )2/12( 1 0 2 2 2 2 a a aa aa a dx =                           − +− − − 7/)8/( 6/)4/3 5/)2/2/3( 4/)2( 3)2/12( 2/1 0 0 2 2 2 2 a a aa aa a 7 6 5 4 3 2 1 0 x x x x x x x x 0 1 = =1 x 2 /2+(1/3)(2 a -1/2) x 3 +1/4( 2a -2 a ) x 4 +1/5(- 2a 3/2+ a /2) x 5 + +1/6( 2a 3/4) x 6 +1/7(- 2a /8) x 7 = =(1/2–1/6)+ a (2/3–1/2+1/10)+ 2a (1/4–3/10+3/24)= =0,333+0,266 a +0,057 2a . (35) Суммирование результатов вычисления интегралов (34) и (35) ( )1ψ =0,4583 a =0,333+0,266 a +0,057 2a = =0,333+0,725 ( )2a +0,057( ( )2a ) 2 = 0,001 (36) дает результат, вычисленный в [1]. Но результат, вычисленный по предлагаемому способу, будет получен в более короткое время. А оно сокращается за счет распараллеливания всего процесса обработки сложных структур данных в СУ взамен последовательного вычисле- ния каждой составляющей подынтегрального выражения (с обращением к памяти за ис- ходными данными и отправкой полученных промежуточных результатов в память) за счет распараллеливания вычислительного процесса (заложенного в алгоритм). 9. Анализ задач Анализ, проведенный в этом разделе, показывает, что вычисление укрупненных значений функций под интегралом не всегда будет оптимальным. Количество столбцов в матрице типа (17), а, следовательно, и (34), (35), колеблется от одной задачи к другой. Поэтому вполне рациональным может быть некоторое «дробление» подынтегральных функций ти- 78 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 па ( )xf1 , ( )xf2 , представив ( )xf3 , например, в виде ( ) xxf =1 и ( ) ( )2/2 5 xxf −= , а значение функции ( )xf2 следует вычислять с помощью скорректированного набора функций, запи- санных в виде РМП: ( )xf3 =[ f 1 ( x )]+[ f 3 ( x )]�           0 10 010 +           − 0 00 2/100 . (37) Тогда ( )1ψ =[ A ]∗ {[ 1f ( x )]∗ [ 1f ( x )]} dx +[ A ]∗ {[ 1f ( x )]∗ [ 5f ( x )]} dx + +[ A ]∗ { 2f ( x )]∗ [ 4f ( x )]} dx +[ A ]∗ {[ 2f ( x )]∗ [ 5f ( x )] dx , (38) где квадрат функции [ 2f ( x )] 2 также может быть представлен не как произведение двух выражений ( )xf2 , заключенных в фигурные скобки уравнения (30), а как сумма квадратов значений )(x и (- x 2 /2) 2 без удвоенного произведения их с последующим умножением на a и на ((1+ ax )– x 2 /2) 2 и т.д. Выражение (1+ ax – 2x /2)=(( ax +(1– 2x /2))=(1+2 ax + 2x ( 2a -1)- 3ax + x 4 /4) (39) можно разбить на 2 части, например, так: (1+2 ax + 2x ( 2a -1))+(- a 3x + 4x /4)= =(1+2 a x - a 3x )+(( 2x ( 2a -1)+ x 4 /4)�[ f 6 ( x )]+[ f 7 ( x )], (40) а затем каждое из них умножать на ( )xf3 [A]∗ [ f 6 ( x )] T ∗ [ f * 3 ( x )]�[ A ]           − ∗ 12 12 1 aa a           − 2/1 1 0 dx + +[ A ]∗             − − 00)1(4/1 00)1( 00 0 2 2 a a             − 0 2/1 1 0 dx =… (41) и т.д. Глубину распараллеливания можно регулировать на стадии подготовки задачи к решению, исходя из возможностей имеющегося в распоряжении оборудования или требований по времени вычисления на стадии проектирования спецустройства, предназначенного для решения конкретной задачи. 10. Дальнейшее вычисление уравнения (19) Их можно производить так. Дифференцируя выражение (20) или полученное нами (36) [C ]= d Ψ / da ) ∆ a� ISSN 1028-9763. Математичні машини і системи, 2012, № 3 79 � ][A ∗           333.0 725.0333.0 057.0725.0333.0 2 1 0 a a a da = ][A ∗           057.0 725.0 333.0 2 1 0 a a a da =           0 114.0 725.0 2 1 0 a a a , (42) где ][A – матрица дифференцирования, и для a =-0,564, полученного в (18), имеем ( d Ψ / da )=0,725+0,114 a =0,661. (42 а) Это позволяет вычислить из (34) a∆ : ∆ a =- ( )1Ψ /( d ( )1Ψ / da )=-0,059/[ C ]=[ ( )1Ψ ]∗ [C ] 1− =0,088. (43) После получения матрицы [C ] 1− , обратной от ][C или путем вычисления обратно- го к 0,661 значения (1 /0,661), вычисление уточненных значений a (уравнения (25) и (26)) выполняются просто, поскольку СУ каждого ПЭ включает сумматор накопительного типа. Из сравнения результатов, полученных по МГ, с точными значениями функции, приведенными в [1], видно, что он дает близкие приближения. Замечание. СУ параллельной структуры имеет n -разрядные сумматоры накопительного типа. В них значения результата и переноса в каждом разряде и на каждом такте запоми- наются элементами типа триггер. На входе сумматора (до схемы конъюнкции) хранятся новые значения переменных (одно из которых при умножении хранит текущий разряд множимого, а другой – множителя), а при сложении хранятся значения обоих слагаемых. 11. Выводы Переход от аналитической записи и последующего численного решения дифференциаль- ных и интегральных уравнений к записи в виде РМП позволяет: – записывать их компактно и в виде, удобном для интегрирования или дифферен- цирования как в аналитическом, так и численном варианте; – при умножении матриц использовать транспонированную от верхней треугольной матрицы в РМП записи в качестве множимого (запись слева) на вектор-столбец, представ- ляющий первую строку матрицы циркулянта в качестве множителя (запись справа), что дает сокращение в n -раз ( n -разрядность сумматора СУ) количества операций умножения; – в работе [2] показано, что произведение матрицы на вектор-столбец можно свести к произведению двух векторов, что в m раз ( −m порядок результирующего сплайна) со- кратит количество оборудования и выполняемых арифметических операций типа умноже- ния; – позволяет от последовательной обработки чисел перейти к параллельной обработ- ке ССД (сплайнов), что резко повышает производительность вычислительного устройства; – решение дифференциальных и интегральных уравнений и систем выполнять в рамках идеологии единого вычислительного (технологического) потока решения задач МФ, что в целом дополнительно повышает производительность и снижает себестоимость устройств, ориентированных на их решение. Считаю приятным долгом выразить благодарность д.ф.-м.н. Химичу А.Н. и д.т.н. Резнику А.М. за полезные замечания по тексту статьи, сделанные в процессе её обсужде- ния. СПИСОК ЛИТЕРАТУРЫ 1. Коннор Дж. Метод конечных элементов в механике жидкости / Дж. Коннор, К. Бреббиа; пер. с англ. – Л.: Судостроение, 1979. – 264 с. 80 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 2. Единый технологический поток в организации вычислений – способ повышения производитель- ности параллельных структур на процессорных элементах транспьютерного типа / Ледянкин Ю.Я. – Киев, 1989. – 20 с. – (Препр. / АН УССР. Ин-т кибернетики им. В.М. Глушкова; 89-57). 3. Ледянкин Ю.Я. К вопросу преобразования и параллельного ввода граничных условий при реше- нии краевых задач в едином вычислительном потоке / Ю.Я. Ледянкин // Математичні машини і си- стеми. – 2012. – № 1. – С. 28 – 35. 4. Ледянкин Ю.Я. Методы взвешенных невязок, коллокаций, моментов. Способ параллельной реа- лизации в едином вычислительном потоке решения задач математической физики / Ю.Я. Ледянкин // Математичні машини і системи. – 2012. – № 2. – С. 17 – 28. Стаття надійшла до редакції 05.10.2011
id nasplib_isofts_kiev_ua-123456789-60006
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1028-9763
language Russian
last_indexed 2025-12-07T17:16:25Z
publishDate 2012
publisher Інститут проблем математичних машин і систем НАН України
record_format dspace
spelling Ледянкин, Ю.Я.
2014-04-11T08:32:09Z
2014-04-11T08:32:09Z
2012
Метод Галеркина. Способ параллельной реализации задач математической физики в едином вычислительном потоке / Ю.Я. Ледянкин // Мат. машини і системи. — 2012. — № 3. — С. 69-80. — Бібліогр.: 4 назв. — рос.
1028-9763
https://nasplib.isofts.kiev.ua/handle/123456789/60006
681.3
Развивается идея применения метода Галеркина как разновидности метода взвешенных невязок в создании единого технологического потока в организации вычислений. Предложен способ параллельной обработки информации на уровне сложных структур данных и описан &#xd; на конкретном примере решения нелинейной задачи методом Галеркина. Статья представляет &#xd; интерес для специалистов в области математики и разработчиков методов и структур спецпроцессоров для решения задач математической физики и других задач.
Розвивається ідея застосування методу Гальоркіна як різновиду методу зважених нев'язок у створенні єдиного технологічного потоку в організації обчислень. Запропоновано спосіб &#xd; паралельної обробки інформації на рівні складних структур даних і описано на конкретному прикладі рішення нелінійної задачі методом Гальоркіна. Стаття представляє інтерес для спеціалістів &#xd; у галузі математики і розробників методів і структур спецпроцесорів для розв'язання задач математичної фізики та інших завдань.
The idea of using the Galerkin method develops as a form of the weighted residuals method to &#xd; create a single technological flow in calculating organization. A way of parallel information processing at &#xd; the level of complex data structures is proposed and it described by the specific example of solving the &#xd; nonlinear problem by the Galerkin method. This article is useful for mathematicians and developers of &#xd; methods and structures of specially designed processor for solving problems of mathematical physics and &#xd; other problems.
ru
Інститут проблем математичних машин і систем НАН України
Математичні машини і системи
Обчислювальні системи
Метод Галеркина. Способ параллельной реализации задач математической физики в едином вычислительном потоке
Метод Гальоркіна. Спосіб паралельної реалізації завдань математичної фізики в єдиному обчислювальному потоці
Galerkin method. A way of parallel implementation of the tasks of mathematical physics in a single computational flow
Article
published earlier
spellingShingle Метод Галеркина. Способ параллельной реализации задач математической физики в едином вычислительном потоке
Ледянкин, Ю.Я.
Обчислювальні системи
title Метод Галеркина. Способ параллельной реализации задач математической физики в едином вычислительном потоке
title_alt Метод Гальоркіна. Спосіб паралельної реалізації завдань математичної фізики в єдиному обчислювальному потоці
Galerkin method. A way of parallel implementation of the tasks of mathematical physics in a single computational flow
title_full Метод Галеркина. Способ параллельной реализации задач математической физики в едином вычислительном потоке
title_fullStr Метод Галеркина. Способ параллельной реализации задач математической физики в едином вычислительном потоке
title_full_unstemmed Метод Галеркина. Способ параллельной реализации задач математической физики в едином вычислительном потоке
title_short Метод Галеркина. Способ параллельной реализации задач математической физики в едином вычислительном потоке
title_sort метод галеркина. способ параллельной реализации задач математической физики в едином вычислительном потоке
topic Обчислювальні системи
topic_facet Обчислювальні системи
url https://nasplib.isofts.kiev.ua/handle/123456789/60006
work_keys_str_mv AT ledânkinûâ metodgalerkinasposobparallelʹnoirealizaciizadačmatematičeskoifizikivedinomvyčislitelʹnompotoke
AT ledânkinûâ metodgalʹorkínasposíbparalelʹnoírealízacíízavdanʹmatematičnoífízikivêdinomuobčislûvalʹnomupotocí
AT ledânkinûâ galerkinmethodawayofparallelimplementationofthetasksofmathematicalphysicsinasinglecomputationalflow