Точные методы минимизации квадратичных функций. Часть 1

Рассматривается единый подход к построению различных по характеру точных методов минимизации квадратичных функций. Описываются возможности применения этих методов к решению задач нелинейной оптимизации и систем линейных уравнений. The unique approach to constructing various by character exact method...

Full description

Saved in:
Bibliographic Details
Date:2007
Main Authors: Данилин, Ю.М., Шубенкова, И.А.
Format: Article
Language:Russian
Published: Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України 2007
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/14080
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Точные методы минимизации квадратичных функций. Часть 1 / Ю.М. Данилин, И.А. Шубенкова // Систем. дослідж. та інформ. технології. — 2007. — № 4. — С. 85-92. — Бібліогр.: 9 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859715956035551232
author Данилин, Ю.М.
Шубенкова, И.А.
author_facet Данилин, Ю.М.
Шубенкова, И.А.
citation_txt Точные методы минимизации квадратичных функций. Часть 1 / Ю.М. Данилин, И.А. Шубенкова // Систем. дослідж. та інформ. технології. — 2007. — № 4. — С. 85-92. — Бібліогр.: 9 назв. — рос.
collection DSpace DC
description Рассматривается единый подход к построению различных по характеру точных методов минимизации квадратичных функций. Описываются возможности применения этих методов к решению задач нелинейной оптимизации и систем линейных уравнений. The unique approach to constructing various by character exact methods for minimization of square-law functions is studied. Possibillity of application of these methods to the solution of nonlinear optimization problems and systems of linear equations is considered. Розглянуто єдиний підхід до побудови різних за характером точних методів мінімізації квадратичних функцій. Описано можливості застосування цих методів до розв’язування задач нелінійної оптимізації та систем лінійних рівнянь.
first_indexed 2025-12-01T08:11:40Z
format Article
fulltext  Ю.М. Данилин, И.А. Шубенкова, 2007 Системні дослідження та інформаційні технології, 2007, № 4 85 УДК 519.8 ТОЧНЫЕ МЕТОДЫ МИНИМИЗАЦИИ КВАДРАТИЧНЫХ ФУНКЦИЙ. ЧАСТЬ 1 Ю.М. ДАНИЛИН, И.А. ШУБЕНКОВА Рассматривается единый подход к построению различных по характеру точ- ных методов минимизации квадратичных функций. Описываются возмож- ности применения этих методов к решению задач нелинейной оптимизации и систем линейных уравнений. Уже длительное время для построения быстросходящихся алгоритмов безусловной нелинейной оптимизации на каждой итерации решается квад- ратичная задача минимизации, в которой вместо матрицы вторых произ- водных используется некоторая ее аппроксимация, строящаяся с примене- нием только первых производных исходной функции или, даже, только ее значений [1–7]. Алгоритмы такого типа (методы сопряженных направлений, переменной метрики, двойственных направлений) используют различные аппроксимационные матрицы, и соответствующие методы изучаются неза- висимо друг от друга, что затрудняет выявление каких-либо общих идей и свойств различных методов. В данной работе предлагается достаточно общий подход к минимиза- ции квадратичных функций, позволяющий строить и обосновывать раз- личные по характеру алгоритмы минимизации (главным образом, будут рассматриваться методы, использующие те или иные процессы ортогонали- зации). В задачах нелинейной оптимизации результаты работы дают воз- можность строить различные аппроксимационные матрицы, которые ис- пользуются при разработке соответствующих алгоритмов. В области точных методов решения линейных систем уравнений результаты дают возмож- ность обосновывать свойства методов, базируясь на некоторых общих тео- ретических результатах, справедливых для различных процессов ортогона- лизации. Под точными методами минимизации квадратичных функций подразу- меваются процессы, дающие точное решение задачи за конечное число ша- гов (итераций). ПРЕОБРАЗОВАНИЕ ЗАДАЧИ Пусть cxbxAxxf ++= ,, 2 1)( , (1) где nEx∈ — n -мерное евклидово пространство 0, ≥xAx . Пусть ранг матрицы A равен nt ≤<0 . Будем считать, что функция (1) достигает ми- нимального значения, т.е. уравнение Ю.М. Данилин, И.А. Шубенкова ISSN 1681–6048 System Research & Information Technologies, 2007, № 4 86 ( ) 0=+≡′ bAxxf (2) имеет решение. Обозначим подпространство вырождения матрицы A через tnE − (подпространство, образованное такими линейно независимыми век- торами ir , что 0=iAr , tni −≤≤1 ). Ортогональное дополнение к tnE − обо- значим tE . Тогда ( ) tExf ∈′ , ( ) ( ) tEArrxfxfe ∈=−′−′= , если tnEr −∉ . (3) Задачу минимизации функции (1) можно по-разному свести к решению системы линейных уравнений, определение которой не предполагает использования матрицы вторых производных A . (Отметим, что при мини- мизации конкретно функции (1) это чистая формальность, однако для нели- нейных функций, где ( )xf ′′ — матрица с переменными коэффициентами, использование лишь градиентов функции играет принципиальную роль.) Рассмотрим некоторые из подходов. Будем далее считать, что системы векторов ir и ii Are = , 10 −≤≤ ti линейно независимы. А. Определим систему уравнений 0, =+ irbAx , 10 −≤≤ ti , т.е. с учетом (3) ii rbxe ,, −= , 10 −≤≤ ti . (4) Лемма 1. Любое решение уравнения (2) является решением системы (4) и наоборот, т.е. уравнение (2) и система (4) эквивалентны. Доказательство. Первая часть утверждения очевидна: если *x — про- извольное решение уравнения (2), то оно удовлетворяет и системе (4). Пусть теперь x~ — некоторое решение системы (4), т.е. ii rbxe ,~, −= , 10 −≤≤ ti . Если *x — произвольное решение уравнения (2), то ii rbxe ,, * −= , 10 −≤≤ ti , и поэтому 0~, * =− xxei , 10 −≤≤ ti . Отсюда, с учетом линейной независимости векторов t i Ee ∈ , 10 −≤≤ ti вытекает, что tnEwxx −∈=− * ~ , т.е. 0=Aw . Следовательно, ( ) =++=+ bwxAbxA * ~ 0* =+= bAx , т.е. x~ — решение уравнения (2). Лемма доказана. Б. Функцию ( )xf (1) представим в виде ( ) ( ) ( ) *** , 2 1 xxxxAxfxf −−+= или ( ) ( ) ( ) ** , 2 1 xxxfxfxf −′+= . (5) Используя выражение (5), можно построить систему уравнений Точные методы минимизации квадратичных функций. Часть 1 Системні дослідження та інформаційні технології, 2007, № 4 87 ( ) ( ) ( ) xxxfxfxf iii −′+= , 2 1 , ti ≤≤0 (6) ( ix , ti ,...,0= — произвольные точки). Очевидно, любое решение уравнения (2) является и решением сис- темы (6). С другой стороны, если система векторов ( ) ( ) ==′−′ + iii exfxf 1 ( )ii xxA −= +1 , 10 −≤≤ ti линейно независима, то любое решение системы (6) определяет некоторую точку *x (решение (2)) и значение ( )*xf . Дейст- вительно, пусть ( )( )xfx ~,~ — произвольное решение системы (6). Вычитая уравнения (6) друг из друга, получаем ( ) ( ) ( ) ( ) ( ) =−′+−′−′=− ++++ iiiiiiii xxxfxxxfxfxfxf 1111 , 2 1~, 2 1 ( ) iiiii xxxfxxe −′+−= ++ 11 , 2 1~, 2 1 . Поскольку в то же время ( ) ( ) ( ) ( ) =−−+−′=− ++++ iiiiiiiii xxxxAxxxfxfxf 1111 , 2 1, ( ) iiiiii xxexxxf −+−′= ++ 11 , 2 1, , устанавливаем ( ) iiiii xxxfxxe −′=− +1, 2 1~, 2 1 . (7) Но ( ) ( )*xxAxf ii −=′ , т.е. из (7) следует iiii exxxxe , 2 1~, 2 1 *−=− , 10 −≤≤ ti . Отсюда так же, как в А, устанавливается wxx += * ~ , tnEw −∈ , т.е. x~ — решение уравнения (2). Следовательно, ( ) ( )* ~ xfxf = . Приведенные рассуждения показывают, что справедлива Лемма 2. Если система векторов ( ) ( ) ( )iiiii xxAexfxf −==′−′ ++ 11 , 10 −≤≤ ti , линейно независима, то уравнение (2) и система (6) эквивалент- ны в том смысле, что любое решение *x уравнения (2) удовлетворяет сис- теме (6), и наоборот. Тот факт, что решение системы (6) позволяет определять значение ( )*xf , при решении задачи (1) не играет особой роли, однако при миними- зации нелинейных функций с использованием вспомогательных квадратич- них задач это может иметь существенное значение. Отметим, что системы вида (6), помимо минимизации квадратичних функций, использовались также для минимизации функций более общего вида — однородных [8]. Ю.М. Данилин, И.А. Шубенкова ISSN 1681–6048 System Research & Information Technologies, 2007, № 4 88 В. Пусть ii Are = , λ,...,1,0=i , где 10 −≤< nλ — линейно независимая система векторов, и ( ) ( ) ∑=−≡′ λ β 0 *00 iiexxAxf . (8) Тогда ∑=− λ β 0 *0 ii rxx . (9) КОНЕЧНОШАГОВЫЕ ПРОЦЕССЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ Итак, для отыскания точки минимума функции ( )xf (1) достаточно решить одну из систем уравнений (4), (6). Далее будем рассматривать конечно- шаговые методы решения систем линейных уравнений. Разработка та- ких методов основывается на следующих соображениях (берем за основу систему (4)). Пусть 0x — произвольная точка, а точки txx ,...,1 строятся таким обра- зом, чтобы выполнялись условия 1,...,1,0,0,,,1 −=≤≤−=+ tkkirbex iik . (10) Тогда, как вытекает из сравнения систем (10) и (4), точка tx будет ре- шением системы (4), т.е. *xxt = . Если выбирать точки txx ,...,1 по формуле 1,...,1,0,1 −=+=+ tkpxx kkkk α , (11) где kα — скалярный множитель, а kp — вектор, то систему (10) можно за- писать в виде kiexrbep ikiikk ≤≤−−= 0,,,,α . (12) При 1≥k точка kx должна удовлетворять условиям (10): =ik ex , irb,−= , 10 −≤≤ ki . Следовательно, из (12) следует 1,10,0, ≥−≤≤= kkiep ikkα . (13) При ki = оказывается ( ) kkkkkkkkkk rxfrbAxrAxrbexrb ,,,,,, ′−=+−=−−=−− , т.е. ( ) kkkkk rxfep ,, ′−=α . (14) Условия (13), (14) будут, очевидно, выполнены, если вектор kp удов- летворяет условиям 10,0, −≤≤= kiep ik , (15) Точные методы минимизации квадратичных функций. Часть 1 Системні дослідження та інформаційні технології, 2007, № 4 89 0, ≠= kkk cep , (16) а множитель ( ) kk kk k ep rxf , ,′ −=α . (17) Таким образом, точка 1+kx , определяемая в виде (11), будет удовлетво- рять условиям (10), если вектор kp и множитель kα определяется условия- ми (15), (16) и (17) (при 0=k вектор kp , очевидно, определяется лишь ус- ловием (16)). Сформулируем некоторые утверждения, справедливые при условии, что точка 1+kx и векторы kp определяются соотношениями (10), (15), (16), причем 0≠kp . Утверждение 1. Векторы kpp ,...,0 , удовлетворяющие условиям (15), (16), линейно независимы. Утверждение 2. При любом 10 −≤≤ tk в точке 1+kx , удовлетворяю- щей условиям (10), реализуется минимум функции (1) на подпространстве, образованном векторами krr ,...,0 , т.е. ( ) kirxf ik ≤≤=′ + 0,0,1 . (18) Справедливость этого утверждения нетрудно установить, воспользо- вавшись условиями (13) и (14), которые можно записать в следующем виде: ( ) =−= + ikkikk rxxAep ,, 1α ( ) ( ) 1,10,0,1 ≥−≤≤=′−′= + kkirxfxf ikk , (19) ( ) =−= + kkkkkk rxxAep ,, 1α ( ) ( ) ( ) 0,,,1 ≥′−=′−′= + krxfrxfxf kkkkk . (20) Из (20) следует, что ( ) 0,1 −′ + kk rxf при любом k . Учитывая это и ис- пользуя (19), получаем условия (18). Утверждение 3. Если ( ) kixfr i j jiji ≤≤′= ∑ = 0, 0 λ , (21) где ijλ — произвольные коэффициенты, причем 0≠iiλ , то при любом 10 −≤≤ tk ( ) ( ) kixfxf ik ≤≤=′′ + 0,0,1 . (22) Справедливость этого утверждения можно установить, используя вы- ражения (21) в (19), (20) и рассуждая по индукции. (Параллельно устанавли- вается линейная независимость векторов ( )ixf ′ , ki ≤≤0 .) Ю.М. Данилин, И.А. Шубенкова ISSN 1681–6048 System Research & Information Technologies, 2007, № 4 90 Замечание. Если 0H — некоторая невырожденная матрица, и ( ) kixfHr i j jiji ≤≤′= ∑ = 0, 0 0λ , (23) то при любом 10 −≤≤ tk ( ) ( ) kixfHxf ik ≤≤=′′ + 0,0, 01 . (24) Справедливость (24) при выборе ir в виде (23) устанавливается точно так же, как (22). В частности, если AH =0 , то условия (24) показывают, что градиенты ( ) ( )10 ,..., +′′ kxfxf оказываются A -ортогональными (или сопря- женными), т.е. при выборе ir в виде (23) (при условии AH =0 ) процесс (11) является методом сопряженных градиентов. Отметим еще следующее. Система векторов irr ,...,0 выбирается доста- точно произвольно (при условии, что она линейно независима, а также ли- нейно независима система векторов iee ,...,0 ). Поэтому можно полагать kkk pr β= , 0≥k , 0≠kβ , где вектор 0p выбирается произвольно, а при 1≥k вектор kp удовлетворяет условиям (15). При этом условия (15), (16) превращаются в условия A -ортогональности векторов ip . 0, =iki Appβ , 0, ≠= kkkk cAppβ . Коэффициент kα выбирается по формуле ( ) ( ) ( ) ( ) ( )kkkk kk kk kk kkk kkk k xfpxfp pxf App pxf App pxf ′−+′ ′ −= ′ −= ′ −= , , , , , , β β α . Реализация процесса (11) таким способом ( kkk pr β= ) заведомо воз- можна в случае, если матрица A невырожденная. Однако в случае, когда A — вырожденная матрица, процесс (11) также может вырождаться. Это происходит, если при некотором k оказывается 0, =kk App . Коэффици- ент kα при этом определить невозможно. Ситуация, когда процесс (11) вырождается, возможна только в случае, если выбор векторов kr , ,...1,0=k связан с реализацией процесса (11), т.е. зависит от вектора kp . Если же линейно независимая система векторов kr , 10 −≤≤ tk , выбрана произвольно, то процесс (11) не вырождается. Ситуа- ция, когда выполняются условия (15), (16), уже рассмотрена выше. Но мо- жет оказаться, что в некоторой точке kx , 1−≤ tk , будет ( ) 0, =′ kk rxf . (С учетом (18) это означает, что в точке kx реализуется минимум функции (1) на подпространстве, образованном векторами krr ,...,0 .) В этом случае мож- Точные методы минимизации квадратичных функций. Часть 1 Системні дослідження та інформаційні технології, 2007, № 4 91 но полагать коэффициент 0=kα , при этом kk xx =+1 . Вектор 1+kp опреде- ляется условиями kiep ikk ≤≤=++ 0,0,11α , ( ) 11111 ,, +++++ ′−= kkkkk rxfepα . Далее, в зависимости от значения ( ) ( ) 111 ,, +++ ′=′ kkkk rxfrxf (равна ли эта величина нулю или нет) процесс (11) продолжается так, как описано выше. По существу это означает, что процесс (11) может реализовывать точку минимума функции (1) за число шагов, меньшее t . В частности, если определить систему векторов 20 ,..., −trr таким обра- зом, чтобы выполнялись условия ( ) 20,0,0 −≤≤=′ tirxf i , то можно полагать 0... 20 === −tαα , ( 0... 20 === −tpp ). В этом случае 110* −−+== ttt pxxx α . Приведем еще одно свойство процессов (11). Утверждение 4. Если ( ) ,0, 0 0 kixfHp i j jiji ≤≤′= ∑ = λ ,1 iiiii xxpr −== +α (25) то ( ) 1,10,0, 01 ≥−≤≤=′ + kkieHxf ik . (26) Действительно, в данном случае справедливо (23), а в силу (25) ( ) ( ) ( )iiiii xfxfxxAe ′−′=−= ++ 11 . С учетом этого справедливость (26) непо- средственно вытекает из (24). Как уже отмечалось выше, в случае, когда матрица A вырожденная, соотношения (26) могут и не выполняться при некотором 1−≤ tk (процесс (11) вырождается). Наконец, отметим следующее. Если определены векторы kp , λ≤≤ k0 , удовлетворяющие условиям (15), (16), то это позволяет вычислить коэффициенты iβ в уравнении (8). ( ) λλ λ λβ ep pxf , ,0′ = , ( ) 0,...,2,1,,, , 1 0 −−=         −′= ∑ ≤< λλββ λ ipepxf ep ji ijji ii i . Тем самым может быть определено решение по формуле (9). Опреде- ление решения в виде (9) также можно трактовать как конечношаговый процесс построения точек kkkk rxx β−=+1 , λ,...,1,0=k . Ю.М. Данилин, И.А. Шубенкова ISSN 1681–6048 System Research & Information Technologies, 2007, № 4 92 В заключение отметим, что выполнения условий (15), (16) можно до- биться, используя различные процессы ортогонализации: собственно орто- гонализацию векторов ie , A -ортогонализацию векторов ip при специаль- ном выборе векторов ir , построение биортогональной системы векторов. Разумеется, можно использовать и другие процессы ортогонализации, из- вестные в линейной алгебре (например, [9]). Во второй части данной работы будут подробно рассмотрены вопросы реализации различных способов построения вектора kp . ЛИТЕРАТУРА 1. Пшеничный Б.Н., Данилин Ю.М. Численные методы в экстремальных зада- чах. — М.: Наука, 1975. — 320 с. 2. Полак Е. Численные методы оптимизации. — М.: Мир, 1974. — 384 с. 3. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. — М.: Мир, 1985. — 510 с. 4. Данилин Ю.М. Методы сопряженных направлений для решения задач миними- зации // Кибернетика. — 1971. — № 5. — С. 122–136. 5. Данилин Ю.М. Скорость сходимости методов сопряженных направлений // Кибернетика. — 1977. — № 6. — С. 97–105. 6. Данилин Ю.М., Буланый А.П. Квазиньютоновские методы минимизации, осно- ванные на построении сопряженных систем векторов // Журн. вычисл. ма- тем. и мат. физики. — 1978. — № 4. — С. 877–885. 7. Данилин Ю.М. Методы сопряженных направлений, не требующие решения одномерных задач минимизации // Докл. АН СССР. — 1974. — 218, №3. — С. 513–516. 8. Данилин Ю.М. Об одном классе алгоритмов со сверхлинейной сходимостью // Журн. вычисл. матем. и мат. физики. — 1974. — № 3. — С. 598–609. 9. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. — М.: Наука, 1960. — 300 с. Поступила 19.06.2007 Точные методы минимизации квадратичных функций. Часть 1 Ю.М. Данилин, И.А. Шубенкова Преобразование задачи Конечношаговые процессы решения систем линейных уравнений
id nasplib_isofts_kiev_ua-123456789-14080
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1681–6048
language Russian
last_indexed 2025-12-01T08:11:40Z
publishDate 2007
publisher Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
record_format dspace
spelling Данилин, Ю.М.
Шубенкова, И.А.
2010-12-10T17:40:31Z
2010-12-10T17:40:31Z
2007
Точные методы минимизации квадратичных функций. Часть 1 / Ю.М. Данилин, И.А. Шубенкова // Систем. дослідж. та інформ. технології. — 2007. — № 4. — С. 85-92. — Бібліогр.: 9 назв. — рос.
1681–6048
https://nasplib.isofts.kiev.ua/handle/123456789/14080
519.8
Рассматривается единый подход к построению различных по характеру точных методов минимизации квадратичных функций. Описываются возможности применения этих методов к решению задач нелинейной оптимизации и систем линейных уравнений.
The unique approach to constructing various by character exact methods for minimization of square-law functions is studied. Possibillity of application of these methods to the solution of nonlinear optimization problems and systems of linear equations is considered.
Розглянуто єдиний підхід до побудови різних за характером точних методів мінімізації квадратичних функцій. Описано можливості застосування цих методів до розв’язування задач нелінійної оптимізації та систем лінійних рівнянь.
ru
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
Методи оптимізації, оптимальне управління і теорія ігор
Точные методы минимизации квадратичных функций. Часть 1
Exact methods for minimization of square-law functions. Part 1
Точні методи мінімізації квадратичних функцій. Часть 1
Article
published earlier
spellingShingle Точные методы минимизации квадратичных функций. Часть 1
Данилин, Ю.М.
Шубенкова, И.А.
Методи оптимізації, оптимальне управління і теорія ігор
title Точные методы минимизации квадратичных функций. Часть 1
title_alt Exact methods for minimization of square-law functions. Part 1
Точні методи мінімізації квадратичних функцій. Часть 1
title_full Точные методы минимизации квадратичных функций. Часть 1
title_fullStr Точные методы минимизации квадратичных функций. Часть 1
title_full_unstemmed Точные методы минимизации квадратичных функций. Часть 1
title_short Точные методы минимизации квадратичных функций. Часть 1
title_sort точные методы минимизации квадратичных функций. часть 1
topic Методи оптимізації, оптимальне управління і теорія ігор
topic_facet Методи оптимізації, оптимальне управління і теорія ігор
url https://nasplib.isofts.kiev.ua/handle/123456789/14080
work_keys_str_mv AT danilinûm točnyemetodyminimizaciikvadratičnyhfunkciičastʹ1
AT šubenkovaia točnyemetodyminimizaciikvadratičnyhfunkciičastʹ1
AT danilinûm exactmethodsforminimizationofsquarelawfunctionspart1
AT šubenkovaia exactmethodsforminimizationofsquarelawfunctionspart1
AT danilinûm točnímetodimínímízacííkvadratičnihfunkcíičastʹ1
AT šubenkovaia točnímetodimínímízacííkvadratičnihfunkcíičastʹ1