Точные методы минимизации квадратичных функций. Часть 1
Рассматривается единый подход к построению различных по характеру точных методов минимизации квадратичных функций. Описываются возможности применения этих методов к решению задач нелинейной оптимизации и систем линейных уравнений. The unique approach to constructing various by character exact method...
Saved in:
| Date: | 2007 |
|---|---|
| Main Authors: | , |
| Format: | Article |
| Language: | Russian |
| Published: |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
2007
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/14080 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Точные методы минимизации квадратичных функций. Часть 1 / Ю.М. Данилин, И.А. Шубенкова // Систем. дослідж. та інформ. технології. — 2007. — № 4. — С. 85-92. — Бібліогр.: 9 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859715956035551232 |
|---|---|
| author | Данилин, Ю.М. Шубенкова, И.А. |
| author_facet | Данилин, Ю.М. Шубенкова, И.А. |
| citation_txt | Точные методы минимизации квадратичных функций. Часть 1 / Ю.М. Данилин, И.А. Шубенкова // Систем. дослідж. та інформ. технології. — 2007. — № 4. — С. 85-92. — Бібліогр.: 9 назв. — рос. |
| collection | DSpace DC |
| description | Рассматривается единый подход к построению различных по характеру точных методов минимизации квадратичных функций. Описываются возможности применения этих методов к решению задач нелинейной оптимизации и систем линейных уравнений.
The unique approach to constructing various by character exact methods for minimization of square-law functions is studied. Possibillity of application of these methods to the solution of nonlinear optimization problems and systems of linear equations is considered.
Розглянуто єдиний підхід до побудови різних за характером точних методів мінімізації квадратичних функцій. Описано можливості застосування цих методів до розв’язування задач нелінійної оптимізації та систем лінійних рівнянь.
|
| first_indexed | 2025-12-01T08:11:40Z |
| format | Article |
| fulltext |
Ю.М. Данилин, И.А. Шубенкова, 2007
Системні дослідження та інформаційні технології, 2007, № 4 85
УДК 519.8
ТОЧНЫЕ МЕТОДЫ МИНИМИЗАЦИИ КВАДРАТИЧНЫХ
ФУНКЦИЙ. ЧАСТЬ 1
Ю.М. ДАНИЛИН, И.А. ШУБЕНКОВА
Рассматривается единый подход к построению различных по характеру точ-
ных методов минимизации квадратичных функций. Описываются возмож-
ности применения этих методов к решению задач нелинейной оптимизации и
систем линейных уравнений.
Уже длительное время для построения быстросходящихся алгоритмов
безусловной нелинейной оптимизации на каждой итерации решается квад-
ратичная задача минимизации, в которой вместо матрицы вторых произ-
водных используется некоторая ее аппроксимация, строящаяся с примене-
нием только первых производных исходной функции или, даже, только ее
значений [1–7]. Алгоритмы такого типа (методы сопряженных направлений,
переменной метрики, двойственных направлений) используют различные
аппроксимационные матрицы, и соответствующие методы изучаются неза-
висимо друг от друга, что затрудняет выявление каких-либо общих идей
и свойств различных методов.
В данной работе предлагается достаточно общий подход к минимиза-
ции квадратичных функций, позволяющий строить и обосновывать раз-
личные по характеру алгоритмы минимизации (главным образом, будут
рассматриваться методы, использующие те или иные процессы ортогонали-
зации). В задачах нелинейной оптимизации результаты работы дают воз-
можность строить различные аппроксимационные матрицы, которые ис-
пользуются при разработке соответствующих алгоритмов. В области точных
методов решения линейных систем уравнений результаты дают возмож-
ность обосновывать свойства методов, базируясь на некоторых общих тео-
ретических результатах, справедливых для различных процессов ортогона-
лизации.
Под точными методами минимизации квадратичных функций подразу-
меваются процессы, дающие точное решение задачи за конечное число ша-
гов (итераций).
ПРЕОБРАЗОВАНИЕ ЗАДАЧИ
Пусть
cxbxAxxf ++= ,,
2
1)( , (1)
где nEx∈ — n -мерное евклидово пространство 0, ≥xAx . Пусть ранг
матрицы A равен nt ≤<0 . Будем считать, что функция (1) достигает ми-
нимального значения, т.е. уравнение
Ю.М. Данилин, И.А. Шубенкова
ISSN 1681–6048 System Research & Information Technologies, 2007, № 4 86
( ) 0=+≡′ bAxxf (2)
имеет решение. Обозначим подпространство вырождения матрицы A через
tnE − (подпространство, образованное такими линейно независимыми век-
торами ir , что 0=iAr , tni −≤≤1 ). Ортогональное дополнение к tnE − обо-
значим tE . Тогда ( ) tExf ∈′ ,
( ) ( ) tEArrxfxfe ∈=−′−′= , если tnEr −∉ . (3)
Задачу минимизации функции (1) можно по-разному свести к решению
системы линейных уравнений, определение которой не предполагает
использования матрицы вторых производных A . (Отметим, что при мини-
мизации конкретно функции (1) это чистая формальность, однако для нели-
нейных функций, где ( )xf ′′ — матрица с переменными коэффициентами,
использование лишь градиентов функции играет принципиальную роль.)
Рассмотрим некоторые из подходов.
Будем далее считать, что системы векторов ir и ii Are = , 10 −≤≤ ti
линейно независимы.
А. Определим систему уравнений
0, =+ irbAx , 10 −≤≤ ti , т.е. с учетом (3)
ii rbxe ,, −= , 10 −≤≤ ti . (4)
Лемма 1. Любое решение уравнения (2) является решением системы
(4) и наоборот, т.е. уравнение (2) и система (4) эквивалентны.
Доказательство. Первая часть утверждения очевидна: если *x — про-
извольное решение уравнения (2), то оно удовлетворяет и системе (4).
Пусть теперь x~ — некоторое решение системы (4), т.е. ii rbxe ,~, −= ,
10 −≤≤ ti . Если *x — произвольное решение уравнения (2), то
ii rbxe ,, * −= , 10 −≤≤ ti , и поэтому 0~, * =− xxei , 10 −≤≤ ti . Отсюда,
с учетом линейной независимости векторов t
i Ee ∈ , 10 −≤≤ ti вытекает,
что tnEwxx −∈=− *
~ , т.е. 0=Aw . Следовательно, ( ) =++=+ bwxAbxA *
~
0* =+= bAx , т.е. x~ — решение уравнения (2).
Лемма доказана.
Б. Функцию ( )xf (1) представим в виде
( ) ( ) ( ) *** ,
2
1 xxxxAxfxf −−+=
или
( ) ( ) ( ) ** ,
2
1 xxxfxfxf −′+= . (5)
Используя выражение (5), можно построить систему уравнений
Точные методы минимизации квадратичных функций. Часть 1
Системні дослідження та інформаційні технології, 2007, № 4 87
( ) ( ) ( ) xxxfxfxf iii −′+= ,
2
1 , ti ≤≤0 (6)
( ix , ti ,...,0= — произвольные точки).
Очевидно, любое решение уравнения (2) является и решением сис-
темы (6). С другой стороны, если система векторов ( ) ( ) ==′−′ + iii exfxf 1
( )ii xxA −= +1 , 10 −≤≤ ti линейно независима, то любое решение системы
(6) определяет некоторую точку *x (решение (2)) и значение ( )*xf . Дейст-
вительно, пусть ( )( )xfx ~,~ — произвольное решение системы (6). Вычитая
уравнения (6) друг из друга, получаем
( ) ( ) ( ) ( ) ( ) =−′+−′−′=− ++++ iiiiiiii xxxfxxxfxfxfxf 1111 ,
2
1~,
2
1
( ) iiiii xxxfxxe −′+−= ++ 11 ,
2
1~,
2
1 .
Поскольку в то же время
( ) ( ) ( ) ( ) =−−+−′=− ++++ iiiiiiiii xxxxAxxxfxfxf 1111 ,
2
1,
( ) iiiiii xxexxxf −+−′= ++ 11 ,
2
1, , устанавливаем
( ) iiiii xxxfxxe −′=− +1,
2
1~,
2
1 . (7)
Но ( ) ( )*xxAxf ii −=′ , т.е. из (7) следует
iiii exxxxe ,
2
1~,
2
1
*−=− , 10 −≤≤ ti .
Отсюда так же, как в А, устанавливается
wxx += *
~ , tnEw −∈ , т.е. x~ — решение уравнения (2). Следовательно,
( ) ( )*
~ xfxf = .
Приведенные рассуждения показывают, что справедлива
Лемма 2. Если система векторов ( ) ( ) ( )iiiii xxAexfxf −==′−′ ++ 11 ,
10 −≤≤ ti , линейно независима, то уравнение (2) и система (6) эквивалент-
ны в том смысле, что любое решение *x уравнения (2) удовлетворяет сис-
теме (6), и наоборот.
Тот факт, что решение системы (6) позволяет определять значение
( )*xf , при решении задачи (1) не играет особой роли, однако при миними-
зации нелинейных функций с использованием вспомогательных квадратич-
них задач это может иметь существенное значение.
Отметим, что системы вида (6), помимо минимизации квадратичних
функций, использовались также для минимизации функций более общего
вида — однородных [8].
Ю.М. Данилин, И.А. Шубенкова
ISSN 1681–6048 System Research & Information Technologies, 2007, № 4 88
В. Пусть ii Are = , λ,...,1,0=i , где 10 −≤< nλ — линейно независимая
система векторов, и
( ) ( ) ∑=−≡′
λ
β
0
*00 iiexxAxf . (8)
Тогда
∑=−
λ
β
0
*0 ii rxx . (9)
КОНЕЧНОШАГОВЫЕ ПРОЦЕССЫ РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ
УРАВНЕНИЙ
Итак, для отыскания точки минимума функции ( )xf (1) достаточно решить
одну из систем уравнений (4), (6). Далее будем рассматривать конечно-
шаговые методы решения систем линейных уравнений. Разработка та-
ких методов основывается на следующих соображениях (берем за основу
систему (4)).
Пусть 0x — произвольная точка, а точки txx ,...,1 строятся таким обра-
зом, чтобы выполнялись условия
1,...,1,0,0,,,1 −=≤≤−=+ tkkirbex iik . (10)
Тогда, как вытекает из сравнения систем (10) и (4), точка tx будет ре-
шением системы (4), т.е. *xxt = . Если выбирать точки txx ,...,1 по формуле
1,...,1,0,1 −=+=+ tkpxx kkkk α , (11)
где kα — скалярный множитель, а kp — вектор, то систему (10) можно за-
писать в виде
kiexrbep ikiikk ≤≤−−= 0,,,,α . (12)
При 1≥k точка kx должна удовлетворять условиям (10): =ik ex ,
irb,−= , 10 −≤≤ ki .
Следовательно, из (12) следует
1,10,0, ≥−≤≤= kkiep ikkα . (13)
При ki = оказывается
( ) kkkkkkkkkk rxfrbAxrAxrbexrb ,,,,,, ′−=+−=−−=−− ,
т.е.
( ) kkkkk rxfep ,, ′−=α . (14)
Условия (13), (14) будут, очевидно, выполнены, если вектор kp удов-
летворяет условиям
10,0, −≤≤= kiep ik , (15)
Точные методы минимизации квадратичных функций. Часть 1
Системні дослідження та інформаційні технології, 2007, № 4 89
0, ≠= kkk cep , (16)
а множитель
( )
kk
kk
k ep
rxf
,
,′
−=α . (17)
Таким образом, точка 1+kx , определяемая в виде (11), будет удовлетво-
рять условиям (10), если вектор kp и множитель kα определяется условия-
ми (15), (16) и (17) (при 0=k вектор kp , очевидно, определяется лишь ус-
ловием (16)).
Сформулируем некоторые утверждения, справедливые при условии,
что точка 1+kx и векторы kp определяются соотношениями (10), (15), (16),
причем 0≠kp .
Утверждение 1. Векторы kpp ,...,0 , удовлетворяющие условиям (15),
(16), линейно независимы.
Утверждение 2. При любом 10 −≤≤ tk в точке 1+kx , удовлетворяю-
щей условиям (10), реализуется минимум функции (1) на подпространстве,
образованном векторами krr ,...,0 , т.е.
( ) kirxf ik ≤≤=′ + 0,0,1 . (18)
Справедливость этого утверждения нетрудно установить, воспользо-
вавшись условиями (13) и (14), которые можно записать в следующем виде:
( ) =−= + ikkikk rxxAep ,, 1α
( ) ( ) 1,10,0,1 ≥−≤≤=′−′= + kkirxfxf ikk , (19)
( ) =−= + kkkkkk rxxAep ,, 1α
( ) ( ) ( ) 0,,,1 ≥′−=′−′= + krxfrxfxf kkkkk . (20)
Из (20) следует, что ( ) 0,1 −′ + kk rxf при любом k . Учитывая это и ис-
пользуя (19), получаем условия (18).
Утверждение 3. Если
( ) kixfr
i
j
jiji ≤≤′= ∑
=
0,
0
λ , (21)
где ijλ — произвольные коэффициенты, причем 0≠iiλ , то при любом
10 −≤≤ tk
( ) ( ) kixfxf ik ≤≤=′′ + 0,0,1 . (22)
Справедливость этого утверждения можно установить, используя вы-
ражения (21) в (19), (20) и рассуждая по индукции. (Параллельно устанавли-
вается линейная независимость векторов ( )ixf ′ , ki ≤≤0 .)
Ю.М. Данилин, И.А. Шубенкова
ISSN 1681–6048 System Research & Information Technologies, 2007, № 4 90
Замечание. Если 0H — некоторая невырожденная матрица, и
( ) kixfHr
i
j
jiji ≤≤′= ∑
=
0,
0
0λ , (23)
то при любом 10 −≤≤ tk
( ) ( ) kixfHxf ik ≤≤=′′ + 0,0, 01 . (24)
Справедливость (24) при выборе ir в виде (23) устанавливается точно
так же, как (22). В частности, если AH =0 , то условия (24) показывают, что
градиенты ( ) ( )10 ,..., +′′ kxfxf оказываются A -ортогональными (или сопря-
женными), т.е. при выборе ir в виде (23) (при условии AH =0 ) процесс (11)
является методом сопряженных градиентов.
Отметим еще следующее. Система векторов irr ,...,0 выбирается доста-
точно произвольно (при условии, что она линейно независима, а также ли-
нейно независима система векторов iee ,...,0 ). Поэтому можно полагать
kkk pr β= , 0≥k , 0≠kβ , где вектор 0p выбирается произвольно, а при
1≥k вектор kp удовлетворяет условиям (15). При этом условия (15), (16)
превращаются в условия A -ортогональности векторов ip .
0, =iki Appβ ,
0, ≠= kkkk cAppβ .
Коэффициент kα выбирается по формуле
( ) ( ) ( )
( ) ( )kkkk
kk
kk
kk
kkk
kkk
k xfpxfp
pxf
App
pxf
App
pxf
′−+′
′
−=
′
−=
′
−=
,
,
,
,
,
,
β
β
α .
Реализация процесса (11) таким способом ( kkk pr β= ) заведомо воз-
можна в случае, если матрица A невырожденная. Однако в случае, когда
A — вырожденная матрица, процесс (11) также может вырождаться. Это
происходит, если при некотором k оказывается 0, =kk App . Коэффици-
ент kα при этом определить невозможно.
Ситуация, когда процесс (11) вырождается, возможна только в случае,
если выбор векторов kr , ,...1,0=k связан с реализацией процесса (11), т.е.
зависит от вектора kp . Если же линейно независимая система векторов kr ,
10 −≤≤ tk , выбрана произвольно, то процесс (11) не вырождается. Ситуа-
ция, когда выполняются условия (15), (16), уже рассмотрена выше. Но мо-
жет оказаться, что в некоторой точке kx , 1−≤ tk , будет ( ) 0, =′ kk rxf . (С
учетом (18) это означает, что в точке kx реализуется минимум функции (1)
на подпространстве, образованном векторами krr ,...,0 .) В этом случае мож-
Точные методы минимизации квадратичных функций. Часть 1
Системні дослідження та інформаційні технології, 2007, № 4 91
но полагать коэффициент 0=kα , при этом kk xx =+1 . Вектор 1+kp опреде-
ляется условиями
kiep ikk ≤≤=++ 0,0,11α ,
( ) 11111 ,, +++++ ′−= kkkkk rxfepα .
Далее, в зависимости от значения ( ) ( ) 111 ,, +++ ′=′ kkkk rxfrxf (равна
ли эта величина нулю или нет) процесс (11) продолжается так, как описано
выше. По существу это означает, что процесс (11) может реализовывать
точку минимума функции (1) за число шагов, меньшее t .
В частности, если определить систему векторов 20 ,..., −trr таким обра-
зом, чтобы выполнялись условия
( ) 20,0,0 −≤≤=′ tirxf i ,
то можно полагать 0... 20 === −tαα , ( 0... 20 === −tpp ). В этом случае
110* −−+== ttt pxxx α .
Приведем еще одно свойство процессов (11).
Утверждение 4. Если
( ) ,0,
0
0 kixfHp
i
j
jiji ≤≤′= ∑
=
λ ,1 iiiii xxpr −== +α (25)
то
( ) 1,10,0, 01 ≥−≤≤=′ + kkieHxf ik . (26)
Действительно, в данном случае справедливо (23), а в силу (25)
( ) ( ) ( )iiiii xfxfxxAe ′−′=−= ++ 11 . С учетом этого справедливость (26) непо-
средственно вытекает из (24).
Как уже отмечалось выше, в случае, когда матрица A вырожденная,
соотношения (26) могут и не выполняться при некотором 1−≤ tk (процесс
(11) вырождается).
Наконец, отметим следующее.
Если определены векторы kp , λ≤≤ k0 , удовлетворяющие условиям
(15), (16), то это позволяет вычислить коэффициенты iβ в уравнении (8).
( )
λλ
λ
λβ ep
pxf
,
,0′
= ,
( ) 0,...,2,1,,,
,
1
0 −−=
−′= ∑
≤<
λλββ
λ
ipepxf
ep ji
ijji
ii
i .
Тем самым может быть определено решение по формуле (9). Опреде-
ление решения в виде (9) также можно трактовать как конечношаговый
процесс построения точек kkkk rxx β−=+1 , λ,...,1,0=k .
Ю.М. Данилин, И.А. Шубенкова
ISSN 1681–6048 System Research & Information Technologies, 2007, № 4 92
В заключение отметим, что выполнения условий (15), (16) можно до-
биться, используя различные процессы ортогонализации: собственно орто-
гонализацию векторов ie , A -ортогонализацию векторов ip при специаль-
ном выборе векторов ir , построение биортогональной системы векторов.
Разумеется, можно использовать и другие процессы ортогонализации, из-
вестные в линейной алгебре (например, [9]). Во второй части данной работы
будут подробно рассмотрены вопросы реализации различных способов
построения вектора kp .
ЛИТЕРАТУРА
1. Пшеничный Б.Н., Данилин Ю.М. Численные методы в экстремальных зада-
чах. — М.: Наука, 1975. — 320 с.
2. Полак Е. Численные методы оптимизации. — М.: Мир, 1974. — 384 с.
3. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. — М.: Мир, 1985. —
510 с.
4. Данилин Ю.М. Методы сопряженных направлений для решения задач миними-
зации // Кибернетика. — 1971. — № 5. — С. 122–136.
5. Данилин Ю.М. Скорость сходимости методов сопряженных направлений //
Кибернетика. — 1977. — № 6. — С. 97–105.
6. Данилин Ю.М., Буланый А.П. Квазиньютоновские методы минимизации, осно-
ванные на построении сопряженных систем векторов // Журн. вычисл. ма-
тем. и мат. физики. — 1978. — № 4. — С. 877–885.
7. Данилин Ю.М. Методы сопряженных направлений, не требующие решения
одномерных задач минимизации // Докл. АН СССР. — 1974. — 218, №3. —
С. 513–516.
8. Данилин Ю.М. Об одном классе алгоритмов со сверхлинейной сходимостью //
Журн. вычисл. матем. и мат. физики. — 1974. — № 3. — С. 598–609.
9. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. —
М.: Наука, 1960. — 300 с.
Поступила 19.06.2007
Точные методы минимизации квадратичных функций. Часть 1
Ю.М. Данилин, И.А. Шубенкова
Преобразование задачи
Конечношаговые процессы решения систем линейных уравнений
|
| id | nasplib_isofts_kiev_ua-123456789-14080 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1681–6048 |
| language | Russian |
| last_indexed | 2025-12-01T08:11:40Z |
| publishDate | 2007 |
| publisher | Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України |
| record_format | dspace |
| spelling | Данилин, Ю.М. Шубенкова, И.А. 2010-12-10T17:40:31Z 2010-12-10T17:40:31Z 2007 Точные методы минимизации квадратичных функций. Часть 1 / Ю.М. Данилин, И.А. Шубенкова // Систем. дослідж. та інформ. технології. — 2007. — № 4. — С. 85-92. — Бібліогр.: 9 назв. — рос. 1681–6048 https://nasplib.isofts.kiev.ua/handle/123456789/14080 519.8 Рассматривается единый подход к построению различных по характеру точных методов минимизации квадратичных функций. Описываются возможности применения этих методов к решению задач нелинейной оптимизации и систем линейных уравнений. The unique approach to constructing various by character exact methods for minimization of square-law functions is studied. Possibillity of application of these methods to the solution of nonlinear optimization problems and systems of linear equations is considered. Розглянуто єдиний підхід до побудови різних за характером точних методів мінімізації квадратичних функцій. Описано можливості застосування цих методів до розв’язування задач нелінійної оптимізації та систем лінійних рівнянь. ru Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України Методи оптимізації, оптимальне управління і теорія ігор Точные методы минимизации квадратичных функций. Часть 1 Exact methods for minimization of square-law functions. Part 1 Точні методи мінімізації квадратичних функцій. Часть 1 Article published earlier |
| spellingShingle | Точные методы минимизации квадратичных функций. Часть 1 Данилин, Ю.М. Шубенкова, И.А. Методи оптимізації, оптимальне управління і теорія ігор |
| title | Точные методы минимизации квадратичных функций. Часть 1 |
| title_alt | Exact methods for minimization of square-law functions. Part 1 Точні методи мінімізації квадратичних функцій. Часть 1 |
| title_full | Точные методы минимизации квадратичных функций. Часть 1 |
| title_fullStr | Точные методы минимизации квадратичных функций. Часть 1 |
| title_full_unstemmed | Точные методы минимизации квадратичных функций. Часть 1 |
| title_short | Точные методы минимизации квадратичных функций. Часть 1 |
| title_sort | точные методы минимизации квадратичных функций. часть 1 |
| topic | Методи оптимізації, оптимальне управління і теорія ігор |
| topic_facet | Методи оптимізації, оптимальне управління і теорія ігор |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/14080 |
| work_keys_str_mv | AT danilinûm točnyemetodyminimizaciikvadratičnyhfunkciičastʹ1 AT šubenkovaia točnyemetodyminimizaciikvadratičnyhfunkciičastʹ1 AT danilinûm exactmethodsforminimizationofsquarelawfunctionspart1 AT šubenkovaia exactmethodsforminimizationofsquarelawfunctionspart1 AT danilinûm točnímetodimínímízacííkvadratičnihfunkcíičastʹ1 AT šubenkovaia točnímetodimínímízacííkvadratičnihfunkcíičastʹ1 |