Методы гладкого штрафа на основе комбинированной штрафной функции
С помощью разработанной общей схемы аппроксимирующих методов последовательного квадратичного программирования, в основе которой лежит релаксация штрафной функции, содержащей гладкие и негладкие штрафы, описаны методы гладких штрафов для решения задач условной оптимизации с нелинейными ограничениями...
Збережено в:
| Дата: | 2014 |
|---|---|
| Автори: | , , |
| Формат: | Стаття |
| Мова: | Russian |
| Опубліковано: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2014
|
| Назва видання: | Теорія оптимальних рішень |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/111509 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Методы гладкого штрафа на основе комбинированной штрафной функции / Л.А. Соболенко, С.Г. Ненахова, И.А. Шубенкова // Теорія оптимальних рішень: Зб. наук. пр. — 2014. — № 2014. — С. 49-54. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-111509 |
|---|---|
| record_format |
dspace |
| spelling |
nasplib_isofts_kiev_ua-123456789-1115092025-02-23T17:00:40Z Методы гладкого штрафа на основе комбинированной штрафной функции Методи гладкого штрафу на основі комбінованої штрафної функції Smooth penalty methods on the basis of combined penalty function Соболенко, Л.А. Ненахова, С.Г. Шубенкова, И.А. С помощью разработанной общей схемы аппроксимирующих методов последовательного квадратичного программирования, в основе которой лежит релаксация штрафной функции, содержащей гладкие и негладкие штрафы, описаны методы гладких штрафов для решения задач условной оптимизации с нелинейными ограничениями в форме неравенств. За допомогою розробленої загальної схеми апроксимуючих методів послідовного квадратичного програмування, в основі якої лежить релаксація штрафної функції, що містить гладкі та негладкі штрафи, описано методи гладких штрафів для розв’язування задач умовної оптимізації з нелінійними обмеженнями у вигляді нерівностей. By means of the developed general scheme of approximating methods of sequential square programming which is based on the relaxation of the penal function containing smooth and unsmooth penalties, smooth penalty methods for the solution of problems of the conditional optimization with nonlinear restrictions in the form of inequalities are described. 2014 Article Методы гладкого штрафа на основе комбинированной штрафной функции / Л.А. Соболенко, С.Г. Ненахова, И.А. Шубенкова // Теорія оптимальних рішень: Зб. наук. пр. — 2014. — № 2014. — С. 49-54. — рос. XXXX-0013 https://nasplib.isofts.kiev.ua/handle/123456789/111509 519.8 ru Теорія оптимальних рішень application/pdf Інститут кібернетики ім. В.М. Глушкова НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Russian |
| description |
С помощью разработанной общей схемы аппроксимирующих методов последовательного квадратичного программирования, в основе которой лежит релаксация штрафной функции, содержащей гладкие и негладкие штрафы, описаны методы гладких штрафов для решения задач условной оптимизации с нелинейными ограничениями в форме неравенств. |
| format |
Article |
| author |
Соболенко, Л.А. Ненахова, С.Г. Шубенкова, И.А. |
| spellingShingle |
Соболенко, Л.А. Ненахова, С.Г. Шубенкова, И.А. Методы гладкого штрафа на основе комбинированной штрафной функции Теорія оптимальних рішень |
| author_facet |
Соболенко, Л.А. Ненахова, С.Г. Шубенкова, И.А. |
| author_sort |
Соболенко, Л.А. |
| title |
Методы гладкого штрафа на основе комбинированной штрафной функции |
| title_short |
Методы гладкого штрафа на основе комбинированной штрафной функции |
| title_full |
Методы гладкого штрафа на основе комбинированной штрафной функции |
| title_fullStr |
Методы гладкого штрафа на основе комбинированной штрафной функции |
| title_full_unstemmed |
Методы гладкого штрафа на основе комбинированной штрафной функции |
| title_sort |
методы гладкого штрафа на основе комбинированной штрафной функции |
| publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
| publishDate |
2014 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/111509 |
| citation_txt |
Методы гладкого штрафа на основе комбинированной штрафной функции / Л.А. Соболенко, С.Г. Ненахова, И.А. Шубенкова // Теорія оптимальних рішень: Зб. наук. пр. — 2014. — № 2014. — С. 49-54. — рос. |
| series |
Теорія оптимальних рішень |
| work_keys_str_mv |
AT sobolenkola metodygladkogoštrafanaosnovekombinirovannojštrafnojfunkcii AT nenahovasg metodygladkogoštrafanaosnovekombinirovannojštrafnojfunkcii AT šubenkovaia metodygladkogoštrafanaosnovekombinirovannojštrafnojfunkcii AT sobolenkola metodigladkogoštrafunaosnovíkombínovanoíštrafnoífunkcíí AT nenahovasg metodigladkogoštrafunaosnovíkombínovanoíštrafnoífunkcíí AT šubenkovaia metodigladkogoštrafunaosnovíkombínovanoíštrafnoífunkcíí AT sobolenkola smoothpenaltymethodsonthebasisofcombinedpenaltyfunction AT nenahovasg smoothpenaltymethodsonthebasisofcombinedpenaltyfunction AT šubenkovaia smoothpenaltymethodsonthebasisofcombinedpenaltyfunction |
| first_indexed |
2025-11-24T02:19:06Z |
| last_indexed |
2025-11-24T02:19:06Z |
| _version_ |
1849636418331082752 |
| fulltext |
Теорія оптимальних рішень. 2014 49
ТЕОРІЯ
ОПТИМАЛЬНИХ
РІШЕНЬ
С помощью разработанной общей
схемы аппроксимирующих мето-
дов последовательного квадра-
тичного программирования, в ос-
нове которой лежит релаксация
штрафной функции, содержащей
гладкие и негладкие штрафы,
описаны методы гладких штра-
фов для решения задач условной
оптимизации с нелинейными огра-
ничениями в форме неравенств.
© Л.А. Соболенко, С.Г. Ненахова,
И.А. Шубенкова, 2014
УДК 519.8
Л.А. СОБОЛЕНКО, С.Г. НЕНАХОВА, И.А. ШУБЕНКОВА
МЕТОДЫ ГЛАДКОГО ШТРАФА
НА ОСНОВЕ КОМБИНИРОВАННОЙ
ШТРАФНОЙ ФУНКЦИИ
Введение. Настоящая работа является про-
должением работы
*
, в которой для решения
гладких задач оптимизации с нелинейными
ограничениями в форме неравенств была
предложена общая схема аппроксимирую-
щих методов последовательного квадратич-
ного программирования на основе штрафной
функции, объединяющей гладкие и неглад-
кие штрафы, а также описаны алгоритмы
негладкого штрафа.
В данной работе предлагается алгоритм
гладкого штрафа на основе той же комби-
нированной штрафной функции.
Постановка задачи. По-прежнему рассма-
тривается задача нелинейной оптимизации:
найти
* min ( ),
x
f f x
( ) 0, 1,..., ,n
ix R g x i m (1)
где ( )f x , ( )ig x , 1,...,i m – дифференци-
руемые функции, градиенты ( )f x , ( )ig x ,
1,..., ,i m удовлетворяющие условию Лип-
шица.
Под решением этой задачи понимается
отыскание стационарных точек
*,x
*,
удовлетворяющих необходимым условиям
экстремума:
* * *
1
( ) ( ) 0,
m
i
i
i
f x g x
* * *( ) 0, 0, 1,..., .i i
ig x i m (2)
*
Соболенко Л.А., Ненахова С.Г., Шубенкова И.А.
Комбинированная штрафная функция для постро-
ения различных методов решения нелинейных задач
условной оптимизации // Теорія оптимальних рі-
шень. – 2013. – С. 42–49.
Л.А. СОБОЛЕНКО, С.Г. НЕНАХОВА, И.А. ШУБЕНКОВА
50 Теорія оптимальних рішень. 2014
Далее
*,X
* – множества соответствующих точек
*,x
*,
*( ) { 1,...,I x i
*,..., ( ) 0},im g x
* * * *( ), .I I x x X
Векторы рассматриваются как вектор-столбцы, – евклидова норма
вектора и согласованная с ней норма матриц: если ,ry R то
1
1
r
i
i
y y
,
( , )z x – вектор с компонентами x и , ,L x – функция Лагранжа задачи (1).
Предлагаемая схема аппроксимирующих методов базируется на решении в
каждой точке
kx итерационного процесса вспомогательной задачи квадратич-
ного программирования
1
min ( ), ( ), ,
2
k k k k k
x
f x x x A x x x x
( ) ( ), 0, 1,..., ,i k i k kg x g x x x i m (3)
где T
k kA A – сильно положительно определенная матрица
2 2
, , 0, n
ka x A x x a x a x R . (4)
А. Относительно задачи (3) предполагается, что она разрешима (ее ограни-
чения совместны) в любой точке итерационной последовательности ,kx
которая предполагается ограниченной, и существует такая константа N и такие
множители Лагранжа ,k что
1
, 0,1,...k N k . (5)
Пара Куна – Таккера ,k kx задачи (3) используется для поиска направле-
ния спуска, а величину спуска характеризует шаговый множитель ,k опреде-
ляемый из условия релаксации (убывания) некоторой штрафной функции.
Штрафная функция. В качестве таковой в [] предложена смешанная
(комбинированная) штрафная функция ( ).F z
2
1 1
( ) ( ) ( ) ( ) , ,
2
m m
i
i i
i i
F z f x g x g x
(6)
где 0, 1,..., ,m iR i m 0, 0 – коэффициенты штрафа: –
негладкий (недифференцируемый) штраф, – гладкий штраф, штраф ( )g x –
вектор из mR с компонентами ( ) max 0, ( ) .i ig x g x
Будем называть алгоритм, основанный на стратегии увеличения коэффи-
циента штрафа (при постоянном 0 ), -алгоритмом, а на увеличении
коэффициента штрафа (при постоянном 0 ) – -алгоритмом.
МЕТОДЫ ГЛАДКОГО ШТРАФА НА ОСНОВЕ КОМБИНИРОВАННОЙ ШТРАФНОЙ ФУНКЦИИ
Теорія оптимальних рішень. 2014 51
В работе [] описан -алгоритм, а также свойства функции ( ).F z
В частности, показано (лемма 2), что для -алгоритма при постоянном
0 существует «пороговое» 0 такое, что для любых во всех точках
ограниченной последовательности n
kz R выполняется неравенство
1 1 1
1 , ,k k k k kb A p p g x (7)
где ,k k kp x x 1 0;1 – любая константа.
Это неравенство гарантирует релаксацию функции ( )F z
в точке
kz вдоль
направления , :k k k kz p
1 1
( )
, ( ) , ( ) ,k
k k k k k k
k
F z
A p p g x g x
z
(8)
где ( )kg x – вектор из mR с компонентами ( ) min 0, ( )i ig x g x .
Поскольку правая часть неравенства (8) в точке
*kx x отрицательна,
производная функции ( )F z
по направлению
kz убывает.
Заметим, что в отличие от (лемма 2 в [] ) коэффициент , при котором
начинает выполняться неравенство (7) и, следовательно, (8) может расти
неограниченно в точках n
kz R , k , т. е. «порогового» 0, вообще
говоря, не существует.
Напомним, что , n
k k kz x R – точки, которые будут генерироваться
-алгоритмом при решении задачи (1), ,k kx – пара Куна – Таккера за-
дачи (3), € €
k k k – направление спуска по , зависящее от выбора € .k
Если € € ,i
k k € min , ,i i i
k k k 1,..., ,i m то € ;k k k
если
€ ,k k то € 0.k
При замене ,k ,k k kz x на € ,k €€ ,k k kz x выражение (7) (см. (13) из
[]) принимает вид:
2
1 1
€2 , ( ) 1 , ( ) ( ) .k k k k k k kg x A p p g x g x
(9)
Приведем основное свойство -алгоритмов, вытекающее из неограничен-
ного роста в точках .kx
Лемма 1. Пусть неравенство (9) нарушено в точке ˆ n
kz R при ( )kx
и выполняется при любых ( );kx последовательности ,kx k ограни-
чены, 0 фиксировано.
Л.А. СОБОЛЕНКО, С.Г. НЕНАХОВА, И.А. ШУБЕНКОВА
52 Теорія оптимальних рішень. 2014
Если учесть ( )kx при ,k то 0,kp
*,kx X *,k
1( ) 0.k kg x C
Доказательство. Нарушение (9) при ( )kx вследствие (4) приводит к
неравенству
2
1 1
€1 , ( ) ( ) 2 , ( ) ,k k k k k k k kA p p g x g x g x
(10)
которое возможно только при € , ( ) 0.k kg x Из ограниченности k и опре-
деления €
k вытекает ограниченность последовательности € ,k € .k
С учетом ограниченности ,kx €
k из (10) и (4) получим, что 1( ) ,k kg x C
где C – константа. Поэтому ( ) 0kg x . Тогда на основании (10) и (4)
выполняется 0kp – необходимое и достаточное условие того, что
*kx X ,
*k и 1( ) 0.k kg x C Лемма доказана.
Формулировка метода. Примем и
1 любыми константами из (0;1);
0 1, 0
nx R произвольно, 0 – любое фиксированное число, его не будем
указывать в обозначениях и вместо ( )F z
будем писать ( , ).kF z
Каждая k -ая итерация в точке
kz (
*kx x , 0kp ), 0,1,...k состоит
в следующем.
Шаг 1 (определение
kp и k ). Задать матрицу T
k kA A , удовлетворяющую
(4) и, решая задачу (3), найти ,kx ,k .kp
Шаг 2 (спуск по и сохранение штрафа
1k k ). Вычислить
€ min ; ,i i i
k k k 1,...,i m и найти €€ ; ,k k kz x € € ,k k k
полагая
0
€
k при 0.k В случае € 0k принять
1k k и перейти к шагу 4; при
нарушении к шагу 3.
Шаг 3 (вычисление нового
k и переопределение ˆ
kz , €
kz ).
Найти ,k как наименьшее из значений
1
2 ,
s
k
1,2,...s , для которого
впервые выполняется (9). Взять в качестве нового €
k вектор k и, соответ-
ственно, новые € , ,k k kz x € 0.k
Шаг 4 (определение
k ). Найти
k как наименьшее из значений 2 ,s
0,1,...s , для которого впервые выполнится неравенство
€€ € €( , , ) ( , ) ,k k k k k k kF z z F z 0 1, (11)
МЕТОДЫ ГЛАДКОГО ШТРАФА НА ОСНОВЕ КОМБИНИРОВАННОЙ ШТРАФНОЙ ФУНКЦИИ
Теорія оптимальних рішень. 2014 53
где
1
1
€€ , ( ) , ( ) ,
2
k k k k k k kA p p g x g x
10 1. (12)
Шаг 5. Вычислить
1
€ € ,k k k kz z z : 1.k k
Конец итерации.
Отметим, что при поиске
k в неравенстве (9) используются вычисленные
на шаге 2 значения € ,k € ,kz € ,k € .kz При этом в (11) в качестве €
k выступает
вектор с компонентами ( 1,...,i m )
1
1
min ; , если ,
€
, если .
i i
k k k ki
k i
k k k
(13)
Соответсвенно (13) определяется и € €
k k k в (11): €
k k k
при
1k k и € 0k при
1.k k
Вследствие ограниченности объема публикации, сформулируем свойства
-алгоритма в виде двух теорем без доказательств.
Теорема 1. Пусть градиенты ( )f x , ( )ig x , 1,...,i m удовлетворяют усло-
вию Липшица, для вспомогательной задачи (3) выполняется предположение А,
0
nx R – произвольно,
tkx – точки увеличения .
Тогда.
1. Если
k , то при k ,
*,tkx X
kx ,
*( , ) ,k kF z F (14)
где
* *( )F f x – значение функции ( )f x в одной из стационарных точек
* *.x X При дополнительном условии выпуклости задачи (1) будет
*,kx X
* *F f ,
*( ) .kf x f (15)
2. Если 0k – константа при
0k k , то справедливы утверждения из
[] для -алгоритма о нелокальной сходимости
*kx X (теорема 1) и
локальных оценках скорости сходимости (теорема 2).
Оценки локальной скорости сходимости устанавливались в зависимости от
выполнения условий:
А1. Функции ( )f x , ( )ig x ,
*( )i I x выпуклы в окрестности множества ,
содержащего внутреннюю точку.
А2. Функции ( )f x , ( )ig x ,
*( )i I x дважды непрерывно дифференцируемы
в окрестности
*,x градиенты ( ),ig x
*( )i I x линейно-независимы и для
всех x таких, что *( ), 0ig x x , * * *( ) ( ) 0ii I x i I x имеет место
*( ) , 0.xxL z x x
Л.А. СОБОЛЕНКО, С.Г. НЕНАХОВА, И.А. ШУБЕНКОВА
54 Теорія оптимальних рішень. 2014
А3. Градиенты
*( ),ig x *( ) 1,...,i I x i m – линейно независимы и * 0i
для всех
*( ).i I x
Ограниченность генерируемых алгоритмом значений
k исследуется в
теореме 2.
Теорема 2. Пусть выполнены условия теоремы 1 и А1,
*kx x при k .
Тогда при дополнительном условии А2 или А3 будет 0k – константа для
0 ,k k при этом
*,k
*
€ ,k € 0k и справедливы оценки локальной
скорости сходимости
* 1 ,k
kx x C q
2
1 * 2 * ,k kx x C x x
где (0;1)q ,
1C ,
2C . – константы.
Заключение. В отличие от -алгоритма [], нелокальная сходимость (14)
в -алгоритме гарантируется, вообще говоря, при . Однако при их
комбинации в предложенной схеме присутствие постоянного 0 положи-
тельно влияет на характер генерируемых .k Так, если ,k k
0 ,k k то
неравенство (9) выполнится, гарантируя ограниченность
k как для выпук-
лой, так и невыпуклой задачи (1). Если же
*( ),ig x
*( )i I x линейно-независимы
в предельной точке
*,x то при любом постоянном 0 генерируется .k
Таким образом, сам факт присутствия коэффициента 0 обуславливает
ограниченность генерируемых .k
Л.О. Соболенко, С.Г. Ненахова, І.А. Шубенкова
МЕТОДИ ГЛАДКОГО ШТРАФУ НА ОСНОВІ КОМБІНОВАНОЇ ШТРАФНОЇ ФУНКЦІЇ
За допомогою розробленої загальної схеми апроксимуючих методів послідовного квадра-
тичного програмування, в основі якої лежить релаксація штрафної функції, що містить гладкі
та негладкі штрафи, описано методи гладких штрафів для розв’язування задач умовної
оптимізації з нелінійними обмеженнями у вигляді нерівностей.
L.A. Sobolenko, S.G. Nenakhova, I.A. Shubenkova
SMOOTH PENALTY METHODS ON THE BASIS OF COMBINED PENALTY FUNCTION
By means of the developed general scheme of approximating methods of sequential square
programming which is based on the relaxation of the penal function containing smooth and
unsmooth penalties, smooth penalty methods for the solution of problems of the conditional
optimization with nonlinear restrictions in the form of inequalities are described.
Получено 20.03.2014
|