Polyak’s Method Based on the Stochastic Lyapunov Function for Justifying the Consistency of Estimates Produced by a Stochastic Approximation Search Algorithm under an Unknown-But-Bounded Noise

Мұқаба

Дәйексөз келтіру

Толық мәтін

Аннотация

In 1976–1977, Polyak published in the journal Avtomatica i Telemekhanika (Automation and Remote Control) two remarkable papers on how to study the properties of estimates of iterative pseudogradient algorithms. The first paper published in 1976 considered the general case based on the stochastic Lyapunov function, and the second one considered the linear case. The assumptions formulated in these papers and the estimates obtained in them can still be considered the state-of-the art. In the current paper, Polyak’s approach is applied to the study of the properties of estimates of a (randomized) stochastic approximation search algorithm for the case of unknown-but-bounded noise in observations. The obtained asymptotic estimates were already known earlier, and exact estimates for a finite number of observations are published for the first time.

Толық мәтін

  1. ВВЕДЕНИЕ

Решение задач оптимизации часто сводится к нахождению точки экстремума некоторой функции. При этом принято полагаться на использование известных итерационных процедур, использующих значения исследуемой функции в выбираемых последовательно точках. Наличие помех при измерениях оказывает существенное влияние на результат. Для практики важно предложить такую итерационную схему, которая как можно более быстрая (по количеству итераций), простая (по сложности, требуемым ресурсам и времени выполнения одной итерации) и работоспособная при почти произвольных помехах. Именно такого типа процедуры были предложены в [1]–[3], основная идея которых состоит в решении сложных многомерных (в пространстве d) задач оптимизации методами, похожими на процедуру Кифера–Вольфовица, но использующими на каждой итерации для формирования новой градиентной аппроксимации вместо 2d-измерений целевой функции только одно или два измерения в точках на случайно выбираемой линии, проходящей через точку предыдущей оценки. В статье 1989 г. [1] была предложена новая стохастическая рекуррентная процедура с одним измерением на итерации с пробными возмущениями на входе, для которой была обоснована состоятельность оценок при почти произвольных зависимых помехах в наблюдениях. Позже этот результат был распространен на векторный случай (см. [4]–[6]). В 1990 г. в статье Б. Т. Поляка и А. Б. Цыбакова [2] такого типа алгоритмы получили название поисковые алгоритмы стохастической аппроксимации, и для них при достаточно общих условиях была доказана асимптотическая оптимальность в том смысле, что для класса близких функций невозможно предложить итеративный алгоритм, который будет асимптотически сходится быстрее. Похожий алгоритм в англоязычной литературе под называнием метод SPSA (Simultaneously Perturbed Stochastic Approximation) в варианте с двумя измерениями был предложен в 1992 г. в статье [3] и с одним измерением — в [7]. Позднее в 1999 г. в статье [8] был обоснован новый алгоритм с двумя измерениями, в одном из которых измерение псевдоградиента проводилось в возмущенной точке, а в другом — в точке предшествующей оценки без возмущения. Такая версия лучше подходит для оптимизации в реальном времени, когда данные поступают в обновляющемся потоке. Основная идея метода состоит в решении сложных многомерных (в пространстве d) задач методами, похожими на процедуру Кифера–Вольфовица, но используя на каждой итерации для формирования одной градиентной аппроксимации вместо 2d-измерений целевой функции только одно или два измерения в точках на случайно выбираемой линии, проходящей через точку предыдущей оценки.

В последнее время подобного рода алгоритмы привлекают внимание исследователей (см., например, [9], [10]). Их часто стали называть безградиентными методами с неточным оракулом. В 2023 г. вышла статья [11], развивающая идеи из [5]. Алгоритм, рассматриваемый в этой статье, был первоначально предложен в [12] для нахождения центров восходящих термических потоков, используемых для увеличения длительности полетов БПЛА планерного типа. При исследовании скорости сходимости оценок ключевую роль играет способ формирования размеров шагов алгоритмов. В статье [13] этот алгоритм с постоянными размерами шага использовался для решения задачи трекинга. На практике с течением времени вид исследуемой функции может несколько видоизменяться, и точки экстремумов могут дрейфовать со временем. В зависимости от скорости дрейфа и уровня помех в измерениях выбор постоянного большего размера шага алгоритма на итерации может давать более высокую скорость сходимости, но только в некоторую окрестность текущей точки экстремума, при малом постоянном размере шага оценки сходятся медленнее, но результаты точнее при отсутствии дрейфа. Важно, чтобы за время сходимости искомая точка экстремума не отдрейфовала далеко. Если нет возможности сходиться точно, есть возможность сойтись быстрее. Например, в задачах слежения за маневрирующими целями не так важно, чтобы оценки точно сошлись к искомому решению, как важно успеть отслеживать дрейф точки минимума (точность отходит на второй план, важнее становится скорость сходимости). Для задач распределенной оптимизации (в частности, распределенного отслеживания целей) в [14] была предложена модификация алгоритма, совмещенная с консенсусным протоколом локального голосования. В [15] показаны возможности ускорения сходимости по Нестерову, основанные на использовании метода тяжелого шарика Б. Т. Поляка (см. [16]).

Детальный вклад известных работ Б. Т. Поляка в развитие численных методов оптимизации анализируется в [17].

Далее в настоящей статье свойства оценок алгоритма из [13] анализируются на основе использования стохастической функции Ляпунова, опираясь на результаты статьи [18], в которой Б. Т. Поляк предложил и обосновал метод на основе стохастической функции Ляпунова для исследования свойств оценок псевдоградиентных итеративных алгоритмов стохастической оптимизации (см. также [6], гл. 5).

  1. ПОСТАНОВКА ЗАДАЧИ, АЛГОРИТМ И ОСНОВНЫЕ ПРЕДПОЛОЖЕНИЯ

Пусть x1, x2, ... — последовательность точек измерения (план наблюдения, выбираемый или контролируемый экспериментатором), xnd, в которых в каждый момент времени n = 1, 2, ... доступно наблюдению с помехами vn значение некоторой дифференцируемой по xn штрафной функции (функции потерь) F (xn, wn):

yn=Fxn,wn+vn, (1)

где F:d×p1, {wn} — неконтролируемая последовательность p-мерных случайных векторов wn (возмущений) с одинаковым (может быть) неизвестным распределением Pw(·) с компактным носителем W=suppPwp.

Рассмотрим задачу минимизации функции

fx:=EwFx,w=pFx,wPwdw. (2)

Здесь и далее E — символ математического ожидания.

Задача: по доступным наблюдениям необходимо построить последовательность оценок θ^n неизвестного вектора θ, минимизирующего функцию .

Для решения поставленной задачи воспользуемся итеративным алгоритмом из [13] с двумя измерениями.

Алгоритм: выберем произвольный вектор начальной оценки θ^0d, и для выбираемых или задаваемых последовательностей положительных чисел αn, βn+ и βn- с помощью пробного одновременного возмущения {∆n} определим шаг итерации:

x2n=θ^2n2+βn+Δn, x2n1=θ^2n2βnΔn,θ^2n1=θ^2n2,y2n=Fx2n,w2n+v2n, y2n1=Fx2n1,w2n1+v2n1,θ^2n=θ^2n1αnβn++βnKnΔny2ny2n1, (3)

где ∆n, n = 1, 2, ... — наблюдаемая (задаваемая или контролируемая пользователем) последовательность независимых случайных векторов из d с известными функциями распределения Pn(·), Kn:dd — задаваемые пользователем вектор-функции (ядра), удовлетворяющие вместе с Pn(·) условиям

KnxPndx=0,KnxxTPndx=I, (4)

supnKnx2Pndx<, n=1,2,. (5)

Следующие предположения будут использоваться для формулировки основного результата.

Предположение 1. Функция f(·) — сильно выпуклая, т. е. имеет единственный минимум в d в некоторой точке θ = θ(f(·)) и

<xθ,fx>μxθ2xd

с некоторой постоянной μ > 0. Здесь и далее <x,y>:=i=1dxiyi — скалярное произведение x,yd.

Предположение 2. Условие Липшица на градиент функции F(·, w)

Fx1,wFx2,wAx1x2

с некоторой постоянной A>μ wp,x1,x2d .

Предположение 3. xd функции F(x, ·) и ∇xF(x, ·) равномерно на  ограничены.

Пусть v¯n=v2nv2n1,    w¯n=w2nw2n1.

Предположение 4. О равномерной ограниченности помех наблюдения v¯n:

n ≥ 1, если v¯n случайно, то Ev¯n2σv2, иначе v¯n ограничены: v¯nσv.

Предположение 5. Условия о взаимной независимости помех v¯n, возмущений w¯n и пробных возмущений ∆n:

n ≥ 1 случайный вектор ∆n не зависит от w¯n, случайные векторы w¯n, ∆n не зависят от w¯1,,w¯n1; если v¯n — случайные величины, то w¯n, ∆n также не зависят от v¯1,,v¯n.

  1. АНАЛИЗ СХОДИМОСТИ ПОСЛЕДОВАТЕЛЬНОСТИ ОЦЕНОК

Для анализа сходимости оценок алгоритма (3) используется метод из [18], аналогичный второму методу Ляпунова в теории устойчивости. В качестве функции Ляпунова выберем

Vθ^2n2=12θ^2n2θ2. (6)

Перечислим основные условия теорем 1—3 из [18], выполнение которых надо проверить.

Условие А. Итеративный процесс Yn, задающий направление изменения оценки, имеет марковский характер, т. е. распределение случайного вектора Yn зависит только от θ^2n2 и n:

Yn=Gnθ^2n2,w¯n.

Для алгоритма (3) имеем

EYn=E{KnΔny2ny2n1βn++βn|Fn1}.

Условие Б. Vθ^2n2 — неотрицательна, infVθ^2n2=0, Vθ^2n2 — дифференцируема, а ее градиент удовлетворяет условию Липшица:

VxVθLxθ.

Условие В. Условие псевдоградиентности:

<Vθ^2n2, EGnθ^2n2,w¯n>δnVθ^2n2γn, δn>0, γn0.

Для алгоритма (3) с учетом выбранной в виде (6) функции Ляпунова получается следующее выражение:

<Vθ^2n2,EGnθ^2n2,w¯n> =<θ^2n2θ,E{KnΔny2ny2n1βn++βn|Fn1}>.

Учитывая вид y2n, y2n–1 и x2n, x2n–1, перепишем EGnθ^2n2,w¯n в виде

EGnθ^2n2,w¯n=E{KnΔnFθ^2n2+βn+Δn,w2n+v2nFθ^2n2βnΔn,w2n1v2n1βn++βn|Fn1}.

Так как в силу предположения 5 вектор ∆n не зависит от vn, то

E{KnΔnv2nv2n1|Fn1}=KnxPndxE{v2nv2n1|Fn1}.

Далее из (4) следует, что первый сомножитель в последней формуле равен нулю, а значит, и

E{KnΔnv2nv2n1|Fn1}=0.

Следовательно,

EGnθ^2n2,w¯n=1βn++βnE{KnΔnFθ^2n2+βn+Δn,w2nFθ^2n2βnΔn,w2n1|Fn1}. (7)

Воспользовавшись дважды формулой Тейлора, перепишем выражение под знаком математического ожидания:

βn+βn++βnfθ^2n2+βn+βn++βnKnxxT01xFθ^2n2+tβn+x,w2nxFθ^2n2,w2ndtPndxPwdw++βnβn++βnfθ^2n2βnβn++βnKnxxT01xFθ^2n2tβnx,w2n1xFθ^2n2,w2n1dtPndxPwdw.

Оценим два слагаемых с интегралами по модулю:

βn+βn++βnKnxxT01xFθ^2n2+tβn+x,w2nxFθ^2n2,w2ndt PndxPwdw++βnβn++βnKnxxT01xFθ^2n2+tβnx,w2nxFθ^2n2,w2n1dt PndxPwdwβn+βn++βnKnxxT01xFθ^2n2+tβn+x,w2nxFθ^2n2,w2ndt PndxPwdw+ (8)

+βnβn++βnKnxxT01xFθ^2n2tβnx,w2n1xFθ^2n2,w2n1dt PndxPwdw(βn+)2+(βn)2βn++βnKnxxAxPndxPwdwC1(βn+)2+(βn)2βn++βn.

Подставляем получившееся в (8) выражение в (7):

<θ^2n2θ, E{KnΔny2ny2n1βn++βn|Fn1}><θ^2n2θ,fθ^2n2>C1(βn+)2+(βn)2βn++βnθ^2n2θ,

Так как

2C1(βn+)2+(βn)2βn++βnθ^2n2θC1(βn+)2+(βn)2βn++βn2+θ^2n2θ2,

то

<Vθ^2n2,EGnθ^2n2,w¯n><θ^2n2θ,fθ^2n2>12C1(βn+)2+(βn)2βn++βn212θ^2n2θ22μ112θ^2n2θ212C1(βn+)2+(βn)2βn++βn2. (9)

Условие Г. Условие на Gn(·, ·):

EGnw¯n,x2σn2+τnVx, σn0,  τn0.

Учитывая ограниченность вектор-функций Kn и компактность их носителя, последовательно выводим

E(y2ny2n1)24βn++βnKnΔn2|Fn112supxx2KnE{v2n12+v2n2|Fn1}+Fθ^2n2+βn+x,w2nFθ^2n2βnx,w2n12××Knx2PndxPwdw2nPwdw2n1 C7βn2θ^2n2θ2+βn2+C8ξn2=C7βn2θ^2n2θ2+C8ξn2+oβn2, (10)

использовав ограниченность вектор-функций Kn, компактность их носителя и неравенство

Fθ^2n2+βn+x,w2nFθ^2n2βnx,w2n1Fθ^2n2+βn+x,w2nFθ^2n2,w2n + + Fθ^2n2βnx,w2n1Fθ^2n2,w2n1+Fθ^2n2,w2nFθ^2n2,w2n1,

где Ci, i = 1, 2, ... — некоторые положительные константы.

Для разности применим дважды формулу Тейлора:

Fθ^2n2+βn+x,w2nFθ^2n2βnx,w2n1=Fθ^2n2,w2n+<xFθ^2n2+tβn+x,w2n,βn+x>Fθ^2n2,w2n1<xFθ^2n2tβnx,w2n1,βnx>. (11)

Добавив и отняв xFθ^2n2,w2n и xFθ^2n2,w2n1, получаем

=Fθ^2n2,w2nFθ^2n2,w2n1+<xFθ^2n2+tβn+x,w2nxFθ^2n2,w2n, βn+x><xFθ^2n2tβnx,w2n1xFθ^2n2,w2n1, βnx>++<xFθ^2n2,w2n, βn+x><xFθ^2n2,w2n1, βnx>. (12)

Оценим скалярные произведения

<xFθ^2n2+tβn+x,w2nxFθ^2n2,w2n, βn+x>xFθ^2n2+tβn+x,w2nxFθ^2n2,w2nβn+x,<xFθ^2n2tβnx,w2n1xFθ^2n2,w2n1, βnx>xFθ^2n2tβnx,w2n1xFθ^2n2,w2n1βnx,

xFθ^2n2,w2n, βn+xxFθ^2n2,w2nβn+x,xFθ^2n2,w2n1, βnxxFθ^2n2,w2n1βnx.

В итоге получаем оценку для (12):

Fθ^2n2+βn+x,w2nFθ^2n2βnx,w2n1Fθ^2n2,w2nFθ^2n2,w2n1++xFθ^2n2+tβn+x,w2nxFθ^2n2,w2nβn+x+xFθ^2n2tβnx,w2n1xFθ^2n2,w2n1βnx++xFθ^2n2,w2nβn+x+xFθ^2n2,w2n1βnx.

Подставив получившуюся оценку в (10), последовательно выводим

Ey2n-y2n-124βn++βn-Knn2|Fn-112supxKnx2Ev2n-12-v2n2|Fn-1++(Fθ^2n-2, w2n-Fθ^2n-2, w2n-1+xFθ^2n-2+tβn+x, w2n-xFθ^2n-2, w2nβn+x+

+xFθ^2n-2+tβn-x, w2n-1-xFθ^2n-2, w2n-1βn-x+xFθ^2n-2, w2nβn+x++xFθ^2n-2, w2n-1βn-x)2Knx2PndxPwdw2nPwdw2n-1==12supxKnx2Ev2n-12-v2n2|Fn-1+

+(Fθ^2n-2, w2n-Fθ^2n-2, w2n-1+xFθ^2n-2+tβn+x, w2n-xFθ^2n-2, w2nβn+x++xFθ^2n-2+tβn-x, w2n-1-xFθ^2n-2, w2n-1βn-+xFθ^2n-2, w2nβn+++xFθ^2n-2, w2n-1βn-x)2Knx2PndxPwdw2nPwdw2n-1 (13)

12supxKnx2Ev2n-12-v2n2|Fn-1++(Fθ^2n-2, w2n-Fθ^2n-2, w2n-1+(Atβn+xβn++Atβn-xβn-++xFθ^2n-2, w2nβn++xFθ^2n-2, w2n-1βn-)x)2×

Knx2PndxPwdw2nPwdw2n-112supxKnx2Ev2n-12-v2n2|Fn-1+(Fθ^2n-2, w2n-Fθ^2n-2, w2n-1+(Axβn+2+βn-2+xFθ^2n-2, w2nβn++xFθ^2n-2, w2n-1βn-)x)2Knx2PndxPwdw2nPwdw2n-1σn2

в силу ограниченности Kn и компактности их носителя. Распишем разность

Fθ^2n2,w2nFθ^2n2,w2n1 (14)

в виде

Fθ,w2n+<xFθ+tθ^2n2θ,w2n,θ^2n2θ>Fθ,w2n1<xFθ+tθ^2n2θ,w2n1,θ^2n2θ>.

Добавив и отняв xFθ^2n2,w2n и xFθ^2n2,w2n1, получаем

=Fθ,w2nFθ,w2n1+<xFθ+tθ^2n2θ,w2nxFθ^2n2,w2n,θ^2n2θ><xFθ+tθ^2n2θ,w2n1xFθ^2n2,w2n1,θ^2n2θ>++<xFθ^2n2,w2n,θ^2n2θ><xFθ^2n2,w2n1,θ^2n2θ>.

Оценим скалярные произведения:

<xFθ+tθ^2n2θ,w2n-xFθ^2n2,w2n,θ^2n2θ>xFθ+tθ^2n2θ,w2n-xFθ^2n2,w2nθ^2n2θ,<xFθ+tθ^2n2θ,w2n-1>-xFθ^2n2,w2n-1,θ^2n2θ>xF|θ+tθ^2n2θ,w2n-1-x|Fθ^2n2,w2n-1θ^2n2θ,

<xFθ^2n2,w2n,θ^2n2θ><xFθ^2n2,w2n1,θ^2n2θ>θ^2n2θxFθ^2n2,w2n+xFθ^2n2,w2n1,

Получили оценку для (14) в виде

Fθ^2n2, w2n-Fθ^2n2, w2n-1Fθ, w2n-Fθ, w2n-1+θ^2n2θ(xFθ+tθ^2n2θ,w2n-xFθ^2n2,w2n++xFθ+tθ^2n2θ,w2n-1-xFθ^2n2,w2n-1++xFθ^2n2,w2n+xFθ^2n2,w2n-1).

Подставим получившееся выражение в (13):

Ey2n-y2n-124βn++βn-Knn2|F2n-212supxKnx2Ev2n-12-v2n2|F2n-2++(Fθ, w2n-Fθ, w2n-1+θ^2n-2-θ(xFθ+tθ^2n-2-θ, w2n-xFθ^2n-2, w2n+ (15)

+xFθ+tθ^2n-2-θ, w2n-1-xFθ^2n-2, w2n-1+xFθ^2n-2, w2n+xFθ^2n-2, w2n-1)+(Axβn+2+βn-2+xFθ^2n-2, w2nβn++xFθ^2n-2, w2n-1βn-)x)2Knx2PndxPwdw2nPwdw2n-1.

Введем обозначения:

a=Fθ,w2nFθ,w2n1+Axβn+2+βn2+xFθ^2n2,w2nβn+++xFθ^2n2,w2n1βnx,b=xFθ+tθ^2n2θ,w2nxFθ^2n2,w2n++xFθ+tθ^2n2θ,w2n1xFθ^2n2,w2n1+xFθ^2n2,w2n+xFθ^2n2,w2n1,a+θ^2n2θb2=a2+abθ^2n2θ+b2θ^2n2θ2.

Так как

2θ^2n2θ1+θ^2n2θ2,θ^2n2θ0.5+0.5θ^2n2θ2,

то

a+θ^2n2θb2a2+ab0.5+0.5θ^2n2θ2+b2θ^2n2θ2=a2+0.5ab+(0.5ab+b2)θ^2n2θ2.

После подстановки в (15) получаем оценку

Ey2ny2n124βn++βnKnΔn2|Fn112supxKnx2E{v2n12+v2n2|Fn1}++a2+0.5ab+0.5ab+b2θ^2n2θ2×Knx2PndxPwdw2nPwdw2n1CτVx+Cσ

в силу компактности носителя Kn, равномерной ограниченности функции F и ∇F.

Условие Д. Условие на начальное приближение Eθ^0θ2< выполнено.

Для формулировки основного результата статьи надо ввести ограничения на последовательность {αn}. Пусть αn удовлетворяет ограничениям

0αn4μ2LCτ,    αn2μ1(2μ1)22LCτLCτ,αn2μ1+(2μ1)22LCτLCτ,    nαn=. (16)

Введем обозначения:

νn=αn2μ1LαnCτ2,    ϕn=αnγn+L2αn2Cσ,    γn=12C1(βn+)2+(βn)2βn++βn2,ψn=ϕnνn,    λn=ψnψn+111νn,    λ'n=1ψn+1ψn1νn+1.

Условие Е.0νn1, nνn= .

При выборе αn, удовлетворяющих ограничениям (16), условие Е выполняется.

Проведенный анализ доказывает следующую теорему, являющуюся прямым следствием теорем 1—3 из [18].

Теорема. Пусть выполняются предположения 1–5 и условия (4), (5) и (16).

Если lim¯nψnψ,  ψ0, тогда lim¯nEθ^nθ2ψ. Если при этом ψn ≤ ψ для всех n, то

Eθ^nθ2Eθ^0θ2i=0n1νi+ψ1i=0n1νi.

Если ψn → 0, тогда Eθ^nθ20.

Если, кроме того,

а) lim¯nλnλ<1, то

Eθ^nθ2ψn+11λ+oψn+1;

б) λn ≤ λ < 1 для всех n, то

Eθ^nθ2μn+111λ+Eθ^0θ2ψ011λi=0n11λνi;

в) lim¯nλn'λ>1, то

Eθ^nθ2=Oi=0n1νi;

г) λn'λ>1 для всех n, то

Eθ^nθ2Eθ^0θ2+ψ01λi=0n1νi.

Если nϕn<, тогда θ^nθ20 c вероятностью единица.

При этом для всякого ε > 0, n0 ≥ 0 имеем

Pθ^nθ2ε nn01Eθ^0θ2+nϕnε,

где P(·) обозначает вероятность.

Если, кроме того, lim¯nλ'nλ>1,

то для всякого K > 0 найдется такое C=CK,Eθ^0θ2, что

Pθ^nθ2C+Ki=0n1νi n1C/K,

а если λn'λ>1 для всех n, то

Pθ^nθ2K+Eθ^0θ2+ψ01λi=0n1νi n1Eθ^0θ2Kψ0Kλ1.

  1. ЗАКЛЮЧЕНИЕ

Борисом Теодоровичем Поляком в 70-е годы XX в. были получены результаты, которые до сих пор активно используются исследователями. В настоящей статье на основании теорем 1—3 из статьи [18] получены новые результаты о свойствах оценок алгоритма (3), расширяющие ранее установленные в [6] асимптотические свойства оценок, добавляя к ним оценки точности при конечном числе итераций.

×

Авторлар туралы

O. Granichin

Saint Petersburg State University; Mechanical Engineering Research Institute, Russian Academy of Sciences

Хат алмасуға жауапты Автор.
Email: oleg_granichin@mail.ru
Ресей, Saint Petersburg; Saint Petersburg

Yu. Ivansky

Saint Petersburg State University; Mechanical Engineering Research Institute, Russian Academy of Sciences

Email: oleg_granichin@mail.ru
Ресей, Saint Petersburg; Saint Petersburg

K. Kopylova

Saint Petersburg State University

Email: oleg_granichin@mail.ru
Ресей, Saint Petersburg

Әдебиет тізімі

  1. Граничин О. Н. Об одной стохастической рекуррентной процедуре при зависимых помехах в наблюдении, использующей на входе пробные возмущения // Вест. Ленингр. ун-та. 1989. Т. 1. № 1. С. 19—21.
  2. Поляк Б. Т., Цыбаков А. Б. О некоторых способах ускорения сходимости итерационных методов // Пробл. передачи информ. 1990. Т. 26. № 2. С. 126—133.
  3. Spall J. C. Multivariate stochastic approximation using a simultaneous perturbation gradient approximation// IEEE Trans. Autom. Control. 1992. V. 37. Iss. 6. P. 332—341.
  4. Граничин О. Н. Процедура стохастической аппроксимации с возмущением на входе // Автоматика и телемехан. 1992. № 2. C. 97—104.
  5. Polyak B. T., Tsybakov A. B. On stochastic approximation with arbitrary noise (the KW-case) // Adv. Sov. Math. 1992. V. 12. Iss. 8.
  6. Граничин О. Н., Поляк Б. Т. Рандомизированные алгоритмы оценивания и оптимизации при почти произвольных помехах. М.: Наука, 2003.
  7. Spall J. C. A one-measurement form of simultaneous perturbation stochastic approximation // Automatica. 1997. V. 33. Iss. 1. P. 109—112.
  8. Chen H., Duncan T. E., Pasik-Duncan B. A Kiefer-Wolfowitz algorithm with randomized differences // IEEE Trans. Autom. Control. 1999. V. 44. Iss. 3. P. 442—453.
  9. Lobanov A., Gasnikov A., Stonyakin F. Highly smoothness zero-order methods for solving optimization problems under PL condition // arXiv preprint arXiv:2305.15828; 2023.
  10. Dvinskikh D., Tominin V., Tominin Y., Gasnikov A. Gradient-free optimization for non-smooth saddle point problems under adversarial noise // arXiv preprint arXiv:2202.06114; 2022.
  11. Akhavan A., Chzhen E., Pontil M., Tsybakov A. B. Gradient-free optimization of highly smooth functions: improved analysis and a new algorithm // arXiv preprint arXiv:2306.02159; 2023.
  12. Antal C., Granichin O. N., Levi S. Adaptive autonomous soaring of multiple UAVs using simultaneous perturbation stochastic approximation // 49th IEEE Conf. on Decision and Control (CDC), 2010. P. 3656—3661.
  13. Granichin O., Amelina N. Simultaneous perturbation stochastic approximation for tracking under unknown but bounded disturbances // IEEE Trans. Autom. Control. 2015. V. 60. Iss. 6. P. 1653—1658.
  14. Granichin O. N., Erofeeva V. A., Ivanskiy Y. V., Jiang Y. Simultaneous perturbation stochastic approximation-based consensus for tracking under unknown-but-bounded disturbances // IEEE Trans. Autom. Control. 2021. V. 66. Iss. 8. P. 3710—3717.
  15. Erofeeva V. А., Granichin O. N., Tursunova M., Sergeenko A., Jiang Y. Accelerated simultaneous perturbation stochastic approximation for tracking under unknown-but-bounded disturbances // Am. Control Conf. (ACC) 2022. P. 1582—1587.
  16. Поляк Б. Т. О некоторых способах ускорения сходимости итерационных методов // Ж. вычисл. матем. и матем. физ. 1964. Т. 4. № 5. С. 791—803.
  17. Аблаев С. С., Безносиков А. Н., Гасников А. В., Двинских Д. М., Лобанов A. B., Пучинин C. М., Стонякин Ф. С. О некоторых работах Бориса Теодоровича Поляка по сходимости градиентных методов и их развитии // Ж. вычисл. матем. и матем. физ. 2024. Т. 64. № 4. С. 25–64.
  18. Поляк Б. Т. Сходимость и скорость сходимости итеративных стохастических алгоритмов. I. Общий случай // Автоматика и телемехан. 1976. № 12. С. 83—94.

Қосымша файлдар

Қосымша файлдар
Әрекет
1. JATS XML

© Russian Academy of Sciences, 2024

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».