Оптимизация траекторий с малой тягой в переменных Кустаанхеймо–Штифеля
- Authors: Корнеев К.Р.1, Трофимов С.П.1
-
Affiliations:
- Институт прикладной математики им. М. В. Келдыша РАН
- Issue: Vol 62, No 3 (2024)
- Pages: 264-274
- Section: Articles
- URL: https://ogarev-online.ru/0023-4206/article/view/271736
- DOI: https://doi.org/10.31857/S0023420624030045
- EDN: https://elibrary.ru/JKFZEX
- ID: 271736
Cite item
Full Text
Abstract
В работе рассматривается регуляризация уравнений движения космического аппарата преобразованием Кустаанхеймо — Штифеля для координат и Сундмана для времени в задаче поиска оптимальной траектории межпланетного перелета с двигателем малой тяги. Из принципа максимума Понтрягина находится оптимальное управление вектором тяги при условии ограниченной мощности двигателя. Задача перелета Земля — Марс решается в регулярных переменных. Проводится сравнение найденных траекторий с траекториями, полученными методом продолжения по параметру, а также исследуется чувствительность решений краевой задачи принципа максимума в декартовых и регулярных переменных.
Full Text
ВВЕДЕНИЕ
В настоящее время задача уменьшения расхода топлива при перелетах космических аппаратов (КА) может быть решена переходом к более экономичным электрореактивным двигателям, которые характеризуются высоким удельным импульсом и небольшим уровнем тяги. Космические аппараты с такими двигателями малой тяги способны совершать перелеты не только в околоземном, но и в межпланетном пространстве. Для построения оптимальных траекторий КА с малой тягой традиционно используются прямые и непрямые методы. Прямые методы подразумевают дискретизацию траектории и функции управления — представление в виде конечномерных векторов значений в узлах временной сетки. Далее получаемая задача нелинейного программирования решается численно. Альтернативный подход — это использование непрямых методов, которые сводят задачу к краевой при помощи необходимых условий оптимальности — принципа максимума Понтрягина или принципа Беллмана.
К прямым методам относятся, например, метод псевдоимпульсов [1] и метод пристрелки, комбинированный с гомотопией [2, 3]. Использование прямых методов в задаче перелета Земля — Луна с малой тягой и баллистическим захватом рассматривается в работе [4]. Одним из популярных непрямых методов является принцип максимума Понтрягина [5] в сочетании с методами гомотопии. Такой подход представлен в работах В. Г. Петухова [6–9] и Д. Переза-Палау [10]. Метод гомотопического продолжения погружает краевую задачу в однопараметрическое семейство и непрерывно трансформирует начальное приближение в решение краевой задачи. Продвинутые методы гомотопии и двойной гомотопии рассматриваются в работах Б. Пана [11, 12], Ф. Джианга [13] и Ч. Джанга [14].
Для увеличения устойчивости непрямых методов особое внимание стоит уделить выбору фазового вектора. Возможные способы выбора переменных состояния рассматриваются в работах Э. Тахери [15–18]. Сравнительное исследование различных вариантов выполняется в работах Дж. Джанкинса [19] и С. Жефруа [20]. Зачастую замена вектора состояния сопровождается репараметризацией траектории, то есть заменой физического времени фиктивным. Первым, кто предложил такой подход был К. Ф. Сундман [21]. В случае репараметризации физическое время может стать компонентой вектора состояния или может быть заменено на временную компоненту. Временные компоненты изучаются в работах П. Накози [22] и Е. Брумберга [23].
Уравнения орбитального движения в декартовых переменных не являются регулярными: правая часть уравнений содержит сингулярность в начале координат. Приведение системы к регулярному виду называется регуляризацией. Один из методов регуляризации — преобразование Кустаанхеймо — Штифеля (KS) [24]. KS-преобразование осуществляет переход от трехмерного пространства к четырехмерному и представляет собой обобщение преобразования Леви — Чивиты [25]. Такое преобразование обсуждается в статье [26]. Стоит учитывать, что условие на физическое существование траекторий в пространстве KS-переменных выражается через билинейное соотношение. Использование KS-переменных вместе с преобразованием Сундмана для задачи оптимального перелета рассматривается в публикации [27], где метод продолжения по параметру применяется следующим образом: сначала траектория в KS-переменных рассчитывается без соблюдения билинейного соотношения, после чего методом продолжения приводится к решению с его соблюдением.
Свойство KS-переменных регуляризировать уравнения движения оказывается полезно в различных задачах небесной механики и астродинамики, где наблюдается высокая чувствительность траекторий. Скажем, в настоящее время KS-переменные находят применение в области предсказания и коррекции движения КА [28] и в моделировании методом Монте-Карло траекторий небесных тел в задачах планетарной защиты [29]. Эти переменные также используются при исследовании топологической устойчивости в задаче N тел [30].
Целью настоящего исследования является изучение потенциальной выгоды от применения KS-преобразования совместно с преобразованием Сундмана к задаче оптимального межпланетного перелета с малой тягой. Этот подход будет сравниваться с гомотопическим методом продолжения по параметру в декартовых переменных. Особое внимание уделяется анализу обусловленности матрицы чувствительности. Билинейное соотношение, выражающее физичность траектории в KS-пространстве, будет учтено в качестве смешанного ограничения в функции Гамильтона — Понтрягина. Терминальные многообразия в KS-переменных выписываются явным образом.
В работе формулируется задача оптимального перелета с ограниченным по мощности идеально регулируемым двигателем малой тяги. После этого вводятся KS-преобразование и преобразование Сундмана. Далее описывается применение принципа максимума Понтрягина в KS-переменных для сведения задачи к двухточечной краевой, которая затем сводится к задаче оптимизации и решается с помощью метода внутренней точки [31]. В качестве модельной задачи рассматривается перелет Земля — Марс. Сравниваются оптимальные решения этой задачи в KS-переменных и в декартовых переменных.
УРАВНЕНИЯ ДВИЖЕНИЯ
Дифференциальные уравнения орбитального движения КА в центральном гравитационном поле в декартовых координатах записываются как
(1)
где r и v — это векторы положения и скорости; a — вектор реактивного ускорения и μ — гравитационный параметр центрального тела. Реактивное ускорение выражается как
, (2)
где — массовый расход (масса рабочего тела, затрачиваемого в единицу времени); m –масса космического аппарата в момент времени t; e — вектор направления тяги; и u — скорость истечения рабочего тела. Если мощность двигателя ограничена доступной электрической мощностью Nmax с известным КПД η, тогда
. (3)
Предполагается, что двигатель идеально регулируемый: можно выбрать u и произвольным образом, лишь бы выполнялось условие. Очевидно, что при этом величина тяги может принимать любые значения. Выражая из равенства u через a, m, и подставляя это выражение в формулу, получим
. (4)
После интегрирования неравенство принимает вид
. (5)
Минимум потребления рабочего тела достигается при использовании всей доступной электрической мощности, то есть превращении неравенства (5) в равенство. Предполагается, что доступная мощность не меняется со временем, что соответствует, например, случаю использования ядерных бортовых источников энергии постоянной мощности. Минимальное потребление топлива требует минимизации функционала
. (6)
Преобразование времени Сундмана
Одним из важных методов регуляризации является замена независимой переменной [32]. В этом случае траектория репараметризуется: вместо физического времени t вводится новая переменная s, называемая фиктивным временем. Репараметризация записывается как
. (7)
Можно задать масштабирующий множитель c так, чтобы правая часть уравнений движения менялась практически равномерно. Сундман предложил выбирать масштабирующий множитель в виде dt = rds. Если поставить требование для фиктивного времени, чтобы оно менялось на 2π за орбитальный период, масштабирующий множитель немного модифицируется:
. (8)
Здесь r — расстояние до центрального тела, а h — кеплерова энергия. Можно показать, что в этой нормированной версии преобразования Сундмана роль фиктивного времени s играет эксцентрическая аномалия E. Для отслеживания физического времени необходимо добавить к системе временное уравнение
, (9)
где штрих обозначает производную по фиктивному времени. Однако временное уравнение уменьшает эффект регуляризации из-за короткопериодических колебаний масштабирующего множителя. Решением этой проблемы будет использование временного элемента — переменной, которая растет линейно по отношению к фиктивному времени в невозмущенном случае, но в то же время явным образом связана с физическим временем. Временной элемент определяется как
. (10)
Как видно, временной элемент τ линеен по отношению к эксцентрической аномалии E.
Преобразование Кустаанхеймо — Штифеля
Преобразование Кустаанхеймо — Штифеля — это гладкое вложение трехмерного конфигурационного пространства (x, y, z)T в четырехмерное параметрическое пространство (u1, u2, u3, u4)T. Это отображение записывается в матричной форме как
, (11)
или же, в краткой форме,
. (12)
Четвертая компонента радиус-вектора обнуляется при условии
, (13)
где ub — это четвертая строка матрицы L. Для того, чтобы движение в параметрическом пространстве было физичным (соответствующим движению в физическом пространстве), требуется выполнение билинейного соотношения
, (14)
в каждый момент времени. Четырехмерное параметрическое пространство расслаивается: каждый слой
. (15)
представляет собой одномерное многообразие точек KS-пространства, которые отображаются в одну точку в физическом пространстве.
Уравнения движения в KS-переменных
Преобразование Сундмана в KS-переменных принимает вид
, (16)
где кеплерова энергия выражается как
. (17)
В этом уравнении w — параметрическая скорость. После применения преобразования Сундмана и KS-преобразования уравнения движения могут быть записаны как
, (18)
где производная кеплеровой энергии по фиктивному времени имеет вид
. (19)
Для использования KS-переменных расширим вектор реактивного ускорения до четырехмерного . Позже будет наложено ограничение для его физической осуществимости. Также обратим внимание, что дифференциальные уравнения задачи двух тел принимают форму регулярных уравнений возмущенного осциллятора. В отсутствие возмущений существует точное решение: гармонические колебания с частотой 1/2. Вывод уравнения (18) детально представлен в работе [24].
Для заданной точки в KS-пространстве параметрическая скорость w связана с производной радиус-вектора по фиктивному времени r' = vt' согласно формуле
. (20)
Это выражение позволяет вычислять начальное значение скорости, необходимое для численного интегрирования. Многообразие параметрических скоростей, которые соответствуют некоторой физической скорости, выражается схожим с формулой (15) образом:
. (21)
Наконец, выражение для временного элемента τ в параметрическом пространстве записывается как
. (22)
Дифференциальное уравнение на τ принимает вид
. (23)
Итого для описания движения КА в параметрическом пространстве требуется 9 скалярных дифференциальных уравнений: к уравнению (23) добавляются еще восемь из векторного уравнения второго порядка (18).
ОПТИМИЗАЦИЯ ТРАЕКТОРИИ В РЕГУЛЯРНЫХ ПЕРЕМЕННЫХ
В этом разделе задача оптимального управления в KS-переменных решается с помощью принципа максимума Понтрягина. Условия трансверсальности выражаются в параметрическом пространстве. Получившаяся двухточечная краевая задача преобразуется в задачу нелинейного программирования с граничными условиями и затем решается с помощью метода внутренней точки.
Функционал стоимости, дифференциальные и смешанные ограничения
Система дифференциальных уравнений орбитального движения в KS-переменных записывается как
(24)
Функционал стоимости также должен быть выражен через KS-переменные и фиктивное время:
. (25)
Физическая осуществимость управления требует, чтобы четвертая компонента вектора управления тождественно равнялась нулю:
. (26)
Этот тип ограничений называется смешанным, так как включает в себя и вектор состояния, и вектор управления. Несложно показать, что в силу
(27)
функция g пропорциональна производной билинейного соотношения:
. (28)
В общем случае в условиях возмущенной динамики при численном интегрировании траектории часто проявляется топологическая неустойчивость [30], что может привести к нарушению ее физической осуществимости. Явное добавление в систему смешанного ограничения, в котором вектор-функция g пропорциональна скорости изменения билинейного параметра, представляет собой, по сути, способ контроля локальной точности интегрирования. Такой подход к стабилизации системы с помощью добавления в нее производных от интегральных соотношений был предложен еще Штифелем [24].
Принцип максимума в регулярных переменных
Теперь возможно применить принцип максимума Понтрягина к автономной системе (24) с функционалом стоимости (25) и смешанным ограничением (26). Процедура учета смешанного ограничения описана, к примеру, в работе [33]: оно должно быть добавлено в функцию Гамильтона — Понтрягина с множителем Лагранжа β:
. (29)
Здесь φ — это подынтегральная функция в функционале стоимости; p — это вектор сопряженных переменных; и f — функция правых частей системы. Значения β и a могут быть определены из условия стационарности гамильтониана и смешанного ограничения:
(30)
Здесь введено обозначение . Подстановка подынтегральной функции и функции правых частей системы в гамильтониан дает
(31)
Введем вспомогательный вектор
, (32)
который упрощает выражение до
. (33)
Также учтем тот факт, что система (24) не зависит от временного элемента τ. Это приводит к тому, что сопряженная переменная pτ является константой вследствие выполнения . Забегая немного вперед, отметим, что ограничений на τ в конечный момент времени sf не накладывается, а значит, из условий трансверсальности следует pτ(sf) = 0, что позволяет исключить слагаемое pττ' из рассмотрения. Условие стационарности, также известное как уравнение Эйлера–Лагранжа, записывается как
. (34)
Если уравнение (34) умножить на ubLT слева, а потом использовать условие (26) для сокращения первого слагаемого, то можно выразить множитель Лагранжа:
. (35)
После подстановки в (34) удобно ввести обозначение
. (36)
Тогда для оптимального управления имеем:
. (37)
Фактически это выражение влечет выполнение смешанного ограничения (26): четвертая компонента вектора управления всегда будет равна нулю. Подстановка оптимального управления в гамильтониан дает
. (38)
Система дифференциальных уравнений для вектора состояния и вектора сопряженных переменных с учетом появляющихся производных dt/ds и ds/dt может быть получена с использованием оптимального гамильтониана:
(39)
Здесь выражение H* ds/dt представляет собой, с точностью до константы, гамильтониан в физическом времени [34], а множитель dt/ds появляется при переходе от производных по физическому времени к производным по фиктивному времени. Другими словами, в физическом времени уравнения (39) имели бы следующий вид:
(40)
Условия трансверсальности
Чтобы определить двухточечную краевую задачу, нужно записать условия трансверсальности. В общем случае они имеют вид
, (41)
где индекс α принимает значения 0 или f; gα определяет соответствующее терминальное многообразие; x = (u, w)T — это параметрический вектор состояния; p = (pu, pw)T — сопряженный вектор и C — вектор произвольных постоянных.
Будем рассматривать задачу встречи, когда КА должен достичь требуемых положения r(sf) и скорости v(sf) в конечный момент времени. Для этой задачи в KS-переменных терминальное многообразие в точке sf выражается как и . Это дает шесть уравнений для gf:
(42)
Здесь — это первые три строки L. Вектор x0 известен на определенную дату старта t(s0). Он должен удовлетворять условиям и , но в остальном может быть выбран произвольным образом и зафиксирован для дальнейших вычислений. Дополнительные ограничения для u(sf) не требуются, потому что условие (13) выполняется в каждой точке траектории, если оно выполняется в момент s0. Значения r(sf) и v(sf) определяются как положение и скорость небесного тела в момент времени , где конкретное значение tf зависит не только от конечного фиктивного времени, но и от самой траектории КА.
Дифференцирование выражений (42) по x дает матрицу 6 × 8. Следовательно, размер вектора C равен 6. Это значит, что вектор p на концах траектории должен принадлежать шестимерному линейному подпространству восьмимерного пространства сопряженных переменных. Двумерное ортогональное дополнение этого подпространства — это линейная оболочка двух векторов, которые могут быть записаны в виде матрицы
. (43)
Эти векторы могут быть найдены как фундаментальные решения линейной системы
. (44)
Суммируя вышесказанное, условия трансверсальности в случае задачи встречи могут быть записаны как
. (45)
Между граничными условиями в начальной и конечной точке существует разница. В начальной точке t = t0, декартовы положение r0 и скорость v0 известны. Например, они могут быть равны положению и скорости небесного тела в точке вылета, которые могут быть взяты из эфемерид. Точное значение u0 неважно, оно может быть выбрано из произвольно. После этого параметрическая скорость w0 вычисляется согласно уравнению (20). Наконец, условия на сопряженные переменные выражаются как.
Граничные условия в конечной точке более сложны: в случае фиксирования фиктивного времени продолжительность полета в физическом времени становится функцией от всей траектории. Тогда, параметрические векторы положения и скорости uf и wf каждый принадлежат двумерному тору — семейству одномерных слоев, которое параметризуется длительностью перелета в физическом времени.
Постановка задачи оптимизации
Краевая задача может быть преобразована в задачу оптимизации. Во-первых, необходимо записать усеченное KS-преобразование:
(46)
Вектор физического положения в конечной точке зависит от начального состояния и сопряженных переменных . Аналогичные зависимости будут соблюдаться для физической скорости: . В задаче встречи вектор-функция невязки принимает вид
, (47)
где начальные значения r0 и v0 уже известны. Значение функции невязки δ — это восьмимерный вектор. Требования δi = 0, i = 1...8 можно трактовать как ограничения типа равенства в задаче оптимизации с тождественно постоянным функционалом стоимости. Такой формальный трюк позволяет свести нашу краевую задачу к задаче конечномерной оптимизации и применить эффективные оптимизационные методы. В частности, в данной работе использовался метод внутренней точки [31]. Этот метод сводит исходную задачу к задаче выпуклой оптимизации, сначала линеаризуя ограничения типа равенства, а потом преобразуя их в выпуклую барьерную функцию. В случае тождественно постоянного функционала минимизируется только барьерная функция, что в свою очередь приводит к минимизации невязки (47). В данной задаче метод внутренней точки оказался более эффективен, чем метод последовательного квадратичного программирования [31] или метод Левенберга — Марквардта [31].
Функция невязки зависит от вектора сопряженных переменных в начальной точке и времени интегрирования sf, то есть δ = δ(sf, p0). Также, метод внутренней точки требует наложить ограничения на сопряженный вектор p0 ∈ [pa, pb], то есть задать область поиска решений. Начальное приближение для вектора сопряженных переменных выбирается равным нулю.
Определение параметра sf является ключевым для успешного решения задачи. Для рассматриваемых траекторий можно записать выражение , где n — число витков траектории; ΔE — изменение эксцентрической аномалии в результате перелета, а ε(x0, p0) — некое малое отклонение, которое зависит от траектории КА. Выбирая параметры n и ΔE, можно контролировать угловую дальность перелета напрямую. При отсутствии априорного знания о функции рекомендуется использовать значение .
Улучшение сходимости может быть достигнуто при помощи преобразования терминального многообразия в задачу со свободным концом
, (48)
где . Константа может быть выбрана в широком диапазоне значений, но рекомендуется использовать C ≤ π / 2. Эта модификация позволяет методу сходиться быстрее, что дает начальное приближение для p0. Имея некоторую дополнительную информацию об оптимальных траекториях, можно сузить диапазон значений фиктивного времени. Например, для задач перелета к внешним планетам Солнечной системы (более удаленным от Солнца, чем Земля) рекомендуется брать .
МОДЕЛЬНАЯ ЗАДАЧА: ПЕРЕЛЁТ ЗЕМЛЯ — МАРС
Этот раздел описывает численные эксперименты с предложенным подходом и его параметрами. Кроме того, проведено сравнение с методом продолжения по параметру [8]. Сравниваемыми характеристиками являются сходимость и численная устойчивость методов.
Параметры численных расчетов
Алгоритм реализован в среде MATLAB, и запускался на ноутбуке со следующими характеристиками: 12 виртуальных ядер с частотой 2.6 ГГц и объемом RAM 32 Гб. Выражения для правых частей уравнений, так же, как и их частные производные, вычислены символьно и затем оптимизированы для уменьшения времени вычислений метода. Для решения оптимизационной задачи использовалась функция fmincon, которая реализует метод внутренней точки [35]. Это метод распараллеливается на 6 процессов, одновременно вычисляя барьерную функцию в нескольких пробных точках. Точность выполнения условий оптимальности составляла 10–10, точность соблюдения граничных условий 10–12, максимальное число вызовов функции взято равным 1010, размер шага был ограничен снизу величиной 10–10, а максимальное число шагов оптимизации равнялось 250. Дополнительно добавлено условие τ' ≥ 0.
Для нахождения положений и скоростей Земли и Марса в начальный и конечный момент времени использовалась эфемеридная модель DE430 [36]. Начальный момент времени соответствует 00:00 UTC1.I.2022.
Решение оптимизационной задачи состоит из двух этапов. Для получения решения время интегрирования sf принадлежит определенному диапазону во время первого этапа и фиксируется во время второго этапа. При этом физическое время tf вычисляется как функция от sf и траектории КА. Стоит заметить, что все переменные предварительно обезразмериваются, а после нахождения решений их размерность восстанавливается. Кроме того, для вектора p0 установлены граничные условия вида |pi,0| '' 1. Также вектор p0 масштабируется путем домножения на гиперпараметр , который явно зависит от времени интегрирования sf. Это масштабирование выполняется при подаче p0 в оптимизатор, чтобы избежать слишком малых значений, однако при интегрировании траекторий КА используется не отмасштабированное значение. Здесь и далее под гиперпараметрами будем иметь в виду некоторые параметры настройки метода, выбираемые исследователем, например, точность интегрирования. Параметр Cp был подобран, исходя из типичных величин вектора сопряженных переменных p0 для выбранного фиктивного времени.
Рассматривалась задача встречи. На первом этапе минимизировалась невязка (47) на области поиска [sf, sf + π / 8] с нулевым начальным приближением p0. Полученные решения на этом этапе могут являться как локально оптимальными, так и глобально оптимальными. Для определения глобальной оптимальности необходимо выяснить, принадлежит ли данное решение Парето-фронту. На втором этапе в качестве начальных приближений использовались p0 из первого этапа, а область поиска сужалась до точки [sf, sf]. Выбирались минимальные по расходу топлива части семейств, а потом проводилась оптимизация вдоль этих семейств влево и вправо. В обоих случаях невязка домножалась на гиперпараметр Cδ = 1010. Помимо этого, точность интегрирования контролировалась третьим гиперпараметром: Ctol = 10−10 на первом этапе и Ctol = 10−12 на втором.
После получения оптимального решения находится tf. Далее применялся метод продолжения с модификацией гравитационного параметра в физических координатах для нахождения решения, которое будем называть эталонным. Затем оба подхода сравнивались с точки зрения затрат рабочего тела и геометрии оптимальных решений. Отличие между ними оценивалось по формуле
, (49)
где γ0 и γ1 — две траектории, полученные разными подходами.
В рамках численного эксперимента были выбраны точки sf = (3/4 + k/16)π, где k = 0...168. Другими словами, рассматривались перелеты с угловой дальностью от трех четвертей витка до шести витков.
Были выбраны следующие параметры КА и двигательной установки, аналогичные параметрам аппарата Европейского космического агентства SMART-1 (запущен к Луне в 2003 г.) и его двигателя PPS-1350 [37]. Начальная масса КА составляла m0 = 367 кг, а максимальная мощность, доступная двигательной установке, равнялась N = 1350 Вт. Для этого двигателя были получены оценки уровня тяги 73 мН и скорости истечения 16.4 км/с. Судя по этим значениям, эффективный КПД ЭРДУ достигал η = 0.45.
Сравнение двух методов
Части нескольких семейств решений, обеспечивающие для фиксированного времени полета минимум затрат топлива, можно объединить в Парето-фронт в координатах фиктивное время — затраты топлива. Вместо фиктивного времени более наглядно ввести угловую дальность перелета, скажем, в терминах изменения эксцентрической аномалии. На рис. 1 представлено сравнение решений, получаемых двумя подходами, в координатах угловая дальность — затраты топлива. Для сохранения представления о поведении семейств решений на графике оставлены и те их участки, которые не принадлежат Парето-фронту; они показаны штриховыми линиями. Сплошной линией обозначены решения, полученные методом внутренней точки и образующие Парето-фронт, а крестиками — решения, полученные стандартным методом продолжения в декартовых координатах.
Рис. 1. Разные семейства решений и Парето-фронт, восстановленный двумя разными подходами
Среднее значение разницы в затратах топлива составляет 10–6 кг, а среднее расстояние между траекториями равно 90 км. Такой результат показывает хорошее совпадение между решениями, полученными разными методами. Заметим, что значения угловой дальности перелета (изменения эксцентрической аномалии) оказываются очень близкими к значениям длительности перелета в фиктивном времени. На рис. 2 показана их разность в точках Парето-фронта.
Рис. 2. Разница между фиктивным временем перелета и изменением эксцентрической аномалии для различных Парето-оптимальных решений
На рис. 3 представлено время вычисления решений с разной угловой дальностью двумя рассмотренными методами. Среднее время поиска решения составляет 16 с для метода продолжения и 3 с для метода внутренней точки.
Рис. 3. Время вычисления локально оптимальных решений разными подходами
Сходимость и гиперпараметры
Для любой выбранной угловой дальности метод продолжения способен достигнуть той же самой точки, что и предложенный метод. Это выполняется и в случае локально-оптимальных частей семейств решений, которые удовлетворяют условиям принципа максимума Понтрягина, но не являются глобально оптимальными. Для одной и той же угловой дальности может существовать несколько локально-оптимальных решений в декартовых координатах. Такие траектории отличаются разным физическим временем перелета.
Теперь перейдем к смыслу и проблеме выбора значений гиперпараметров. Множитель невязки Cδ позволяет избежать слишком малых ее значений, которые могут достигать машинного нуля, что приводит к ранней остановке оптимизации. На основе ряда численных экспериментов было выбрано значение 1010.
Точность интегрирования Ctol особенно важна на первом этапе поиска решения и в меньшей степени на втором. При необходимости ее можно уменьшать до 10–10 на первом этапе, и это повлияет на близость начального приближения второй стадии к оптимальному.
Третий гиперпараметр Cp — это множитель начальных значений сопряженных переменных, к значению которого задача оказывается наиболее чувствительна. Несмотря на отсутствие влияния на получающиеся траектории, этот параметр влияет на процедуру оптимизации. Меньшие его значения будут неявным образом уменьшать шаг оптимизатора, но увеличивать время сходимости. В идеальном случае он должен быть таким, чтобы отмасштабированные значения p0, подаваемые в качестве аргумента оптимизатора fmincon, были близки к единице.
Устойчивость траекторий
Матрица чувствительности
(50)
может быть использована для оценки устойчивости решений. Это матрица вычисляется с помощью центральной разности при интегрировании траектории. Точность вычисления матрицы чувствительности приблизительно равна 10–7. Это значение также было определено численно. Чувствительность решений к начальным условиям характеризуется числом обусловленности матрицы чувствительности. Для квадратных матриц это число определяется как
. (51)
Оно равно соотношению между максимальным и минимальным сингулярными значениями матрицы A. На рис. 4 показаны числа обусловленности для семейства оптимальных траекторий перелета с различной угловой дальностью, полученных двумя подходами. Среднее значение чисел обусловленности для решений, найденных методом продолжения в декартовых координатах, равно 1.3·105, в то время как для решений, полученных методом внутренней точки в KS-переменных, число обусловленности в среднем составляет 4.3·103, что означает лучшую обусловленность матрицы чувствительности.
Рис. 4. Числа обусловленности матрицы чувствительности для двух разных подходов
ЗАКЛЮЧЕНИЕ
Реализованный подход к оптимизации перелетов с малой тягой в регулярных переменных уменьшает числа обусловленности краевых задач принципа максимума Понтрягина, что делает возможным использование стандартных методов оптимизации, таких как метод внутренней точки и получение оптимальные траектории без помощи метода продолжения по параметру. Это упрощает этап предварительного проектирования траекторий. Также низкие числа обусловленности означают меньшую чувствительность решений, что ускоряет численное интегрирование траекторий и повышает его устойчивость. Среди преимуществ подхода стоит упомянуть и простой контроль над угловой дальностью перелета, что позволяет получить многовитковую траекторию с определенным числом витков.
В задаче перелета с идеально регулируемым двигателем ограниченной мощности оптимизация в KS-переменных дает решения, которые близки к решениям, получаемым в декартовых переменных методом продолжения, и имеют практически одинаковые затраты топлива. Это подтверждает корректность вычислений.
Метод внутренней точки, используемый для решения задачи оптимизации, к которой сводится краевая задача принципа максимума Понтрягина в KS-переменных, хорошо распараллеливается. Это помогает уменьшить время вычислений на поиск оптимальных траекторий.
В дальнейшем планируется протестировать эффективность разработанного подхода в случае более реалистичных моделей среды и двигателя (то есть, с другими видами функционала стоимости и в присутствии внешних возмущений). Целесообразно провести сравнение KS-переменных с другими наборами фазовых переменных в смысле численных свойств получающихся краевых и оптимизационных задач.
ФИНАНСИРОВАНИЕ РАБОТЫ
Исследование выполнено за счет гранта Российского научного фонда (проект № 19-11-00256).
About the authors
К. Р. Корнеев
Институт прикладной математики им. М. В. Келдыша РАН
Author for correspondence.
Email: kirill_rnd@mail.ru
Russian Federation, Москва
С. П. Трофимов
Институт прикладной математики им. М. В. Келдыша РАН
Email: kirill_rnd@mail.ru
Russian Federation, Москва
References
- Улыбышев Ю. П. Обзор методов оптимизации траекторий космических аппаратов с использованием дискретных множеств псевдоимпульсов // Космическая техника и технологии. 2016. Т. 15. № 4. С. 67–79.
- Gergaud J., Haberkorn T. Homotopy method for minimum consumption orbit transfer problem // ESAIM: Control, Optimisation and Calculus of Variations. 2006. V. 12. Iss. 2. P. 294–310.
- Haberkorn T., Martinon P., Gergaud J. Low thrust minimum-fuel orbital transfer: a homotopic approach // J. Guidance, Control, and Dynamics. 2004. V. 27. Iss. 6. P. 1046–1060.
- Mingotti G., Topputo F., Bernelli-Zazzera F. A method to design sun-perturbed earth-to-moon low-thrust transfers with ballistic capture // Proc. XIX Congresso nazionale AIDAA. 2007. V. 17. Art.ID. 21.
- Pontryagin L.S., Boltyanskii V. G., Gamkrelidze R. V. et al. Mathematical theory of optimal processes. New York–London: Interscience Publishers John Wiley & Sons, Inc., 1962. 360 p.
- Petukhov V. G. Optimal multi-orbit trajectories for inserting a low-thrust spacecraft to a high elliptic orbit // Cosmic Research. 2009. V. 47. Iss. 3. P. 243–250.
- Petukhov V. G. Optimization of multi-orbit transfers between noncoplanar elliptic orbits // Cosmic Research. 2004. V. 42. Iss. 3. P. 250–268.
- Petukhov V. G. Method of continuation for optimization of interplanetary low-thrust trajectories // Cosmic Research. 2012. V. 50. Iss. 3. P. 249–261.
- Petukhov V. G. Optimization of interplanetary trajectories for spacecraft with ideally regulated engines using the continuation method // Cosmic Research. 2008. V. 46. Iss. 3. P. 219–232.
- Pérez-Palau D., Epenoy R. Fuel optimization for low-thrust Earth–Moon transfer via indirect optimal control // Celestial Mechanics and Dynamical Astronomy. 2018. V. 130. Iss. 2. Art.ID. 21.
- Pan B., Pan X., Zhang S. A new probability-one homotopy method for solving minimum-time low-thrust orbital transfer problems // Astrophysics and Space Science. 2018. V. 363. Iss. 9.
- Pan B., Lu P., Pan X. et al. Double-homotopy method for solving optimal control problems // Journal of Guidance, Control, and Dynamics. American Institute of Aeronautics and Astronautics. 2016. V. 39. Iss. 8. P. 1706–1720.
- Jiang F., Baoyin H., Li J. Practical techniques for low-thrust trajectory optimization with homotopic approach // J. Guidance, Control, and Dynamics. 2012. V. 35. Iss. 1. P. 245–258.
- Zhang C., Topputo F., Bernelli-Zazzera F. et al. Low-thrust minimum-fuel optimization in the circular restricted three-body problem // J. Guidance, Control, and Dynamics. American Institute of Aeronautics and Astronautics. 2015. V. 38. Iss. 8. P. 1501–1510.
- Taheri E., Kolmanovsky I., Atkins E. Enhanced smoothing technique for indirect optimization of minimum-fuel low-thrust trajectories // J. Guidance, Control, and Dynamics. American Institute of Aeronautics and Astronautics. 2016. V. 39. Iss. 11. P. 2500–2511.
- Taheri E., Junkins J. L. Generic smoothing for optimal bang-off-bang spacecraft maneuvers // J. Guidance, Control, and Dynamics. American Institute of Aeronautics and Astronautics. 2018. V. 41. Iss. 11. P. 2470–2475.
- Taheri E., Junkins J., Kolmanovsky I. et al. A novel approach for optimal trajectory design with multiple operation modes of propulsion system, part 1 // Acta Astronautica. 2020. V. 172. P. 151–165.
- Taheri E., Junkins J., Kolmanovsky I. et al. A novel approach for optimal trajectory design with multiple operation modes of propulsion system, part 2 // Acta Astronautica. 2020. V. 172. P. 166–179.
- Junkins J.L., Taheri E. Exploration of alternative state vector choices for low-thrust trajectory optimization // J. Guidance, Control, and Dynamics. American Institute of Aeronautics and Astronautics. 2019. V. 42. Iss. 1. P. 47–64.
- Geffroy S., Epenoy R. Optimal low-thrust transfers with constraints-generalization of averaging techniques // Acta Astronautica. 1997. V. 41. Iss. 3. P. 133–149.
- Sundman K. F. Mémoire sur le problème des trois corps // Acta mathematica. Institut Mittag-Leffler. 1913. V. 36. P. 105–179.
- Nacozy P. E. Time elements in Keplerian orbital elements // Celestial mechanics. 1981. V. 23. Iss. 2. P. 173–198.
- Brumberg E. V. Length of arc as independent argument for highly eccentric orbits // Celestial Mechanics and Dynamical Astronomy. 1992. V. 53. P. 323–328.
- Stiefel E.L., Scheifele G. Linear and Regular Celestial Mechanics. Berlin Heidelberg: Springer-Verlag Berlin Heidelberg, 1971. 306 p.
- Levi-Civita T. Sur la régularisation du probleme des trois corps // Acta mathematica. Institut Mittag-Leffler. 1920. V. 42. P. 99–144.
- Иванов Д.С., Трофимов С. П., Широбоков М. Г. Численное моделирование орбитального и углового движения космических аппаратов / под ред. М. Ю. Овчинникова. М: ИПМ им. М. В. Келдыша РАН, 2016. 118 с.
- Иванюхин А. В. Оптимизация траектории космического аппарата с идеально регулируемым двигателем в переменных Кустаанхеймо — Штифеля // Труды МАИ. 2014. № 75.
- Chelnokov Yu.N., Loginov M. Yu. Prediction and Correction of Spacecraft Motion Based on the Solutions of Regular Quaternion Equations in KS-Variables and Isochronous Derivatives // Proc. 29th Saint Petersburg International Conference on Integrated Navigation Systems (ICINS). Saint Petersburg, Russia. IEEE, 2022.
- Masat A., Romano M., Colombo C. Kustaanheimo — Stiefel Variables for Planetary Protection Compliance Analysis // J. Guidance, Control, and Dynamics. 2022. V. 45. Iss. 7. P. 1286–1298.
- Roa J., Urrutxua H., Peláez J. Stability and chaos in Kustaanheimo — Stiefel space induced by the Hopf fibration // Mon. Not. R. Astron. Soc. 2016. V. 459. Iss. 3. P. 2444–2454.
- Nocedal J., Wright S. J. Numerical Optimization. Springer New York, 2006.
- Roa J. Regularization in Orbital Mechanics. Berlin, Boston: De Gruyter, 2017. 403 p.
- Милютин А.А., Дмитрук А. В., Осмоловский Н. П. Принцип максимума в оптимальном управлении. М.: Центр прикладных исследований мехмата МГУ, 2004. 168 p.
- Powers W.F., Tapley B. D. Canonical transformation applications to optimal trajectory analysis. // AIAA Journal. 1969. V. 7. Iss. 3. P. 394–399.
- Byrd R.H., Hribar M. E., Nocedal J. An Interior Point Algorithm for Large-Scale Nonlinear Programming // SIAM J. Optim. 1999. V. 9. Iss. 4. P. 877–900.
- Folkner W.M., Williams J. G., Boggs D. et al. The planetary and lunar ephemerides DE430 and DE431 // Interplanetary Network Progress Report. 2014. V. 196. Iss. 1. P. 42–196.
- Schoenmaekers J. Post-launch Optimisation of the SMART-1 Low-thrust Trajectory to the Moon // Proc. 18th International Symposium on Space Flight Dynamics. 2004. P. 505–510.
Supplementary files
