Quaternion Solution of the Problem on Optimum Control of the Orientation of a Solid (SPACECRAFT) with a Combined Quality Criteria
- Authors: Levskii M.V.1
-
Affiliations:
- Maksimov Space System Research and Development Institute, Khrunichev State Research and Production Space Center
- Issue: No 1 (2024)
- Pages: 197-222
- Section: Articles
- URL: https://ogarev-online.ru/1026-3519/article/view/262662
- DOI: https://doi.org/10.31857/S1026351924010115
- EDN: https://elibrary.ru/VZSRQQ
- ID: 262662
Cite item
Full Text
Abstract
The problem on optimal rotation of a solid (spacecraft) from an arbitrary initial to a prescribed final angular position in the presence of restrictions on the control variables is studied. The turnaround time is set. To optimize the rotation control program, a combined quality criterion that reflects energy costs is used. The minimized functional combines in a given proportion the integral of the rotational energy and the contribution of control forces to the maneuver. Based on the Pontryagin’s maximum principle and quaternion models of controlled motion of a solid, an analytical solution of the problem has been obtained. The properties of optimal motion are revealed in analytical form. To construct an optimal rotation program, formalized equations and calculation formulas are written. Analytical equations and relations for finding optimal control are given. The key relations that determine the optimal values of the parameters of the rotation control algorithm are given. In addition, a constructive scheme for solving the boundary value problem of the maximum principle for arbitrary turning conditions (initial and final positions and moments of inertia of a solid) is described. For a dynamically symmetric solid, a closed-form solution for the reorientation problem is obtained. A numerical example and mathematical modeling results that confirm the practical feasibility of the developed method for controlling the orientation of a spacecraft are presented.
Full Text
Введение. Подробно изучена задача переориентации твердого тела, например, космического аппарата (КА) из исходного углового положения в положение заданной ориентации. Главным отличием предложенного решения является использование нового показателя качества в условиях ограниченности управляющих переменных.
Огромное количество работ изучают проблемы управления угловым положением твердого тела в различных формулировках и использующих широкий диапазон методов решения [1–26]. Например, одни авторы предлагают синтез оптимального управлении, основанный на методе аналитического конструирования оптимальных регуляторов [1], другие используют концепцию обратных задач динамики для получения гладких управлений для реализации пространственного вращения КА, когда программная траектория разыскивается в классе полиномов заданной степени, коэффициенты которых определяются известными значениями фазовых переменных в граничных точках траектории [2]. Особое внимание уделяется проблемам оптимального управления [1, 3–24]. Методы оптимизации различны. В частности, решения задачи переориентации твердых тел различной конфигурации, основанные на принципе максимума Л.С. Понтрягина, рассматриваются в [8–24]. Ранее использовались классические критерии качества процесса управления (быстродействие [4–12], минимум расхода топлива [13], минимум энергозатрат [11, 13, 14] и др.); более подробно рассмотрены кинематические задачи разворота [15–18]. Задачи оптимального управления в динамической постановке представляют особый интерес, однако они встречают определенные сложности при решении краевой задачи разворота; в отдельных частных случаях управления за фиксированное время краевая двухточечная задача разворота может быть решена методом разделения переменных [13]. Практически важными остаются аналитические решения задачи оптимального управления разворотом. Однако получить их для тел с произвольным сочетанием моментов инерции крайне затруднительно. Некоторые решения (в том числе аналитические) известны для оптимальных разворотов сферически-симметричных [12, 19] и динамически симметричных тел [9, 11, 16, 20–22].
Ниже решается задача оптимального разворота твердого тела (КА) с использованием нового показателя качества, объединяющего в заданной пропорции вклад управляющих сил на совершение маневра (по энергозатратам) и интеграл энергии вращения (наличие интеграла энергии вращения приводит к ограничению кинетической энергии во время разворота); фазовыми переменными являются кватернион ориентации и кинетический момент твердого тела (КА). Решаемая задача отличается от других задач с комбинированным функционалом видом функционала, а также наличием ограничений на управление [21–23].
- Постановка оптимизационной задачи управления. Вращательное движение твердого тела (КА) описывает следующее уравнение [12]:
(1.1)
и кинематическое уравнение [12]
, (1.2)
где L − кинетический момент КА; М − управляющий момент; I − тензор инерции КА; Λ c нормированный кватернион [12], задающий движение связанного базиса относительно инерциального базиса (||Λ||= 1), “” – знак умножения кватернионов [12, с. 11−20]. Управление КА вокруг центра масс производится за счет изменения момента М. Считается, что область допустимых управлений М подобна эллипсоиду инерции КА [11]:
, (1.3)
где u0 > 0 определяет управляющие возможности системы ориентации КА; Мi − проекции управляющего момента М на главные центральные оси эллипсоида инерции КА (эти оси образуют связанный базис); Ji − главные центральные моменты инерции КА (i = ). На практике интересны задачи, когда в начальный и конечный моменты времени кинетический момент L равен нулю. Выпишем граничные условия для управляемой системы (1.1)–(1.3):
(1.4)
, (1.5)
где Т − время завершения маневра. Кватернионы Λin и Λf удовлетворяют условию ||Λin|| =||Λf||= 1. Учитывая, что кватернионы Λ и Λ соответствуют одному и тому же угловому положению твердого тела (КА), мы рассматриваем только те задачи, в которых Λf ≠ ±Λin .
Предполагается, что вращательное движение КА регулируется с помощью системы ориентации, создающей вращающие моменты относительно трех главных центральных осей инерции. Оптимальным считаем управление, при котором достигается минимум следующей величины
, (1.6)
где k0 > 0 – постоянный положительный коэффициент (k0 ≠ 0); Li − проекции кинетического момента КА L на оси связанного базиса. Задачу оптимального управления сформулируем в следующей постановке: КА требуется перевести из состояния (1.4) в состояние (1.5) согласно уравнениям (1.1), (1.2) с ограничением (1.3) так, чтобы сумма (1.6) была минимальной (время Т задано). Решение М (t) находится в классе кусочно-непрерывных функций времени.
Принятый критерий качества (1.6) отличает предлагаемую оптимизационную задачу от рассмотренных ранее задач видом минимизируемого функционала при наличии ограничения (1.3). Присутствие в показателе (1.6) интеграла энергии ограничивает кинетическую энергию вращения Ek во время разворота, делая ее минимально возможной на заданном интервале управления (коэффициент k0 ≠ 0). Так как время Т фиксировано, а управление М ограничено, то требуемый маневр может быть исполнен не для всех значений Λin, Λf и J1, J2, J3, k0, u0. Задача оптимального разворота КА с ограниченным управлением, в которой качество процесса управления определяется индексом (1.6), остается актуальной.
Заметим, что оптимизация разворотов с минимальными затратами на основе (1.6) оказывается полезной для КА с системой ориентации, использующей электроракетные двигатели (ЭРД), поскольку при управлении с помощью ЭРД (в частности, ионными двигателями) первый интеграл в показателе (1.6) пропорционален потребляемой электроэнергии (тяга ЭРД прямо-пропорциональна потребляемому электрическому току [27], с высокой степенью достоверности, а вращающий момент пропорционален плечу установки управляющего ЭРД).
- Применение принципа максимума. Рассматриваемая задача (1.1)–(1.6) есть задача динамического оптимального разворота твердого тела [12], в которой моменты Мi – управляющие функции (). Поставленную задачу (1.1)–(1.6) решаем с помощью процедуры принципа максимума Л.С. Понтрягина [28]. Введем сопряженные переменные φ , которые соответствуют проекциям кинетического момента КА Li (). Так как в критерий качества (1.6) не входят элементы кватерниона ориентации Λ, мы вместо сопряженных функций ψj , соответствующих компонентам λ j кватерниона Λ, используем следующие переменные ri () :
.
Такой прием применяли многие исследователи [10–24], но с другими функционалами качества (чистые быстродействие, минимум энергозатрат и пр.); впервые указанную замену переменных сделали В.Н. Бранец, И.П. Шмыглевский и М.Б. Черток, Ю.В. Казначеев [11, 12]. Оптимальные функции ri и вектор r, образованный из ri , удовлетворяют уравнениям
(2.1)
(символ × означает векторное произведение векторов).
Составим функцию Гамильтона–Понтрягина для оптимизационной задачи (1.1), (1.6)
Уравнения для φi получаются из формул [28]
.
Поэтому сопряженная система выглядит следующим образом:
(2.2)
При составлении функции Гамильтона–Понтрягина ограничение || Λ ||= 1 не учитывалось в силу равенства || Λ(0)|| = 1, о чем ранее было сказано. Вектор r неподвижен относительно инерциального базиса и | r | = const > 0 (постоянство модуля | r | следует из свойств уравнений (2.1)). Решение r(t) системы (2.1) определяется начальным Λin и конечным Λf положениями КА. Оптимальная функция r(t) вычисляется, используя кватернион L(t) [12]:
где ,
причем r(0) ≠ 0 (в противном случае r1 = r2 = r3 ≡ 0 и дальше не имеет смысла решать оптимизационную задачу). Здесь – сопряженный кватерниону Λ кватернион [12, с. 10–22].
Задача поиска оптимального управления состоит в решении системы дифференциальных уравнений (1.1), (1.2), (2.1), (2.2) с ограничением (1.3) с одновременной максимизацией функции Н в каждый текущий момент времени t и выполнением краевых условий (1.4), (1.5).
2.1. Определение структуры оптимального управления. Найдем условия максимума функции Н. Пусть и (i = ), u = {u1 , u2 , u3}, n = {n1 , n2 , n3}; а векторы u и n образуют угол δ. Тогда
,
где Hinv в явном виде не зависит от управляющих моментов Mi (знак умножения “ ⋅ ” означает скалярное произведение векторов). Функция Н максимальна, если δ = 0. Если u≤ u0 , то максимум функции Н по аргументу u находится внутри отрезка [0 , u0] и совпадает с локальным максимумом. Гамильтониан Н – квадратичная функция управлений Mi , и локальный максимум определяется необходимыми условиями экстремума , из которых следует
. (2.3)
Управление (2.3) будет оптимальным, если .
Если , то точка экстремума функции Н находится за пределами отрезка 0 ≤ u≤ u0 , и Н достигает максимума на границе указанного отрезка и когда векторы u и имеют одинаковое направление, т.е. в оптимальном решении u = u0, а значит,
.
Объединяя оба случая, получили следующую структуру оптимального управления для Mi
. (2.4)
Система уравнений (2.1), (2.2), (2.4) – необходимые условия оптимальности для задачи (1.1)−(1.6). Решение системы уравнений (1.1), (2.1), (2.2), (2.4) существует и оно единственное (при условии L(0) = L(Т) = 0). Вектор r(0) должен быть таким, чтобы после интегрирования системы (1.1), (1.2), (2.1), (2.2), (2.4) с начальным условием Λ(0) = Λin удовлетворялось требование Λ(Т) = Λf для траектории Λ(t ).
Введем обозначение r0 = |r (t)|= const ≠ 0 и перейдем к нормированному вектору р = r / |r|, у которого pi = ri / r0 . Для вектора р и его составляющих pi выполняются уравнения
,
. (2.5)
Замкнутая система уравнений (1.1), (1.2), (2.1), (2.2), (2.4) позволяет найти оптимальное управление. Задача поиска оптимальной программы вращения КА свелась к решению системы уравнений движения (1.1), (1.2), сопряженных уравнений (2.2) и уравнений (2.5) с равенствами ri = r0pi при наличии закона (2.4) для управляющих моментов Mi . Искомое оптимальное решение удовлетворяет следующим соотношениям:
(2.6)
, (2.7)
где a(t), b (t) – скалярные функции времени (b (t) ≥ 0 на всем отрезке времени t ∈ [0 , T ]).
Из (2.1), (2.2), (2.4) видим, что оптимальные функции a(t), b(t) удовлетворяют зависимости
. (2.8)
Последовательная подстановка (2.6) в (2.2), имея ввиду (2.7) и ri = r0 pi , подтверждает, что решение (2.6), (2.7) действительно справедливо для системы дифференциальных уравнений (1.1), (2.2), (2.4), (2.5) (зависимости (2.7) прямо следуют из системы (1.1), (2.4), (2.5) с учетом (2.6)). После обозначения φ – вектор с компонентами φ i , − тензор инерции твердого тела, перепишем систему (2.2) в векторном виде:
. (2.9)
Учитывая (2.5), (2.6), (2.7), левая часть уравнения (2.9) будет следующей:
.
Найдем теперь правую часть уравнения (2.9), учитывая (2.6), (2.7). Она такова
.
Левая и правая части (2.9) тождественно равны, только если a(t) и b (t) удовлетворяют (2.8).
Управляющие функции Mi пропорциональны компонентам pi вектора p, т.е.
(2.10)
(a(t) и константа k0u0 определяют m (t)). Функция m (t) такова:
Оптимальное движение, соответствующее уравнениям (2.5), (2.7), имеет свойство . Для проверки этого утверждения достаточно продифференцировать по времени левую часть данного равенства с учетом (2.5), (2.7) и убедиться, что полученная производная равна нулю после подстановки по формуле (2.5), а затем Li по (2.7).
Принимая во внимание (2.4), (2.7) и свойства зависимости а(t), имеем
,
где m0 = u0 / С ; , рi 0 = рi (0). Скалярная функция времени m (t) не выходит за пределы диапазона от −m0 до m0 , поэтому |M|≤ m0 .
2.2. Главные свойства и возможные версии оптимального управления. При любом варианте оптимального управления a (0) > 0 , a (T) < 0, а функции b(t) и m(t) связаны так
(связь получается из динамических уравнений (1.1) и (2.4), (2.5)). Для оптимальной функции a(t) получаем следующее дифференциальное уравнение: . Если |a(t)|≤ 2k0m0 , то ; если |a(t)|> 2k0m0, то . На всем интервале времени t ∈[0 , T ] а(t) – гладкая функция времени. Поведение функций m(t) и b(t) при оптимальном управлении наглядно демонстрирует рис. 1, где t1 и t2 – времена наступления равенств a(t) = 2k0m0 и a(t) = -2k0m0. Оптимальная функция b(t) описывается зависимостью:
(2.11)
где C1 и C2 – некоторые константы. Соответственно, функция m(t) выглядит таким образом:
, (2.12)
поскольку в интервале времени, когда |a(t)|≤ 2k0m0 , функция а(t) имеет вид:
.
Рис. 1. Вид оптимальных функций m(t) и b(t).
Необходимо отметить, что значения C1 и C2 должны удовлетворять равенствам
,
так как в момент времени t1 функция a(t) равна a(t1) = 2k0m0, а в момент времени t2 функция a(t) будет a(t2) = -2k0m0 . Отсюда получаем следующие соотношения:
,
так как b(t2) = b(t1) = m0t1 и t2 = T –t1 . Нетрудно видеть, что a (T) = –a (0) и a (T/2) = 0, .
Краевая задача принципа максимума состоит в определении вектора p(0) и величины r0 > 0, при которых решение системы уравнений (1.1), (1.2), (2.2), (2.4), (2.5) с начальными условиями (1.4) и связью ri = r0pi удовлетворит краевым условиям (1.5).
Существование точек переключения t1 , t2 зависит от интеграла
, (2.13)
который не зависит от характера изменения функции b (t) и определяется исключительно кватернионами Λin , Λf и моментами инерции J1 , J2 , J3 [18] (величина Q рассчитывается одновременно с вектором р0).
Если m0T2 < 4Q , то решения задачи разворота (1.1)(1.6) не существует, так как – минимально возможное время разворота твердого тела с моментами инерции J1 , J2 , J3 из положения (1.4) в положение (1.5) при ограничении (1.3) [8].
Если m0T2 = 4Q , то |M|= const = m0 на всем интервале управления t ∈[0 , T ] независимо от значения коэффициента k0 .
Если , то в любой момент времени M≠ const, поскольку в этом случае a(0) ≤ 2k0m0 , и |a(t)|≤ 2k0m0 при любом t ∈[0 , T ]. Ограничение (1.3) не существенно при таком сочетании величин Q, k0 , m0 и T.
Если , то m(0) = m0 и в оптимальном управлении неизбежны интервалы времени, на которых |M| = const. На участке, когда |M| ≠ const, справедливо уравнение , и функции a(t) , b(t) таковы:
.
Значение интеграла (2.13) равно
Точка переключения t1 определяется из уравнения
.
Значение t2 = T – t1 . Постоянные С1 и С2 , а также r0 рассчитываются по выражениям:
(2.14)
.
.
Максимальное значение кинетического момента bmax равно
.
Важным свойством оптимального управления является постоянство пропорции между кинетической энергией вращения Еk и квадрата модуля кинетического момента КА.
,
так как b2 = | L |2 (это видно из (2.7)) и , где р10 , р20 , р30 – составляющие вектора p0 = p(0).
Гамильтониан Н не зависит от времени в явной форме, поэтому на оптимальной траектории Н = const на всем интервале управления t ∈[0 , T ] [29]. В начальный момент времени t = 0, ; в конечный момент времени t = T, . Откуда a(T) = – a(0) и . В момент времени t = T/2 будет a (T/2) = 0 и H(T/2) = bmaxC2(r0 – bmax). В момент времени t = t1 имеем = H(t2). На участках, когда |M|= const, функции a(t) , b(t) таковы:
Нетрудно убедиться, что в любой момент времени . Соответственно, a(0) =. При любых значениях Q , k0 и T выполняются условия C1 > 0, C2 < 0 и тем самым обеспечивается r0 > 0 и a (0) > 0 , a (T) < 0. Таким образом:
на участке t < t1 , когда a(t) > 2k0m0 , оптимальная функция a(t) вычисляется по выражению
,
на участке t1 ≤ t ≤ t2 , когда | a(t) |≤ 2k0m0 , оптимальная функция a(t) имеет вид:
,
на участке t > t2 , когда a(t) < –2k0m0 , оптимальная функция a(t) вычисляется по выражению:
В интервале времени t1 < t < t2 , когда | a(t) |< 2k0m0 , оптимальная функция b(t) такая
.
Если a(t) ≥ 2k0m0 , то b(t) = m0t ; если a(t) ≤ –2k0m0 , то b(t) = m0(T – t ).
- Доказательство единственности оптимального решения. Введем орт q, коллинеарный моменту М, причем направления векторов q и M совпадают в начальный момент времени t = 0. Далее определим скалярный множитель f, удовлетворяющий двум условиям: φ = I–1f q и f (0) > 0. В окрестности точки t = 0 справедливы соотношения МL и L = χ q , где χ – скалярный множитель. Сначала оптимальный управляющий момент М, рассчитанный по выражению (2.4) при условии φ = I–1f (t) q , подставляем в (1.1) с учетом зависимости L = χ q и получаем
. (3.1)
Векторы и q ортогональны, либо сумма есть нулевой вектор (|q|= 1 , а значит в любом случае q⋅= 0). Уравнение (3.1) удовлетворяется, если только и . Далее векторы φ = I–1f (t) q и L = χq подставим в (2.9). С учетом соотношения , которое имеет место в силу уравнения (3.1) (оптимальное вращение подчиняется уравнениям (1.1), (2.9) одновременно), левая часть (2.9) станет такой
.
Правая часть (2.9) принимает вид
Приравнивая правую и левую части (2.9), получаем уравнение q = 2χq − r0p , из которого = 2χ -r0 и q ≡ р (так как , и ). Пришли к однозначному выводу: если в какой-то момент времени t векторы I φ и L коллинеарны, то они остаются коллинеарными внутри всего интервала времени 0 <t<T. Требования L(0) = 0 и L(T) = 0 гарантируют существование как минимум двух таких моментов времени, когда L и I φ коллинеарны (L = h t I φ при t → 0, и L = -h (Т – t )I φ при t → T ). Можем утверждать, что в процессе оптимального движения закономерность L р сохраняется на всем отрезке времени t ∈ [ 0 , T ], и оптимальное вращение обязательно удовлетворяет условиям (2.6), (2.7). Доказано, что зависимости (2.6), (2.7) – единственное решение системы (1.1), (2.2), (2.4), (2.5), поскольку L(0) = 0 и L(T) = 0 (напомним, ri = r0 pi ).
Таким образом, оптимизация свелась к определению такого вектора p0, чтобы в ходе вращения КА согласно уравнениям (1.2), (2.5), (2.7) удовлетворились условия Λ(Т ) = Λf , L(T) = 0. Уравнения (2.5) с учетом (2.7) принимают вид:
. (3.2)
Найти общее решение указанной системы практически не представляется возможным. Сложность заключается в нахождении p(0), p(T), связанных выражением
(, здесь − кватернион разворота).
- Проектирование программы оптимального вращения. Решение задачи оптимального разворота описывается уравнениями (2.6), (2.7), (3.2); управляющие функции Мi и компоненты кинетического момента Li изменяются в соответствии с (2.7), (2.10). Вектор р0 и характеристика Q находятся из решения двухточечной краевой задачи разворота. Программу вращения КА полностью определяют Q, m0. Программное значение М связано с кватернионом Λ по выражению
,
в котором m(t) изменяется в соответствии с (2.12).
При оптимальном вращении имеет свойство симметрии (прежде всего, для функций m(t) и b (t)) и характеризуется следующими закономерностями:
,
.
Из (2.7) следует, что р – это орт кинетического момента L. Оптимальные функции Li(t ), φi (t ), рi (t) соответствуют требованиям (2.6), (2.7), где рi (t) – решение системы (2.5). Оптимальное управление определяется выражением (2.10), направление кинетического момента L остается постоянным относительно инерциального базиса, векторы М и L коллинеарны в любое время t ∈ [0 , T ]. Управление (2.10) является действительно оптимальным, поскольку оно – единственное решение системы уравнений (1.1), (2.2), (2.4), (2.5).
Для неограниченного управления оптимальное решение заметно проще:
.
Для управления, ограниченного требованием (1.3), оптимальное решение М = m(t) р , где m(t) = u0 / С , если a(t) > 2k0m0 ; m(t) = a(t) / (2k0), если |a(t)|≤ 2k0m0 ; m(t) = –u0 / С , если a(t) < –2k0m0 .
Значения Q, m0 и р0 определяются исключительно значениями u0 , Λin , Λf и J1 , J2 , J3 , а времена t1 , t2 зависят от k0 . В момент времени t = T / 2 момент М меняет свое направление на противоположное, модуль | L | максимален (| L (T / 2)| = Lmax ).
Искомое значение t1 находится внутри отрезка t1∈[0, t0], где . Если предположить t1 = t0 , то это означает С1 = С2 = 0 (как следует из (2.14)) и b = const, а a(t) = 0, чего не может быть в оптимальном управлении, поскольку в интервале t∈[t1 , t2 ] оптимальный момент M ≠ 0 и оптимальная функция a(t) должна меняться от 2k0m0 до уровня –2k0m0 . Следовательно, для оптимального движения t1 < t0 .
4.1. Некоторые частные случаи оптимального управления разворотом. Управляющие функции формируются согласно (2.10), (2.12), для чего надо в каждый момент времени t знать р1 , р2 , р3 (их изменение описывает (3.2)). Аналитическое решение системы (1.2), (2.7), (3.2) существует применительно динамически симметричных и сферически-симметричных тел.
В случае сферически-симметричного КА () зависимости известны [19]:
рi (t ) = const = рi 0 =, Мi (t ) = m (t) рi 0 , ωi (t ) = b(t) рi 0 / Ji где временные функции b(t) и m (t) определяются параметрами m0 =, Q = 2 J1 arccos ν0 и k0 (о чем было сказано в разделе 2); – элементы кватерниона . Траекторию вращения Λ(t ) представим в аналитической форме
.
При динамической симметрии твердого тела (J2 = J3 ) задача оптимального управления (1.1)–(1.6) может быть доведена до аналитического решения (для конкретности дальнейшего изложения осью симметрии считается ось ОХ). При таком распределении масс оптимальное движение есть одновременное вращение тела (КА) вокруг направления, задаваемого вектором р, неподвижным относительно инерциальной системы координат, и вокруг оси ОХ, которая образует с р постоянный угол ϑ . Угловые скорости вокруг р и оси ОХ изменяются пропорционально с постоянным коэффициентом пропорциональности, в силу чего имеем [8, 11]
,
где е1 − орт оси симметрии; α , β − углы поворота твердого тела вокруг оси ОХ и вокруг р (|α|≤ π , ). Запишем p(t) в аналитической форме [8, 11]:
, (4.1)
где pi 0 = рi (0) ; J = J2 = J3 ; продольная скорость w1 (t) определяется из (2.7) при том, что р1 = const = р10 . Значения α , β и pi 0 находятся по кватернионам Λin и Λf из системы [8, 11]:
, (4.2)
причем −π ≤ α ≤ π , 0 ≤ β ≤ π (здесь – элементы кватерниона ).
В случае осевой симметрии КА описанное решение отличается от [11], так как все управляющие переменные Мi (t) – непрерывные функции времени. Компоненты кинетического момента Li рассчитываются по уравнениям (2.7) и (4.1). Оптимальные функции b(t) и m(t) определены программами (2.11), (2.12) и зависят от параметров T, m0 , Q, которые рассчитываются однозначно по заданным Λin , Λf , u0 , k0 и J1 , J2 , J3. Искомые оптимальные управления Mi (t) запишем в следующем аналитическом виде:
,
где если или если (); вариант | р10 | = 1 означает плоское вращение вокруг оси ОХ, поэтому мы его не рассматриваем.
Оптимальную траекторию Λ(t ) представим в следующей аналитической форме
,
где
Параметры р0 , m0 , Т для динамически симметричного тела находятся намного проще (также упрощается определение величины (2.13)); Q = J2β, так как , где – скорость вращения вокруг L (уточним, β ≥ 0 , ≥ 0). Величины bmax , G зависят от β. Чтобы (1.6) было минимальным необходимо, чтобы угол β был минимально возможным, для чего потребуем β ≤ π (именно поэтому (4.2) включает условие 0 ≤ β ≤ π). Заметим, что в более ранних работах [11, 14] также выписаны предварительные выражения общего решения задачи оптимального разворота, но для других функционалов качества, и доведено до конца решение для частного случая динамической симметрии твердого тела. При этом авторами статьи [11] было доказано, что решение системы (4.2) существует при любых Λt и любых J1 , J2 = J3 .
Для несимметричного тела (J1 ≠ J2 ≠ J3 ) решение системы (1.2), (2.5), (2.7) находится исключительно численными методами (например, методом последовательных приближений [30], или как описано в предыдущей работе [8]). Расчет искомого орта p0 осуществляется решением краевой задачи р(0) = р0 , для системы дифференциальных уравнений (3.2). Ранее она решалась методом итераций (см. способ [31] и систему [32]). Известно [18], что р0 не зависит от поведения b(t), которая входит в (3.2), и мы находим р0 в предположении, что b(t)= const; это обстоятельство значительно упрощает алгоритм поиска требуемого р0. Когда b(t)= const, решение р(t) уравнений (3.2) соответствует вращению по инерции, поскольку уравнения (3.2) выполняются совместно с (1.1), (2.7), из которых следует .
Необходимо заметить, что чем больше коэффициент k0 , тем больше максимальная энергия вращения Emax = Ek(T/2) и максимальный кинетический момент Lmax = |L(T/2)|. При неограниченно большом k0 → ∞ в интервале времени, когда |М|≠ const , функции m(t) и a (t) изменяются практически по линейному закону (соответственно, в этом интервале времени b (t) близка к квадратичной функции времени). С уменьшением коэффициента k0 максимальная энергия вращения Emax и максимальный кинетический момент Lmax уменьшаются. Если k0 → 0, то максимальный кинетический момент Lmax достигает минимально возможного уровня (для заданного времени T и ограничения u0 в (1.3)), при этом оптимальное управление становится практически двухимпульсным, когда управляющий момент между участками с |М|= const = m0. отсутствует и КА вращается по инерции [32].
- Данные математического моделирования. Для примера рассмотрим разворот на 150° в положение, соответствующее кватерниону Λf с элементами l0 = 0.258819; l1 = 0.683013; l2 = 0.258819; l3 = 0.591505. В исходном положении направления одноименных осей связанного и инерциального базисов совпадают, и L(0) = L(Т) = 0. Определим оптимальную программу управления для перевода КА из состояния (1.4) в состояние (1.5) за время Т = 300 с. Численное решение задачи управляемого разворота в постановке (1.1)–(1.6) приведем для случая, когда u0 = 0.044 H и k0 = 10 с2, а инерционные характеристики КА приняты следующими: J1 = 4710 кг м2, J2 = 17160 кг м2, J3 = 18125 кг м2.
При решении двухточечной краевой задачи разворота в (2.7) полагаем (и ), так как характер поведения функции b(t) не влияет на искомое значение p0 [18]. Поиск p0 начнем с решения той же задачи для динамически симметричного тела с моментами инерции J1 и J, где J – момент инерции относительно поперечной оси, равный среднему значению между J2 и J3 (исследователи нередко применяют принцип осреднения [33]). Допустимым является значение , хотя чаще используют следующую величину [8]
.
Предположив, что КА – динамически симметричное тело, решаем систему (4.2). Найденные из нее значения p0 и β принимаем за начальное приближение к истинным значениям, соответствующим оптимальному решению. Они уточняются до тех пор, пока не будут удовлетворять системе (1.2), (2.7), (3.2) с учетом (что соответствует M = 0) при условиях Λ(0) = Λin, Λ(tpr) = Λf , предъявляемых к вращению КА. Полагаем . Зная p0 и угол β, компоненты начального кинетического момента Lst вычисляем по выражениям:
. (5.1)
Прогноз “свободного” движения осуществляем путем интегрирования системы уравнений (1.2), (2.7), (3.2) и с начальными условиями Λ(0) = Λin , L(0) = Lst , р(0) = р0 . Степень отличия р0 и β от истинного решения отражает оценка ε = sqal (), где Λpr − максимально близкое к Λf положение, полученное в ходе моделирования движения КА относительно центра масс, соответствующего вращению по инерции (Mi = 0). Значение р0 уточняем до тех пор, пока ε < εth (εth – заданная пороговая величина чуть меньше единицы, которая отражает точность рассчитанного решения). Как только условие ε ≥ εth будет достигнуто (прогнозируемая ошибка удовлетворит заданной точности), искомые значения p0 и β (для удовлетворения краевым условиям Λ(0) = Λin , Λ(tpr) = Λf ) считаются найденными, а краевая задача решенной. Вектор p0 уточнялся в соответствии с рекуррентным правилом:
,
где Λt(k) – кватернион разворота для расчета p0 и Lst на k-м приближении. Правые части системы (4.2) (элементы кватерниона разворота Λt(k)) обновляются на каждом k-м шаге итераций, из (4.2) мы находим p0 , β, а также кинетический момент Lst (согласно (5.1)) для интегрирования уравнений (1.2), (2.7), (3.2), и вычисляем прогноз Λpr . Если ε < εth , то рассчитывается новый кватернион разворота Λt(k + 1) для следующего (k + 1)-го приближения – процесс уточнения p0 возобновляется. В правых частях системы (4.2) для начального приближения берем элементы кватерниона . Итерационный процесс останавливается, когда ε ≥ εth .
Описанная схема итераций напоминает метод решения уравнения вида x = g(x) для скалярной функции g(x) скалярного (одномерного) аргумента x . В описанной схеме аргумент – кватернион Λt , а функция – кватернионное произведение (Λf – постоянный кватернион, а Λpr зависит от аргумента Λt через систему (4.2), (5.1) и модель движения, описываемую уравнениями (1.2), (2.7), (3.2) и b(t) = const = Jβ / Т). Изменяя Λt , получим новый вектор p0 (как решение системы (4.2) с новыми правыми частями), и новые начальные значения List и прогнозируемое положение Λpr , что приведет к изменению функции . Как только sqal () ≥ εth , поиск новых приближений прекращается, считается, что вектор p0 найден. Поскольку |vect()| <|vect| для всех k, то можно констатировать, что процесс приближений к искомому значению p0 сходится. Похожий способ расчета р0 применялся в решении двухточечной краевой задачи разворота для максимального быстродействия [8].
После решения краевой задачи разворота из положения Λ(0) = Λin в положение Λ(Т) = Λf были получены p0 = {0.381804; 0.1941395; 0.9036236} и (2.13), Q = 28907.5 Н⋅м⋅с2. Соответственно, m0 = 5 Н⋅м. Поскольку m0T2 > 4Q , то заданный разворот реализуем. Кроме того, k0 и m0 соответствуют условию . Поэтому в начальный и конечный моменты времени |М|= m0 , оптимальное вращение включает два участка, внутри которых |М| = const. Реализующееся управление имеет три интервала изменения момента М – вначале интенсивная раскрутка КА (когда m(t) = const = m0 ), участок с экспоненциальным изменением m(t) (функция m(t) уменьшается с m(t) = m0 до m(t) = –m0), и интенсивное торможение в конце (когда m(t) = const = –m0 ). Точкам переключения соответствуют t1 = 17.576 с и t2 = 282.424 с, постоянная r0 = 178.92 Н⋅м⋅с. В момент времени t = 150 с кинетический момент достигает максимальной величины Λmax = 103.69 Н⋅м⋅с. Энергия вращения во время разворота не превышает Emax = 0.42 Дж.
Наглядная иллюстрация движения КА во время оптимального разворота приведена на рис. 2–6 (по результатам математического моделирования). На рис. 2 даны графики изменения проекций кинетического момента на оси связанной системы координат L1(t), L2(t), L3(t) во времени (проекции Li даны в Н⋅м⋅с). Рис. 3 иллюстрирует изменение элементов кватерниона Λ(t) в процессе совершаемого маневра (λ0(t),λ1(t), λ2(t), λ3(t) отражают текущую ориентацию КА). Характер поведения составляющих р1(t), р2(t), р3(t) показан на рис. 4 (значения рi , как и λj, – безразмерные величины), причем проекция р1 изменяется незначительно. Оптимальная функция m(t) для рассматриваемого разворота показана на рис. 5 (m(t) дается в Н⋅м). Изменение модуля кинетического момента КА и кинетической энергии вращения во время оптимального разворота иллюстрируют рис. 6 и рис. 7 (энергия Еk дана в Дж). Свидетельством того, что ОХ − продольная ось КА, является то обстоятельство, что L1 знакопостоянна, и характер ее изменения повторяет поведение модуля кинетического момента (в отличие от L2 и L3). Для оптимального управления переменные рi и λj – гладкие функции времени; Li – гладкие функции времени (за исключением t = 0 и t = Т ).
Рис. 2. Изменение проекций кинетического момента КА во время разворота.
Рис. 3. Изменение компонент кватерниона ориентации Λ(t) во время разворота.
Рис. 4. Вид функций p1(t), p2 (t), p3 (t) во время оптимального разворота.
Рис. 5. Оптимальная функция m(t) для модельного разворота.
Рис. 6. Изменение модуля кинетического момента при оптимальном управлении.
Рис. 7. Изменение кинетической энергии вращения Еk в процессе разворота.
Заключение. Исследуется задача оптимального управления разворотом твердого тела (в частности, КА) из исходного положения в предписанное конечное положение. Для оптимизации выбранный показатель качества объединяет в заданной пропорции вклад управляющих усилий (по энергозатратам), затраченных для совершения маневра и интеграл кинетической энергии вращения. Проблемы экономичности управления вращениями актуальны и в настоящее время, в силу чего рассмотренная задача остается практически важной. Обнаружены ключевые свойства разворота и тип траектории, соответствующей критерию (1.6). Доказано, что постоянной величиной является отношение квадрата модуля кинетического момента к кинетической энергии вращения КА.
Чтобы решить поставленную задачу мы использовали кватернионные модели и принцип максимума Л.С. Понтрягина. Для сформулированной оптимизационной задачи выписаны функция Гамильтона–Понтрягина, сопряженная система уравнений и аналитические выражения для оптимальных управляющих функций. На основе необходимых условий оптимальности определена структура оптимального управления. Даны соотношения для определения пространственного движения КА; при этом доказана единственность оптимального решения.
Главное отличие представленного решения – использование нового функционала качества. Наличие в минимизируемом функционале интеграла энергии ограничивает максимальную кинетическую энергию вращения. Коэффициент k0 , устанавливающий пропорцию между затратами управляющих усилий и интегралом энергии вращения, определяет, насколько пологим будет изменение модуля кинетического момента во время оптимального разворота. Другое принципиальное отличие заключается в том, что из-за ограниченности управления во время оптимального разворота не исключено наличие участков вращения с постоянным модулем управляющего момента. В статье определены и подробно описаны все возможные варианты реализующегося оптимального управления, найдено условие (критерий), позволяющее определить тип оптимального управления, исходя из заданного коэффициента k0 минимизируемого функционала и размера области допустимых управлений. В зависимости от значения k0 оптимальным может быть один из двух вариантов управления: a) вращение с переменным модулем управляющего момента на протяжении всего маневра; b) управление с участками вращения с постоянным максимально возможным модулем управляющего момента – раскрутка в начале разворота и торможение в конце разворота. Приведено аналитическое уравнение, устанавливающее связь между длительностью участков вращения с постоянным модулем управляющего момента и коэффициентом k0 минимизируемого функционала, а также максимально возможной величиной управляющего момента m0. Выписаны формулы (в аналитической форме) для расчета максимальной энергии вращения и максимального модуля кинетического момента. Описана реализация программного разворота.
Полученные результаты отличаются от решения работы [11], где найдено оптимальное релейное управление вместо непрерывного управления, полученного в нашем случае. Представлены выражения для расчета основных характеристик поворотного маневра. Описывается вычислительный алгоритм решения краевой задачи для произвольного распределения масс твердого тела. Приведен пример математического моделирования, демонстрирующий поведение параметров движения. В частном случае динамически симметричного КА решение задачи оптимального управления доведено до конца: в аналитическом виде получена система уравнений, позволяющая напрямую найти решение двухточечной краевой задачи и рассчитать ключевые константы закона управления (для этого может использоваться устройство [34]).
В последние годы в связи с ростом сроков активного существования КА (10 –15 лет), а также применением высокоточных систем ориентации интерес к ЭРД значительно возрос [35]. Неоспоримые преимущества ЭРД – возможность маленькой величины единичного импульса тяги, большая точность дозирования импульсов, практически отсутствует импульс последействия, что позволяет осуществлять особо точную ориентацию. Благодаря невообразимо высоким значениям удельного импульса (до 6000 с) массовое применение ЭРД на КА (в том числе для ориентации КА) – одна из ведущих и закономерных тенденций космической деятельности в мире. В настоящее время многие зарубежные КА используют ионные двигатели для управления ориентацией (например, при решении задач ориентации КА в космической программе США использовали ионные двигатели XIPS-25, созданные корпорацией Boeing Space Systems). В этом случае потребляемая электроэнергия достаточно близко оценивается величиной, пропорциональной первому слагаемому в (1.6); второй интеграл в показателе (1.6) ограничивает кинетическую энергию вращения, делая ее минимально возможной при заданном времени разворота, что также немаловажно в космическом полете. Учитывая необходимость снижения электропотребления ЭРД для управления КА с желательным уменьшением энергии вращения, становится понятным выбор минимизируемого функционала в форме (1.6).
About the authors
M. V. Levskii
Maksimov Space System Research and Development Institute, Khrunichev State Research and Production Space Center
Author for correspondence.
Email: levskii1966@mail.ru
Russian Federation, Korolev, Moscow oblast, 141091
References
- L. I. Sinitsin and A. V. Kramlikh, “Synthesis of the optimal control law for the reorientation of a nanosatellite using the procedure of analytical construction of optimal regulators,” J. Phys.: Conf. Ser. 1745, 012053 (2021). https://doi.org/10.1088/1742-6596/1745/1/012053
- M. A. Velishchanskii, A. P. Krishchenko, and S. B. Tkachev, “Synthesis of spacecraft reorientation algorithms using the concept of the inverse dynamic problem,” J. Comput. Syst. Sci. Int. 42, 811–818 (2003).
- J. L. Junkins and J. D. Turner, Optimal Spacecraft Rotational Maneuvers (Elsevier, 1986).
- S. A. Reshmin, “Threshold absolute value of a relay control when time-optimally bringing a satellite to a gravitationally stable position,” J. Comput. Syst. Sci. Int. 57, 713–722 (2018). https://doi.org/10.1134/S106423071805012X –320 c.
- S. Scrivener and R. Thompson, “Survey of time-optimal attitude maneuvers,” J. Guid. Contr. Dyn. 17 (2), 225–233 (1994). https://doi.org/10.2514/3.21187
- H. Zhou, D. Wang, B. Wu, and E. K. Poh., “Time-optimal reorientation for rigid satellite with reaction wheels,” Int. J. Contr. 85 (10), 1452–1463 (2012). https://doi.org/10.1080/00207179.2012.688873
- S. A. Reshmin, “The threshold absolute value of a relay control bringing a satellite to a gravitationally stable position in optimal time,” Dokl. Phys. 63, 257–261 (2018). https://doi.org/10.1134/S1028335818060101
- M. V. Levskii, “Pontryagin’s maximum principle in optimal control problems of orientation of a spacecraft,” J. Comput. Syst. Sci. Int. 47, 974–986 (2008). https://doi.org/10.1134/S1064230708060117
- H. Shen and P Tsiotras, “Time-optimal control of Axi-symmetric rigid spacecraft with two controls,” AIAA J. Guid. Contr. Dyn. 22 (5), 682–694 (1999). https://doi.org/10.2514/2.4436
- A. V. Molodenkov and Y. G. Sapunkov, “Analytical solution of the minimum time slew maneuver problem for an axially symmetric spacecraft in the class of conical motions,” J. Comput. Syst. Sci. Int. 57, 302–318 (2018). https://doi.org/10.1134/S1064230718020120
- V. N. Branets, M. B. Chertok, and Yu. V. Kaznacheev, “Optimal turn of a rigid body with a single axis of symmetry,” Kosm. Issl. 22 (3), 352–360 (1984).
- V. N. Branets and I. P. Shmyglevskii, Application of Quaternions to Rigid Body Attitude Problems (Nauka, Moscow, 1973) [in Russian].
- S. A. Aipanov and A. T. Zhakypov, “The method of separation of variables and its application to the problem of a spacecraft’s optimal turn,” Cosmic Res. 58, 53–63 (2020). https://doi.org/10.1134/S0010952520010013
- N. A. Strelkova, “On optimal reorientation of a solid,” in Problems of Mechanics of Controlled Motion. Nonlinear Dynamical Systems (PGU, Perm, 1990), pp. 115–133 [in Russian].
- M. V. Levskii, “Kinematically optimal spacecraft attitude control,” J. Comput. Syst. Sci. Int. 54, 116–132 (2015). https://doi.org/10.1134/S1064230714050116
- O. V. Zelepukina and Y. N. Chelnokov, “Construction of optimal laws of variation in the angular momentum vector of a dynamically symmetric rigid body,” Mech. Solids 46, 519–533 (2011). https://doi.org/10.3103/S0025654411040030
- V. G. Biryukov and Y. N. Chelnokov, “Construction of optimal laws of variation of the angular momentum vector of a rigid body,” Mech. Solids 49, 479–494 (2014). https://doi.org/10.3103/S002565441405001X
- M. V. Levskii, “Optimal spacecraft terminal attitude control synthesis by the quaternion method,” Mech. Solids 44, 169–183 (2009). https://doi.org/10.3103/S0025654409020022
- M. V. Levskii, “About method for solving the optimal control problems of spacecraft spatial orientation,” Probl. Nonlin. Anal. Eng. Syst. 21 (2), 61–75 (2015).
- A. V. Molodenkov and Yu. G. Sapunkov, “Analytical solution of the optimal slew problem for an axisymmetric spacecraft in the class of conical motions,” J. Comput. Syst. Sci. Int. 55, 969–985 (2016). https://doi.org/10.1134/S1064230716060095
- A. V. Molodenkov and Yu. G. Sapunkov, “Analytical quasi-optimal solution of the slew problem for an axially symmetric rigid body with a combined performance index,” J. Comput. Syst. Sci. Int. 59, 347–357 (2020). https://doi.org/10.1134/S1064230720030107
- Yu. G. Sapunkov and A. V. Molodenkov, “Analytical solution of the problem on an axisymmetric spacecraft attitude maneuver optimal with respect to a combined functional,” Autom. Remote Contr. 82, 1183–1200 (2021). https://doi.org/10.1134/S0005117921070043
- A. V. Molodenkov and Yu. G. Sapunkov, “Analytical approximate solution of the problem of a spacecraft’s optimal turn with arbitrary boundary conditions,” J. Comput. Syst. Sci. Int. 54, 458–468 (2015). https://doi.org/10.1134/S1064230715030144
- M. V. Levskii, “Control of the rotation of a solid (spacecraft) with a combined optimality criterion based on quaternions,” Mech. Solids 58, 1483–1499 (2023). https://doi.org/10.3103/S002565442360040X
- Quang M. Lam, “Robust and adaptive reconfigurable control for satellite attitude control subject to under-actuated control condition of reaction wheel assembly,” Math. Eng. Sci. Aerosp. 9 (1), 47–63 (2018).
- M. V. Levskii, “Special aspects in attitude control of a spacecraft, equipped with inertial actuators,” J. Comput. Sci. Appl. Inform. Technol. 2 (4), 1–9 (2017). http://dx.doi.org/10.15226/2474-9257/2/4/00121
- O. A. Gorshkov, V. A. Murav’ev, and A. A. Shagaida, Hall and Ion Plasma Engines for Spacecraft (Mashinostroenie, Moscow, 2008) [in Russian].
- L. S. Pontryagin, V. G. Boltyanskii, R. V. Gamkrelidze, and E. F. Mishchenko, The Mathematical Theory of Optimal Processes (Wiley-Interscienc, New York, 1962; Nauka, Moscow, 1983).
- L. C. Young, Lectures on the Calculus of Variations and the Theory of Optimal Control (Saunders, 1969; Mir, Moscow, 1974).
- A. A. Lyubushin, “Modifications of the method of successive approximations for solving optimal control problems,” USSR Computat. Math. Math. Phys. 22 (1), 29–34 (1982). https://doi.org/10.1016/0041-5553(82)90160-4
- M. V. Levskii, RF Patent No. 2 114 771, Byull. Izobr., No. 19, 234–236 (1998).
- M. V. Levskii, RF Patent No. 2 006 431, Byull. Izobr., No. 2, 49–50 (1994).
- V. Ph. Zhuravlev and D. M. Klimov, Applied Methods in the Vibration Theory (Nauka, Moscow, 1988) [in Russian].
- M. V. Levskii, RF Patent No. 2 146 638, Byull. Izobr., No. 8, 148 (2000).
- V. M. Kulkov, V. A. Obukhov, Y. G. Yegorov, et al., “Comparative evaluation of the effectiveness of the application of perspective types of electric propulsion thrusters in the small spacecraft,” Vestn. Samarsk. Gos. Aerokosm. Univ., No. 3(34), 187–195 (2012).
Supplementary files
