Алгоритм решения задачи оптимального управления химико-технологическим процессом с терминальными ограничениями
- Авторы: Антипина Е.В.1, Мустафина С.А.2, Антипин А.Ф.3, Морозкин Н.Д.2
-
Учреждения:
- Стерлитамакский филиал Башкирского государственного университета
- Башкирский государственный университет
- Стерлитамакский филиал Башкирского государственного
- Выпуск: Том 32, № 3 (2022)
- Страницы: 410-422
- Раздел: Технологии, машины и оборудование
- Статья получена: 16.06.2025
- Статья одобрена: 16.06.2025
- Статья опубликована: 19.06.2025
- URL: https://ogarev-online.ru/2658-4123/article/view/296958
- DOI: https://doi.org/10.15507/2658-4123.032.202203.410-422
- ID: 296958
Цитировать
Полный текст
Аннотация
Введение. Задача определения оптимальных режимных параметров при математическом моделировании химико-технологических процессов является важнейшей задачей. Численные методы и алгоритмы решения создают основу для разработки программных комплексов для расчета процессов и их цифровых двойников. Математическую модель химико-технологического процесса можно описать системой дифференциальных уравнений, выделив фазовые переменные, определяющие состояние процесса, и параметры управления, которые можно изменять и влиять тем самым на течение процесса.
Целью работы является разработка численного алгоритма решения задачи оптимального управления химико-технологическим процессом при наличии терминальных ограничений и ограничений на параметр управления.
Материалы и методы. Сформулирована задача оптимального управления в общем виде. Для ее решения применены метод штрафов и метод искусственных иммунных систем. Описан способ включения ограничений в функцию штрафа и выбора последовательности коэффициентов, с которыми берется штраф. Для преодоления локальных экстремумов использован случайный выбор начальных значений управляющих параметров.
Результаты исследования. Приведен пошаговый численный алгоритм решения задачи оптимального управления химико-технологическим процессом с терминальными ограничениями. Проведен вычислительный эксперимент для модельного примера, в результате которого определена структура оптимального управления процессом и соответствующие оптимальные траектории фазовых переменных. Показано, что рассчитанное решение задачи оптимального управления согласуется с решением, полученным методом игольчатой линеаризации.
Обсуждение и заключение. Разработанный алгоритм позволяет найти численное решение задачи оптимального управления химико-технологическим процессом с терминальными ограничениями. Решение не зависит от выбора начального приближения.
Полный текст
Введение
Основная задача промышленного предприятия состоит в максимально эффективном использовании имеющихся ресурсов с минимальными издержками производства. Решить данную проблему можно путем применения цифровых двойников химико-технологических процессов. Это позволит смоделировать работу технологической установки или конкретный химико-технологический процесс.
Поэтому возникает необходимость в установлении тесной связи производства и научных организаций для создания новых цифровых технологий и решения ряда задач по оптимизации и модернизации, в частности определения оптимальных параметров проведения химико-технологических процессов в различных условиях.
Задачу определения оптимальных режимных параметров ведения химико-технологических процессов можно решить путем применения методов математического моделирования. Для ее формализации необходимо составить математическую модель процесса (например в виде системы дифференциальных уравнений), выделить управляющие параметры и область их изменения, а также обозначить критерий качества управления. В задачах оптимального управления ограничения могут быть наложены не только на управляющие параметры, но и на фазовые переменные. Если ограничения на фазовые переменные заданы в конечный момент времени функционирования системы, то такая задача является задачей с терминальными ограничениями [1]. Разработка численных методов решения задачи оптимального управления с терминальными ограничениями представляет научный и практический интерес, поскольку более сложные задачи с фазовыми и промежуточными ограничениями могут быть сведены к терминальным задачам путем применения математических редукций [2].
Цель работы – разработка численного алгоритма решения задачи оптимального управления химико-технологическим процессом с терминальными ограничениями.
Обзор литературы
Для решения задач оптимального управления с фазовыми ограничениями существует несколько подходов. Один из них предполагает вывод точных условий оптимальности и исследование свойств получаемых решений [3; 4]. Необходимые условия оптимальности решений задач оптимального управления с фазовыми ограничениями в форме принципа максимума Понтрягина получены как в работах российских авторов [5; 6], так и в зарубежных исследованиях [7; 8]. Однако при разработке численных алгоритмов решения задач оптимального управления данный подход трудно реализовать на практике.
Другой подход основан на применении метода штрафов для практической реализации алгоритмов решения задачи оптимального управления с ограничениями, наложенными на фазовые переменные. Основная идея метода штрафов заключается в замене задачи с фазовыми ограничениями на задачу без ограничений путем добавления «штрафа» к критерию оптимальности. При этом последовательность решений новой задачи оптимального управления дает решение исходной задачи.
Разработке методов решения задач оптимального управления с терминальными ограничениями на основе метода штрафа посвящен ряд работ [9–13]. Численная реализация данного метода представлена в работах, в которых последовательность оптимизационных задач без ограничений решается с помощью градиентного метода [14; 15]. Однако недостатком градиентных методов является чувствительность решения оптимизационной задачи к выбору начального приближения, что может привести к попаданию решения в локальный экстремум или в область, противоречащую физическому смыслу задачи.
Основные трудности, возникающие при программной реализации методов решения задач оптимального управления, связаны с нелинейностью описания процесса, высокой размерностью пространства поиска, наличием фазовых ограничений, а также чувствительностью найденного решения к начальной точке поиска [16; 17]. Преодолеть перечисленные трудности позволяет применение эволюционных методов оптимизации, к которым относится метод искусственных иммунных систем.
Метод искусственных иммунных систем основан на имитации функционирования иммунной системы живых организмов. Функционирование заключается в защите от неблагоприятных внешних воздействий (патогенов, антигенов) [18–20]. В этом процессе основную роль играют защитные клетки – антитела, вырабатываемые иммунными клетками и претерпевающие изменения в ходе борьбы с антигенами и патогенами. Наиболее приспособленные для защиты антитела подавляют чужеродные тела, и именно эти клетки запоминает иммунная система для их воспроизведения при повторной атаке организма схожим патогеном.
В настоящее время искусственные иммунные системы находят широкое применение при решении задач распознавания образов [21], прогнозирования [22], классификации [23], оптимизации [24] и оптимального управления [25].
По сравнению с классическими методами оптимизации метод искусственных иммунных систем обладает рядом преимуществ, к которым можно отнести независимость найденного решения оптимизационной задачи от начального приближения. Отсутствие чувствительности решения задачи к начальному приближению достигается за счет того, что в начале поиска задается набор векторов возможных решений, которые заполняются случайными допустимыми значениями и в ходе работы алгоритма путем применения операторов метода претерпевают изменения, приближаясь к решению оптимизационной задачи. По сравнению с другими эволюционными методами искусственные иммунные системы оперируют в своей работе лучшими решениями, найденными на предыдущей итерации поиска, что позволяет применять их при решении задач мультимодальной оптимизации [26].
В настоящей работе представлен пошаговый алгоритм для поиска численного решения задачи оптимального управления химико-технологическим процессом с терминальными ограничениями и его апробация на модельном примере.
Материалы и методы
Пусть динамика протекания химико-технологического процесса описывается системой обыкновенных дифференциальных уравнений
(1)
с начальными условиями
(2)
где – вектор фазовых переменных; – параметр управления; U – множество допустимых значений управления; – время, f (x(t), u(t), t) = ( f1(x(t), u(t), t), f2(x(t), u(t), t), …, fn(x(t), u(t), t))T – вектор-функция, непрерывная вместе со своими частными производными [27].
Пусть множество U задается неравенством
(3)
где ua, ub – верхняя и нижняя допустимые границы значений параметра управления.
Пусть на фазовые переменные в момент времени t1 наложены ограничения:
(4)
(5)
где rj (x) – непрерывно дифференцируемые функции.
Введем функционал качества управления:
(6)
Требуется для химико-технологического процесса, описываемого системой дифференциальных уравнений (1) с начальными условиями (2), найти такую управляющую функцию , с учетом ограничений (4), (5), для которой критерий оптимальности (6) принимает минимальное значение.
Для решения задачи оптимального управления (1)–(6) применим метод штрафов и метод искусственных иммунных систем.
Для того чтобы применить метод штрафов, необходимо построить новый критерий оптимальности, содержащий штрафной функционал W(u, sk), значение которого равно нулю при выполнении ограничений (4), (5) и больше нуля в противном случае. Поэтому введем в рассмотрение критерий оптимальности
(7)
где W(u, sk) – штрафной функционал, определяемый по формуле
где k – номер итерации, sk – параметр штрафа.
На каждой итерации поиска решения необходимо найти решение задачи оптимального управления без ограничений. Найденный параметр управления u*(t) становится начальным для следующей итерации с увеличенным значением параметра штрафа.
Последовательность решений задачи оптимального управления (1)–(3), (7) дает решение исходной задачи (1)–(6).
Для решения задачи оптимального управления (1)–(3), (7) применим метод искусственных иммунных систем. Критерий оптимальности (7) соответствует понятию приспособленности иммунной клетки к борьбе с антигенами и патогенами и представляет собой фитнес-функцию. Пусть иммунной клеткой является вектор управляющих параметров u = (u1, u2, .., ul), а набор из count_u таких векторов составляет популяцию
(8)
Наиболее приспособленной иммунной клетке u соответствует наименьшее значение фитнес-функции (7), так как решается задача на поиск минимума критерия оптимальности.
Результаты исследования
Сформулируем численный алгоритм решения задачи оптимального управления с терминальными ограничениями, основанный на комбинации метода штрафов и метода искусственных иммунных систем:
- Задать параметры алгоритма искусственных иммунных систем: начальное значение параметра штрафа s0, размер популяции count_u, количество иммунных клеток с наихудшим значением фитнес-функции maxf, количество клеток-родителей для селекции sel, количество клонов для оператора клонирования klon, параметр оператора мутации mut, параметры завершения поиска решения ε1, ε2.
- Случайным образом заполнить начальную популяцию иммунных клеток (8) допустимыми значениями из области U.
- Вычислить значение фитнес-функции (7) для каждой иммунной клетки ui , ,
- Применить к текущей популяции оператор клонирования. Для этого выбрать наиболее приспособленные иммунные клетки (клетки-родители) и создать для каждой klon копий.
- Применить к каждому вектору-клону оператор мутации. Для этого сгенерировать случайные числа для каждой клетки-родителя. Координаты клона вычислить по формуле [28]:
- Вычислить значение фитнес-функции (7) для каждой клетки-мутанта.
- Применить к каждому клону-мутанту оператор селекции. Для этого выбрать среди них наиболее приспособленные клетки и поместить в популяцию вместо клетки-родителя при условии, что она менее приспособлена по сравнению с клоном-мутантом.
- Случайным образом сгенерировать maxf новых иммунныx клеток и вычислить для них значение фитнес-функции.
- Выбрать из популяции maxf наименее приспособленные иммунные клетки и заменить их новыми клетками.
- Проверить условие окончания поиска решения задачи оптимального управления без ограничений. Если изменение значения фитнес-функции не превышает заданной малой величины ε1, то выбрать из последней популяции клетку u* с наименьшим значением фитнес-функции, иначе перейти к шагу 4.
- Проверить условие окончания работы алгоритма. Если то увеличить штраф по правилу:
В качестве начальной популяции для следующей итерации алгоритма задать наиболее приспособленную иммунную клетку u*. Затем перейти к шагу 4.
Если то остановить работу алгоритма. Решением задачи оптимального управления будет наиболее приспособленная иммунная клетка u* из последней популяции.
Найдем численное решение задачи оптимального управления с терминальными ограничениями с помощью описанного алгоритма.
Пусть химико-технологический процесс описывается системой обыкновенных дифференциальных уравнений
(9)
где – вектор фазовых переменных; u(t) – параметр управления; – время функционирования системы.
Область допустимых значений параметра управления задается неравенством:
(10)
Пусть заданы начальные значения фазовых переменных:
(11)
На значение фазовой переменной x1 в конечный момент времени наложено ограничение вида
(12)
Пусть критерий оптимальности имеет вид
(13)
Необходимо для химико-технологического процесса, описываемого системой обыкновенных дифференциальных уравнений (9) с начальными условиями (10), найти такое управление u*(t), при котором выполнены ограничения (10), (12) и достигается минимум критерия оптимальности (13).
Критерий оптимальности со штрафным функционалом в нашем случае имеет вид
(14)
Для решения поставленной задачи оптимального управления в среде визуального программирования Delphi реализовано программное средство, в основу которого положен разработанный комбинированный алгоритм.
Численное решение системы обыкновенных дифференциальных уравнений (9) с начальными условиями (11) найдено с помощью метода Рунге – Кутты четвертого порядка.
Разработанный алгоритм применен со следующими параметрами: s0 = 0,01, count_u = 40, maxf = 10, sel = 15, klon = 10, mut = 0,5, ε1 = ε2 = 10–4.
В результате решения задачи (9)–(13) с помощью разработанного алгоритма определено оптимальное управление u*(t) (рис. 1) и соответствующая ему оптимальная траектория процесса (рис. 2). При этом а
Для оценки решения задачи (9)–(13), найденного с помощью разработанного комбинированного алгоритма, сравним его с решением, полученным в работе В. А. Срочко с помощью метода игольчатой линеаризации (обозначим его ) 1.
Согласно В. А. Срочко,
Относительная погрешность рассчитанного вектора оптимального управления u* составила δ(u*) = 1,9 %, поэтому можно сделать вывод о корректной работе комбинированного алгоритма решения задачи оптимального управления химико-технологическим процессом с терминальными ограничениями.
Fig. 1. Optimal control
Обсуждение и заключение
Таким образом, разработанный алгоритм позволяет найти решение задачи оптимального управления химико-технологическим процессом при наличии ограничений на фазовые переменные и на параметр управления. Работа алгоритма основана на применении метода штрафов и метода искусственных иммунных систем. С помощью метода штрафов исходная задача с терминальными ограничениями сводится к задаче оптимального управления без ограничений, решение которой ищется с помощью метода искусственных иммунных систем. Особенностью разработанного алгоритма решения задачи оптимального управления с терминальными ограничениями является независимость от начальной точки поиска решения.
С помощью алгоритма проведен вычислительный эксперимент для модельной задачи оптимального управления химико-технологическим процессом. В результате расчетов определены параметры оптимального управления, обеспечивающего достижение минимального значения критерия оптимальности, и соответствующая оптимальная траектория процесса. Приведено сравнение полученного численного решения модельной задачи с решением, рассчитанным с помощью метода игольчатой линеаризации. Показано, что относительная погрешность найденного решения не превышает 2 %.
1 Срочко В. А. Итерационные методы решения задач оптимального управления. М. : Физматлит, 2000. 160 с. URL: https://search.rsl.ru/ru/record/01000686861 (дата обращения: 10.05.2022).
Об авторах
Евгения Викторовна Антипина
Стерлитамакский филиал Башкирского государственного университета
Автор, ответственный за переписку.
Email: stepashinaev@ya.ru
ORCID iD: 0000-0002-8458-9638
ResearcherId: AAG-2956-2021
младший научный сотрудник научно-инновационного управления, кандидат физико-математических наук
Россия, 453103, г.Стерлитамак, пр. Ленина, д. 49Светлана Анатольевна Мустафина
Башкирский государственный университет
Email: mustafina_sa@mail.ru
ORCID iD: 0000-0002-6363-1665
проректор по научной и инновационной работе, заведующий кафедрой математического моделирования, доктор физико-математических наук, профессор
Россия, 450076, г. Уфа, ул. Заки Валиди, д. 32Андрей Федорович Антипин
Стерлитамакский филиал Башкирского государственного
Email: andrejantipin@ya.ru
ORCID iD: 0000-0002-9151-4167
доцент кафедры прикладной информатики и программирования, кандидат технических наук
Россия, 453103, г. Стерлитамак, пр. Ленина, д. 49Николай Данилович Морозкин
Башкирский государственный университет
Email: morozkinnd@mail.ru
президент, доктор физико-математических наук, профессор
Россия, 450076, г. Уфа, ул. Заки Валиди, д. 32Список литературы
- Численный алгоритм решения задачи оптимального управления с терминальными ограничениями для динамических систем / Е. В. Антипина [и др.] // Автометрия. 2020. Т. 56, № 6. С. 132–140.doi: https://doi.org/10.15372/AUT20200615
- Горнов А. Ю. Алгоритмы решения задач оптимального управления с терминальными ограничениями // Вычислительные технологии. 2008. Т. 13, № 4. С. 44–50. URL: https://elibrary.ru/item.asp?id=11913113 (дата обращения: 10.05.2022).
- Benita F., Mehlitz P. Optimal Control Problems with Terminal Complementarity Constraints // SIAM Journal on Optimization. 2018. Vol. 28, Issue 4. P. 3079–3104. doi: https://doi.org/10.1137/16M107637X
- Iori T., Kawano Yu., Ohtsuka T. Algebraic Approach to Nonlinear Optimal Control Problems with Terminal Constraints: Sufficient Conditions for Existence of Algebraic Solutions // SICE Journal of Control, Measurement, and System Integration. 2018. Vol. 11, Issue 3. P. 198–206. doi: https://doi.org/10.9746/jcmsi.11.198
- Карамзин Д. Ю. Принцип максимума Понтрягина для задачи оптимального управления с фазовыми ограничениями при ослабленных предположениях управляемости // Вопросы теории безопасности и устойчивости систем. 2018. № 20. С. 46–61. URL: https://elibrary.ru/item.asp?id=36422015 (дата обращения: 10.05.2022).
- Арутюнов А. В., Жуков Д. А. Исследование одной линейной задачи оптимального управления с фазовыми ограничениями // Владикавказский математический журнал. 2010. Т. 12, № 1.С. 3–9. URL: http://mi.mathnet.ru/rus/vmj/v12/i1/p3 (дата обращения: 10.05.2022).
- Longla M. Pontryagin’s Principle of Maximum for Linear Optimal Control Problems with Phase Constraints in Infinite Dimensional Spaces // Discrete and Continuous Models and Applied Computational Science. 2008. Issue 4. P. 5–19. URL: https://journals.rudn.ru/miph/article/view/8586 (дата обращения:10.05.2022).
- Bergounioux M., Bourdin L. Pontryagin Maximum Principle for General Caputo Fractional Optimal Control Problems with Bolza Cost and Terminal Constraints // ESAIM: Control, Optimisation and Calculus of Variations. 2020. Vol. 26. P. 38. doi: https://doi.org/10.1051/cocv/2019021
- Smith S., Mayne D. Q. Exact Penalty Algorithm for Optimal Control Problems with Control and Terminal Constraints // International Journal of Control. 1988. Vol. 48, Issue 1. P. 257–271. doi: https://doi.org/10.1080/00207178808906173
- Gugat M., Zuazua E. Exact Penalization of Terminal Constraints for Optimal Control Problems // Optimal Control Applications and Methods. 2016. Vol. 37, Issue 6. P. 1329–1354. doi: https://doi.org/10.1002/oca.2238
- Gao X., Zhang X., Wang Y. A Simple Exact Penalty Function Method for Optimal Control Problem with Continuous Inequality Constraints [Электронный ресурс] // Abstract and Applied Analysis.2014. Vol. 2014. doi: https://doi.org/10.1155/2014/752854
- Malisani P., Chaplais F., Petit N. An Interior Penalty Method for Optimal Control Problems with State and Input Constraints of Nonlinear Systems // Optimal Control Applications and Methods. 2014.Vol. 37, Issue 1. P. 3–33. doi: https://doi.org/10.1002/oca.2134
- Pan L. P., Teo K. L. Linear-Nonquadratic Optimal Control Problems with Terminal Inequality Constraints // Journal of Mathematical Analysis and Applications. 1997. Vol. 212, Issue 1. P. 176–189. doi:https://doi.org/10.1006/jmaa.1997.5489
- Duan Y. Application of Penalty Function Method and the Conjugate Gradient Method in Economic Scheduling of Cascade Hydropower Stations // IFAC Proceedings Volumes. 1986. Vol. 19, Issue 10.P. 227–232. doi: https://doi.org/10.1016/S1474-6670(17)59671-8
- An Exact Penalty Method for Free Terminal Time Optimal Control Problem with Continuous Inequality Constraints / C. Jiang [et. al.] // Journal of Optimization Theory and Applications. 2012. Vol. 154.P. 30–53. doi: https://doi.org/10.1007/s10957-012-0006-9
- Biegler L. T. Integrated Optimization Strategies for Dynamic Process Operations // TheoreticalFoundations of Chemical Engineering. 2017. Vol. 51, Issue 6. P. 910–927. doi: https://doi.org/10.1134/S004057951706001X
- Optimized Choice of Parameters in Interiorpoint Methods for Linear Programming / L.-R. Santos [et. al.] // Computational Optimization and Applications. 2019. Vol. 73. P. 535–574. doi: https://doi.org/10.1007/s10589-019-00079-9
- Карпенко А. П., Щербакова Н. О., Буланов В. А. Гибридный алгоритм глобальной оптимизации на основе алгоритмов искусственной иммунной системы и роя частиц // Машиностроение и компьютерные технологии. 2014. № 3. С. 255–274. URL: https://clck.ru/uwmDo (дата обращения:10.05.2022).
- Wei Y. H., Wang J. Z. An Artificial Immune System Approach to Business Process Mining // AMR. 2012. Vol. 472–475. P. 35–38. doi: https://doi.org/10.4028/www.scientific.net/amr.472-475.35
- Search for the Optimal Ratio of the Initial Substances of a Chemical Reaction Based on Evolutionary Calculations / S. Mustafina [et. al.] // ARPN Journal of Engineering and Applied Sciences. 2020. Vol. 15,Issue 1. P. 56–60. URL: http://www.arpnjournals.org/jeas/research_papers/rp_2020/jeas_0120_8067.pdf(дата обращения: 10.05.2022).
- Михерский Р. М. Применение искусственной иммунной системы для распознавания зрительных образов // Компьютерная оптика. 2018. Т. 42, № 1. С. 113–117. doi: https://doi.org/10.18287/2412-6179-2018-42-1-113-117
- Самигулина Г. А. Разработка интеллектуальных экспертных систем прогнозирования и управления на основе искусственных иммунных систем // Теоретическая информатика. 2009.Вып. 4. С. 15–22. URL: https://clck.ru/uvy6P (дата обращения: 10.05.2022).
- Бардачев Ю. Н., Дидык А. А. Использование положений теории опасности в искусственных иммунных системах // Автоматика, автоматизация, электротехнические комплексы и системы.2007. № 2. С. 107–111. URL: https://aaecs.org/bardachev-yun-didik-aa-ispolzovanie-polojenii-teoriiopasnosti-v-iskusstvennih-immunnih-sistemah.html (дата обращения: 10.05.2022).
- Artificial Immune Systems Optimization Approach for Multiobjective Distribution System Reconfiguration / F. R. Alonso [et al.] // IEEE Transactions on Power Systems. 2015. Vol. 30, Issue 2. P. 840–847.doi: https://doi.org/10.1109/TPWRS.2014.2330628
- Антипина Е. В., Мустафина С. А., Антипин А. Ф. Поиск оптимальных режимных параметров каталитического процесса на основе эволюционных вычислений // Теоретические основы химической технологии. 2022. Т. 56, № 2. С. 158–166. URL: https://sciencejournals.ru/view-article/?j=toht&y=2022&v=56&n=2&a=TOHT2202003Antipina (дата обращения: 10.05.2022).
- Clonal Optimization-Based Negative Selection Algorithm with Applications in Motor Fault Detection / X. Z. Gao [et. al.] // Neural Computing and Applications. 2009. Vol. 18, Issue 7. P. 719–729. doi:https://doi.org/10.1007/s00521-009-0276-9
- Antipina E. V., Mustafina S. A., Antipin A. F. Algorithm of Solving a Multiobjective Optimization Problem on the Basis of a Kinetic Chemical Reaction Model // Optoelectronics, Instrumentation and Data Processing. 2021. Vol. 57, Issue 6. P. 668–674. URL: https://jglobal.jst.go.jp/en/detail?JGLOBAL_ID=202202234405460173 (дата обращения: 10.05.2022).
- Антипина Е. В., Антипин А. Ф. Алгоритм расчета оптимальных начальных концентраций веществ химических реакций // Вестник Технологического университета. 2017. Т. 20, № 13.С. 84–87. URL: https://elibrary.ru/item.asp?id=29745220 (дата обращения: 10.05.2022).
