A Simplest Differential Game on a Plane with Four Participants
- Autores: Shiryayev V.D.1, Shagilova E.V.1
-
Afiliações:
- National Research Mordovia State University
- Edição: Volume 29, Nº 1 (2019)
- Páginas: 40-50
- Seção: Информатика, вычислительная техника и управление
- ##submission.dateSubmitted##: 04.09.2025
- ##submission.dateAccepted##: 04.09.2025
- ##submission.datePublished##: 12.09.2025
- URL: https://ogarev-online.ru/2658-4123/article/view/308146
- DOI: https://doi.org/10.15507/2658-4123.029.201901.040-050
- ID: 308146
Citar
Texto integral
Resumo
Introduction. The article presents a simplest differential game with four participants. The players move on a plane and can do simple movements. The game under considering comes down to a cooperative differential game. The dynamic stability of such optimality principles as the S-kernel and Shapley vector is shown.
Materials and Methods. The standard procedures of the cooperative game theory are applied to the analysis and decision of a cooperative differential game. The conditional and optimum trajectories, along which the players move, are found using the Pontryagin’s maximum principle. When constructing the characteristic function, the minimax approach is used.
Results. The optimum strategy of the players, conditional and optimum trajectories of their movements at various ways of formation of coalitions are written out explicitly. The characteristic function is constructed according to the accepted max-min principle; the S-kernel and Shapley vector are considered as a decision. The components of the Shapley vector are written out explicitly; the fact that the Shapley vector is an element of the S-kernel and nonemptiness of the S-kernel, when the players are moving along an optimum trajectory, are shown. Using the results of the static cooperative game theory for researching differential games, we face the problems, which are connected with specifics of the differential equations of the movement. As a priority, the problem of the dynamic stability of the optimality principles under consideration is identified. In the work, the dynamic stability of the Shapley vector and S-kernel is shown.
Discussion and Conclusion. The results of the research show that the analysis of the dynamic stability of the optimality principles considered is relevant.
Texto integral
Введение
Процессы преследования являются типичными примерами дифференциальных игр. Различные методы поведения сторон в конфликтных ситуациях со многими участниками и в играх с неполной информацией моделируются прежде всего на примерах простого преследования. Несмотря на внешнюю простоту постановки, многие задачи простого преследования сами по себе являются серьезными математическими проблемами.
Одним из подходов к изучению таких дифференциальных игр является использование кооперативной теории, когда они рассматриваются как кооперативные дифференциальные игры. С учетом того, что движения игроков описываются дифференциальными уравнениями, возникает вопрос об устойчивости (состоятельности во времени) рассматриваемых принципов оптимальности. Отказ от данной концепции содержит в себе возможность отклонения от первоначально выбранного оптимального поведения в состояниях, в которых появляется новое оптимальное решение, не являющееся таковым в первоначальном смысле, что приводит к нарушению устойчивости процесса в целом.
В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки совершают простое движение1 [1; 2], т. е. перемещаются на плоскости с ограниченной или постоянной по величине скоростью, при этом направление движения может меняться произвольным образом. Исследуется неантагонистическая кооперативная дифференциальная игра четырех лиц из начального состояния и продолжительностью T ‒ t0. Уравнения движения имеют вид:
, (1)
. (2)
В равенстве (1) .
Функция выигрыша игрока i определяется следующим образом:
где – решение системы (1)–(2) при допустимых управлениях u1, u2, u3, u4,
Обзор литературы
Задачи простого преследования рассматривались в ряде работ2; 3 [1–5]. Так, в исследованиях Л. А. Петросяна, В. Д. Ширяева и Р. Р. Бикмурзиной4 [1; 2] решение задачи было найдено в предположении о том, что очередность встреч выбирается в начальный момент времени (программно), а игроки движутся по прямым линиям. В статье Т. Г. Абрамянц, В. П. Маслова и Е. Я. Рубиновича [4] рассмотрены возможности выбора очередности встреч как программно, так и позиционно, а в работе И. И. Шевченко [5] приведено решение поставленной задачи с использованием подхода Р. Айзекса. В исследовании В. Д. Ширяева, Н. М. Куляшовой и О. О. Виноградовой5 при решении задачи в основном использовались геометрические методы. При изучении таких игр часто используется методология кооперативной теории игр6 [6–8]. В качестве принципа оптимальности в основном рассматривается С-ядро. Однако вопрос исследования выбранного принципа оптимальности осложняется тем, что в таких задачах необходимо учитывать его динамическую устойчивость.
Впервые понятие динамической устойчивости решений в дифференциальных играх как с интегральными, так и с терминальными выигрышами ввел Л. А. Петросян [6; 9–11]; он же предложил и пути преодоления динамической неустойчивости принципов оптимальности [8; 10–13]. Несколько позже в западных странах независимо от вышеназванных исследований возник интерес к указанным вопросам, и проблема получила название «time-consistency problem» (проблема состоятельности во времени) [14–16]. Однако в большинстве случаев подобный интерес ограничивался лишь констатацией проблемы, и в упомянутых работах не рассматривались вопросы, связанные с решением вопроса несостоятельности во времени, что крайне важно для практических приложений.
Материалы и методы
В статье при переходе к рассмотрению исследуемой дифференциальной игры с простым движением как кооперативной дифференциальной игры при построении характеристической функции был предложен общепринятый принцип максимина. Для нахождения оптимальных траекторий и оптимальных управлений (стратегий) игроков использовался принцип максимума Понтрягина. При исследовании С-ядра на устойчивость использовался явный вид условий непустоты игры четырех лиц.
Результаты исследования
Введем следующие обозначения:
Вычислим значение характеристической функции:
Для нахождения воспользуемся принципом максимума [17]. Для рассматриваемой задачи
Сопряженное уравнение примет вид:
Т. к. рассматривается задача со свободным правым концом и, следовательно, p(T) = 0, то
Тогда
Итак, следует найти
;
max H1 достигается при .
Следовательно,
Аналогично находим, что
Тогда
И, следовательно,
если
если
если
Таким образом,
Рассмотрим С-ядро (Сv(T-t0, z0)) данной игры.
Теорема 1
Доказательство
Необходимым и достаточным условием непустоты С-ядра в игре четырех лиц является выполнение следующих неравенств7:
В нашем случае эти неравенства примут вид:
Покажем справедливость этих неравенств.
Аналогично доказывается, что
Рассмотрим теперь вектор Шепли. Формулы для нахождения компонентов вектора Шепли примут вид:
(3)
Подставляя значения в выражение (3), получим:
В случае кооперативной дифференциальной игры характеристическая функция зависит от времени, поэтому решение кооперативной дифференциальной игры изменяется в каждый момент времени. В связи с этим естественным является вопрос о динамической устойчивости рассматриваемых принципов оптимальности [6; 9–11].
Перейдем к формальному определению принципа динамической устойчивости в игре .
Пусть – условно-оптимальная траектория в игре , – текущие игры с решениями
где
Предположим, что для всех t0 ≤ t ≤ T.
Определение 1 [6; 7; 11]
Дележ будем называть устойчивым в игре , если существует интегрируемая на [t0, T] вектор-функция β(t) и такая дифференцируемая на [t0, T] вектор-функция ξ (t), что дележ ξ представим в виде:
и для всех существует такое подмножество множества что
Определение 2
Решение называется устойчивым, если устойчивы все входящие в него дележи. В таком случае условно-оптимальная траектория называется оптимальной.
Данный способ реализации дележа зависит от выбора функции β(τ) и, следовательно, является неоднозначным. Однако он обладает важным свойством: в каждый момент времени игроки ориентируются на один и тот же принцип оптимальности, придерживаются выбранного оптимального управления и поэтому не имеют оснований для нарушения ранее принятого соглашения.
В качестве решения рассмотрим С-ядро игры , которое обозначим через .
Как было показано выше, где – условно оптимальная траектория. Выведем необходимое условие динамической устойчивости С-ядра в кооперативной дифференциальной игре с интегральными выигрышами.
Теорема 2
Для того чтобы С-ядро кооперативной дифференциальной игры с интегральными выигрышами было динамически устойчивым, необходимо, чтобы для каждого дележа имело место представление
где вектор-функция β(t) в каждый момент удовлетворяет условиям:
Доказательство теоремы аналогично доказательству из работ Л. А. Петросяна, Н. Н. Данилова и Д. В. Кузютина [9; 12].
Исследуем теперь динамическую устойчивость вектора Шепли.
Теорема 3
В рассматриваемой игре вектор Шепли динамически устойчив.
Доказательство
Взяв βi(τ) равным
получим, что
Теорема доказана
Обсуждение и заключение
В работе в явном виде найдены оптимальные стратегии и траектории движения игроков. В качестве принципов оптимальности рассмотрены С-ядро и вектор Шепли. Выбранные принципы оптимальности оказались динамически устойчивыми, и, следовательно, у игроков нет оснований для завершения игры. Исследованная задача показала реализуемость идеи устойчивости рассматриваемых принципов оптимальности.
Попытки применить динамически неустойчивые принципы оптимальности при решении практических задач приводят, как правило, к грубым ошибкам, в результате которых «оптимальные» решения оказываются нереализованными. Именно динамическая неустойчивость была причиной невыполнения многих долгосрочных проектов и нарушения многосторонних договоренностей.
1 Ширяев В. Д., Бикмурзина Р. Р. Простое преследование на плоскости с четырьмя участниками // В мире науки и инноваций : сб. науч. ст. междунар. науч.-практ. конф. В 3 ч. Ч. 3. Уфа : АЭТЕРНА, 2016. С. 6–8.
2 Ширяев В. Д., Куляшова Н. М., Виноградова О. О. Геометрический подход к решению игр простого преследования со многими участниками. Деп. ВИНИТИ № 1254 – В 98 от 22.04.1998 г. 26 с.
3 Ширяев В. Д., Бикмурзина Р. Р. Простое преследование на плоскости с четырьмя участниками.
4 Там же.
5 Ширяев В. Д., Куляшова Н. М., Виноградова О. О. Геометрический подход к решению игр простого преследования со многими участниками.
6 Ширяев В. Д., Нестерова Т. Н, Боткина И. А. Простейшая дифференциальная игра четырех лиц. Деп ВИНИТИ № 954 – В 2005 от 07.07.2005. 14 с.
7 Ширяев В. Д. С-ядро в играх четырех лиц // Сборник научных трудов SWorld. 2013. T. 4, № 4. С. 79–85.
Sobre autores
Viktor Shiryayev
National Research Mordovia State University
Email: shiryaevvd@mail.ru
ORCID ID: 0000-0003-0497-3769
Researcher ID: B-8540-2019
Professor, Chair of Fundamental Informatics, Ph.D. (Physics and Mathematics),
Associate Professor
Elena Shagilova
National Research Mordovia State University
Autor responsável pela correspondência
Email: shagilova_elena@mail.ru
ORCID ID: 0000-0003-0267-6082
Researcher ID: B-8524-2019
Associate Professor, Chair of Fundamental Informatics, Ph.D. (Pedagogy), Associate Professor
Rússia, 68/1 Bolshevistskaya St., Saransk 430005Bibliografia
- Petrosyan L.A., Shiryayev V.D. [Group pursuit with one pursuer and pursued more]. Vestnik Leningradskogo universiteta. Ser. 1: Matematika, mekhanika i astronomiya = Leningrad University Bulletin.Series 1: Mathematics, Mechanics and Astronomy). 1980; 13:50-57. (In Russ.)
- Shiryayev V.D. [On tasks of simple pursuit with four participants]. In: Mathematical Modeling of Complex Systems. St. Petersburg; 1999; 52-53. (In Russ.)
- Petrosyan L.A., Rikhsiyev B.B. [Pursuit on the plane]. Moscow: Nauka Publ., 1991. (In Russ.)
- Abramyants T.G, Maslov Ye.P., Rubinovich Ye.Ya. A simplest differential game of alternate pursuit. Avtomatika i telemekhanika = Automation and Remote Control. 1980; 8:5-15. Available at:http://www.mathnet.ru/links/18b651a96ec80bd34126bef353968bc9/at7146.pdf (In Russ.)
- Shevchenko I.I. On successive pursuit. Avtomatika i telemekhanika = Automation and Remote Control.1981; 11:54-59. Available at: http://www.mathnet.ru/links/56042ca7de6dcc2aca19b4094cf18822/at6041.pdf (In Russ.)
- Petrosyan L.A. [Stability of solutions in differential games with many participants]. Vestnik Leningradskogo universiteta. Ser. 1: Matematika, mekhanika i astronomiya = Leningrad University Bulletin.Series 1: Mathematics, Mechanics and Astronomy. 1977; 4:46-52. (In Russ.)
- Shiryaev V.D., Bikmurzina R.R. Dynamic stability of solution in a simple differential game for four individuals. Nauchnyye trudy SWorld = SWorld Scientific Papers. 2015; 7(2):60-64. Available at: http://www.sworld.com.ua/konfer39/97.pdf (In Russ.)
- Petrosyan L.A. Strongly time consistent optimality principles in the games with discount payoffs.Lecture Notes in Control and Information Sciences. 1994; 197:513-520.
- Petrosyan L.A., Danilov N.N. [The stability of the solutions in nonantagonistic differential games with transferable wins]. Vestnik Leningradskogo universiteta. Ser. 1: Matematika, mekhanika i astronomiya = Leningrad University Bulletin. Series 1: Mathematics, Mechanics and Astronomy.1979; 1:52-59. (In Russ.)
- Petrosyan L.A. [Construction of strongly dynamically stable solutions in cooperative differential games]. Vestnik Leningradskogo universiteta. Ser. 1: Matematika, mekhanika i astronomiya = Leningrad University Bulletin. Series 1: Mathematics, Mechanics and Astronomy. 1992; 4:33-38. (In Russ.)
- Petrosyan L.A. [Strongly dynamically stable differential optimality principles]. Vestnik Sankt-Peterburgskogo universiteta. Ser. 1: Matematika, mekhanika i astronomiya = St. Petersburg University Bulletin. Series 1: Mathematics, Mechanics and Astronomy. 1993; 4:40-46. (In Russ.)
- Petrosyan L.A., Kuzutin D.V. [Stable solutions of positional games]. St. Petersburg UniversityPubl.; 2008. (In Russ.)
- Yeung D.W.K., Petrosyan L.A. Subgame consistent cooperative solutions in stochastic differential games. Journal of Optimization Theory and Applications. 2004; 120(3):651-666. DOI: https://doi.org/10.1023/B:JOTA.0000025714.04164.e4
- Kreps D.M., Ramey G. Structural consistency, consistency and sequential rationality. Econometrica.1987; 55(6):1331-1348. Available at: https://ideas.repec.org/a/ecm/emetrp/v55y1987i6p1331-48.html
- Peleg B., Tijs S. The consistency principle for games in strategic form. International Journal of Game Theory. 1996; 25(1):13-34. DOI: https://doi.org/10.1007/BF01254381
- Kydland F.E., Prescott E.C. Rules rather than decisions: the inconsistency of optimal plan. The Journal of Political Economy. 1977; 85(3):473-492. Available at: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.603.6853&rep=rep1&type=pdf
- Pontryagin L.S., Boltyanskiy V.T., Gamkrelidze R.D., Mishchenko E.M. [Mathematical theory of optimum processes]. 2nd ed. Moscow: Nauka Publ., 1969. (In Russ.)
Arquivos suplementares
