Простейшая дифференциальная игра на плоскости с четырьмя участниками
- Авторы: Ширяев В.Д.1, Шагилова Е.В.1
-
Учреждения:
- ФГБОУ ВО «МГУ им. Н. П. Огарёва»
- Выпуск: Том 29, № 1 (2019)
- Страницы: 40-50
- Раздел: Информатика, вычислительная техника и управление
- Статья получена: 04.09.2025
- Статья одобрена: 04.09.2025
- Статья опубликована: 12.09.2025
- URL: https://ogarev-online.ru/2658-4123/article/view/308146
- DOI: https://doi.org/10.15507/2658-4123.029.201901.040-050
- ID: 308146
Цитировать
Полный текст
Аннотация
Введение. В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки перемещаются на плоскости и совершают простое движение. Рассматриваемая игра сводится к кооперативной дифференциальной игре. Показывается динамическая устойчивость таких принципов оптимальности, как С-ядро и вектор Шепли.
Материалы и методы. Для анализа и решения кооперативной дифференциальной игры применяются стандартные процедуры кооперативной теории игр. Условно-оптимальные траектории, вдоль которых осуществляется движение игроков, находятся с использованием принципа максимума Понтрягина. При построении характеристической функции используется минимаксный подход.
Результаты исследования. В явном виде выписаны оптимальные управления (стратегии) игроков, а также условно-оптимальные траектории их движения при различных способах образования коалиций. Характеристическая функция построена в соответствии с принятым принципом максимина, а в качестве решения рассматриваются С-ядро и вектор Шепли. В явном виде выписаны компоненты вектора Шепли, показана принадлежность вектора Шепли С-ядру, а также непустота С-ядра при движении игроков вдоль оптимальной траектории. Используя результаты статической кооперативной теории игр при исследовании дифференциальных игр, исследователи сталкиваются с проблемами, которые связаны со спецификой дифференциальных уравнений движения. В качестве первоочередной здесь выступает проблема динамической устойчивости рассматриваемых принципов оптимальности. В работе показывается динамическая устойчивость вектора Шепли и С-ядра.
Обсуждение и заключение. Результаты, полученные в ходе проведенного исследования, показывают целесообразность анализа динамической устойчивости рассматриваемых принципов оптимальности.
Ключевые слова
Полный текст
Введение
Процессы преследования являются типичными примерами дифференциальных игр. Различные методы поведения сторон в конфликтных ситуациях со многими участниками и в играх с неполной информацией моделируются прежде всего на примерах простого преследования. Несмотря на внешнюю простоту постановки, многие задачи простого преследования сами по себе являются серьезными математическими проблемами.
Одним из подходов к изучению таких дифференциальных игр является использование кооперативной теории, когда они рассматриваются как кооперативные дифференциальные игры. С учетом того, что движения игроков описываются дифференциальными уравнениями, возникает вопрос об устойчивости (состоятельности во времени) рассматриваемых принципов оптимальности. Отказ от данной концепции содержит в себе возможность отклонения от первоначально выбранного оптимального поведения в состояниях, в которых появляется новое оптимальное решение, не являющееся таковым в первоначальном смысле, что приводит к нарушению устойчивости процесса в целом.
В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки совершают простое движение1 [1; 2], т. е. перемещаются на плоскости с ограниченной или постоянной по величине скоростью, при этом направление движения может меняться произвольным образом. Исследуется неантагонистическая кооперативная дифференциальная игра четырех лиц из начального состояния и продолжительностью T ‒ t0. Уравнения движения имеют вид:
, (1)
. (2)
В равенстве (1) .
Функция выигрыша игрока i определяется следующим образом:
где – решение системы (1)–(2) при допустимых управлениях u1, u2, u3, u4,
Обзор литературы
Задачи простого преследования рассматривались в ряде работ2; 3 [1–5]. Так, в исследованиях Л. А. Петросяна, В. Д. Ширяева и Р. Р. Бикмурзиной4 [1; 2] решение задачи было найдено в предположении о том, что очередность встреч выбирается в начальный момент времени (программно), а игроки движутся по прямым линиям. В статье Т. Г. Абрамянц, В. П. Маслова и Е. Я. Рубиновича [4] рассмотрены возможности выбора очередности встреч как программно, так и позиционно, а в работе И. И. Шевченко [5] приведено решение поставленной задачи с использованием подхода Р. Айзекса. В исследовании В. Д. Ширяева, Н. М. Куляшовой и О. О. Виноградовой5 при решении задачи в основном использовались геометрические методы. При изучении таких игр часто используется методология кооперативной теории игр6 [6–8]. В качестве принципа оптимальности в основном рассматривается С-ядро. Однако вопрос исследования выбранного принципа оптимальности осложняется тем, что в таких задачах необходимо учитывать его динамическую устойчивость.
Впервые понятие динамической устойчивости решений в дифференциальных играх как с интегральными, так и с терминальными выигрышами ввел Л. А. Петросян [6; 9–11]; он же предложил и пути преодоления динамической неустойчивости принципов оптимальности [8; 10–13]. Несколько позже в западных странах независимо от вышеназванных исследований возник интерес к указанным вопросам, и проблема получила название «time-consistency problem» (проблема состоятельности во времени) [14–16]. Однако в большинстве случаев подобный интерес ограничивался лишь констатацией проблемы, и в упомянутых работах не рассматривались вопросы, связанные с решением вопроса несостоятельности во времени, что крайне важно для практических приложений.
Материалы и методы
В статье при переходе к рассмотрению исследуемой дифференциальной игры с простым движением как кооперативной дифференциальной игры при построении характеристической функции был предложен общепринятый принцип максимина. Для нахождения оптимальных траекторий и оптимальных управлений (стратегий) игроков использовался принцип максимума Понтрягина. При исследовании С-ядра на устойчивость использовался явный вид условий непустоты игры четырех лиц.
Результаты исследования
Введем следующие обозначения:
Вычислим значение характеристической функции:
Для нахождения воспользуемся принципом максимума [17]. Для рассматриваемой задачи
Сопряженное уравнение примет вид:
Т. к. рассматривается задача со свободным правым концом и, следовательно, p(T) = 0, то
Тогда
Итак, следует найти
;
max H1 достигается при .
Следовательно,
Аналогично находим, что
Тогда
И, следовательно,
если
если
если
Таким образом,
Рассмотрим С-ядро (Сv(T-t0, z0)) данной игры.
Теорема 1
Доказательство
Необходимым и достаточным условием непустоты С-ядра в игре четырех лиц является выполнение следующих неравенств7:
В нашем случае эти неравенства примут вид:
Покажем справедливость этих неравенств.
Аналогично доказывается, что
Рассмотрим теперь вектор Шепли. Формулы для нахождения компонентов вектора Шепли примут вид:
(3)
Подставляя значения в выражение (3), получим:
В случае кооперативной дифференциальной игры характеристическая функция зависит от времени, поэтому решение кооперативной дифференциальной игры изменяется в каждый момент времени. В связи с этим естественным является вопрос о динамической устойчивости рассматриваемых принципов оптимальности [6; 9–11].
Перейдем к формальному определению принципа динамической устойчивости в игре .
Пусть – условно-оптимальная траектория в игре , – текущие игры с решениями
где
Предположим, что для всех t0 ≤ t ≤ T.
Определение 1 [6; 7; 11]
Дележ будем называть устойчивым в игре , если существует интегрируемая на [t0, T] вектор-функция β(t) и такая дифференцируемая на [t0, T] вектор-функция ξ (t), что дележ ξ представим в виде:
и для всех существует такое подмножество множества что
Определение 2
Решение называется устойчивым, если устойчивы все входящие в него дележи. В таком случае условно-оптимальная траектория называется оптимальной.
Данный способ реализации дележа зависит от выбора функции β(τ) и, следовательно, является неоднозначным. Однако он обладает важным свойством: в каждый момент времени игроки ориентируются на один и тот же принцип оптимальности, придерживаются выбранного оптимального управления и поэтому не имеют оснований для нарушения ранее принятого соглашения.
В качестве решения рассмотрим С-ядро игры , которое обозначим через .
Как было показано выше, где – условно оптимальная траектория. Выведем необходимое условие динамической устойчивости С-ядра в кооперативной дифференциальной игре с интегральными выигрышами.
Теорема 2
Для того чтобы С-ядро кооперативной дифференциальной игры с интегральными выигрышами было динамически устойчивым, необходимо, чтобы для каждого дележа имело место представление
где вектор-функция β(t) в каждый момент удовлетворяет условиям:
Доказательство теоремы аналогично доказательству из работ Л. А. Петросяна, Н. Н. Данилова и Д. В. Кузютина [9; 12].
Исследуем теперь динамическую устойчивость вектора Шепли.
Теорема 3
В рассматриваемой игре вектор Шепли динамически устойчив.
Доказательство
Взяв βi(τ) равным
получим, что
Теорема доказана
Обсуждение и заключение
В работе в явном виде найдены оптимальные стратегии и траектории движения игроков. В качестве принципов оптимальности рассмотрены С-ядро и вектор Шепли. Выбранные принципы оптимальности оказались динамически устойчивыми, и, следовательно, у игроков нет оснований для завершения игры. Исследованная задача показала реализуемость идеи устойчивости рассматриваемых принципов оптимальности.
Попытки применить динамически неустойчивые принципы оптимальности при решении практических задач приводят, как правило, к грубым ошибкам, в результате которых «оптимальные» решения оказываются нереализованными. Именно динамическая неустойчивость была причиной невыполнения многих долгосрочных проектов и нарушения многосторонних договоренностей.
1 Ширяев В. Д., Бикмурзина Р. Р. Простое преследование на плоскости с четырьмя участниками // В мире науки и инноваций : сб. науч. ст. междунар. науч.-практ. конф. В 3 ч. Ч. 3. Уфа : АЭТЕРНА, 2016. С. 6–8.
2 Ширяев В. Д., Куляшова Н. М., Виноградова О. О. Геометрический подход к решению игр простого преследования со многими участниками. Деп. ВИНИТИ № 1254 – В 98 от 22.04.1998 г. 26 с.
3 Ширяев В. Д., Бикмурзина Р. Р. Простое преследование на плоскости с четырьмя участниками.
4 Там же.
5 Ширяев В. Д., Куляшова Н. М., Виноградова О. О. Геометрический подход к решению игр простого преследования со многими участниками.
6 Ширяев В. Д., Нестерова Т. Н, Боткина И. А. Простейшая дифференциальная игра четырех лиц. Деп ВИНИТИ № 954 – В 2005 от 07.07.2005. 14 с.
7 Ширяев В. Д. С-ядро в играх четырех лиц // Сборник научных трудов SWorld. 2013. T. 4, № 4. С. 79–85.
Об авторах
Виктор Дмитриевич Ширяев
ФГБОУ ВО «МГУ им. Н. П. Огарёва»
Email: shiryaevvd@mail.ru
ORCID iD: 0000-0003-0497-3769
ResearcherId: B-8540-2019
профессор, кафедра фундаментальной информатики, кандидат физико-математических наук, доцент
Россия, 430005, г. Саранск, ул. Большевистская, д. 68/1Елена Викторовна Шагилова
ФГБОУ ВО «МГУ им. Н. П. Огарёва»
Автор, ответственный за переписку.
Email: shagilova_elena@mail.ru
ORCID iD: 0000-0003-0267-6082
ResearcherId: B-8524-2019
доцент, кафедра фундаментальной информатики, кандидат педагогических наук, доцент
Россия, 430005, г. Саранск, ул. Большевистская, д. 68/1Список литературы
- Петросян Л. А., Ширяев В. Д. Групповое преследование одним преследователем нескольких преследуемых // Вестник Ленинградского университета. Сер. 1: Математика, механика и астрономия. 1980. № 13. С. 50–57.
- Ширяев В. Д. О задачах простого преследования с четырьмя участниками // Математическое моделирование сложных систем. СПб., 1999. С. 52–53.
- Петросян Л. А., Рихсиев Б. Б. Преследование на плоскости. М. : Наука, 1991. 96 с.
- Абрамянц Т. Г., Маслов Е. П., Рубинович Е. Я. Простейшая дифференциальная игра поочередного преследования // Автоматика и телемеханика. 1980. № 8. С. 5–15. URL:http://www.mathnet.ru/links/18b651a96ec80bd34126bef353968bc9/at7146.pdf
- Шевченко И. И. О поочередном преследовании // Автоматика и телемеханика. 1981. № 11.С. 54–59. URL: http://www.mathnet.ru/links/56042ca7de6dcc2aca19b4094cf18822/at6041.pdf
- Петросян Л. А. Устойчивость решений дифференциальных игр со многими участниками //Вестник Ленинградского университета. Cер. 1: Математика. Механика. Астрономия. 1977. № 4.С. 46–52.
- Ширяев В. Д., Бикмурзина Р. Р. Динамическая устойчивость решения в простой дифференциальной игре четырех лиц // Научные труды SWorld. 2015. Т. 7, вып. 2 (39). С. 60–64. URL:http://www.sworld.com.ua/konfer39/97.pdf
- Petrosjan L. A. Strongly time consistent optimality principles in the games with discount payoffs //Lecture Notes in Control and Information Sciences. 1994. No. 197. P. 513–520.
- Петросян Л. А., Данилов Н. Н. Устойчивость решений в неантагонистических дифференциальных играх с трансферабельными выигрышами // Вестник Ленинградского университета.Сер. 1 : Математика. Механика. Астрономия. 1979. № 1. С. 52–59.
- Петросян Л. А. Построение сильно динамически устойчивых решений в кооперативных дифференциальных играх // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика и астрономия. 1992. № 4. С. 33–38.
- Петросян Л. А. Сильно динамически устойчивые дифференциальные принципы оптимальности // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика, астрономия.1993. № 4. С. 40–46.
- Петросян Л. А., Кузютин Д. В. Устойчивые решения позиционных игр. СПб. : Изд-во СПбГУ, 2008. 326 с.
- Yeung D. W. K., Petrosyan L. A. Subgame consistent cooperative solutions in stochastic differential games // Journal of Optimization Theory and Applications. 2004. Vol. 120, Issue 3. P. 651–666.DOI: https://doi.org/10.1023/B:JOTA.0000025714.04164.e4
- Kreps D. M., Ramey G. Structural consistency, consistency, and sequential rationality // Econometrica.1987. Vol. 55, Issue 6. P. 1331–1348. DOI: https://doi.org/10.2307/1913559
- Peleg B., Tijs S. The consistency principle for games in strategic form // International Journal of Game Theory. 1996. Vol. 25, Issue 1. P. 13–34. DOI: https://doi.org/10.1007/BF01254381
- Kydland F. E., Prescott E. C. Rules rather than discretion: the inconsistency of optimal plans //The Journal of Political Economy. 1977. Vol. 85, no. 3. P. 473–492. URL: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.603.6853&rep=rep1&type=pdf
- Математическая теория оптимальных процессов / Л. С. Понтрягин [и др.]. 2-е изд. М. :Наука, 1969. 384 с.
Дополнительные файлы
