Конкуренция среди фирм, использующих алгоритмы динамического ценообразования

Обложка

Цитировать

Полный текст

Аннотация

развитие современных технологий сбора и анализа данных приводит к все большей автоматизации ценообразования на товарных рынках. Все больше фирм применения алгоритмы ценообразования, последствия использования которых остаются неясными. В большинстве исследований рассматриваются подобные алгоритмы в случае, когда фирма является монополистом. В текущей же работе сравнивается ряд алгоритмов динамического ценообразования в конкурентной среде. Предполагается, что две фирмы используют алгоритмы независимо друг от друга и не знают о выборе алгоритма своего оппонента. Через череду «дуэлей» алгоритмов сравнивается несколько алгоритмов: два простых алгоритма, основанных на проблеме «многорукого бандита», параметрический алгоритм, основанный на обучении взвешенной линейнной регрессии, а также Q-learning алгоритм. Результаты показывают, что использование разных алгоритмов может приводить к дисперсии цен. Также сложность алгоритма не всегда означает большую прибыль фирмы. Работа также показывает, что, если бы фирмы выбирали алгоритмы ценообразования некооперативно в игре по выборе алгоритма, то на рынке могло бы сложиться два равновесия по Нэшу: симметричное равновесие, где обе фирмы выбирают сложные Q-learning алгоритмы и получают низкую прибыль, и асимметричное равновесие, где фирмы выбирают разные алгоритмы, получают большую прибыль, но одна фирма является лидером.

Об авторах

П. С Пронин

Российский экономический университет им. Г.В. Плеханова

Список литературы

  1. Alamdar P., Seifi A. deep Q-learning approach to optimize ordering and dynamic pricing decisions in the presence of strategic customers // International Journal of Production Economics. 2024. № 269. P. 109 – 154.
  2. Berry S., Levinsohn J., Pakes A.Automobile prices in market equilibrium // Econometrica. 1995. № 63 (4). P. 841 – 890.
  3. Burman V., Vashishtha R.K., Kumar R., Ramanan S. Deep reinforcement learning for dynamic pricing of perishable products // International Conference on Optimization and Learning. Cham: Springer International Publishing, 2021. P. 132 – 143.
  4. Calvano E., Calzolari G., Denicolo V., Pastorello S. Artificial intelligence, algorithmic pricing, and collusion // American Economic Review. 2020. № 110 (10). P. 3267 – 3297.
  5. Cavallo A. More Amazon effects: online competition and pricing behaviors // National Bureau of Economic Research. 2018. № 25138. P. 1 – 37.
  6. Den Boer A.V. Dynamic pricing and learning: Historical origins, current research, and new directions // Surveys in operations research and management science. 2015. № 20 (1). P. 1 – 8.
  7. Den Boer A.V., Keskin N.B. Dynamic pricing and demand learning in nonstationary environments // The Elements of Joint Learning and Optimization in Operations Management. Cham: Springer International Publishing, 2022. P. 137 – 150.
  8. Den Boer A.V., Zwart B. Simultaneously learning and optimizing using controlled variance pricing // Management science. 2014. № 60 (3). P. 770 – 783.
  9. Deng S., Schiffer M., Bichler M.Algorithmic collusion in dynamic pricing with deep reinforcement learning // arXiv preprint. 2024. № 2406.02437. P. 1 – 20.
  10. Elreedy D.A. F. Atiya, S. I. Shaheen Novel pricing strategies for revenue maximization and demand learning using an exploration–exploitation framework // Soft Computing. 2021. № 25 (17). P. 11711 – 11733.
  11. Huang Y.P.B., Ellickson M.J. Lovett Learning to set prices // Journal of Marketing Research. 2022. № 59 (2). P. 411 – 434.
  12. Kastius A.R. Schlosser Dynamic pricing under competition using reinforcement learning // Journal of Revenue and Pricing Management. 2021. № 21 (1). P. 50 – 63.
  13. Klein T. Autonomous algorithmic collusion: Q?learning under sequential pricing // The RAND Journal of Economics. 2021. № 52 (3). P. 538 – 558.
  14. Kleinberg R.T. Leighton The value of knowing a demand curve: Bounds on regret for online posted-price auctions // 44th Annual IEEE Symposium on Foundations of Computer Science. 2003. P. 594 – 605.
  15. Luo Y.W.W. Sun Y. Liu Distribution-free contextual dynamic pricing // Mathematics of Operations Research. 2024. № 49 (1). P. 599 – 618.
  16. Meylahn J.M., Den A.V. Boer Learning to collude in a pricing duopoly // Manufacturing & Service Operations Management. 2022. № 24 (5). P. 2577 – 2594.
  17. Misra K.E.M., Schwartz J. Abernethy Dynamic online pricing with incomplete information using multiarmed bandit experiments // Marketing Science. 2019. № 38 (2). P. 226 – 252.
  18. Slivkins A. Introduction to multi-armed bandits // Foundations and Trends® in Machine Learning. 2019. № 12. P. 1 – 286.
  19. Sutton R.S., Barto A.G. Reinforcement Learning: An Introduction. 2 изд. Cambridge: MIT Press, 2018. 552 p.
  20. Trovo F., Paladino S., Restelli M., Gatti N. Multi-armed bandit for pricing // Proceedings of the 12th European Workshop on Reinforcement Learnin. 2015. P. 1 – 9.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).