Вычислительная креативность генеративной сети Midjourney в полимодальном пространстве

Обложка

Цитировать

Полный текст

Аннотация

В данной статье исследуется полимодальное пространство в области вычислительной креативности у нейронных сетей. Объектом нашего исследования является полимодальная среда, которая объединяет в себе ряды разнородных кодов для выражения общей идеи, а предметом – возможность создания полимодального цифрового искусства с помощью текстового и голосового промта в генеративной сети Midjourney. Цель исследования – доказать, что вычислительная креативность у машин может быть обнаружена и описана по результатам итераций в процессе создания изображений, что в свою очередь позволит говорить о сложной полимодальной системе как об отдельной цифровой категории полимодальности. Задачи, которые решались в рамках данного исследования: 1) обоснование использования термина полимодальный в контексте вычислительной креативности в цифровом искусстве нейронных сетей; 2) проведение серии тестов с генеративной сетью Midjourney для возможности описания вербально-визуального контента; 3) анализ и выведение алгоритма создания изображения в условиях суммаризации данных и трансформационной креативности.  Нами был использован метод сплошной выборки при сборе языковых единиц по мере их встречаемости; контекстный анализ для систематического описания присутствующих вербальных и невербальных компонентах. Необходимо было провести эксперимент с генеративной сетью Midjourney для выявления закономерностей при создании графического пространства, а далее сравнить и сопоставить результаты итераций с оригинальным изображением. Научная новизна заключается в отсутствии исследований о полимодальном пространстве в контексте нейронных сетей и их генеративной способности. В ходе проведённого эксперимента нами были получены следующие результаты: термин «полимодальность» в контексте генеративной сети Midjourney и её «цифрового искусства» обусловлен наличием трёх каналов: вербального, визуального и голосового (звукового); тесты показали, что способность нейронной сети к созданию изображений посредством промта находится на высоком уровне, однако прослеживаются грубые технические ошибки в системе, которые не позволяют пользователям в полной мере приблизиться к желаемому результату при генерации изображения; суммаризация данных позволяет говорить о наличии черт вычислительной креативности у генеративных сетей, так как в ходе создания изображения возникают новые образы (идеи), ранее не предполагаемые пользователем.

Об авторах

Кристина Петровна Жикулина

Российский университет дружбы народов имени Патриса Лумумбы

Email: christina.zhikulina@gmail.com
ORCID iD: 0000-0003-2488-4616
ассистент; кафедра общего и русского языкознания;аспирант; кафедра общего и русского языкознания;

Виктория Владимировна Костромина

Российский университет дружбы народов имени Патриса Лумумбы

Email: kostromina_vv@pfur.ru
магистр; кафедра общего и русского языкознания;

Список литературы

  1. Белова С.С. Творчество: психологические и компьютерные модели / Психология. Журнал Высшей школы экономики. 2008. Т. 5, №4. С. 112-119.
  2. Гусева А.П. Семиотически гетерогенный художественный текст как содержательно осложненная коммуникация // Вестник Московского государственного лингвистического университета. Гуманитарные науки. 2018. №18 (816). С. 98-109.
  3. Евграфова Ю.А. Лингвосемиотика экрана: моделирование реальности в экранных текстах (на материале текстов кино, телевидения и сети Интернет) : дисс. на соискание ученой степени доктора филологических наук. (10.02.19). МГОУ. – Москва, 2020.
  4. Коломийцева О.Ю., Москалева А.Н. Способы реализации категории полимодальности в англоязычном инстаграм-дискурсе. Вестник Международного института рынка. 2021. №2. С. 115-125.
  5. Коллекция вкладышей популярной жвачки ‘Love is...’. Режим доступа: https://www.liveinternet.ru/users/zimuka/post354225218/ (дата обращения: 01.05.2024).
  6. Максименко О.И. Поликодовый vs. креолизованный текст: проблема терминологии. Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика, no. 2, 2012, С. 93-102.
  7. Нечаева О.А. Функционально-смысловые типы речи: (Описание, повествование, рассуждение) : Автореферат дис. на соискание ученой степени доктора филологических наук. (10.02.01) / Моск. обл. пед. ин-т им. Н. К. Крупской. – Москва: [б. и.], 1975.
  8. Новоспасская Н.В., Дугалич Н.М. Терминосистема теории поликодовых текстов // Русистика. 2022. Т. 20. No 3. С. 298-311. http://doi.org/10.22363/2618-8163-2022-20-3-298-311
  9. Полонский А.В. Медиалект: язык в контексте медийной культуры // Современный дискурс-анализ. 2018. № 3 (20). Т. 1. С. 189-199.
  10. Сафаралиева Л.А., Перфильева Н.В. Моделирование многомерного лингвокультурного концепта на материале концепта СТАРОСТЬ // Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика. 2023. Т. 14. № 4. С. 1217-1234. https://doi.org/10.22363/2313-2299-2023-14-4-1217-1234
  11. Сонин А.Г. Экспериментальное исследование поликодовых текстов : основные направления // Вопросы языкознания. 2005. No 6. С. 115-123.
  12. Социальный интернет-сервис, фотохостинг «Pinterest». Режим доступа: https://www.pinterest.ca/pin/2251868556772924/ (дата обращения: 01.05.2024).
  13. Степанова И. В. (2013). Креолизованный текст как средство репрезентации концепта Love (на материале комиксов Love is). Вестник Челябинского государственного университета, 24 (315), С. 152-156.
  14. Телеграм чат-бот ‘ChatGPT | Midjourney | Claude | Suno AI – GPT4Telegrambot Inc.’. Имя пользователя: @GPT4Telegrambot (дата обращения: 12.05.2024).
  15. Boden M.A. Creativity and artificial intelligence // Artificial Intelligence. 1998.103. Pp. 347-356.
  16. Boden M.A. Computer models of creativity // Handbook of Creativity. R.J. Sternberg (ed.). Cambridge University Press, 1999. Pp. 351-372.
  17. Colton S. From Computational Creativity to Creative AI and Back Again. Interalia Magazine. 2019. Режим доступа: https://www.interaliamag.org/articles/simon-colton/ (дата обращения: 04.05.2024).
  18. Colton S. & Wiggins, G. A. Computational creativity: The final frontier? In ECAI 2012-20th European Conference on Artificial Intelligence, 27-31 August 2012, Montpellier, France-Including Prestigious Applications of Artificial Intelligence (PAIS-2012) System Demonstration. Frontiers in Artificial Intelligence and Applications. Vol. 242. 2012. IOS Press. Pp. 21-26. https://doi.org/10.3233/978-1-61499-098-7-21
  19. Pickover A. Clifford. Artificial Intelligence: An Illustrated History: From Medieval Robots to Neural Networks. Sterling Publishing Co., Inc. (USA) via Alexander Korzhenevski Agency (Russia), 2021.
  20. Santini C. Kinttsugi: Finding Strength in Imperfection. Andrews McMeel Publishing LLC. 2019.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).