Computational creativity of neural network Midjourney in a polymodal space

Abstract

This article deals with the polymodal space in the field of computational creativity in neural networks. The object of research is a polymodal environment that integrates a series of heterogeneous codes to express a common idea, and the subject is the possibility of creating polymodal digital art using text and voice prompts in the generative network Midjourney. The aim of the study is to prove that computational creativity can be detected and described based on the results of iterations in the process of creating images, which in turn will allow us to talk about a complex polymodal system as a separate digital category of polymodality. We used the continuous sampling method when collecting linguistic units as they occur in the analysis process; contextual analysis for the systematic identification and description of the verbal and non-verbal contexts. It was necessary to conduct an experiment with the generative network Midjourney to identify patterns in the creation of a graphic space through text and voice data input, and then compare and contrast the results of iterations with the original image. The scientific novelty consists in the lack of research on the polymodal space in the context of neural networks and their generative ability. During the experiment, we obtained the following results: the term ‘polymodality’ in the context of the generative network Midjourney and its ‘digital art’ is due to the presence of three channels: verbal, visual and voice; tests have shown that the ability of the neural network to create images through prompt is at a high level, however, there are rough technical errors that do not allow users to fully approach the desired result when they generate an image; the summarization of the data allows us to talk about the presence of features of computational creativity in generative networks.

References

  1. Белова С.С. Творчество: психологические и компьютерные модели / Психология. Журнал Высшей школы экономики. 2008. Т. 5, №4. С. 112-119.
  2. Гусева А.П. Семиотически гетерогенный художественный текст как содержательно осложненная коммуникация // Вестник Московского государственного лингвистического университета. Гуманитарные науки. 2018. №18 (816). С. 98-109.
  3. Евграфова Ю.А. Лингвосемиотика экрана: моделирование реальности в экранных текстах (на материале текстов кино, телевидения и сети Интернет) : дисс. на соискание ученой степени доктора филологических наук. (10.02.19). МГОУ. – Москва, 2020.
  4. Коломийцева О.Ю., Москалева А.Н. Способы реализации категории полимодальности в англоязычном инстаграм-дискурсе. Вестник Международного института рынка. 2021. №2. С. 115-125.
  5. Коллекция вкладышей популярной жвачки ‘Love is...’. Режим доступа: https://www.liveinternet.ru/users/zimuka/post354225218/ (дата обращения: 01.05.2024).
  6. Максименко О.И. Поликодовый vs. креолизованный текст: проблема терминологии. Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика, no. 2, 2012, С. 93-102.
  7. Нечаева О.А. Функционально-смысловые типы речи: (Описание, повествование, рассуждение) : Автореферат дис. на соискание ученой степени доктора филологических наук. (10.02.01) / Моск. обл. пед. ин-т им. Н. К. Крупской. – Москва: [б. и.], 1975.
  8. Новоспасская Н.В., Дугалич Н.М. Терминосистема теории поликодовых текстов // Русистика. 2022. Т. 20. No 3. С. 298-311. http://doi.org/10.22363/2618-8163-2022-20-3-298-311
  9. Полонский А.В. Медиалект: язык в контексте медийной культуры // Современный дискурс-анализ. 2018. № 3 (20). Т. 1. С. 189-199.
  10. Сафаралиева Л.А., Перфильева Н.В. Моделирование многомерного лингвокультурного концепта на материале концепта СТАРОСТЬ // Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика. 2023. Т. 14. № 4. С. 1217-1234. https://doi.org/10.22363/2313-2299-2023-14-4-1217-1234
  11. Сонин А.Г. Экспериментальное исследование поликодовых текстов : основные направления // Вопросы языкознания. 2005. No 6. С. 115-123.
  12. Социальный интернет-сервис, фотохостинг «Pinterest». Режим доступа: https://www.pinterest.ca/pin/2251868556772924/ (дата обращения: 01.05.2024).
  13. Степанова И. В. (2013). Креолизованный текст как средство репрезентации концепта Love (на материале комиксов Love is). Вестник Челябинского государственного университета, 24 (315), С. 152-156.
  14. Телеграм чат-бот ‘ChatGPT | Midjourney | Claude | Suno AI – GPT4Telegrambot Inc.’. Имя пользователя: @GPT4Telegrambot (дата обращения: 12.05.2024).
  15. Boden M.A. Creativity and artificial intelligence // Artificial Intelligence. 1998.103. Pp. 347-356.
  16. Boden M.A. Computer models of creativity // Handbook of Creativity. R.J. Sternberg (ed.). Cambridge University Press, 1999. Pp. 351-372.
  17. Colton S. From Computational Creativity to Creative AI and Back Again. Interalia Magazine. 2019. Режим доступа: https://www.interaliamag.org/articles/simon-colton/ (дата обращения: 04.05.2024).
  18. Colton S. & Wiggins, G. A. Computational creativity: The final frontier? In ECAI 2012-20th European Conference on Artificial Intelligence, 27-31 August 2012, Montpellier, France-Including Prestigious Applications of Artificial Intelligence (PAIS-2012) System Demonstration. Frontiers in Artificial Intelligence and Applications. Vol. 242. 2012. IOS Press. Pp. 21-26. https://doi.org/10.3233/978-1-61499-098-7-21
  19. Pickover A. Clifford. Artificial Intelligence: An Illustrated History: From Medieval Robots to Neural Networks. Sterling Publishing Co., Inc. (USA) via Alexander Korzhenevski Agency (Russia), 2021.
  20. Santini C. Kinttsugi: Finding Strength in Imperfection. Andrews McMeel Publishing LLC. 2019.

Supplementary files

Supplementary Files
Action
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).