Computational creativity of neural network Midjourney in a polymodal space
- Authors: Zhikulina C.P.1, Kostromina V.V.1
-
Affiliations:
- Issue: No 6 (2024)
- Pages: 1-16
- Section: Articles
- URL: https://journals.rcsi.science/2409-8698/article/view/379512
- DOI: https://doi.org/10.25136/2409-8698.2024.6.70890
- EDN: https://elibrary.ru/COCFNP
- ID: 379512
Cite item
Full Text
Abstract
This article deals with the polymodal space in the field of computational creativity in neural networks. The object of research is a polymodal environment that integrates a series of heterogeneous codes to express a common idea, and the subject is the possibility of creating polymodal digital art using text and voice prompts in the generative network Midjourney. The aim of the study is to prove that computational creativity can be detected and described based on the results of iterations in the process of creating images, which in turn will allow us to talk about a complex polymodal system as a separate digital category of polymodality. We used the continuous sampling method when collecting linguistic units as they occur in the analysis process; contextual analysis for the systematic identification and description of the verbal and non-verbal contexts. It was necessary to conduct an experiment with the generative network Midjourney to identify patterns in the creation of a graphic space through text and voice data input, and then compare and contrast the results of iterations with the original image. The scientific novelty consists in the lack of research on the polymodal space in the context of neural networks and their generative ability. During the experiment, we obtained the following results: the term ‘polymodality’ in the context of the generative network Midjourney and its ‘digital art’ is due to the presence of three channels: verbal, visual and voice; tests have shown that the ability of the neural network to create images through prompt is at a high level, however, there are rough technical errors that do not allow users to fully approach the desired result when they generate an image; the summarization of the data allows us to talk about the presence of features of computational creativity in generative networks.
About the authors
Christina Petrovna Zhikulina
Email: christina.zhikulina@gmail.com
ORCID iD: 0000-0003-2488-4616
Viktoriya Vladimirovna Kostromina
Email: kostromina_vv@pfur.ru
References
- Белова С.С. Творчество: психологические и компьютерные модели / Психология. Журнал Высшей школы экономики. 2008. Т. 5, №4. С. 112-119.
- Гусева А.П. Семиотически гетерогенный художественный текст как содержательно осложненная коммуникация // Вестник Московского государственного лингвистического университета. Гуманитарные науки. 2018. №18 (816). С. 98-109.
- Евграфова Ю.А. Лингвосемиотика экрана: моделирование реальности в экранных текстах (на материале текстов кино, телевидения и сети Интернет) : дисс. на соискание ученой степени доктора филологических наук. (10.02.19). МГОУ. – Москва, 2020.
- Коломийцева О.Ю., Москалева А.Н. Способы реализации категории полимодальности в англоязычном инстаграм-дискурсе. Вестник Международного института рынка. 2021. №2. С. 115-125.
- Коллекция вкладышей популярной жвачки ‘Love is...’. Режим доступа: https://www.liveinternet.ru/users/zimuka/post354225218/ (дата обращения: 01.05.2024).
- Максименко О.И. Поликодовый vs. креолизованный текст: проблема терминологии. Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика, no. 2, 2012, С. 93-102.
- Нечаева О.А. Функционально-смысловые типы речи: (Описание, повествование, рассуждение) : Автореферат дис. на соискание ученой степени доктора филологических наук. (10.02.01) / Моск. обл. пед. ин-т им. Н. К. Крупской. – Москва: [б. и.], 1975.
- Новоспасская Н.В., Дугалич Н.М. Терминосистема теории поликодовых текстов // Русистика. 2022. Т. 20. No 3. С. 298-311. http://doi.org/10.22363/2618-8163-2022-20-3-298-311
- Полонский А.В. Медиалект: язык в контексте медийной культуры // Современный дискурс-анализ. 2018. № 3 (20). Т. 1. С. 189-199.
- Сафаралиева Л.А., Перфильева Н.В. Моделирование многомерного лингвокультурного концепта на материале концепта СТАРОСТЬ // Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика. 2023. Т. 14. № 4. С. 1217-1234. https://doi.org/10.22363/2313-2299-2023-14-4-1217-1234
- Сонин А.Г. Экспериментальное исследование поликодовых текстов : основные направления // Вопросы языкознания. 2005. No 6. С. 115-123.
- Социальный интернет-сервис, фотохостинг «Pinterest». Режим доступа: https://www.pinterest.ca/pin/2251868556772924/ (дата обращения: 01.05.2024).
- Степанова И. В. (2013). Креолизованный текст как средство репрезентации концепта Love (на материале комиксов Love is). Вестник Челябинского государственного университета, 24 (315), С. 152-156.
- Телеграм чат-бот ‘ChatGPT | Midjourney | Claude | Suno AI – GPT4Telegrambot Inc.’. Имя пользователя: @GPT4Telegrambot (дата обращения: 12.05.2024).
- Boden M.A. Creativity and artificial intelligence // Artificial Intelligence. 1998.103. Pp. 347-356.
- Boden M.A. Computer models of creativity // Handbook of Creativity. R.J. Sternberg (ed.). Cambridge University Press, 1999. Pp. 351-372.
- Colton S. From Computational Creativity to Creative AI and Back Again. Interalia Magazine. 2019. Режим доступа: https://www.interaliamag.org/articles/simon-colton/ (дата обращения: 04.05.2024).
- Colton S. & Wiggins, G. A. Computational creativity: The final frontier? In ECAI 2012-20th European Conference on Artificial Intelligence, 27-31 August 2012, Montpellier, France-Including Prestigious Applications of Artificial Intelligence (PAIS-2012) System Demonstration. Frontiers in Artificial Intelligence and Applications. Vol. 242. 2012. IOS Press. Pp. 21-26. https://doi.org/10.3233/978-1-61499-098-7-21
- Pickover A. Clifford. Artificial Intelligence: An Illustrated History: From Medieval Robots to Neural Networks. Sterling Publishing Co., Inc. (USA) via Alexander Korzhenevski Agency (Russia), 2021.
- Santini C. Kinttsugi: Finding Strength in Imperfection. Andrews McMeel Publishing LLC. 2019.
Supplementary files

