Pelevin vs Sorokin: an Attempt of Stylometric Comparison

Cover Page

Full Text

Abstract

Our study is related to quantitative linguistics and focuses on the application of a new method for analyzing the author's style in literary texts. The method uses computer analysis of numerical data found in texts, including both cardinal and ordinal numerals, expressed both in numbers and verbally. Author used the program which automatically removed phraseological units and fixed combinations accidentally containing numerals. Before analysis, the text must be manually cleaned of numbers that do not contribute to the author's artistic vision, such as page numbers or chapter numbers. The analysis revealed that the use of numerals by an author in his/her texts is unique and individual, forming a characteristic feature that distinguishes texts by different authors. For the first time, a formal quantitative stylometric analysis is performed of the literary works by Victor Pelevin and Vladimir Sorokin – authors whose literary styles share many similarities when viewed through the lens of a traditional descriptive philological approach. To validate this methodology, we have also included the texts of four "impostor" authors in our analysis. It has been found that Pelevin's and Sorokin's texts differ significantly in their use of numerals. The data on occurrences of numerals in the texts were subjected to hierarchical clustering, which accurately divided the texts into groups based on their authorship. Since the clusterization results can be influenced by the choice of both metrics and clustering method, we tried various reasonable combinations of them to ensure the reliability of our results. Each time, the dendrogram would change only slightly. Thus, the clustering outcomes were found to be reliable. The proposed new method of quantitative linguistics, which is based on the analysis of numerals in literary texts, has the potential to successfully solve the stylometric problems, particularly related to the attribution of texts.

References

  1. Богданова О.В. Литературные стратегии Виктора Пелевина / О.В. Богданова, С.А. Кибальник, Л.В. Сафронова. СПб.: Петрополис, 2008.
  2. Полотовский С. Пелевин и поколение пустоты / С.А. Полотовский, Р.В. Козак. М.: Манн, Иванов и Фербер, 2012.
  3. Шилова Н.Л. Визионерские мотивы в постмодернистской прозе 1960–1990-х годов (Вен. Ерофеев, А. Битов, Т. Толстая, В. Пелевин) / Н.Л. Шилова. Петрозаводск: Изд-во Карельской гос. пед. академии, 2011.
  4. Khagi S. Alternative Historical Imagination in Viktor Pelevin // Slavic and Eastern European Journal. 2018. No. 62(3). Pp. 483–502.
  5. Хаги С. Пелевин и несвобода: Поэтика, политика, метафизика. М.: Новое литературное обозрение, 2023. – 392 с. ISBN: 978-5-4448-1967-8.
  6. Ланин Б.А. Новая старая литературократия: Сорокин и Пелевин в борьбе с традициями // Ценности и смыслы. 2015. № 40(6). С. 110–123.
  7. Богданова О.В. Концептуалист, писатель и художник Владимир Сорокин. СПб.: СПбГУ, 2005.
  8. Андреева Н.Н., Биберган Е.С. Игры и тексты Владимира Сорокина / Н.Н. Андреева, Е.С. Биберган. СПб.: Петрополис, 2012.
  9. Марусенков М.П. Абсурдопедия русской жизни Владимира Сорокина: Заумь, гротеск и абсурд / М.П. Марусенков. СПб.: Алетейя, 2012.
  10. Биберган Е.С. Рыцарь без страха и упрёка: Художественное своеобразие прозы Владимира Сорокина / Е.С. Биберган. СПб.: Петрополис, 2014.
  11. «Это просто буквы на бумаге…» Владимир Сорокин: после литературы / И.А. Калинин; М.Н. Липовецкий; Е.А. Добренко и др. М.: Новое литературное обозрение, 2018.
  12. Stamatatos E. A survey of modern authorship attribution methods // J. Amer. Soc. for Information Science and Technology. 2009. No. 60(3). Pp. 538–556.
  13. Tempestt N., Kalaivani S., Aneez F., Yiming Y., Yingfei X., and Damon W. Surveying Stylometry Techniques and Applications // ACM Comput. Surv. 2017, No. 50(6), Article 86, 36 pages.
  14. La Inteligencia Artificial ayuda a descubrir una obra desconocida de Lope de Vega en los fondos de la BNE, Biblioteca Nacional de España, https://www.bne.es/es/noticias/inteligencia-artificial-ayuda-descubrir-obra-desconocida-lope-vega-fondos-bne (Accessed: June 30, 2024).
  15. Зенков А.В. Новый метод стилеметрии на основе статистики числительных, Компьютерные исследования и моделирование, 2017, Т. 9, № 5, С. 837–850.
  16. Zenkov A.V. A Method of Text Attribution Based on the Statistics of Numerals // J. of Quantitative Linguistics. 2018. No. 25(3). Pp. 256–270.
  17. Zenkov A.V., Místecký M. The Romantic Clash: Influence of Karel Sabina over Macha’s Cikani from the Perspective of the Numerals Usage Statistics // Glottometrics. 2019, No. 46, Pp. 12–28.
  18. Zenkov A.V. Stylometry and Numerals Usage: Benford’s Law and Beyond // Stats 2021. No. 4. Pp. 1051–1068.
  19. Zenkov A., Místecký M. Young Vladimír Vašek? – A Numerals Analysis Contribution to the Bezruč−Hrzánský Identity Issue // Naše řeč, 2022. No. 105(3). Pp. 151–161.
  20. Зенков А.В. Литературные мистификации и авторское использование числительных // Филологические науки. Вопросы теории и практики. 2023. № 16(11). С. 3696–3709. URL: https://doi.org/10.30853/phil20230568.
  21. Zenkov A.V. Under a False Flag: Literary Hoaxes and the Use of Numerals // Litera. 2023. № 10. С. 86-109. doi: 10.25136/2409-8698.2023.10.68743 EDN: TYDRFD URL: https://e-notabene.ru/fil/article_68743.html
  22. Зенков А.В., Ермаков Н.Е. Числительные в текстах как характерная особенность авторского стиля // Russian Linguistic Bulletin. 2023. № 45(9). URL: https://doi.org/10.18454/RULB.2023.45.28.
  23. Moisl H. Cluster Analysis for Corpus Linguistics. De Gruyter Mouton, 2015.
  24. Gan G., Ma C., Wu J., Data Clustering: Theory, Algorithms, and Applications. Society for Industrial and Applied Mathematics, 2007.
  25. Koppel M., Winter Y. Determining if two documents are written by the same author // J. of the Association for Information Science and Technology. 2014. No. 65(1). Pp. 178–187.
  26. Плеханова И.И. Внутрилитературная полемика начала XXI века: мотивы и содержание («Околоноля» Н. Дубовицкого и «S.N.U.F.F.» В. Пелевина) // Филологический класс. 2013. № 33(3). С. 26–32.

Supplementary files

Supplementary Files
Action
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).