The Chekhov Digital project: semantic markup of a parallel corpus of translations of Chekhov's fiction into German

Cover Page

Full Text

Abstract

The article discusses the issues of developing the principles of a semantically marked parallel corpus of translations of Chekhov's fiction into German within the framework of the Chekhov Digital project, a digital academic publication of the writer's collected works in TEI (Text Encoding Initiative) format. The parallel corpus project is focused on creating a digital infrastructure for studying the writer's works, allowing researchers to analyze and compare original texts with their translations. Difficulties were identified related to the interpretation of significant elements of the writer's works, the specifics of their translation into German and the semantic markup of translations of fiction, for example, difficulties arose with defining the boundaries and relationships between the elements of semantic markup. Ways to overcome them are proposed, including the use of digital methods and natural language processing technologies. The project uses digital methods and technologies of natural language processing, the standard of digital publication Text Encoding Initiative (TEI). The text markup structure based on the TEI standard makes documents machine-readable, which allows to develop tools for complex semantic information retrieval. The inclusion in the Chekhov Digital project of parallel corpora of translations of A. P. Chekhov's works into different languages makes it possible to expand research tools in the field of translation studies, making it possible to compare texts of translations and originals, detect similarities and differences in vocabulary, grammar, style and cultural references, as well as automate routine research processes, which makes search and analysis much more effective information on large volumes of texts. The results of the project will contribute to the development of the digital humanitarian environment, contributing to the preservation and popularization of the literary heritage of A.P. Chekhov. The creation of a semantically marked parallel corpus of translations will be important for literary critics, linguists and translators, allowing them to study the specifics of translations of Chekhov's works and develop new forms of text analysis and interpretation. The experience gained during the project will be valuable for future research and practical applications, demonstrating the effectiveness of digital technologies in humanitarian research and education.

References

  1. Чехов А. П. Полное собрание сочинений и писем: В 30 т. / АН СССР. Ин-т мировой лит. им. А. М. Горького. М.: Наука, 1974-1983.
  2. TEI Consortium, eds. TEI P5: Guidelines for Electronic Text Encoding and Interchange. Version 4.7.0. Last updated on 16th November 2023. TEI Consorti-um. URL: http://www.tei-c.org/Guidelines/P5/ (дата обращения: 24.03.2024).
  3. Wikidata // URL: https://www.wikidata.org/wiki/Wikidata: Main_Page (дата обращения: 10.04.2024).
  4. Северина Е. М., Бонч-Осмоловская А. А., Кудин А. М. Цифровые филологические практики: проект "Chekhov Digital" // Актуальные проблемы филологии и педагогической лингвистики. 2022. №2. С. 153-165.
  5. Добровольский Д. О., Кретов А. А., Шаров С. А. Корпус параллельных текстов: архитектура и возможности использования // Национальный корпус русского языка: 2003–2005. М.: Индрик, 2005, 263-296.
  6. Калинина Е. Э. Рамочная конструкция предложения как результат генезиса порядка слов индоевропейских языков // Международный научно-исследовательский журнал. 2017. №5-1 (59). С. 141-143.
  7. Северина Е.М., Ларионова М.Ч. Новые филологические практики: семантическое издание текстов А. П. Чехова // Филология: научные исследования. 2020. № 10. С.13-21. doi: 10.7256/2454-0749.2020.10.33970 URL: https://e-notabene.ru/fmag/article_33970.html
  8. Projekt Gutenberg-DE. URL: https://www.projekt-gutenberg.org/ (дата обращения 10.04.2024).
  9. Chekhov Digital. Семантическое издание текстов А. П. Чехова. URL: https://chekhov-digital.sfedu.ru/ (дата обращения: 10.04.2024).
  10. Tschekhow Anton Pawlowitsch Gesammelte Erzählungen: Geschichten in Grau + Kleine Erzählungen + Lustige Geschichten + Von Frauen und Kindern + Duell… // Sharp Ink Publishing. 2023.
  11. Eder M. Rolling stylometry //Digital Scholarship in the Humanities. 2016. 31(3). P. 457-469.
  12. Федоров Н. А. Проект Chekhov Digital: стилометрический анализ текстов перевода рассказов А.П. Чехова на немецкий язык // Инновации в науке и трансформация парадигмы современного образования: сборник научных трудов. Казань: ООО "САНТРЕМ", 2024. С. 147-150.
  13. Меньшиков Я. С. Преимущества автоматического сбора данных в сети интернет над ручным сбором данных // Universum: технические науки. 2022. №10-1 (103). С. 33-36.
  14. ЭНИ «Чехов» / ФЭБ. URL: https://feb-web.ru/feb/chekhov/default.asp (дата обращения 10.04.2024).

Supplementary files

Supplementary Files
Action
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).