Проект Chekhov Digital: семантическая разметка параллельного корпуса переводов художественной прозы А. П. Чехова на немецкий язык

Обложка

Цитировать

Полный текст

Аннотация

В статье рассматриваются вопросы разработки принципов семантически размеченного параллельного корпуса переводов художественной прозы А.П. Чехова на немецкий язык в рамках проекта Chekhov Digital цифрового академического издания собрания произведений писателя в формате TEI (Text Encoding Initiative). Проект параллельного корпуса ориентирован на создание цифровой инфраструктуры для изучения произведений писателя, позволяющей исследователям анализировать и сравнивать оригинальные тексты с их переводами. Были выявлены сложности, связанные с интерпретацией значимых элементов произведений писателя, спецификой их перевода на немецкий язык и семантической разметкой переводов художественной прозы, например, возникли сложности с определением границ и связей между элементами семантической разметки. Предложены пути их преодоления, включая использование цифровых методов и технологий обработки естественного языка. В проекте используются цифровые методы и технологии обработки естественного языка, стандарт цифровой публикации Text Encoding Initiative (TEI). Структура разметки текстов, основанная на стандарте TEI, делает документы машиночитаемыми, что позволяет разрабатывать инструменты сложного семантического поиска информации. Включение в проект Chekhov Digital параллельных корпусов переводов произведений А. П. Чехова на разные языки позволяет расширить исследовательские инструменты в области переводоведения, давая возможность сравнивать тексты переводов и оригиналов, обнаруживать сходства и различия в лексике, грамматике, стиле и культурных отсылках, а также автоматизировать рутинные процессы исследования, что делает значительно более эффективным поиск и анализ информации на больших объемах текстов. Результаты проекта будут вносить вклад в развитие цифровой гуманитарной среды, способствуя сохранению и популяризации литературного наследия А.П. Чехова. Создание семантически размеченного параллельного корпуса переводов будет иметь важное значение для литературоведов, лингвистов и переводчиков, позволяя им изучать специфику переводов произведений Чехова и развивать новые формы анализа и интерпретации текстов. Опыт, полученный в ходе проекта, будет ценным для будущих исследований и практических применений, демонстрируя эффективность цифровых технологий в гуманитарных исследованиях и образовании.

Об авторах

Елена Михайловна Северина

Южный федеральный университет

Email: emkovalenko@sfedu.ru
ORCID iD: 0000-0001-6518-2771
профессор; кафедра лингвистики и профессиональной коммуникации;

Никита Александрович Фёдоров

Южный федеральный университет

Email: nfyodorov@sfedu.ru
ORCID iD: 0000-0002-7436-2202
магистр; институт филологии, журналистики и межкультурной коммуникации;

Список литературы

  1. Чехов А. П. Полное собрание сочинений и писем: В 30 т. / АН СССР. Ин-т мировой лит. им. А. М. Горького. М.: Наука, 1974-1983.
  2. TEI Consortium, eds. TEI P5: Guidelines for Electronic Text Encoding and Interchange. Version 4.7.0. Last updated on 16th November 2023. TEI Consorti-um. URL: http://www.tei-c.org/Guidelines/P5/ (дата обращения: 24.03.2024).
  3. Wikidata // URL: https://www.wikidata.org/wiki/Wikidata: Main_Page (дата обращения: 10.04.2024).
  4. Северина Е. М., Бонч-Осмоловская А. А., Кудин А. М. Цифровые филологические практики: проект "Chekhov Digital" // Актуальные проблемы филологии и педагогической лингвистики. 2022. №2. С. 153-165.
  5. Добровольский Д. О., Кретов А. А., Шаров С. А. Корпус параллельных текстов: архитектура и возможности использования // Национальный корпус русского языка: 2003–2005. М.: Индрик, 2005, 263-296.
  6. Калинина Е. Э. Рамочная конструкция предложения как результат генезиса порядка слов индоевропейских языков // Международный научно-исследовательский журнал. 2017. №5-1 (59). С. 141-143.
  7. Северина Е.М., Ларионова М.Ч. Новые филологические практики: семантическое издание текстов А. П. Чехова // Филология: научные исследования. 2020. № 10. С.13-21. doi: 10.7256/2454-0749.2020.10.33970 URL: https://e-notabene.ru/fmag/article_33970.html
  8. Projekt Gutenberg-DE. URL: https://www.projekt-gutenberg.org/ (дата обращения 10.04.2024).
  9. Chekhov Digital. Семантическое издание текстов А. П. Чехова. URL: https://chekhov-digital.sfedu.ru/ (дата обращения: 10.04.2024).
  10. Tschekhow Anton Pawlowitsch Gesammelte Erzählungen: Geschichten in Grau + Kleine Erzählungen + Lustige Geschichten + Von Frauen und Kindern + Duell… // Sharp Ink Publishing. 2023.
  11. Eder M. Rolling stylometry //Digital Scholarship in the Humanities. 2016. 31(3). P. 457-469.
  12. Федоров Н. А. Проект Chekhov Digital: стилометрический анализ текстов перевода рассказов А.П. Чехова на немецкий язык // Инновации в науке и трансформация парадигмы современного образования: сборник научных трудов. Казань: ООО "САНТРЕМ", 2024. С. 147-150.
  13. Меньшиков Я. С. Преимущества автоматического сбора данных в сети интернет над ручным сбором данных // Universum: технические науки. 2022. №10-1 (103). С. 33-36.
  14. ЭНИ «Чехов» / ФЭБ. URL: https://feb-web.ru/feb/chekhov/default.asp (дата обращения 10.04.2024).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).