Автоматизированный перевод политического дискурса: от больших языковых моделей к мультиагентной системе MAGIC-PTF

Обложка

Цитировать

Полный текст

Аннотация

Исследование посвящено проблеме автоматизированного перевода китайского политического дискурса на русский язык с применением технологий оптимизации БЯМ и мультиагентного подхода. В фокусе внимания находится разработка системы MAGIC-PTF, реализующей принцип многоступенчатой обработки текста через взаимодействие четырех специализированных агентов. Ключевым компонентом системы является Агент-Стилист, обеспечивающий стилистическое единообразие и терминологическую точность перевода на основе специально обученной БЯМ. Агент-Переводчик выполняет основную переводческую работу и отвечает за окончательное оформление текста. Агент-Редактор осуществляет многоуровневую проверку и корректировку перевода с учетом лингвистических, семантических и культурологических аспектов. Агент-Читатель анализирует текст с позиции целевой аудитории, оценивая его восприятие носителями русского языка. Предметом исследования также являются механизмы взаимодействия между агентами и процессы оптимизации качества перевода в рамках многоступенчатой системы обработки текста. Методология основана на интеграции технологий оптимизации БЯМ и мультиагентного подхода, с применением экспериментального тестирования на материале четвертого тома сборника «О государственном управлении» и его официального перевода на русский язык. Исследование включает комплексный анализ эффективности системы с использованием метрики COMET, а также сравнительное тестирование с существующими платформами машинного перевода. Научная новизна исследования заключается в создании комплексной методологии применения БЯМ для решения задач специализированного перевода и разработке эффективного механизма координации интеллектуальных агентов в процессе перевода. Экспериментальное исследование продемонстрировало превосходство MAGIC-PTF над традиционными системами машинного перевода по ключевым параметрам: точность передачи терминологии, стилистическая согласованность, сохранение культурно-специфических элементов политического дискурса. Результаты автоматического измерения с использованием метрики COMET подтвердили эффективность предложенного подхода. Разработанная система открывает новые возможности для автоматизированного перевода политического дискурса и может быть адаптирована для перевода других типов специализированных текстов, что подтверждает её значимость для развития современных переводческих технологий. Особую ценность представляет возможность масштабирования системы и её адаптации к различным языковым парам и типам дискурса, что создает перспективы для дальнейшего развития автоматизированного перевода специализированных текстов. Результаты исследования также вносят важный вклад в развитие теории и практики применения БЯМ в области профессионального перевода.

Об авторах

Мяо Лю

Пекинский университет

Email: liumiaolm@pku.edu.cn
ORCID iD: 0000-0003-2346-0600
доцент; факультет русского языка и литературы;

Цин Шао

ООО “Сучжоу Сайнапус Сетевые Технологии”

Email: shaoqingpku@163.com
ORCID iD: 0009-0003-9656-6681
Специалист технической поддержки;

Гуанцзэн Се

Средняя школа при Китайском народном университете

Email: smsxgz@pku.edu.cn
ORCID iD: 0009-0002-7732-2203
Преподаватель;

Список литературы

  1. Brown T., Mann B., Ryder N. et al. Language models are few-shot learners // Advances in neural information processing systems. 2020. No. 33. P. 1877-1901.
  2. OpenAI. Gpt-4 technical report // arXiv preprint arXiv:2303.08774. 2023.
  3. Zhou J., Ke P., Qiu X., Huang M., Zhang J. ChatGPT: potential, prospects, and limitations // Frontiers of Information Technology & Electronic Engineering. 2023. P. 1-6.
  4. Ху Кайбао, Гао Ли. Развитие иностранных языков в контексте больших языковых моделей: проблемы и перспективы // Внешний мир иностранных языков. 2024. № 2. С. 7-12.
  5. Цинь Хунъу, Чжоу Ся. Большие языковые модели и сопоставительное изучение языков // Обучение и исследование иностранных языков. 2024. № 2. С. 163-176, 318.
  6. Ху Кайбао, Ли Сяоцянь. Развитие переводческих исследований в контексте больших языковых моделей: проблемы и перспективы // Китайский перевод. 2023. № 6. С. 64-73, 192.
  7. Фэн Цинхуа, Чжан Кайи. Анализ возможностей искусственного интеллекта в преподавании иностранных языков и исследованиях на примере ChatGPT-4o и языковой модели Wenxin 4.0 // Преподавание иностранных языков с помощью электронных технологий. 2024. № 3. С. 3-12, 109.
  8. Ван Хуашу, Се Фэй. Инновационное исследование практической модели переводческого образования под влиянием технологии больших языковых моделей // Китайский перевод. 2024. № 2. С. 70-78.
  9. Су Ци. Анализ эффективности применения больших языковых моделей в преподавании второго языка // Внешний мир иностранных языков. 2024. № 3. С. 35-42.
  10. Zhang B., Haddow B., Birch A. Prompting large language model for machine translation: A case study // International Conference on Machine Learning, PMLR. 2023. P. 41092-41110.
  11. Zhang X., Rajabi N., Duh K., Koehn P. Machine translation with large language models: Prompting, few-shot learning, and fine-tuning with QLoRA // Proceedings of the Eighth Conference on Machine Translation. 2023. P. 468-481.
  12. Moslem Y., Haque R., Kelleher J.D., Way A. Adaptive machine translation with large language models // arXiv preprint arXiv:2301.13294. 2023.
  13. Li J., Zhou H., Huang S., Cheng S., Chen J. Eliciting the translation ability of large language models via multilingual finetuning with translation instructions // Transactions of the Association for Computational Linguistics. 2024. No. 12. P. 576-592.
  14. Du Y., Li S., Torralba A., Tenenbaum J., Mordatch I. Improving Factuality and Reasoning in Language Models through Multiagent Debate // arXiv preprint arXiv:2305.14325. 2023.
  15. Wu Q., Bansal G., Zhang J. et al. Autogen: Enabling next-gen LLM applications via multi-agent conversation framework // arXiv preprint arXiv:2308.08155. 2023.
  16. OpenAI. ChatGPT (версия от 20 июня) [Электронный ресурс]. 2024. URL: https://chat.openai.com/chat
  17. Andreas J. Language Models as Agent Models // Findings of the Association for Computational Linguistics: EMNLP 2022. 2022. P. 5769-5779.
  18. Базовые нормы перевода китайского политического дискурса на английский язык / Под ред. редакционной группы. Пекин: Издательство литературы на иностранных языках, 2023. C. 4.
  19. Си Цзиньпин. О государственном управлении. Т. 4 (на китайском языке). Пекин: Издательство литературы на иностранных языках, 2022. 575 c.
  20. Си Цзиньпин. О государственном управлении IV [Перевод с китайского]. Пекин: Издательство литературы на иностранных языках, 2023. 836 c.
  21. DeepL Translator [Электронный ресурс]. URL: https://www.deepl.com/zh/translator#zh/ru/ (дата обращения: 08.08.2024).
  22. Guerreiro N.M., Rei R., Stigt D. et al. xComet: Transparent machine translation evaluation through fine-grained error detection // Transactions of the Association for Computational Linguistics. 2024. № 12. P. 979-995.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).