Longitudinal studies of language errors based on a German-language learner corpus

Cover Page

Cite item

Full Text

Abstract

In the age of digitalization and the active spread of corpus technologies in linguistic education, linguodidactics specialists are constantly discovering new opportunities in working with big data. One relatively new phenomenon in Russian education is the collection of corpora of student texts in a foreign language. It’s possibilities for linguodidactical research depend primarily on the duration of the data collection and on the markup that corpus contains. The article focuses on the corpus of German-language student texts PACT (Petrozavodsk annotated corpus of texts) and longitudinal research of types of linguistic mistakes made by students throughout the study of the German language for 5 years. The result of the research is statistics for 90 classes of errors, divided into 7 major groups – grammar, vocabulary, orthography, punctuation, discourse, omissions and superfluous elements – and the dynamics of these statistics over the 5 years of German language study. Comparison of the most frequent errors made by 1st and 5th year students respectively shows that subjects causing the most problems for students during all years of study are lexeme selection, orthography, omissions in text, punctuation and reverse word order. At the end of study problems with indefinite articles, adjective and noun declension, formation of plural form and gender of nouns are giving way to other issues such as superfluous elements in text, logic, word order in subordinate sentences and stylistic errors.

About the authors

Irina Avramovna Kotyurova

Petrozavodsk State University

Email: koturova@petrsu.ru
Petrozavodsk, Russian Federation

Georgiy Romanovich Safonov

Petrozavodsk State University

Email: jiri.safonov@gmail.com
Petrozavodsk, Russian Federation

References

  1. Трудности и перспективы цифровой трансформации образования / под. ред. А. Ю. Уварова, И. Д. Фрумина. М.: НИУ ВШЭ, 2019. 344 с. doi: 10.17323/978-5-7598-1990-5
  2. Павлова О. Ю. Использование языковых корпусов в обучении иностранному языку // Язык и культура. 2021. № 54. С. 283–298. doi: 10.17223/19996195/54/16
  3. Большие данные в образовании: доказательное развитие образования / под ред. О. А. Фиофановой. М.: Дело. 2021. 342 с.
  4. Modeling Language Learning Using Specialized Elo Ratings. Innovative Use of NLP for Building Educational Applications / J. Hou, M. Koppatz, J. M. Hoya Quecedo, N. Stoyanova, M. Kopotev, R. Yangarber; eds. H. Yannakoudakis, E. Kochmar, C. Leacock, N. Madnani, I. Pilán, T. Zesch. Stroudsburg, PA: Association for Computational Linguistics, 2019. P. 494–506. http://dx.doi.org/10.18653/v1/W19-4451
  5. Granger S. The International Corpus of Learner English: a new resource for foreign language learning and teaching and second language acquisition research // TESOL Quarterly. 2003. Vol. 37, № 3. P. 538–546.
  6. Камшилова О. Н. Учебный корпус текстов: потенциал, состав, структура. СПб.: Книжный дом, 2012. 56 с.
  7. Ахапкина Я. Э. Эрратологическая разметка корпуса русских учебных текстов: тактические решения // Труды Института русского языка им. В. В. Виноградова. 2019. № 4 (22). С. 9–21.
  8. Грудева Е. В., Бучилова И. А., Волкова Н. А. Корпусы ошибок: целевая аудитория, возможная архитектура корпуса // Вестник Череповецкого государственного университета. 2018. № 5 (86). С. 63–72. URL: https://cyberleninka.ru/article/n/korpusy-oshibok-tselevaya-auditoriya-vozmozhnaya-arhitektura-korpusa (дата обращения: 21.01.2023).
  9. Котюрова И. А., Щеголева Л. В. Корпус студенческих текстов на немецком языке как источник данных для образования и науки // Вопросы образования. 2022. № 4. С. 322–349. URL: https://cyberleninka.ru/article/n/korpus-studencheskih-tekstov-na-nemetskom-yazyke-kak-istochnik-dannyh-dlya-obrazovaniya-i-nauki (дата обращения: 21.01.2023).
  10. Götz S. Learner Corpora to Inform Testing and Assessment // The Routledge Handbook of Corpora and English Language Teaching and Learning. Routledge, 2022. P. 311–326.
  11. Vinogradova O., Login N. The Design of Tests with Multiple Choice Questions Automatically Generated from Essays in a Learner Corpus // Higher School of Economics Research Paper No. WP BRP. 2017. Vol. 60. P. 16.
  12. Bowles M. A. Using instructor judgment, learner corpora, and DIF to develop a placement test for Spanish L2 and heritage learners // Language Testing. 2022. Vol. 39, № 3. Р. 355–376. https://doi.org/10.1177/02655322221076033
  13. Granger S. The computer learner corpus: a versatile new source of data for SLA research // Learner English on computer. Routledge, 2014. P. 3–18.
  14. Kwon H. English learner corpora and research in Korea // Corpora. 2022. Vol. 17, № Supplement. P. 5–22.
  15. Liu K., Oiwun Cheung J., Zhao N. Learner corpus research in Hong Kong: past, present and future // Corpora. 2022. Vol. 17, № Supplement. P. 79–97.
  16. Смульская Е. Д. Лонгитюдные исследования в лингвистике: опыт и перспективы // Известия РГПУ им. А. И. Герцена. 2016. № 182. C. 53–58.
  17. Сибирякова Н. Б. Интерференция с родным (русским) языком при пунктуационных ошибках в текстах студентов на немецком языке // Языковые контакты в поликультурном мире. Курск, 2022. С. 87–94.

Supplementary files

Supplementary Files
Action
1. JATS XML


Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).