Предикативная сила лексических параметров: оценка сложности текста в учебниках по русскому языку для 5-7 классов
- Авторы: Андреева М.И.1,2, Замалетдинов Р.Р.2, Борисова А.С.3
-
Учреждения:
- Казанский государственный медицинский университет
- Казанский (Приволжский) федеральный университет
- Россйский университет дружбы народов
- Выпуск: Том 22, № 4 (2024): ЛИНГВИСТИЧЕСКОЕ ПРОФИЛИРОВАНИЕ ТЕКСТОВ НА РУССКОМ ЯЗЫКЕ: ОТ ФОРМ К СМЫСЛАМ
- Страницы: 518-539
- Раздел: Актуальные проблемы исследований русского языка
- URL: https://journals.rcsi.science/2618-8163/article/view/324745
- DOI: https://doi.org/10.22363/2618-8163-2024-22-4-518-539
- EDN: https://elibrary.ru/APRGCY
- ID: 324745
Цитировать
Полный текст
Аннотация
Рассмотрена оценка влияния лексических параметров на сложность текста и реализована на материале специализированного лингвистического корпуса, в состав которого вошли тексты 15 действующих учебников по русскому языку для 5-7 классов общим объемом 811911 слов. Исследование нацелено на определение объема и динамики изменения лексического состава учебников для 5-7 классов современных линеек учебников по русскому языку. Алгоритм исследования: (а) выявление объема и состава лексики в текстах учебников; (б) оценка доли лингвистических терминов в их составе; (в) идентификация предикторов сложности, т.е. параметров, демонстрирующих статистически значимую корреляцию с читабельностью. Осуществлению аналитической части исследования предшествовали метаописание корпуса, его токенизация, лемматизация, сегментирование на отрывки приблизительно по 1000 слов. Расчеты параметров текста производились при помощи текстового профайлера RuLingva, оценка силы корреляционных зависимостей выполнялась при помощи программы STATISTIKA. Для достоверности результатов исследования анализ влияния лексиче ских параметров на читабельность текста проведен на двух уровнях: учебники (рассчитывались средние показатели по 15 учебникам 5-7 классов), 1000-словные сегменты текста. Выявлен несколько сниженный (в среднем на 1.0-1.5. уровней) от ожидаемого индекс читабельности изученных текстов, который может служить характеристикой текста учебника по русскому языку как жанра и свидетельствует об эклектичности учебного текста, включающего фрагменты научного стиля (правила), художественного (упражнения) и делового (инструкции и задания к упражнениям). Установлено, что доля терминов не превышает 2 % в словарном составе учебников, но их доля в тексте поднимается до 13 %. Доказано, что предиктивной силой роста сложности текста обладают индексы «лексической плотности», связности (локальный и глобальный повторы существительного и аргумента), «дескриптивность» (отношение прилагательных к существительным), «нарративность» (отношение глаголов к существительным), а также доля имен существительных в родительном падеже. Перспектива исследования видится в изучении роли глаголов и местоимений в текстах учебников по русскому языку как предикторов сложности.
Об авторах
Мария Игоревна Андреева
Казанский государственный медицинский университет; Казанский (Приволжский) федеральный университет
Автор, ответственный за переписку.
Email: mariia99andreeva@yandex.ru
ORCID iD: 0000-0002-5760-0934
SPIN-код: 9243-6995
Scopus Author ID: 57195974758
ResearcherId: ABF-7003-2020
кандидат филологических наук, доцент кафедры иностранных языков, Казанский государственный медицинский университет; старший научный сотрудник НИЛ «Мультидисциплинарные исследования текста», Казанский (Приволжский) федеральный университет
Российская Федерация, 420012, Республика Татарстан, г. Казань, ул. Бутлерова, д. 49; Российская Федерация, 420008, Республика Татарстан, г. Казань, ул. Кремлевская, д. 18, корп. 1Радиф Рифкатович Замалетдинов
Казанский (Приволжский) федеральный университет
Email: director.ifmk@gmail.com
ORCID iD: 0000-0002-2692-1698
SPIN-код: 4027-8784
Scopus Author ID: 56027359900
ResearcherId: M-2174-2013
доктор филологических наук, профессор, директор Института филологии и межкультурной коммуникации, заведующий кафедрой общего языкознания и тюркологии
Российская Федерация, 420008, Республика Татарстан, г. Казань, ул. Кремлевская, д. 18, корп. 1Анна Степановна Борисова
Россйский университет дружбы народов
Email: borisova-as@rudn.ru
ORCID iD: 0000-0002-7395-7028
SPIN-код: 2332-6093
Scopus Author ID: 57194527178
ResearcherId: AAH-9347-2019
кандидат филологических наук, доцент кафедры иностранных языков, филологический факультет
Российская Федерация, 117198, г. Москва, ул. Миклухо-Маклая, д. 6Список литературы
- Andreeva, M., Solnyshkina M., Bukach, O., Zaikin, A., & Zamaletdinov, R. (2020). Assessment of comparative abstractness: Quantitative approach. In CEUR Workshop Proceedings (pp. 132-144). Kazan.
- Biber, D. (2006). University Language: A Corpus-Based Study of Spoken and Written Registers. John Benjamins Publ. https://doi.org/10.1075/scl.23
- Churunina, A.A., Solnyshkina, M.I., & Yarmakeev, I.E. (2023). Lexical diversity as a predictor of the complexity of textbooks on the Russian language. Russian Studies, 21(2), 212-227. (In Russ.). https://doi.org/10.22363/2618-8163-2023-21-2-212-227.
- Crossley, S.A., Louwerse, M.M., McCarthy, P.M., & McNamara, D.S. (2007). A linguistic analysis of simplified and authentic texts. The Modern Language Journal, 91(1), 15-30.
- Dubay, W. (2004). The Principles of Readability. CA.
- Gadasin, D.V., Pak, E.V., Korovushkina, V.M., & Melkova, E.K. (2022). Preprocessing of textual information based on natural language terms. REDS: Telecommunication Devices and Systems, 12(1), 4-11. (In Russ.).
- Gatiyatullina, G., Solnyshkina, M., Solovyev, V., Danilov, A., Martynova, E., & Yarmakeev, I. (2020). Computing Russian morphological distribution patterns using RusAC online server. In 2020 13th International Conference on Developments in eSystems Engineering (DeSE) (pp. 393-398). IEEE Publ. https://doi.org/10.1109/DeSE51703.2020.9450753
- Gatiyatullina, G.M., Solnyshkina, M.I., Kupriyanov, R.V., & Ziganshina, C.R. (2023). Lexical density as a complexity predictor: the case of Science and Social Studies textbooks. Research Result. Theoretical and Applied Linguistics, 9(1), 11-26. https://doi.org/10.18413/2313-8912-2023-9-1-0-2
- Goldman, S.R., & Lee, C.D. (2014). Text complexity: State of the art and the conundrums it raises. The Elementary School Journal, 115(2), 290-300. https://doi.org/10.1086/678298
- Graesser, A.C., McNamara, D.S., Louwerse, M.M., & Cai, Zh. (2004). Coh-Metrix: Analysis of text on cohesion and language. Behavior research methods, instruments, & computers, 36(2), 193-202. http://doi.org/10.3758/BF03195564
- Halliday, M.A.K. (1985). An Introduction to Functional Grammar. London: Hodder Arnold Publ.
- Kupriyanov, R.V., Solnyshkina, M.I., Dascalu, M., & Soldatkina, T.A. (2022). Lexical and syntactic features of academic Russian texts: A discriminant analysis. Research Result. Theoretical and Applied Linguistics, 8(4), 105-122. http://doi.org/10.18413/2313-8912-2022-8-4-0-8
- Okladnikova, S.V. (2010). A model for a comprehensive assessment of the readability of test materials. Caspian Journal: Management and High Technologies, (3), 63-71. (In Russ.).
- Paraschiv, A., Dascalu, M., & Solnyshkina, M.I. (2023). Classification of Russian textbooks by grade level and topic using Readerbench. Research result. Theoretical and applied linguistics, 9(1), 73-86. https://doi.org/10.18413/2313-8912-2023-9-1-0-4
- Ranzato, P.L.R. (2018). A text segmentation technique based on language models. Master thesis, Milano.
- Sardinha, T.B. (2002). Segmenting corpora of texts. DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada, 18(2), 273-286. https://doi.org/10.1590/S0102-44502002000200004
- Solnyshkina, M., Guryanov, I., Gafiyatova, E., & Varlamova, E. (2018). Readability Metrics: the Case of Russian Educational Texts. In Abstracts & Proceedings of ADVED 2018 - 4th International Conference on Advances in Education and Social Sciences (pp. 676-681). Istanbul.
- Solnyshkina, M.I., Kupriyanov, R.V., & Shoeva, G.N. (2024). Linguistic profiling of text genres: adventure stories vs. textbooks. Research Result. Theoretical and Applied Linguistics, 10(1), 115-132. https://doi.org/10.18413/2313-8912-2024-10-1-0-7
- Solnyshkina, M.I., & Shoeva, G.N. (2024). Towards a taxonomy of textbooks as a genre: The case of Russian textbooks. RUDN Journal of Language Studies, Semiotics and Semantics, 15(3), 313-328. https://doi.org/10.22363/2313-2299-2024-15-2-313-328
- Solovyev, V., Andreeva, M., Solnyshkina, M., Zamaletdinov, R., Danilov, A., & Gaynutdinova, D. (2019). Computing concreteness ratings of Russian and English most frequent words: Contrastive approach. In 2019 12th International Conference on Developments in eSystems Engineering (DeSE), 403-408. https://doi.org/10.1109/DeSE.2019.00081
- Solovyev, V.D., Dascalu, M., & Solnyshkina, M.I. (2023). Discourse complexity: driving forces of the new paradigm. Research Result. Theoretical and Applied Linguistics, 9(1), 4-10. https://doi.org/10.18413/2313-8912-2023-9-1-0-1
- Templin, M. (1957). Certain language skills in children. Minneapolis: University of Minnesota Press.
- Vakhrusheva, A.Y., Solnyshkina, M.I., Kupriyanov, R.V., Gafiyatova, E.V., & Klimagina, I.O. (2021). Linguistic complexity of academic texts. Issues in Journalism, Education, Linguistics, 40(1), 89-99. https://doi.org/10.18413/2712-7451-2021-40-1-89-99
- Вахрушева А.Я., Солнышкина М.И., Куприянов Р.В., Гафиятова Э.В., Климагина И.О. Лингвистическая сложность учебных текстов // Вопросы журналистики, педагогики, языкознания. 2021. Т. 40. № 1. С. 88-99. https://doi.org/10.18413/2712-7451-2021-40-1-89-99
- Vahrusheva, A., Solovyev, V., Solnyshkina, M., Gafiaytova, E., & Akhtyamova, S. (2023). Revisiting Assessment of Text Complexity: Lexical and Syntactic Parameters Fluctuations. In International Conference on Speech and Computer, 430-441. Cham: Springer Nature Switzerland. https://doi.org/10.1007/978-3-031-48309-7_35
- Ure, J. (1971). Lexical density and register differentiation. Applications of linguistics, 23(7), 443-452.
Дополнительные файлы
