Digitization of Linguistic Research as Means of Preservation of Linguistic Diversity of Siberia (Database of Dialogical Speech of Minority Ethnic Groups of Novosibirsk Region and Adjacent Regions)

Cover Page

Cite item

Full Text

Abstract

Representatives of two indigenous ethnic minorities, Baraba Tatars and Chat Tatars, live in the Novosibirsk Region. Their languages and culture are endangered for a number of extralinguistic reasons: disruption of their compact residence; interrupted passing of the language and traditions from generation to generation; labor migration; globalization. Whereas 20–25 years ago children spoke their native idiom, now there are either no young speakers or very few. The language is limited to the domestic use; there is no written tradition. The related Turkic languages, Kumandin and Teleut, are in a similar condition. However, a written form has been developed or is being developed for the two languages. The situation among the Mennonite Germans of Siberia is slightly better, but the general trends in language development are the same as among the indigenous peoples. The project included the development of a database of dialogical speech of Baraba Tatars, Chat Tatars, Kumandins, Teleuts and Mennonite Germans that provides audio records of dialogs of native speakers with different communicative focus (both full-length or separate phrases). In addition to studying the intonation of dialogical speech, the project author is developing spelling rules (all texts are transcribed in the original language and translated into Russian). Individual phrases have phonemic marks, which allow performing intonation analysis semi-automatically. Modern technologies enable researchers to introduce into scientific circulation and provide access to the recorded 
speech of ethnic minorities, which surely contributes to the preservation of endangered idioms.

About the authors

T. R. Ryzhikova

Institute of Philology SB RAS

Author for correspondence.
Email: tanya12@mail.ru

Candidate of Philology, Senior Researcher

Russian Federation, Novosibirsk

References

  1. Natsional'nyj korpus russkogo yazyka [National corpus of Russian language]. El. resurs: https://ruscorpora.ru. Data obrashcheniya: 04.06.2025.
  2. Natsional'nyj korpus tatarskogo yazyka [National corpus of Tatar language]. El. resurs: https://tugantel.tatar/. Data obrashcheniya: 04.06.2025.
  3. Natsional'nyj korpus bashkirskogo yazyka [National corpus of Bashkir language]. El. resurs: https://web.archive.org/web/20220303071103/https://bashcorpus.ru/#about_other. Data obrashcheniya: 04.06.2025.
  4. Elektronnyj korpus tuvinskogo yazyka [Electronical corpus of Tuvan language]. El. resurs: https://tuvancorpus.ru/. Data obrashcheniya: 04.06.2025.
  5. Krivnova O. F., Zakharov L. M., Kobozeva I. M. Russkij intonatsionnyj korpus RINKO: dialogicheskaya i monologicheskaya rech' [Russian intonation corpus RINKO: dialogical and momological speech] // Vestnik Moskovskogo universiteta. Seriya 9. Filologiya. 2021. №5.
  6. Korpus «Odin rechevoj den'» (ORD) [Corpus “One speech day” (OSD)]. El. resurs: https://ord.spbu.ru. Data obrashcheniya: 04.06.2025.
  7. Kachkovskaia T., Kocharov D., Skrelin P., Volskaya N. CoRuSS – a New Prosodically Annotated Corpus of Russian Spontaneous Speech. Conference: 10th International Confer-ence on Language Resources and Evaluation (LREC 2016). 2016.
  8. Abaeva Yu. D. Dialektnyj korpus kak sredstvo sokhraneniya i izucheniya buryatskoj prosodii [Dialect corpus as a means of preserving and study the Buryat prosody] // Tomskij zhurnal lingvisticheskikh i antropologicheskikh issledovaingnij (Tomsk Journal of Linguistics and Anthropology). 2020. Vyp. 3 (29). S. 9–19. doi: 10.23951/2307-6119-2020-3-9-19
  9. Ustnyj korpus dialektov khakasskogo yazyka [Oral corpus of the Khakas language dia-lects]. El. resurs: https://lingconlab.ru/spoken_khakas/search. Data obrashcheniya: 04.06.2025.
  10. Tokmashev D. M. Iz istorii literalizatsii teleutskogo yazyka [From the history of literar-iness of the Teleut language] // Vestnik Bashkirskogo universiteta. 2016. T. 21. №4. S. 1009–1016.
  11. Zaлharov L. M., Kazakevich O. A. Intonatsiya dialoga (na materiale audiozapisej ketskoj, sel'kupskoj i evenkijskoj rechi) [Dialogue intonation (on audiomaterials of Ket, Selkup and Even speech] // Komp'yuternaya lingvistika i intellektual'nye tekhnologii: Trudy mezhdunarodnoj konferentsii «Dialog 2007» (Bekasovo, 30 maya – 3 iyunya 2007 g.). M.: Izd-vo RGGU, 2007. S. 207–212.
  12. Berríos J., Swain A., Fricke M. Implementing the map task in applied linguistics re-search: What, how, and why // Research Methods in Applied Linguistics. № 2. 2023.
  13. Grice M., Savino M. Map tasks in Italian: Asking questions about given, accessible and new information. Catalan Journal of Linguistics. № 2. 2003. R. 153–180.
  14. Prieto P., Roseano P. Atlas interactivo de la entonación del español. 2009–2013. https://prosodia.upf.edu/atlasentonacion/metodologia/index-english.html.
  15. Dmitrieva L.V. Yazyk barabinskikh tatar [Baraba-tatar language]. Leningrad: Nauka: Leningr. otd-nie, 1981. 225 s.
  16. Sagidullin M.A. Fonetika i grafika sovremennogo sibirskotatarskogo yazyka [Phonetics and graphics of the modern siberiantatar language]. Tyumen': ISKER. 2008. 62 s.
  17. Ryumina-Syrkasheva L. T., Ryumin N. M. Russko-teleutskij slovar'. Orus-teleut sözlik [Russian-Teleut dictionary]. Kemerovo: Kuzbassvuzizdat. 2002. 192 s.
  18. Petrushova M. B., Danilov V. M. Russko-kumandinskij slovar' [Russian-Kumandy dic-tionary]. Bijsk: Izd-vo «Format», Izdatel'skij dom «Biya». 2006. 554 s.
  19. International Phonetic Alphabet (IPA) Chart with Sounds. El. resurs: https://www.internationalphoneticalphabet.org/ipa-sounds/ipa-chart-with-sounds/. Data obrashcheniya: 04.06.2025.
  20. Ryzhikova T. R., Shindrova K. V., Plotnikov I. M., Yakimets N. V. Intonatsionnye i pragmaticheskie kharakteristiki dialogicheskoj rechi barabintsev i chatov [Intonational and pragmatic characteristics of the Barabian and Chat dialogical speech] // Yazyki i fol'klor ko-rennykh narodov Sibiri. 2024. № 4 (Vyp. 52). S. 98‒113.
  21. Dobrynina A. A., Shindrova K. V., Grigor'eva A. S., Shestera E. A. Intonatsiya dialoga na kumandinskom yazyke (rezul'taty polevykh issledovanij) [Intonationa of a dialogue in Kumandy language (results of the field research)] // Tomskij zhurnal lingvisticheskikh i an-tropologicheskikh issledovanij. 2024. №4 (46). S. 47–57.
  22. Ryzhikova T. R., Dobrinina A. A., Plotnikov I. M., Shestera E. A., Shamrin A. S. Into-natsiya modal'nykh voprositel'nykh vyskazyvanij v altajskom yazyke (na materiale fol'klora altaj-kizhi) [Intonation of modal interrogative utterances in the Altai language (on the folklore of Altai-kizhi)] // Sibirskii filologicheskii zhurnal. 2020. №2. S. 149–165.
  23. Ladd D. R. Intonation // Halbband Language Typology and Language Universals 2. Teilband. Berlin, Boston: De Gruyter Mouton. 2001. P. 1380–1390.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2025 Ryzhikova T.R.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».