Textual studies of the era of big data and neural networks

Cover Page

Full Text

Open Access Open Access
Restricted Access Access granted
Restricted Access Subscription Access

Abstract

This article analyses the emergence of new technologies for working with big data which can be highly helpful to philologists, studying the diachronic development. First of all, that applies to the study and publication of Old Russian manuscripts with traditional liturgical texts used for church service. These manuscripts existed in a huge number of folios, and in the process of copying were subjected to considerable textual unification. That makes it very difficult to study them by the laborious methods of traditional textual criticism. Now, when the full text of the monuments can be automatically processed, the creation of the Linguistic intellectual environment (LIE) has been lounged. This tool will provide new opportunities for the study of Slavonic liturgical texts from different historical periods. As a result, we will create a corpus of liturgical texts of the 11th–17th centuries, obtained using a program for automatic text recognition of manuscripts, with annotation und search module. The user of the LIE will be able to receive a complete list of variant readings for each fragment of a liturgical book of the widest range of manuscripts. In fact, we are talking of a new type of publication of traditional liturgical texts, when the user can set the parameters for the edition in accordance with his research interests.

Full Text

Restricted Access

About the authors

Alexandr G. Kravetskiy

V. V. Vinogradov Russian Language Institute of the Russian Academy of Sciences; National Research Nuclear University “MEPhI”

Author for correspondence.
Email: krav62@mail.ru
Russian Federation, Moscow; Moscow

Svetlana M. Kusmaul’

V. V. Vinogradov Russian Language Institute of the Russian Academy of Sciences; National Research Nuclear University “MEPhI”

Email: kusmauls@yandex.ru
Russian Federation, Moscow; Moscow

Ekaterina A. Mishina

V. V. Vinogradov Russian Language Institute of the Russian Academy of Sciences; National Research Nuclear University “MEPhI”

Email: kmishina@mail.ru
Russian Federation, Moscow; Moscow

Alexandra A. Pletneva

V. V. Vinogradov Russian Language Institute of the Russian Academy of Sciences; National Research Nuclear University “MEPhI”

Email: apletneva@list.ru
Russian Federation, Moscow; Moscow

References

  1. Alexeev A. A. [The project of textual research of the Cyril and Methodius translation of the Gospel]. Sovetskoe slavyanovedenie, 1985, no. 1, pp. 82–95. (In Russ.)
  2. Alexeev A. A. Tekstologiya slavyanskoi Biblii [Text History of the Slavonic Bible]. St. Petersburg, Dmitrii Bulanin Publ., 1999. 255 p.
  3. Alexeev A. A. [Text History of Translated Works (Holy Scripture)]. Likhachev D. S. with the participation of Alekseev A. A. i Bobrov A. G. Tekstologiia. Na materiale russkoi literatury XI–XVII v. [Textology. Based on Russian literature 11th — 17th c.] St. Petersburg, Aleteiia Publ., 2001, pp. 689–717. (In Russ.)
  4. Alekseev A. A., Kuznetsova E. L. [Computers and Problems of Text History of Slavic texts]. Lingvisticheskie zadachi i problemy obrabotki dannykh na EVM [Linguistic problems and problems of data processing on computers]. Ed. by Yu. N. Karaulov. Moscow, AS USSR Publ., 1988, pp. 111–120. (In Russ.)
  5. Afanas'eva E. V., Shvarts E. M. [The oldest Slavic translation of the Book of Job (based on parchment manuscripts)]. Istochnikovedenie literatury Drevnei Rusi [Source study of literature of Ancient Russia] Ed. by D. S. Likhachev. Leningrad, Nauka Publ., 1980, pp. 7–32. (In Russ.)
  6. Colwell E. C. Studies in Methodology in Textual Criticism of the New Testament. Leiden, E. J. Brill Publ., 1969. 175 p.
  7. Likhachev D. S. Tekstologiya. Na materiale russkoi literatury X–XI vekov [Textology. Based on the material of Russian literature of the 10th — 11th centuries]. Leningrad, Nauka Publ., 1983. 639 p.
  8. Pichkhadze A. A. [The book “Exodus” in the Slavic Lectionar]. Uchenye zapiski Rossiiskogo pravoslavnogo universiteta ap. Ioanna Bogoslova [Scientific notes of the Russian Orthodox University of the Apostle John the Theologian.]. Ed. by Igumen Ioann (Ekonomtsev). Moscow, Russian Orthodox University Publ., 1998, pp. 5–60. (In Russ.)
  9. Rabus A. Recognizing handwritten text in Slavic Manuscripts: a neural-network approach using Transcribus. Scripta & e-Scripta, 2019, vol. 19, pp. 9–32. (In Eng.)
  10. Sapunov B. V. Kniga v Rossii v XI–XIII vv. [The book in Russia in the 11th — 13th centuries]. Leningrad, Nauka Publ., 1978. 231 p.
  11. Spasskii F. G. Russkoe liturgicheskoe tvorchestvo [Russian Liturgical creativity] Mockow, Publ. Council of the Russian Orthodox Church, 2008. 544 p.

Copyright (c) 2024 Russian Academy of Sciences

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».