Идентификация средств категории отрицания в сбалансированном лингвистическом корпусе

Обложка

Цитировать

Аннотация

Цель исследования – разработать базовую технологию идентификации средств категории отрицания в рамках работы программного комплекса «Генератор сбалансированного лингвистического корпуса и корпусный менеджер». Применяются методы анализа, тестирования, моделирования, профессионально ориентированного программирования и эксперимента. В качестве лингвистического материала выступает корпус актуальных новостных текстов CNN объемом 1 024 583 токена. В результате исследования уточнены возможности текущей версии программного комплекса, а также написано расширение, позволяющее находить лексические единицы, находящиеся в прямом подчинении от заданной леммы.

Об авторах

Алексей Иванович Горожанов

Московский государственный лингвистический университет

Автор, ответственный за переписку.
Email: a.gorozhanov@linguanet.ru
ORCID iD: 0000-0003-2280-1282
SPIN-код: 1753-4920
Scopus Author ID: 57221193252
ResearcherId: U-2569-2018

доктор филологических наук, доцент, профессор кафедры грамматики и истории немецкого языка факультета немецкого языка

Россия

Список литературы

  1. Гращенков П. В., Студеникина К. А., Паско Л. И. Ограничение сочинительного острова в лингвистической компетенции больших языковых моделей // Вестник Санкт-Петербургского университета. Язык и литература. 2024. Т. 21. № 3. С. 668–688. doi: 10.21638/spbu09.2024.309. EDN HCAZUH.
  2. Лагутина К. В., Бойчук Е. И., Лагутина Н. С. Автоматическая классификация русскоязычных интернет-текстов по жанрам // Искусственный интеллект и принятие решений. 2023. № 4. С. 103–114. doi: 10.14357/20718594230410. EDN BAKBAF.
  3. Солнышкина М. И., Макнамара Д. С., Замалетдинов Р. Р. Обработка естественного языка и изучение сложности дискурса // Russian Journal of Linguistics. 2022. Т. 26. № 2. С. 317–341. doi: 10.22363/2687-0088-30171. EDN EQQVTI.
  4. Гагарин С. Н. Базовые методики анализа языковых картин политики с помощью языка программирования Python и библиотеки NLTK (на материалах корпусов британского парламентского дискурса) // Филологические науки в МГИМО. 2024. Т. 10. № 2. С. 125–140. doi: 10.24833/2410-2423-2024-2-39-125-140. EDN GDGMAO.
  5. Сафина З. М. Переводческий анализ художественного текста на языке Python // Глобальный научный потенциал. 2024. Т. 1. № 11(164). С. 177-180. EDN RTJTGQ.
  6. Красикова Е. А. Роль корпусного менеджера в анализе употребления имен собственных в текстах электронных СМИ (на примере англоязычного корпуса CNN) // Филологические науки в XXI веке: актуальность, многополярность, перспективы развития : Сборник научных трудов. Краснодар: КубГУ, 2024. С. 45–49. EDN JPRHAE.
  7. Степанова Д. В. Презентация существительных семантического ряда «традиционные энергоносители» в современных СМИ ФРГ (на материале текстов газеты «Франкфуртер Альгемайне Цайтунг») // Филологические науки в XXI веке: актуальность, многополярность, перспективы развития : Сборник научных трудов. Краснодар: КубГУ, 2024. С. 136–140. EDN PUDELJ.
  8. Горожанов А. И. Архитектура сбалансированного лингвистического корпуса, полученного автоматическим путем (опыт Московского государственного лингвистического университета) // Вестник Московского государственного лингвистического университета. Гуманитарные науки. 2024а. № 11 (892). С. 24–30. EDN BCSCXQ.
  9. Глушак В. М. Отрицание немецких полярных слов и выражений в автоматизированном анализе тональности текста // Филологические науки. Вопросы теории и практики. 2023. Т. 16. № 10. С. 3287–3292. doi: 10.30853/phil20230510. EDN CWDXEU.
  10. Горожанов А. И. Метод программного анализа контекста лексической единицы // Актуальные проблемы филологии и педагогической лингвистики. 2024б. № 3. С. 178–190. doi: 10.29025/2079-6021-2024-3-178-190. EDN QNFATA.
  11. Горожанов А. И. Расширение стандартного сбалансированного лингвистического корпуса, построенного по правилам spaCy, коннотативными характеристиками // Филологические науки. Вопросы теории и практики. 2023. Т. 16. № 11. С. 3888–3893. doi: 10.30853/phil20230594. EDN FVUIUL.
  12. Сытько А. В. Отрицательные деонтические высказывания: семантика и прагматика (на материале немецкого и русского языков) // Вестник Минского государственного лингвистического университета. Серия 1: Филология. 2023. № 2 (123). С. 40–49. EDN MZPNGY.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).