Сентимент анализ как инструмент лингвоэмотиологии: оценка потенциала систем анализа тональности текста

Обложка

Цитировать

Полный текст

Аннотация

Оценка тональности текста в больших информационных потоках решается как качественными так и количественными методами. Качественные методы включают в себя, в первую очередь, методы лингвоэмотиологии, включая составление тональных словарей, используемых в том числе в компьютерных системах оценки тональности текста. В статье рассматриваются принципы функционирования систем автоматического анализа текста как метода компьютерного анализа текста, приводится анализ ряда современных систем анализа тональности текста. Определяются характеристики систем, на языковом материале размеченных корпусов кинорецензий и отзывов на товары известного маркетплейса выявляются достоинства и недостатки анализируемых систем. Особое внимание уделяется лингвистическим причинам недостатков оценки тональности, таким как многоязычие, разные способы представления текста пользователями, включая сокращенные формы или аббревиатуры, расшифровка которых затрудняет процесс анализа, жанровое разнообразие, имплицитные оценки, полисемия и омонимия лексики, модификаторы полярности, ирреальное наклонение, сарказм, ирония и пр. По результатам исследования делается вывод, что наиболее эффективным функционалом определения тональности, необходимом оценочном средстве для лингвоэмотиологии и лингвоконфликтологии, обладают программы, использующие гибридный метод. В работе предлагаются возможные подходы к оптимизации функционирования программ. Исследование позволяет приблизиться к более четкому пониманию феномена выявления тональности текста и выбора для этих целей систем сентимент анализа, основанных на разных принципах функционирования. Такие системы, с одной стороны, решают прикладные задачи сентимент анализа, а с другой - являются источником материала для исследований в рамках лингвистической теории эмоций.

Об авторах

Ольга Ивановна Максименко

Государственный университет просвещения

Автор, ответственный за переписку.
Email: maxbel7@yandex.ru
ORCID iD: 0000-0002-6611-8744
SPIN-код: 7708-5901

доктор филологических наук, профессор, профессор кафедры теории языка, англистики и прикладной лингвистики лингвистического факультета

105005, Российская Федерация, г. Москва, ул. Радио, д. 10а, стр. 2

Михаил Васильевич Беляков

Московский государственный институт международных отношений (университет) МИД России

Email: m.belyakov@my.mgimo.ru
ORCID iD: 0000-0002-6230-9893
SPIN-код: 1761-5400

доктор филологических наук, доцент, профессор кафедры русского языка

119454, Российская Федерация, г. Москва, проспект Вернадского, д. 76

Список литературы

  1. Shakhovsky, V.I. (1987). Categorization of Emotions in the Lexico-Semantic System of Language. Voronezh: Voronezh State University publ. (In Russ.).
  2. Shakhovsky, V.I. (2008). Linguistic Theory of Emotions. Moscow: Gnosis. (In Russ.).
  3. Belyakov, M.V. (2022). Linguoaxiology and Linguosemiotics of Diplomatic discourse (based on the Material of Open Professional Diplomacy) [Doctoral Thesis]. Moscow. (In Russ.).
  4. Belyakov, M.V. (2016). Analysis of News Reports on the Website of the Ministry of Foreign Affairs of the Russian Federation by the Method of Sentiment Analysis (Art. 2). RUDN Journal of Language Studies, Semiotics and Semantics, 6(4), 115–124. (In Russ.).EDN: WZZKRZ
  5. Maksimenko, O.I. (2012). Analysis of the Tonality of Texts (Sentiment Analysis) Based on Media Texts. In: Proceedings of IV Novikov readings: Functional Semantics and Semiotics of Sign Systems. Part 1 (pp. 96–105). Moscow: RUDN University publ. (In Russ.).
  6. Introduction to Sentiment Analysis: What is Sentiment Analysis (2018). URL: https://algorithmia.com/blog/introduction-sentiment-analysis (accessed: 10.01.2025).
  7. Agrawal, R., & Gupta, N. (2018). Extracting Knowledge from Opinion Mining. In: Advances in Data Mining and Database Management. Hershey: IGI Global. https://doi.org/ 10.4018/978-1-5225-6117-0
  8. Yurganov, A.A. (2017). Sentiment Analysis as a Tool for Text Research. Problems of Modern Science and Education, 29(111), 39–41. (In Russ.). EDN: ZDMSVF
  9. Pang, B., & Lee, L. (2008). Opining Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval, 2(1–2), 1–135.
  10. Shakhovsky, V.I. (2009). Emotions as an Object of Research in Linguistics. Journal of Psycholinguistics, 9, 29–43. (In Russ.). EDN: LAULHF
  11. Kolmogorova, A.V., Kalinin, A.A., & Malikova, A.V. (2019). Who Speaks about What in “Joyful” and “Sad” Texts: in Search of Discriminating Features of Texts of Different Emotional Tones. Proceedings of the Ural Federal University. Series 2, Humanities, 21(4(193)), 219—234. (In Russ.). https://doi.org/ 10.15826/izv2.2019.21.4.078 EDN: JMPVSS
  12. Kolmogorova, A.V., & Vdovina, L.A. (2019). Lexico-Grammatical Markers of Emotions as Parameters for The Sentimental Analysis of Russian-Language Internet Texts. Bulletin of the Perm University. Russian and Foreign Philology, 11(3), 38–46. (In Russ.). https://doi.org/ 10.17072/2073-6681-2019-3-38-46 EDN: VOGAAV
  13. Kolmogorova, A.V. (2018). Verbal Markers of Emotions in the Context of Solving Problems of Sentiment Analysis. Questions of Cognitive Linguistics, Issues of Cognitive Linguistics, 1(54), 83—93. (In Russ.). https://doi.org/ 10.20916/1812-3228-2018-1-83-93 EDN: QIWKPN
  14. Semina, T.A. (2018). Dichotomy Subjectivity vs. Objectivity and Tonal Relevance in the Tasks of Tonality Analysis. Bulletin of the Moscow State Regional University. Series: Linguistics, 1, 38–45. (In Russ.). https://doi.org/ 10.18384/2310-712X-2018-1-38-45 EDN: YRNQNH
  15. Scheible, C., & Schutze, H. (2013). Sentiment Relevance. In: Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics, August 4–9. (pp. 954–963). Sofia, Bulgaria: Association for Computational Linguistics.
  16. Narayanan, R., Liu, B., & Choudhary, A. (2009). Sentiment Analysis of Conditional Sentences. In: Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing (pp. 180–189). Singapore: ACL and AFNLP. URL: https://www.researchgate.net/publication/221012837_Sentiment_Analysis_of_Conditional_Sentences (accessed: 10.01.2025). https://doi.org/ 10.3115/1699510.1699534
  17. Failures, A.G., Voronina, I.E., et al. (2016). Advanced Neural Network Models for Solving the Problem of Determining Tonality. Proceedings of Voronezh State University. Series: Systems Analysis and Information Technologies, 4, 178–183. EDN: XVSYZX
  18. Rentoumi, V., Petrakis, S., Klenner, M. et al. (2010). United We Stand: Improving Sentiment Analysis by Joining Machine Learning and Rule Based Methods. In: 7th International Conference on Language Resources and Evaluation (LREC 2010), 19–21 May 2010 (pp. 954–963). Malta: Zurich Open Repository and Archive, University of Zurich.
  19. Becker, I., & Aharonson, V. (2010). Last but definitely not least: on the role of the last sentence in automatic polarity-classification. In: Proceedings of the ACL 2010 Conference Short Papers 11–16 July 2010 (pp. 331–335). Sweden: Uppsala, Association for Computational Linguistics URL: https://www.researchgate.net/publication/220873476_Last_but_Definitely_Not_Least_On_the_Role_of_the_Last_Sentence_in_Automatic_Polarity-Classification (accessed: 10.01.2025).
  20. Shakhovsky, V.I. (2019). Substantiation of the Linguistic Theory of Emotions. Journal of psycholinguistics, 1(39), 22–37. (In Russ.). https://doi.org/ 10.30982/2077-5911-2019-39-1-22-37 EDN: SKQDYO

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».