Application for Data Retrieval, Analysis, and Forecasting in Social Networks

Cover Page

Cite item

Full Text

Open Access Open Access
Restricted Access Access granted
Restricted Access Subscription Access

Abstract

In this article, we present a web service designed for searching, extracting, and analyzing data from social networks and messengers, demonstrating its application for studying communities within the "VKontakte" social network. The web service enables the identification of typical user profiles within communities, the assessment of emotional sentiment in posts and comments, as well as the forecasting of community development trends. The described web service boasts extensive functional capabilities and an original neural network model for classifying texts of varying lengths based on emotional sentiment. Examples of the tool's usage are showcased in the analysis of the development of car brand communities. The analysis encompasses millions of subscriber audiences, tens of thousands of posts, and hundreds of thousands of comments, thereby affirming the relevance of the samples and the credibility of the results.

About the authors

Sergey A. Slastnikov

National Research University Higher School of Economics

Author for correspondence.
Email: sslastnikov@hse.ru

Associate Professor, Candidate of Technical Sciences

Russian Federation, Moscow

Liliia F. Zhukova

National Research University Higher School of Economics

Email: lfzhukova@hse.ru

Associate Professor, Candidate of Physical and Mathematical Sciences

Russian Federation, Moscow

Ilya V. Semichasnov

National Research University Higher School of Economics

Email: isemichasnov@hse.ru

Director

Russian Federation, Moscow

References

  1. Smetanin S. Pulse of the Nation: Observable Subjective Well-Being in Russia Inferred from Social Network Odnoklassniki. Mathematics. 2022;10(16):2497. Available from: https://doi.org/10.3390/math10162947 [Accessed 19 October 2022].
  2. Kovaleva Yu.V., Zhuravlev A.L. Social Mood and Subjectivity of Networks Community during the Pandemic COVID-19: Using the Example of Social Network Twitter. Federal State Financed Establishment of Science Institute of psychology. 2020;2(18):151-188 (In Russ.). doi: 10.38098/ipran.sep.2020.18.2.005
  3. Dokuka S.V., Valeeva D.R. Statistical Models for Analysis of Social Network Dynamics in Educational Studies. Voprosy Obrazovaniya. 2015;1:201-2013. (In Russ.) doi: 10.17323/1814-9545-2015-1-201-213
  4. Social networks as a tool for studying the psychological portrait of the consumer. Available from: https://econet.ru/articles/69899-sotsialnye-seti-kak-instrument-izucheniya-psihologicheskogo-portreta-potrebitelya. [Accessed 19 October 2022].
  5. Personality analysis on social networks as an effective method of recruitment. Available from:: https://www.4dk.ru/news/d/20181005135017-analiz-lichnosti-po-sotsialnym-setyam-kak-effektivnyy-metod-podbora-kadrov. [Accessed 19 October 2022].
  6. Ilić S. et al. Deep contextualized word representations for detecting sarcasm and irony/ arXiv preprint arXiv:1809.09795.2018.
  7. Ke G. et al. Lightgbm: A highly efficient gradient boosting decision tree. Advances in neural information processing systems. 2017; 30. doi: 10.5555/3294996.3295074.
  8. Sparck Jones K. A statistical interpretation of term specificity and its application in retrieval. Journal of documentation. 1972;28(1):11-21.doi: 10.1108/eb026526.
  9. Rogers A. et al. RuSentiment: An enriched sentiment analysis dataset for social media in Russian. Proceedings of the 27th international conference on computational linguistics. – 2018. – С. 755-763.
  10. Sidorov N., Slastnikov S. Some Features of Sentiment Analysis for Russian Language Posts and Comments from Social Networks. Journal of Physics: Conference Series. 2021;1740(1): 012036. doi: 10.1088/1742-6596/1740/1/012036.
  11. Blinov V., Bolotova-Baranova V., Braslavski P. Large dataset and language model fun-tuning for humor recognition. Proceedings of the 57th annual meeting of the association for computational linguistics. 2019;4027-4032. doi: 10.18653/v1/P19-1394.
  12. Pikabu. Available from: https://pikabu.ru. [Accessed 29 October 2022].
  13. Leaders and outsiders of the Russian car market in 2021. Available from: https://www.autostat.ru/in- fographics/50415/. [Accessed 23 October 2022].
  14. The ideal length of publications for social networks. Available from: https://rusability.ru/pfanshtil/idealnaya-dlinapublikatsii-dlya-sotssetei/5fd295792dda593c3483df3. [Accessed 24 October 2022].
  15. KPI in SMM: how to evaluate the effectiveness of promotion in social networks? Available from: https://vk.com/@smmmad-kpi-v-smm-kak-ocenit-effektivnost-prodvizheniya-v-socialnyh. [Accessed 24 October 2022].
  16. Social media and Media monitoring and Analysis system. Available from: https://br-analytics.ru/. [Accessed 28 October 2022].
  17. Medialogy: monitoring of mass media and social networks, a tool for evaluating the effectiveness of communications. Available from: https://www.mlg.ru. [Accessed 28 October 2022].
  18. Kostenetskiy P.S., Chulkevich R.A., Kozyrev V.I. HPC Resources of the Higher School of Economics. Journal of Physics: Conference Series. 2021;1740(1): 012050. doi: 10.1088/1742-6596/1740/1/012050.

Supplementary files

Supplementary Files
Action
1. JATS XML


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».