Forecasting Russian stock returns based on investor sentiment analysis in social networks

Cover Page

Full Text

Open Access Open Access
Restricted Access Access granted
Restricted Access Subscription Access

Abstract

The study explores the sentiment of Russian private investors in social networks and its impact on the dynamics of the stock return of 78 companies on the Russian stock market (MOEX) in the period from 2018 to 2022. To take into account sentiment when forecasting returns, the authors RSMI index (Russian social media index) is used, which is based on a unique sample of messages from the most popular social networks among Russian investors — “Telegram” and “Tinkoff Pulse”. The RSMI index includes quantitative (the number of publications in relation to each company) and qualitative (investor reactions) characteristics, allowing to determine the real impact of a particular publication on investors. Using the RSMI index, several models for predicting stock prices of Russian companies were used: lasso regression, random forest, gradient boosting, extreme gradient boosting, ensemble learning and long short-term memory. It is demonstrated that for a wide sample of stocks, indicators of technical and fundamental analysis play a large role in building forecasts of changes in stock returns based on hourly data. Although the addition of the sentiment index improves the results of predicting returns for a wide sample of stocks, it does not significantly improve the predictive ability of the models and shows mixed results. The best results of adding the sentiment index to forecast models are shown for the top 15 most discussed Russian companies. For individual models, we achieved an average error reduction of 4.9%, and at the level of specific companies, the MAE error rate was reduced by more than 10% and MSE by 20%. It has been proven that the returns of low-liquidity stocks of the second and third tiers of the Russian stock market are not significantly influenced by the sentiment of private investors on hourly data, and the addition of the sentiment index does not improve the results of forecast models.

Full Text

Restricted Access

About the authors

G. A. Khaziev

National Research University Higher School of Economics (HSE University)

Author for correspondence.
Email: gakhaziev@hse.ru
Russian Federation, Moscow

T. V. Sokolova

National Research University Higher School of Economics, (HSE University)

Email: tv.sokolova@hse.ru
Russian Federation, Moscow

References

  1. Теплова Т. В., Соколова Т. В., Томтосов А. Ф., Бучко Д. В., Никулин Д. Д. (2022). Сентимент частных инвесторов в объяснении различий в биржевых характеристиках акций российского рынка // Журнал Новой экономической ассоциации. № 1 (53). C. 53–84. [Teplova T. V., Sokolova T. V., Tomtosov A. F., Buchko D. V., Nikulin D. D. (2022). The sentiment of private investors in explaining the differences in the trade characteristics of the Russian market stocks. Journal of the New Economic Association, 1 (53), 53–84 (in Russian).]
  2. Agrawal T. J., Sehgal S., Vasishth V. (2020). Firm attributes, corporate fundamentals and investment strategies: An empirical study for Indian stock market. Management and Labour Studies, 45 (3), 366–387. doi: 10.1177/0258042X20927995
  3. Ahmed D., Neema R., Visqanadha N. (2022). Analysis and prediction of healthcare sector stock price using machine learning techniques: Healthcare stock analysis. International Journal of Information System Modeling and Design, 13, 9, 1–15. doi: 10.4018/IJISMD.303131
  4. Aslim M. F., Firmansyah G., Tjahjono B., Akbar H., Widodo A. M. (2024). Utilization of LSTM (Long Short Term Memory) based sentiment analysis for stock price prediction. Asian Journal of Social & Humanities, 1, 12, 1241– 1255. doi: 10.59888/ajosh.v1i12.141
  5. Audrino F., Sigrist F., Ballinari D. (2020). The impact of sentiment and attention measures on stock market volatility. International Journal of Forecasting, 36, 2, 334–357.
  6. Baker M., Wurgler J. (2007). Investor sentiment in the stock market. Journal of Economic Perspectives, 21, 2, 129–152.
  7. Basu S. (1983). The relationship between earnings yield, market value and return for NYSE Common Stocks. Journal of Financial Economics, 12, 129–156. doi: 10.1016/0304-405X(83)90031-4
  8. Bui D. G., Kong D.-R., Lin C.-Y., Lin T.-C. (2023). Momentum in machine learning: Evidence from the Taiwan stock market. Pacific-Basin Finance Journal, 82. Article 102178. doi: 10.1016/j.pacfin.2023.102178
  9. Cai Y., Tang Z., Chen Y. (2024). Can real-time investor sentiment help predict the high frequency stock returns? Evidence from a mixed-frequency-rolling decomposition forecasting method. North American Journal of Economics & Finance, 72. Article 102147. doi: 10.1016/j.najef.2024.102147
  10. Chen S., Ge L. (2019). Exploring the attention mechanism in LSTM-based Hong Kong stock price movement prediction. Quantitative Finance, 19, 9, 1507–1515.
  11. Chong E., Han C., Park F. C. (2017). Deep learning networks for stock market analysis and prediction: Methodology, data representations, and case studies. Expert Systems with Applications, 83, 187–205.
  12. Fama E. F. (1965). The behavior of stock-market prices. Journal of Business, 38, 34, Article 105.
  13. Gao B., Xie J. (2020). Forecasting excess returns and abnormal trading, using investor sentiment: Evidence from Chinese stock index futures market. Emerging Markets Finance and Trade, 56, 3, 593–612.
  14. Gao Y., Zhao C., Sun B., Zhao W. (2022). Effects of investor sentiment on stock volatility: New evidences from multi-source data in China’s green stock markets. Financial Innovation, 8, Article 77.
  15. Gu C., Kurov A. (2020). Informational role of social media: Evidence from Twitter sentiment. Journal of Banking & Finance, 121, Article 105969.
  16. Gupta R., Nel J., Pierdzioch C. (2023). Investor confidence and forecastability of US stock market realized volatility: Evidence from machine learning. Journal of Behavioral Finance, 24, 1, 111–122.
  17. Li T., Chen H., Liu W., Yu G., Yu Y. (2023). Understanding the role of social media sentiment in identifying irrational herding behavior in the stock market. International Review of Economics & Finance, 87, 163–179. DOI: 10.1016/ j.iref.2023.04.016
  18. Li Y., Bu H., Li J., Wu J. (2020). The role of text-extracted investor sentiment in Chinese stock price prediction with the enhancement of deep learning. International Journal of Forecasting, 36 (4), 1541–1562.
  19. Liang C., Tang L., Li Y., Wei Y. (2020). Which sentiment index is more informative to forecast stock market volatility? Evidence from China. International Review of Financial Analysis, 71, Article 101552.
  20. Lin P., Ma S., Fildes R. (2024). The extra value of online investor sentiment measures on forecasting stock return volatility: A large-scale longitudinal evaluation based on Chinese stock market. Expert Systems with Applications, 238, Article 121927. doi: 10.1016/j.eswa.2023.121927
  21. Liu J.-X., Leu J.-S., Holst S. (2023). Stock price movement prediction based on stocktwits investor sentiment using FinBERT and ensemble SVM. PeerJ Computer Science, 9, Article e1403. doi: 10.7717/peerj-cs.1403
  22. Liu Q., Lee W.-S., Huang M., Wu Q. (2023). Synergy between stock prices and investor sentiment in social media. Borsa Istanbul Review, 23, 1, 76–92. doi: 10.1016/j.bir.2022.09.006
  23. Mili M., Sahut J.-M., Teulon F., Hikkerova L. (2024). A multidimensional Bayesian model to test the impact of investor sentiment on equity premium. Annals of Operations Research, 334, 1–3, 919–39. doi: 10.1007/s10479-023-05165-0
  24. Navratil R., Taylor S., Vecer J. (2021). On equity market inefficiency during the COVID-19 pandemic. International Review of Financial Analysis, 77, Article 101820. doi: 10.1016/j.irfa.2021.101820
  25. Neely C., Rapach D. E., Tu J., Zhou G. (2014). Forecasting the equity risk premium: The role of technical indicators. Management Science, 60, 7, 1772–1791. doi: 10.1287/mnsc.2013.1838
  26. Niu H., Pan Q., Xu K. (2023). Hybrid deep learning models with multi-classification investor sentiment to forecast the prices of China’s leading stocks. PLoS ONE, 18, 11, Article e0294460. doi: 10.1371/journal.pone.0294460
  27. Ph H., Rishad A. (2020). An empirical examination of investor sentiment and stock market volatility: evidence from India. Financial Innovations, 6, Article 34.
  28. Phuoc T., Anh P. T.K., Tam P. H., Nguyen C. V. (2024). Applying machine learning algorithms to predict the stock price trend in the stock market — the case of Vietnam. Humanities and Social Sciences Communications, 11, Article 393. doi: 10.1057/s41599-024-02807-x
  29. Sarkar A., Chakraborty S., Ghosh S., Naskar S. K. (2022). Evaluating impact of social media posts by executives on stock prices. FIRE ‘22: Proceedings of the 14th Annual Meeting of the Forum for Information Retrieval Evaluation, 74–82. doi: 10.1145/3574318.3574339
  30. Shiller R. J. (2003). From efficient markets theory to behavioral finance. Journal of Economic Perspectives, 17, 83, Article 104.
  31. Tallboys J., Zhu Y., Rajasegarar S. (2022). Identification of stock market manipulation with deep learning. In: International Conference on Advanced Data Mining and Applications, 408–420. Cham: Springer.
  32. Teplova T., Tomtosov A., Sokolova T. (2022). A retail investor in a cobweb of social networks. PLoS One, 17, 12, Article e0276924.
  33. Uslu N. C., Akal F. (2021). A machine learning approach to detection of trade-based manipulations in Borsa Istanbul. Computational Economics, 60, 1, 25–45.
  34. Wang G., Yu G., Shen X. (2020). The effect of online investor sentiment on stock movements: An LSTM approach. Complexity, 1–11, Article 4754025.
  35. Xu L., Xue C., Zhang J. (2024). The impact of investor sentiment on stock liquidity of listed companies in China. Investment Management and Financial Innovations, 21, 2, 1–14.
  36. Xu Q., Wang L., Jiang C., Zhang X. (2019). A novel UMIDAS-SVQR model with mixed frequency investor sentiment for predicting stock market volatility. Expert Systems with Applications, 132, 12–27.

Copyright (c) 2025 Russian Academy of Sciences

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».