Comparative Analysis of Rumour Detection on Social Media Using Different Classifiers

Мұқаба

Дәйексөз келтіру

Толық мәтін

Аннотация

As the number of users on social media rise, information creation and circulation increase day after day on a massive basis. People can share their ideas and opinions on these platforms. A social media microblogging site such as Facebook or Twitter is the favoured medium for debating any important event, and information is shared immediately. It causes rumours to spread quickly and circulates inaccurate information, making people uneasy. Thus, it is essential to evaluate and confirm the level of veracity of such information. Because of the complexities of the text, automated detection of rumours in their early phases is challenging. This research employs various NLP techniques to extract information from tweets and then applies various machine learning models to determine whether the information is a rumour. The classification is performed using three classifiers such as SVC (Support Vector Classifier), Gradient Boosting, and Naive Bayes classifiers for five different events from the PHEME dataset. Some drawbacks include limited handling of imbalanced data, difficulty capturing complex linguistic patterns, lack of interpretability, difficulty handling large feature spaces, and insensitivity to word order and context by using the above classifiers. The stacking approach is used to overcome the above drawbacks in which the output of combined classifiers is an ensemble with LSTM. The performance of the models has been analyzed. The experimental findings reveal that the ensemble model obtained efficient outcomes compared to other classifiers, with an accuracy of 93.59%.

Авторлар туралы

M. Gidwani

Mukesh Patel School of Technology Management and Engineering (MPSTME), Shri Vile Parle Kelavani Mandal's Narsee Monjee Institute of Management Studies (SVKM's NMIMS)

Хат алмасуға жауапты Автор.
Email: renu.meghani@gmail.com
V.L. Mehta Road, Vile Parle, West, Maharashtra -

A. Rao

Mukesh Patel School of Technology Management and Engineering (MPSTME), Shri Vile Parle Kelavani Mandal's Narsee Monjee Institute of Management Studies (SVKM's NMIMS)

Email: ashwini.rao@nmims.edu
V.L. Mehta Road, Vile Parle, West, Maharashtra -

Әдебиет тізімі

  1. Bingol H., Alatas B. Rumor Detection in Social Media using machine learning methods. 1st International Informatics and Software Engineering Conference (UBMYK). 2019. pp. 1–4.
  2. He Z., Li C., Zhou F., Yang Y. Rumor detection on social media with event augmentations. Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2021. pp. 2020–2024.
  3. Pathak A.R., Mahajan A., Singh K., Patil A., Nair A. Analysis of techniques for rumor detection in social media. Procedia Computer Science. 2020. vol. 167. pp. 2286–2296.
  4. Xuan K., Xia R. Rumor stance classification via machine learning with text, user and propagation features. International Conference on Data Mining Workshops (ICDMW). 2019. pp. 560–566.
  5. Shi A., Qu Z., Jia Q., Lyu C. Rumor detection of COVID-19 pandemic on online social networks. IEEE/ACM Symposium on Edge Computing (SEC). 2020. pp. 376–381.
  6. Gidwani M., Rao A. Early Identification of Rumors in Social Media: A Survey. Modern Approaches in Machine Learning & Cognitive Science: A Walkthrough. 2022. pp. 305-316. doi: 10.1007/978-3-030-96634-8_28.
  7. Hassan N.Y., Gomaa W.H., Khoriba G.A., Haggag M.H. Supervised learning approach for Twitter credibility detection. 13th International Conference on computer engineering and Systems (ICCES). 2018. pp. 196–201.
  8. Zhao Z., Resnick P., Mei Q. Enquiring minds: Early detection of rumors in social media from enquiry posts. Proceedings of the 24th international conference on world wide web. 2015. pp. 1395–1405.
  9. Zubiaga A., Liakata M., Procter R. Learning reporting dynamics during breaking news for rumour detection in social media. Computer Science. arXiv preprint arXiv:1610.07363. 2016. 20 p.
  10. Kandasamy N., Murugasamy K. Detecting and filtering rumor in social media using news media event. Concurrency and Computation: Practice and Experience. 2021. vol. 33(5). doi: 10.1002/cpe.6329.
  11. Kumar A., Bhatia M.P.S., Sangwan S.R. Rumour detection using deep learning and filter-wrapper feature selection in benchmark Twitter dataset. Multimedia Tools and Applications. 2022. vol. 81. no. 24. pp. 34615–34632.
  12. Ahmad I., Yousaf M., Yousaf S., Ahmad M.O. Fake news detection using machine learning ensemble methods. Complexity. 2020. vol. 2020. pp. 1–11.
  13. Zubiaga A., Aker A., Bontcheva K., Liakata M., Procter R. Detection and resolution of rumours in social media: A survey. ACM Computing Surveys (CSUR). 2018. vol. 51. no. 2. pp. 1–36.
  14. Kotteti C.M.M., Dong X., Li N., Qian L. Fake news detection enhancement with data imputation. IEEE 16th Intl Conf on Dependable, Autonomic and Secure Computing, 16th Intl Conf on Pervasive Intelligence and Computing, 4th Intl Conf on Big Data Intelligence and Computing and Cyber Science and Technology Congress (DASC/PiCom/DataCom/CyberSciTech). 2018. pp. 187–192.
  15. Li Z., Zhang Q., Du X., Ma Y., Wang S. Social media rumor refutation effectiveness: Evaluation, modelling and enhancement. Information Processing & Management. 2021. vol. 58(1), 102420.
  16. Zubiaga A., Wong Sak Hoi G., Liakata M., Procter R. PHEME dataset of rumours and non-rumours. 2016. doi: 10.6084/M9.FIGSHARE.4010619.V1.
  17. Karkali M., Rousseau F., Ntoulas A., Vazirgiannis M. Efficient online novelty detection in news streams. Proceedings of International Conference on Web Information Systems Engineering. 2013. pp. 57–71. doi: 10.1007/978-3-642-41230-1_5.
  18. Vijayaraghavan S., Wang Y., Guo Z., Voong J., Xu W., Nasseri, A., Cai J., Li L., Vuong K., Wadhwa E. Fake news detection with different models. arXiv preprint arXiv:2003.04978. 2020. doi: 10.48550/arXiv.2003.04978.
  19. Vinothkumar S., Varadhaganapathy S., Ramalingam M., Ramkishore D., Rithik S., Tharanies K.P. Fake News Detection Using SVM Algorithm in Machine Learning. Proceedings of International Conference on Computer Communication and Informatics (ICCCI). 2022. pp. 1–7. doi: 10.1109/ICCCI54379.2022.9740886.
  20. Birunda S.S., Devi R.K. A novel score-based multi-source fake news detection using gradient boosting algorithm. Proceedings of International Conference on Artificial Intelligence and Smart Systems (ICAIS). 2021. pp. 406–414.
  21. Granik M., Mesyura V. Fake news detection using naive Bayes classifier. Proceedings of IEEE first Ukraine conference on electrical and computer engineering (UKRCON). 2017. pp. 900–903.

Қосымша файлдар

Қосымша файлдар
Әрекет
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».