Intelligent System of Analytical Processing of Digital Network Content for Protection Against Inappropriate Information

Cover Page

Cite item

Full Text

Abstract

Currently, the Internet and social networks as a medium for the distribution of digital network content are becoming one of the most important threats to personal, public and state information security. There is a need to protect the individual, society and the state from inappropriate information. In scientific and methodological terms, the problem of protection from inappropriate information has an extremely small number of solutions. This determines the relevance of the results presented in the article, aimed at developing an intelligent system of analytical processing of digital network content to protect against inappropriate information. The article discusses the conceptual foundations of building such a system, revealing the content of the concept of inappropriate information and representing the overall architecture of the system. Models and algorithms for the functioning of the most characteristic components of the system are given, such as a distributed network scanning component, a multidimensional classification component of network information objects, a component for eliminating incompleteness and inconsistency, and a decision-making component. The article presents the results of the implementation and experimental evaluation of system components, which demonstrated the ability of the system to meet the requirements for the completeness and accuracy of detection and counteraction of unwanted information in conditions of its incompleteness and inconsistency.

About the authors

I. V Kotenko

SPC RAS

Email: ivkote@comsec.spb.ru
14-th Line V.O. 39

I. B Saenko

SPC RAS

Email: ibsaen@comsec.spb.ru
14-th Line V.O., 39

A. A Branitskiy

SPC RAS

Email: branitskiy@comsec.spb.ru
14-th Line V.O. 39

I. B Parashchuk

SPC RAS

Email: parashchuk@comsec.spb.ru
14-th Line V.O. 39

D. A Gaifulina

SPC RAS

Email: gaifulina@comsec.spb.ru
14-th Line V.O. 39

References

  1. Scott J. Social Network Analysis: Developments, Advances, and Prospects // Social Network Analysis and Mining. 2011. vol. 1. no. 1. pp. 21-26.
  2. Jebari C. A pure URL-based genre classification of web pages // Proceedings of the 25th International Workshop on Database and Expert Systems Applications. 2014. pp. 233–237.
  3. Kotenko I., Chechulin A., Komashinsky D. Categorisation of Web Pages for Protection against Inappropriate Content in the Internet // International Journal of Internet Protocol Technology (IJIPT). 2017. vol. 10. no. 1. pp. 61-71.
  4. Vaismoradi M., Turunen H., Bondas T. Content Analysis and Thematic Analy-sis: Implications for Conducting a Qualitative Descriptive Study // Nursing & Health Sciences. 2013. vol. 15. no. 3. pp. 398-405.
  5. Defranco J.F., Laplante Ph.A. A Content Analysis Process for Qualitative Software Engineering Research // Innov. Syst. Softw. Eng. 2017. vol. 13. no. 2-3. pp. 129-141.
  6. Boettger R.K., Palmer L.A. Quantitative Content Analysis: Its Use in Technical Communication // IEEE Transactions on Professional Communication. 2010. vol. 53. no. 4. pp. 346-357.
  7. Linhares R.N., Costa A.P. The use of qualitative data analysis software in brazilian educational papers // Proceedings of the International Conference in Engineering Applications (ICEA). 2019. pp. 1–7.
  8. Pashakhanlou H. Fully Integrated Content Analysis in International Relations // International Relations. 2017. vol. 31. no. 4. pp. 447-465.
  9. Timmermans S., Iddo T. Theory Construction in Qualitative Research: From Grounded Theory to Abductive Analysis // Sociological Theory. 2012. vol. 30. no. 3. pp. 167-186.
  10. Gunawan T.S., Abdullah N.A.J., Kartiwi M., Ihsanto E. Social network analysis using python data mining // Proceedings of the 8th International Conference on Cyber and IT Service Management (CITSM). 2020. pp. 1–6.
  11. UCINET documentation. URL: sites.google.com/site/ ucinetsoftware/document (дата доступа: 29.07.2021).
  12. Du W. Toward semantic social network analysis for business big data // Proceedings of the 14th International Conference on Semantics, Knowledge and Grids (SKG). 2018. pp. 1–8.
  13. Li H., Zhang Z., Xu Y. Web page classification method based on semantics and structure // Proceedings of the 2nd International Conference on Artificial Intelligence and Big Data (ICAIBD). 2019. pp. 238–243.
  14. Patil A., Pawar B. Automated classification of web sites using Naive Bayessian algorithm // Proceedings of the International Multi-Conference of Engineers and Computer Scientists. 2012. vol. 1. pp. 466–467.
  15. Kotenko I., Chechulin A., Shorov A., Komashinsky D. Analysis and evaluation of web pages classification techniques for inappropriate content blocking // Proceedings of the 14th Industrial Conference on Data Mining (ICDM 2014). Lecture Notes in Artificial Intelligence. 2014. vol. 8557. pp. 39–54.
  16. Shibu S., Vishwakarma A., Bhargava N. A Combination Approach for Web Page Classification using Page Rank and Feature Selection Technique // International Journal of Computer Theory and Engineering. 2010. vol. 2. no. 6. pp. 897-900.
  17. Xu Z., Yan F., Qin J., Zhu H. A web page classification algorithm based on link information // Proceedings of the 10th International Symposium on Distributed Computing and Applications to Business, Engineering and Science. 2011. pp. 82–86.
  18. Hashemi M. Web Page Classification: A Survey of Perspectives, Gaps, and Future Directions // Multimed. Tools Appl. 2020. vol. 79. pp. 11921-11945.
  19. Patel A.D., Pandya V.N. Web page classification based on context to the con-tent extraction of articles // Proceedings of the 2nd International Conference for Convergence in Technology (I2CT). 2017. pp. 539–541.
  20. Arya C., Dwivedi S.K. News web page classification using URL content and structure attributes // Proceedings of the 2nd International Conference on Next Generation Computing Technologies (NGCT). 2016. pp. 317–322.
  21. Safae L., Habib B. E., Abderrahim T. A Review of machine learning algorithms for web page classification // Proceedings of the 5th International Congress on Information Science and Technology (CiSt). 2018. pp. 220–226.
  22. Aydın K.E., Baday S. Machine learning for web content classification // Proceedings of the Innovations in Intelligent Systems and Applications Conference (ASYU). 2020. pp. 1–7.
  23. Petprasit W., Jaiyen S. E-commerce web page classification based on automatic content extraction // Proceedings of the 12th International Joint Conference on Computer Science and Software Engineering (JCSSE). 2015. pp. 74–77.
  24. Belmouhcine A., Idrissi A., Benkhalifa M. Web Classification Approach Using Reduced Vector Representation Model Based on HTML Tags // Journal of Theoretical and Applied Information Technology. 2013. vol. 55. no. 1. pp. 137-148.
  25. Kotenko I., Chechulin A., Komashinsky D. Evaluation of text classification techniques for inappropriate web content blocking // Proceedings of the IEEE 8th International Conference on Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications (IDAACS'2015). 2015. pp. 412–417.
  26. Novozhilov D., Kotenko I., Chechulin A. Improving the categorization of web sites by analysis of html-tags statistics to block inappropriate content // Proceedings of the 9th International Symposium on Intelligent Distributed Computing (IDC’2015). 2016. pp. 257–263.
  27. Mishra M., Srivastava M. A view of artificial neural network // Proceedings of the International Conference on Advances in Engineering & Technology Research (ICAETR - 2014). 2014, pp. 1–3.
  28. Mehlig B. Artificial Neural Networks. University of Gothenburg, Sweden. 2019.
  29. Burghardt F., Garbe R. Introduction of artificial neural networks in EMC // Proceedings of the IEEE Symposium on Electromagnetic Compatibility, Signal Integrity and Power Integrity (EMC, SI & PI). 2018. pp. 165–169.
  30. Parashchuk I.B. System formation algorithm of communication network quality factors using artificial neural networks // Proceedings of the 1st IEEE International Conference on Circuits and System for Communications (ICCSC’02). 2002. pp. 263–266.
  31. Pandey K., Bhanacharjee S., Lau S., Tushir M. A Comparative study of fuzzy systems and neural networks for system modeling and identification // Proceedings of the 2nd IEEE International Conference on Power Electronics, Intelligent Control and Energy Systems (ICPEICES). 2018. pp. 876–880.
  32. Агеев С.А., Саенко И.Б. Управление безопасностью защищенных мульти-сервисных сетей специального назначения // Труды СПИИРАН. 2010. № 2(13). С. 182–198.
  33. Kotenko I., Parashchuk I., Omar T. Neuro-fuzzy models in tasks of intelligent data processing for detection and counteraction of inappropriate, dubious and harmful information // Proceedings of the 2nd International Scientific-Practical Conference Fuzzy Technologies in the Industry. 2018. pp. 116–125.
  34. Нугуманова А.Б., Бессмертный И.А., Пецина П., Байбурин Е.М. Обогаще-ние модели Bag of words семантическими связями для повышения качества классификации текстов предметной области // Программные продукты и системы. 2016. №. 2 (114). С. 89–99.
  35. Mikolov T., Chen K., Corrado G., Dean J. Efficient estimation of word representations in vector space // arXiv preprint arXiv:1301.3781. 2013. pp. 1–12.
  36. SquidGuard – Blacklists. URL: www.squidguard.org/blacklists.html (дата доступа: 29.07.2021).
  37. Shalla Secure Services. Shalla's Blacklists. URL: www.shallalist.de/ (дата доступа: 29.07.2021).
  38. DMOZ. Archive. URL: dmoz-odp.org/ (дата доступа: 29.07.2021).
  39. Joulin A., Grave E., Bojanowski P., Mikolov T. Bag of tricks for efficient text classification // arXiv preprint arXiv:1607.01759. 2016. pp. 1–5.
  40. Браницкий А.А., Котенко И.В. Обнаружение сетевых атак на основе комплексирования нейронных, иммунных и нейронечетких классификаторов // Информационно-управляющие системы. 2015. № 4 (77). С. 69–77.
  41. Паращук И.Б., Башкирцев А.С., Михайличенко Н.В. Анализ уровней и видов неопределенности, влияющей на принятие решений по управлению информационными системами // Информация и космос. 2017. № 1. С. 112–120.

Supplementary files

Supplementary Files
Action
1. JATS XML

Statistics

Views

Abstract: 128

PDF (Russian): 5

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».