Логико-математическая интерпретация решений интеллектуальных агентов
- Авторы: Лютикова Л.А.1, Кочкарова М.С.2
-
Учреждения:
- Институт прикладной математики и автоматизации - филиал Кабардино-Балкарского научного центра Российской академии наук
- Северо-Кавказская государственная академия
- Выпуск: Том 27, № 6 (2025)
- Страницы: 125-134
- Раздел: Информатика и информационные процессы
- Статья получена: 29.01.2026
- Статья опубликована: 02.02.2026
- URL: https://journals.rcsi.science/1991-6639/article/view/378581
- DOI: https://doi.org/10.35330/1991-6639-2025-27-6-125-134
- EDN: https://elibrary.ru/MQAQTJ
- ID: 378581
Цитировать
Полный текст
Аннотация
Современные системы кибербезопасности сталкиваются с постоянным усложнением архитектуры сетей и увеличением разнообразия атакующих воздействий. В этих условиях особое значение приобретает способность интеллектуальных систем не только эффективно обнаруживать угрозы, но и объяснять принимаемые решения.
Цель работы – разработка и экспериментальная верификация модели RL-агента, способного принимать решения в сетевой среде, интерпретируемые в терминах временной и эпистемической логики.
Результаты. В статье представлен формальный подход к развитию объяснимого обучения с подкреплением (Explainable Reinforcement Learning, XRL) для задач кибербезопасности, включающий разработку математической модели интеллектуального агента, способного выявлять аномалии в сетевом трафике и принимать решения в условиях неопределенности. Предложен метод интерпретации стратегий агента, основанный на использовании временной логики линейных последовательностей (LTL) и эпистемической логики (EL), что обеспечивает прозрачность, формальную проверяемость и объяснимость поведения системы. Демонстрируется, что логико-математическая интерпретация обученных политик позволяет перейти от эмпирических зависимостей к формализуемым свойствам безопасности, живости и причинности, что способствует повышению доверия и надежности систем киберзащиты. В рамках вычислительного эксперимента подтверждена эффективность предложенного подхода: точность обнаружения аномалий достигла 94–96 %, а средняя задержка реакции – менее 0,3 секунды.
Заключение. Полученные результаты свидетельствуют о высокой применимости модели для построения объяснимых, верифицируемых и устойчивых систем кибербезопасности, а также демонстрируют, что логическая интерпретация стратегий способствует повышению прозрачности решений и укреплению доверия к интеллектуальным системам в области защиты информации. Эксперимент показал, что агент способен достигать высокой точности обнаружения угроз при малом времени реакции, а полученные логические формулы успешно проходят проверку на выполнимость спецификаций. Это подтверждает, что логическая интерпретация стратегий повышает прозрачность и доверие к решениям интеллектуальных систем.
Ключевые слова
Об авторах
Лариса Адольфовна Лютикова
Институт прикладной математики и автоматизации - филиал Кабардино-Балкарского научного центра Российской академии наук
Email: lylarisa@yandex.ru
ORCID iD: 0000-0003-4941-7854
SPIN-код: 1679-7460
вед. науч. сотр. отдела нейроинформатики и машинного обучения
Россия, 360000, Россия, г. Нальчик, ул. Шортанова, 89 АМадина Сосламбековна Кочкарова
Северо-Кавказская государственная академия
Автор, ответственный за переписку.
Email: madina_kochkarova_94@mail.ru
ассистент кафедры "Цифровая инженерия и сетевые технологии"
Россия, 369001, Россия, г. Черкесск, ул. Ставропольская, 36Список литературы
- Sutton R.S., Barto A.G. Reinforcement learning: an introduction. 2nd ed. MIT Press, 2020.
- Rybakov V.V. Intransitive linear temporal logic, knowledge from past, decidability, admissible rules. arXiv preprint arXiv: 1503.08761. 2015.
- Doshi-Velez F., Kim B. Towards a rigorous science of interpretable machine learning. arXiv preprint arXiv:1702.08608, 2017.
- Rudin C. Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead. Nature Machine Intelligence. 2019. Vol. 1. Pp. 206–215.
- Wang Ya., Yu W., Seligman J. Quantifier-free epistemic term-modal logic with assignment operator. Annals of Pure and Applied Logic. 2022. Vol. 173. No. 3. P. 103071. doi: 10.1016/j.apal.2021.103071
- Nguyen T.T., Reddi V.J. Deep reinforcement learning for cyber security. Computers & Security, 2022. Vol. 113. P. 102583. doi: 10.1109/TNNLS.2021.3121870
- Baier C., Katoen J.-P. Principles of Model Checking. MIT Press, 2008.
- Shoham Y., Leyton-Brown K. Multiagent systems: algorithmic, game-theoretic, and logical foundations. Cambridge University Press, 2009.
- Башмаков С. И., Кошелева А. В., Рыбаков В. В. Унификация во временных многоагентных логиках с универсальной модальностью // Математика в современном мире: тез. докл. междунар. конф. (14–19 августа 2017 г.). Новосибирск: ИМ СО РАН, 2017. С. 67.
- Wolter F.M., Zakharyaschev M. Undecidability of the unification and admissibility problems for modal and description logics. ACM Transactions on Computational Logic. 2008. Vol. 9. No. 4. P. 25.
- Lyutikova L.A. Methods for improving the efficiency of neural network decision-making. Advances in Automation IV. RusAutoCon 2022. Lecture Notes in Electrical Engineering. 2023. Vol. 986. Pp. 294–303. doi: 10.1007/978-3-031-22311-2_29
Дополнительные файлы



