Разработка подхода к классификации дефолта заемщика на основе интеграции методов предварительной обработки и методов машинного обучения

Обложка

Цитировать

Полный текст

Аннотация

Задача прогнозирования дефолта заемщиков лежит в основе финансовой стабильности кредитных организаций и является актуальной.

Цель исследования - разработка и оценка работы интегрального метода прогнозирования дефолта заемщика.

Материалы и методы. Исследование проведено путем моделирования работы интегрального метода прогнозирования дефолта заемщиков, анализа и сравнения полученных результатов с базовой моделью ИИ и формирования выводов.

Результаты. По итогам анализа зависимостей разработан и просчитан интегральный метод прогнозирования дефолта заемщика, который показал значительный рост показателей качества (рост средней точности - на 0,383, рост f1-score на - 0,509 и точности - на 0,792) относительно базовой модели. В данной статье приведены результаты экспериментов по улучшению показателей качества моделей машинного обучения, выполняющих прогнозирование дефолта заемщика.

Выводы. Разработка интегральных методов прогнозирования дефолта заемщиков позволит повысить точность и надежность прогнозных моделей, что имеет большое практическое значение.

Об авторах

А. Ф. Константинов

Российский экономический университет имени Г. В. Плеханова

Email: konstantinovaf@gmail.com
ORCID iD: 0009-0000-9591-3301
SPIN-код: 3088-3121

 аспирант кафедры информатики 

Россия, 115054, Россия, Москва, Стремянный переулок, 36

Л. П. Дьяконова

Российский экономический университет имени Г. В. Плеханова

Автор, ответственный за переписку.
Email: Dyakonova.LP@rea.ru
ORCID iD: 0000-0001-5229-8070
SPIN-код: 2513-8831

 канд. физ.-мат. наук, доцент, кафедра информатики 

Россия, 115054, Россия, Москва, Стремянный переулок, 36

Список литературы

  1. Информационно-аналитический материал о развитии банковского сектора Российской Федерации в декабре 2024. [Электронный ресурс]. Режим доступа: https://www.cbr.ru/collection/collection/file/55056/razv_bs_24_12.pdf (дата обращения: 17.09.2025)
  2. Ali A.A., Khedr A.M., El-Bannany M., Kanakkayil S. A powerful predicting model for financial statement fraud based on optimized xgboost ensemble learning technique. Applied Sciences. 2023. Vol. 13. No. 4. P. 2272. doi: 10.3390/app13042272
  3. Константинов А. Ф., Дьяконова Л. П. Сравнительный анализ методов снижения дисбаланса классов при построении моделей машинного обучения в финансовом секторе // Известия Кабардино-Балкарского научного центра РАН. 2025. Т. 27. No 1. C. 143-151. doi: 10.35330/1991-6639-2025-27-1-143-151
  4. Qian H., Zhang S., Wang B. et al. A comparative study on machine learning models combining with outlier detection and balanced sampling methods for credit scoring 2021. [Электронный ресурс]. Режим доступа: https://arxiv.org/abs/2112.13196 (дата обращения: 01.09.2025). doi: 10.48550/arXiv.2112.13196
  5. Dyakonova L., Konstantinov A. Approaches to risk analysis in the financial sector based on machine learning and artificial intelligence methods / MPRA Paper. [Электронный ресурс]. Режим доступа: https://mpra.ub.uni-muenchen.de/122941/ (дата обращения: 17.09.2025)
  6. Liu F.T., Ting K.M., Zhou Z.H. Isolation forest. IEEE Xplore. 2008. Pp. 413-422. doi: 10.1109/ICDM.2008.17
  7. Blázquez-García A., Conde A., Mori U., Lozano J.A. A review on outlier/anomaly detection in time series data. [Электронный ресурс]. Режим доступа: https://arxiv.org/abs/2002.04236 (дата обращения: 01.09.2025).
  8. Ribeiro M.T., Singh S., Guestrin C. Why should I trust you? Explaining the predictions of any classifier. [Электронный ресурс]. Режим доступа: https://arxiv.org/abs/1602.04938 (дата обращения: 01.09.2025).
  9. Breiman L. Bagging predictors. Machine Learning. 1996. Vol. 24. No. 2. Pp. 123-140.
  10. Abdoli M., Akbari M., Shahrabi J. Bagging supervised autoencoder classifier for credit scoring. Preprint. doi: 10.48550/arXiv.2108.078
  11. Zou Y., Gao C., Xia M., Pang C. Credit scoring based on a bagging-cascading boosted decision tree. Intelligent Data Analysis. 2022. Vol. 26. No. 6. Pp. 1557-1578. doi: 10.3233/IDA-216228

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Константинов А.Ф., Дьяконова Л.П., 2025

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».