🔧На сайте запланированы технические работы
25.12.2025 в промежутке с 18:00 до 21:00 по Московскому времени (GMT+3) на сайте будут проводиться плановые технические работы. Возможны перебои с доступом к сайту. Приносим извинения за временные неудобства. Благодарим за понимание!
🔧Site maintenance is scheduled.
Scheduled maintenance will be performed on the site from 6:00 PM to 9:00 PM Moscow time (GMT+3) on December 25, 2025. Site access may be interrupted. We apologize for the inconvenience. Thank you for your understanding!

 

ДЕКОМПОЗИЦИЯ ОБУЧАЮЩЕЙ ВЫБОРКИ В ЗАДАЧЕ ПРОГНОЗИРОВАНИЯ КУРСА ЦЕННЫХ БУМАГ

Обложка

Цитировать

Полный текст

Аннотация

Изложены базовые основы постановки классической задачи прогнозирования курса ценных бумаг. Построена обучающая выборка, состоящая из цены открытия торговой сессии, максимальной и минимальной цен и цены закрытия торговой сессии. Для построения прогноза использованы цены закрытия сессии на 4 этапа (торгового дня) вперед. В качестве инструментального средства выбрана система символьной математики Wolfram Mathematica, являющаяся современной средой машинного обучения систем искусственного интеллекта. Построена оптимальная структура многослойной искусственной нейронной сети, содержащей три скрытых слоя и два слоя нормализации данных. Произведено аналитическое сравнение результатов прогнозирования курса ценных бумаг при использовании только обучающего множества с последующей проверкой на тестовом множестве с вариантом полной декомпозиции обучающей выборки на обучающее, проверочное и тестовое множества. Получено доказательство того, что использование проверочного множества для контроля точности обучения на каждом шаге (раунде) обучения позволяет существенно повысить точность предсказания (прогноза). Приведены кривые обучения для исследуемых вариантов декомпозиции обучающей выборки и величины параметров оценки качества прогнозных моделей.

Полный текст

  1. Основные понятия

Ценная бумага – это документ, выпускаемый фирмами, финансовыми организациями, государством для получения дополнительного капитала.

Курс ценных бумаг (Rate of securities) – это цена ценных бумаг, по которой они продаются на вторичном рынке.

  1. Постановка задачи

Имеется генеральная совокупность, определяющая временной ряд изменения курса некоторой ценной бумаги. Из генеральной совокупности выделена конечная обучающая выборка за определенное число торговых сессий (например, дней), которая, которая будет использоваться для прогнозирования курса ценной бумаги на конечной число торговых сессий вперед. На основе обучающей выборки может быть синтезирован регрессор вида R:X®Y.

где X= {x1, x2, x3, x4} = {Open(t), High(t), Low(t), Close(t)},

Y= {y1, y2, y3, y4} = {Close(t+1), Close(t+2), Close(t+3), Close(t+4)}.

Здесь Open(t), High(t), Low(t), Close(t) – цена открытия сессии, максимальная, минимальная и цена закрытия сессии, например, торгового дня t.

На рисунке 1 приведена структура обучающей выборки с учетом лага на 4 дня вперед.

 

Рис. 1. Начальный фрагмент обучающей выборки

 

Таким образом, объектом исследования является задача прогнозирования курса ценных бумаг.

Предмет исследования – проблема декомпозиции обучающей выборки.

Целью исследования является оценка влияния принципа разбиения обучающей выборки на обучающее, проверочное и тестовое множества на точность прогнозной модели.

  1. Материал и методы исследования

Апробация фундаментальных основ и базовых методов исследования осуществлялась в системе символьной математики Wolfram Mathematica [2], являющейся одной из современных высокоуровневых систем машинного обучения и моделирования систем искусственного интеллекта.

На рисунке 2 представлены операторы, определяющие структуру используемой нейронной сети.

 

Рис. 2. Задание структуры нейронной сети

 

Рисунок 3 представляет таблицу основных компонентов нейронной сети.

 

Рис. 3. Основные компоненты нейронной сети

 

В результате вычислительных экспериментов была синтезирована оптимальная топология (структура) искусственной нейронной сети, в которой входной слой содержит 4 нейрона, соответствующие X= {x1, x2, x3, x4}, выходной 4 нейрона – Y= {y1, y2, y3, y4}. Нейронная сеть состоит из 3 линейных (скрытых) слоев, предназначенных для вычисления скалярного произведения величины входных сигналов на веса соответствующих связей. В этих скрытых слоях 15, 10 и 4 нейрона соответственно. В качестве функции активации используется «рампа» (рис. 4).

 

Рис. 4. График функции активации

 

Применяются два слоя нормализации данных (по среднему значению и дисперсии). Граф используемой в исследовании нейронной сети представлен на рисунке 5.

 

Рис. 5. Граф нейронной сети

 

Для оценки точности обучения модели использовались величины RMSE – Root Mean Squared Error и MAPE – Mean Absolute Percentage Error [3, 4]. На рисунке 6 приведены соответствующие формулы для расчета этих показателей в системе (символьной математики) Wolfram Mathematica. 

 

Рис. 6. Формулы точечных оценок ошибок обучения

 

В этих формулах y и x – точное  и расчетное значение выходного сигнала. Отметим, что использование в исследовании системы символьной математики позволяет писать программу вычислений в терминах формального математического языка без использования традиционных операторов языка программирования.

  1. Основные результаты и их обсуждение

4.1. Реализация процесса обучения нейронной сети

Простейшие операторы обучения нейронной сети представлены на рисунке 7.

 

Рис. 7 Задание параметров обучения нейронной сети

 

В данном случае обучение контролируется величиной стандартного отклонения. На рисунке 8 представлен типовой график изменения стандартного отклонения в процессе обучения сети.

 

Рис. 8. Изменение стандартного отклонения

 

Использовался оптимизатор ADAM [5, 6], который по праву считается эталоном в машинном обучении.

4.2. Сравнение методов декомпозиции обучающей выборки

Результаты обучения сети при разбиении обучающей выборки на обучающее и тестовое множества представлены на рисунке 9. В данном случае проверочное множество не выделялось.

 

Рис. 9. Изменение ошибки обучения

 

Результаты обучения на обучающем и проверки на тестовом множестве (которое взято из обучающей выборки, но в процессе обучения не использовалось) приведены в таблице. В этом варианте величины RMSE и MAPE для обучающего и тестового множеств примерно равны.

 

Таблица. Результаты сравнения

Декомпозиция обучающей выборки

Показатель

RMSE

MAPE%

Обучающее множество

Тест

16.1

16.4

4.0%

4.4%

Обучающее множество с выделением проверочного

Тест

8.3

7.8

2.2%

2.1%

 

При выделении из обучающей выборки проверочного множества, которое используется для контроля обучения на каждом этапе (раунде) величины ошибок обучения уменьшаются практически в два раза (см. таблица). На рисунке 10 приведены кривые обучения отдельно для обучающего и проверочного множеств.

 

Рис. 10. Кривые обучения для обучающего и проверочного множеств

 

Заключение

Предложена базовая постановка задачи прогнозирования курса ценных бумаг на основании обучающей выборки за предыдущие торговые сессии. Исследованы варианты оптимальной декомпозиции обучающей выборки на конкретно обучающее, проверочное и тестовое множества. Отработана методика синтеза нейросетевого регрессора. Приведена оптимальная структура используемой искусственной многослойной нейронной сети. Проведена практическая апробация методологических принципов синтеза системы прогнозирования курса ценных бумаг в системе символьной математики Wolfram Mathematica. Представлены итоговые результаты аналитического сравнения вариантов декомпозиции обучающей выборки по критерию ее влияния на точность оценок прогнозирования.

×

Об авторах

Н. С. Вашакидзе

Сахалинский государственный университет

Автор, ответственный за переписку.
Email: nvash@mail.ru

старший преподаватель

Россия, Россия, г. Южно-Сахалинск

Г. В. Филиппова

Сахалинский государственный университет

Email: g.v.filippova@gmail.com

старший преподаватель

Россия, Россия, г. Южно-Сахалинск

Н. Л. Рауш

Сахалинский государственный университет

Email: r_n_l@mail.ru

старший преподаватель

Россия, Россия, г. Южно-Сахалинск

Г. С. Осипов

Сахалинский государственный университет

Email: osipov_gs@sakhgu.ru

д-р техн. наук, профессор

Россия, Россия, г. Южно-Сахалинск

Список литературы

  1. Ким Н.Г. Понижение размерности обучающей выборки при решении задачи прогнозирования с помощью многослойной нейронной сети / Н.Г. Ким // Лучшая исследовательская статья 2021: сборник статей II Международного научно-исследовательского конкурса, Петрозаводск, 01 ноября 2021 года. – Петрозаводск: Международный центр научного партнерства «Новая Наука», 2021. – С. 272-277. – doi: 10.46916/08112021-3-978-5-00174-363-7. – EDN UPNJUS.
  2. Русскоязычная версия WOLFRAM. – [Электронный ресурс]. – Режим доступа: https://www.wolfram.com/russian/?source=frontpage-stripe.
  3. Common Evaluation Metrics (MAE, MSE, RMSE, MAPE). – [Электронный ресурс]. – Режим доступа: https://apxml.com/courses/time-series-analysis-forecasting/chapter-6-model-evaluation-selection/evaluation-metrics-mae-mse-rmse.
  4. Меры оценки качества регрессионных прогнозов. – [Электронный ресурс]. – Режим досту-па: https://deepmachinelearning.ru/docs/Machine-learning/Regression-evaluation/Regression-evaluation-metrics?ysclid=mcdyil8qe4373105814.
  5. Адам Оптимизатор. – [Электронный ресурс]. – Режим доступа: https://www.ultralytics.com/ru/glossary/adam-optimizer.
  6. ADAM: A METHOD FOR STOCHASTIC OPTIMIZATION. – [Электронный ресурс]. – Режим доступа: https://arxiv.org/pdf/1412.6980.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».