Methods of Randomized Machine Learning for Generation of Random Data with Given Numerical Properties

Cover Page

Cite item

Full Text

Open Access Open Access
Restricted Access Access granted
Restricted Access Subscription Access

Abstract

Рассматривается задача генерации случайных ансамблей данных с заданными числовыми характеристиками. Развивается метод ее решения, использующий процедуры рандомизированного машинного обучения, которые строятся на последовательности задач функционального энтропийно-линейного программирования. В качестве ограничений в них рассматриваются нормированные моменты. Задача генерации сводится к системе нелинейных уравнений с интегральными компонентами. Адаптируется разработанный авторами асимптотический аналитический метод преобразования указанных уравнений к системе уравнений с полиномиальной левой частью. Развитые аналитические методы применены для генерации случайных ансамблей данных, прогнозирующих динамику стоимости финансовых активов.

References

  1. Rubinstein R.Y., Kroese D.P. Simulation and the Monte Carlo Method, 2016, John Wiley & Sons.
  2. Vapnik V.N. Statistical Learning Theory, Wiley, 1998.
  3. Bishop C.M. Pattern Recognition and Machine Learning, Springer, 2006.
  4. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning, Springer, 2009.
  5. Vovk V., Shafer G. Good Randomized sequential probability forecasting is always possible // J. Royal. Stat. Soc. B. 2005. V. 67. No. 5. P. 747–763.
  6. Hong T., Prinson P., Fan S., Zareipour H., Triccoli A., Hyndman R.J. Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond // Int. J. Forecast. 2016. V. 32. No. 3. P. 896–913.
  7. Zhang et al. Stock priceprediction via discovering multy-frequency trading patterns // Proc. 23rd ACM SIGKDD international Conference on Knowledge Discovery and Data Mining. 2017. P. 2141–2149.
  8. Myers G.J. The Art of Software Testing. John Wiley & Sons, 1979.
  9. Городецкий В.И., Грушицкий М.С., Хабалов А.В. Многодетные системы (обзор) // Новости искусственного интеллекта, 1998, № 2, С. 116.
  10. Patton R. Software Testing, SAWS Publishers, 2005.
  11. Лысенков А.И., Бупп Г.С., Диденко Д.А. Система для разработки компьютерных тестов. http://www.bytic.ru/cue99m/cf7pvke.html, 2002.
  12. Мицель А.А., Позудов А.А. Нейросетевой подход к задаче тестирования // Прикладная информатика, 2011. № 5 (35). С. 60–67.
  13. Заозерская Л.А., Платонова В.А. Математические модели формирования оптимального комплекса структур тестов для контроля знаний // Омский научный вестник. 2012. № 3.
  14. Campi M.C., Garatti S., Prandini M. The scenario approach for systems and control design // Ann. Rev. Control. 2009. V. 33. No. 2. P. 149–157.
  15. Chi Z., Liu Y., Turrini A., Zhang L., Jansen D.N. A scenario approach for parametric Markov decision processes / In Principles of Verification: Cycling the Probabilistic Landscape: Essay Dedicated to Joost-Pieter Katoen on the Occasion of His 60th Birthday, Part II. Cham, Springer Nature Switzerland. 2024. P. 234–266.
  16. Boltzmann L. Vorlesungen über Gastheory. Leipzig, 1896, V. 1, J.A.Barth; 1898, V. 2, J.A.Barth.
  17. Jaynes E.T. Information theory and statistical Mechanics // Phys. Rev. 1957. V. 104. No. 4. P. 620–630.
  18. Jaynes E.T. Gibbs vs Boltzmann entropy // Amer. J. Phys. 1965. V. 33. P. 391–398.
  19. Rosenkrantz R.D., Jaynes E.T. Paper on Probability, Statistics,and Statistical Physics. Kluwer Academic Publishers, 1989.
  20. Jaynes E.T. Probability theory: the logic of science. Cambridge Uni. Press, 2003.
  21. Попков Ю.С. Асимптотическая эффективность оценок максимальной энтропии // Докл. AH. 2020. Т. 493. С. 100–103.
  22. Popkov Yu.S., Popkov A.Yu., Dubnov Yu.A. Entropy Randomization in Machine Learning. CRC Press, 2023.
  23. Красносельский М.А., Вайникко Г.М., Забрейко П.П., Руппицкий Я.Б., Отвеченко В.Я. Приближенные решения операторных уравнений. М.: Наука, 1969.
  24. Малкин И.Г. Некоторые задачи теории нелинейных колебаний. М.: УРСС, 2004.
  25. Darkhovsky, B.S., Popkov, Y.S., Popkov, A.Y., Aliev, A.S. A Method of Generating Random Vectors with a Given Probability Density Function // Autom. Remote Control. 2018. V. 79. No. 9. P. 1569–1581. https://doi.org/10.1134/S0005117918090035
  26. Avellaneda M. Minimum-relative-entropy calibration of asset-pricing models // Int. J. Theor. App. Finance. 1998. V. 1. No. 04. P. 447–472.
  27. Jackwerth J.C. Recovering Risk Aversion from OptionPrices and Realized Returns // Rev. Financ. Stud. 2000. V. 11. No. 2. P. 437.
  28. Ant-Sahalia Y., Lo A.W. Nonparametric Risk Management and Implied Risk Aversion // J. Econom. 2000. V. 94. P. 4–5.
  29. Рорkov Yu.S. Analytic Method for Solving One Class of Nonlinear Equations // Doklady Mathematics. 2024. https://doi.org/10.1134/S1064562424601392
  30. Фигтенсомун Г.М. Курс дифференциального и интегрального исчисления. М.: Физматгиз, 1962.
  31. Фелер В. Введение в теорию вероятностей и ее приложения. М.: Мир, 1967.
  32. Соболь И.М. Численные методы Монте-Карло. М.: Наука, 1973.
  33. Багдалов Н.С., Жидков Н.П., Кобельков Г.М. Численные методы. М.: Бином, 2003.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2025 Russian Academy of Sciences

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».