<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="en"><front><journal-meta><journal-id journal-id-type="publisher-id">Computational nanotechnology</journal-id><journal-title-group><journal-title xml:lang="en">Computational nanotechnology</journal-title><trans-title-group xml:lang="ru"><trans-title>Computational nanotechnology</trans-title></trans-title-group></journal-title-group><issn publication-format="print">2313-223X</issn><issn publication-format="electronic">2587-9693</issn><publisher><publisher-name xml:lang="en">YUR-VAK</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="publisher-id">358384</article-id><article-id pub-id-type="doi">10.33693/2313-223X-2025-12-5-47-55</article-id><article-id pub-id-type="edn">EGDNUN</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>SYSTEM ANALYSIS, INFORMATION MANAGEMENT  AND PROCESSING, STATISTICS</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>СИСТЕМНЫЙ АНАЛИЗ, УПРАВЛЕНИЕ  И ОБРАБОТКА ИНФОРМАЦИИ, СТАТИСТИКА</subject></subj-group><subj-group subj-group-type="article-type"><subject>Research Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">Formation of synthetic data in machine learning models based on multiscale analysis of binary Markov models</article-title><trans-title-group xml:lang="ru"><trans-title>Формирование синтетических данных в моделях машинного обучения на основе кратномасштабного анализа двоичных марковских моделей</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><contrib-id contrib-id-type="spin">9901-4887</contrib-id><name-alternatives><name xml:lang="en"><surname>Pushkin</surname><given-names>Pavel Yu.</given-names></name><name xml:lang="ru"><surname>Пушкин</surname><given-names>Павел Юрьевич</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>Cand. Sci. (Eng.), Associate Professor, Director, Institute of Advanced Technologies and Industrial Programming</p></bio><bio xml:lang="ru"><p>кандидат технических наук, доцент, директор, Институт перспективных технологий и индустриального программирования</p></bio><email>pushkin@mirea.ru</email><xref ref-type="aff" rid="aff1"/></contrib><contrib contrib-type="author"><contrib-id contrib-id-type="spin">4213-7083</contrib-id><name-alternatives><name xml:lang="en"><surname>Konyshev</surname><given-names>Mikhail Yu.</given-names></name><name xml:lang="ru"><surname>Конышев</surname><given-names>Михаил Юрьевич</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>Dr. Sci. (Eng.), Associate Professor, Professor, Department KB-1 “Information Protection”, Institute of Cybersecurity and Digital Technologies</p></bio><bio xml:lang="ru"><p>доктор технических наук, доцент, профессор, кафедра КБ-1 «Защита информации», Институт кибербезопасности и цифровых технологий</p></bio><email>konyshev@mirea.ru</email><xref ref-type="aff" rid="aff1"/></contrib><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Perevezentsev</surname><given-names>Dmitry S.</given-names></name><name xml:lang="ru"><surname>Перевезенцев</surname><given-names>Дмитрий Сергеевич</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>senior lecturer, Basic Department BK-252, Institute of Artificial Intelligence</p></bio><bio xml:lang="ru"><p>старший преподаватель, базовая кафедра БК-252, Институт искусственного интеллекта</p></bio><email>perevezentsev@mirea.ru</email><xref ref-type="aff" rid="aff1"/></contrib><contrib contrib-type="author"><contrib-id contrib-id-type="spin">2556-2201</contrib-id><name-alternatives><name xml:lang="en"><surname>Grachev</surname><given-names>Alexander S.</given-names></name><name xml:lang="ru"><surname>Грачев</surname><given-names>Александр Сергеевич</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>senior lecturer, Department KB-1, Institute of Cybersecurity and Digital Technologies</p></bio><bio xml:lang="ru"><p>старший преподаватель, кафедра КБ-1, Институт кибербезопасности и цифровых технологий</p></bio><email>grachyov@mirea.ru</email><xref ref-type="aff" rid="aff1"/></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">MIREA – Russian Technological University</institution></aff><aff><institution xml:lang="ru">МИРЭА – Российский технологический университет</institution></aff></aff-alternatives><pub-date date-type="pub" iso-8601-date="2025-12-14" publication-format="electronic"><day>14</day><month>12</month><year>2025</year></pub-date><volume>12</volume><issue>5</issue><fpage>47</fpage><lpage>55</lpage><history><date date-type="received" iso-8601-date="2025-12-16"><day>16</day><month>12</month><year>2025</year></date></history><permissions><copyright-statement xml:lang="en">Copyright ©; 2025, Yur-VAK</copyright-statement><copyright-statement xml:lang="ru">Copyright ©; 2025, Юр-ВАК</copyright-statement><copyright-year>2025</copyright-year><copyright-holder xml:lang="en">Yur-VAK</copyright-holder><copyright-holder xml:lang="ru">Юр-ВАК</copyright-holder><license><ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://www.urvak.ru/contacts/</ali:license_ref></license></permissions><self-uri xlink:href="https://journals.rcsi.science/2313-223X/article/view/358384">https://journals.rcsi.science/2313-223X/article/view/358384</self-uri><abstract xml:lang="en"><p>A method for generating synthetic data for training systems in binary Markov data sources is presented, based on estimates of the elements of the transition probability matrices of binary Markov chains obtained as a result of a multiscale analysis, which differs from the known ones by taking into account the ranges of values of the matrix elements in the observed objects. An algorithm for the formation of synthetic data is proposed, which implements the calculation of elements of transition probability matrices within the estimates obtained on real data. The results of a computational experiment organized to test the quality of machine learning using the developed method and algorithm confirmed the possibility of improving the quality of artificial intelligence systems.</p></abstract><trans-abstract xml:lang="ru"><p>Представлен метод формирования синтетических данных для обучения систем в условиях двоичных марковских источников данных, основанный на полученных в результате кратномасштабного анализа оценках элементов матриц переходных вероятностей двоичных цепей Маркова, отличающийся от известных учетом диапазонов значений элементов матриц в наблюдаемых объектах. Предложен алгоритм формирования синтетических данных, реализующий вычисление элементов матриц переходных вероятностей в пределах оценок, полученных на реальных данных. Результаты вычислительного эксперимента, организованного для проверки качества машинного обучения с использованием разработанных способа и алгоритма, подтвердили возможность повышения качества систем искусственного инетеллекта.</p></trans-abstract><kwd-group xml:lang="en"><kwd>machine learning</kwd><kwd>synthetic data</kwd><kwd>binary Markov chain</kwd><kwd>multiscale analysis</kwd><kwd>parameter estimation</kwd><kwd>computational experiment</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>машинное обучение</kwd><kwd>синтетические данные</kwd><kwd>двоичная марковская цепь</kwd><kwd>кратномасштабный анализ</kwd><kwd>оценка параметров</kwd><kwd>вычислительный эксперимент</kwd></kwd-group><funding-group/></article-meta></front><body></body><back><ref-list><ref id="B1"><label>1.</label><citation-alternatives><mixed-citation xml:lang="en">Belyaeva O.V., Perminov A.I., Kozlov I.S. Using synthetic data for fine-tuning document segmentation models. Proceedings of the Institute for System Programming of the Russian Academy of Sciences. 2020. Vol. 32. No. 4. Pp. 189–202. (In Rus.)</mixed-citation><mixed-citation xml:lang="ru">Беляева О.В., Перминов А.И., Козлов И.С. Использование синтетических данных для тонкой настройки моделей сегментации документов // Труды Института системного программирования РАН. 2020. Т. 32. № 4. С. 189–202.</mixed-citation></citation-alternatives></ref><ref id="B2"><label>2.</label><citation-alternatives><mixed-citation xml:lang="en">Mosalov O.P. Using generative adversarial networks in the problem of predicting the existence of edges in an ontological graph. Information Technology Bulletin. 2020. No. 4 (26). Pp. 96–103. (In Rus.)</mixed-citation><mixed-citation xml:lang="ru">Мосалов О.П. Использование генеративно-состязательных сетей в задаче предсказания существования ребер в онтологическом графе // Информационно-технологический вестник. 2020. № 4 (26). С. 96–103.</mixed-citation></citation-alternatives></ref><ref id="B3"><label>3.</label><citation-alternatives><mixed-citation xml:lang="en">Laptev V.V., Danilov V.V. Study of variational autoencoder for synthesis of new medical data. In: Collection of selected articles of the scientific session of TUSUR. 2020. No. 1-2. Pp. 68–70.</mixed-citation><mixed-citation xml:lang="ru">Лаптев В.В., Данилов В.В. Исследование вариационного автоэнкодера для синтеза новых медицинских данных // Сборник избранных статей научной сессии ТУСУР. 2020. № 1-2. С. 68–70.</mixed-citation></citation-alternatives></ref><ref id="B4"><label>4.</label><mixed-citation>Anderson T.W. The statistical analysis of time series. New York, 1971. 704 p.</mixed-citation></ref><ref id="B5"><label>5.</label><citation-alternatives><mixed-citation xml:lang="en">Konyshev M.Yu., Ivanov V.A., Tarakanov O.V. et al. Binary Markov chains and their application. Moscow: MIREA, 2023. 181 p.</mixed-citation><mixed-citation xml:lang="ru">Конышев М.Ю., Иванов В.А., Тараканов О.В. и др. Двоичные цепи Маркова и их приложения. М.: МИРЭА, 2023. 181 с.</mixed-citation></citation-alternatives></ref><ref id="B6"><label>6.</label><citation-alternatives><mixed-citation xml:lang="en">Konyshev M.Yu., Baranov V.A., Bliznyuk V.I. et al. Methods of analysis and synthesis of binary random sequences. Orel: Academy of the Federal Security Service of the Russian Federation, 2020. 120 p.</mixed-citation><mixed-citation xml:lang="ru">Конышев М.Ю., Баранов В.А., Близнюк В.И. и др. Методы анализа и синтеза двоичных случайных последовательностей. Орёл: Академия Федеральной службы охраны Российской Федерации, 2020. 120 с.</mixed-citation></citation-alternatives></ref><ref id="B7"><label>7.</label><citation-alternatives><mixed-citation xml:lang="en">Agamirov L.V., Agamirov V.L., Vestyak V.A. Calculations of inverse distribution functions: Algorithms and programs. Software Products and Systems. 2024. No. 2. Pp. 137–145. (In Rus.)</mixed-citation><mixed-citation xml:lang="ru">Агамиров Л.В., Агамиров В.Л., Вестяк В.А. Вычисления обратных функций распределений: алгоритмы и программы // Программные продукты и системы. 2024. № 2. С. 137–145.</mixed-citation></citation-alternatives></ref><ref id="B8"><label>8.</label><citation-alternatives><mixed-citation xml:lang="en">Li Ts., Judge D., Zellner A. Estimation of Markov model parameters from aggregated time series. Moscow: Statistika, 1977. 221 p.</mixed-citation><mixed-citation xml:lang="ru">Ли Ц., Джадж Д., Зельнер А. Оценивание параметров Марковских моделей по агрегированным временным рядам. М.: Статистика, 1977. 221 с.</mixed-citation></citation-alternatives></ref><ref id="B9"><label>9.</label><citation-alternatives><mixed-citation xml:lang="en">Gluskin V.A., Dementyev A.N., Gondarenko E.A. et al. Estimation of error source parameters in discrete communication channels with error grouping. Dynamics of Complex Systems XXI Century. 2023. Vol. 17. No. 4. Pp. 56–69. (In Rus.)</mixed-citation><mixed-citation xml:lang="ru">Глускин В.А., Дементьев А.Н., Гондаренко Е.А. и др. Оценивание параметров источников ошибок в дискретных каналах связи с группированием ошибок // Динамика сложных систем XXI век. 2023. Т. 17. № 4. С. 56–69.</mixed-citation></citation-alternatives></ref><ref id="B10"><label>10.</label><citation-alternatives><mixed-citation xml:lang="en">Feder J. Fractals. Transl. from Engl. Moscow: Mir, 1991. 254 p.</mixed-citation><mixed-citation xml:lang="ru">Федер Е. Фракталы / пер. с англ. М.: Мир, 1991. 254 с.</mixed-citation></citation-alternatives></ref><ref id="B11"><label>11.</label><citation-alternatives><mixed-citation xml:lang="en">Bliznyuk V.I., Konyshev M.Yu., Ivanov V.A., Kharchenko S.V. Method of directed enumeration of distribution series in problems of modeling Markov binary sequences. Industrial ACS and Controllers. 2015. No. 5. Pp. 40–45. (In Rus.)</mixed-citation><mixed-citation xml:lang="ru">Близнюк В.И., Конышев М.Ю., Иванов В.А., Харченко С.В. Метод направленного перебора рядов распределений в задачах моделирования марковских двоичных последовательностей // Промышленные АСУ и контроллеры. 2015. № 5. С. 40–45.</mixed-citation></citation-alternatives></ref><ref id="B12"><label>12.</label><citation-alternatives><mixed-citation xml:lang="en">Baranov V.A., Konyshev M.Yu., Privalov A.A., Shestakov A.V. Verification of cryptographic algorithms based on the use of the method of simulating binary random sequences with given statistical properties. High-tech in Space Research of the Earth. 2019. Vol. 11. No. 6. (In Rus.)</mixed-citation><mixed-citation xml:lang="ru">Баранов В.А., Конышев М.Ю., Привалов А.А., Шестаков А.В. Верификация криптографических алгоритмов на основе использования метода симуляции двоичных случайных последовательностей с заданными статистическими свойствами // Наукоемкие технологии в космических исследованиях Земли. 2019. Т. 11. № 6.</mixed-citation></citation-alternatives></ref><ref id="B13"><label>13.</label><citation-alternatives><mixed-citation xml:lang="en">Ivanov V.A., Konyshev M.Yu., Markin A.V. Conceptual model of a message source at the output of a multiplexer for studying the properties of a binary stream in data compression procedures. Communication Equipment. 2022. No. 1 (157). Pp. 61–68. (In Rus.)</mixed-citation><mixed-citation xml:lang="ru">Иванов В.А., Конышев М.Ю., Маркин А.В. Концептуальная модель источника сообщений на выходе мультиплексора для исследования свойств двоичного потока в процедурах сжатия данных // Техника средств связи. 2022. № 1 (157). С. 61–68.</mixed-citation></citation-alternatives></ref><ref id="B14"><label>14.</label><citation-alternatives><mixed-citation xml:lang="en">Ivanov V.A., Konyshev M.Yu., Ivanov I.V. Application of traffic acceleration in multichannel radio communication networks. In: Information society technologies. Collection of Proceedings of the XVII International Industry Scientific and Technical Conference (Moscow, March 2–3, 2023). Moscow: Media Puplisher, 2023. Pp. 26–28.</mixed-citation><mixed-citation xml:lang="ru">Иванов В.А., Конышев М.Ю., Иванов И.В. Применение акселерации трафика в сетях многоканальной радиосвязи // Технологии информационного общества: сб. трудов XVII Междунар. отраслевой науч.-техн. конф. (Москва, 2–3 марта 2023 г.). М.: Медиа паблишер, 2023. С. 26–28.</mixed-citation></citation-alternatives></ref></ref-list></back></article>
