Designing a digital twin of an employee
- Autores: Orlova E.V.1
-
Afiliações:
- Ufa University of Science and Technology
- Edição: Volume 15, Nº 4 (2025)
- Páginas: 471-485
- Seção: GENERAL ISSUES OF FORMALIZATION IN THE DESIGNING: ONTOLOGICAL ASPECTS
- URL: https://journals.rcsi.science/2223-9537/article/view/352629
- DOI: https://doi.org/10.18287/2223-9537-2025-15-4-471-485
- ID: 352629
Citar
Texto integral
Resumo
The development of a digital twin of an employee aims to reduce risks such as unpredictable or undesirable behavior, burnout, declining engagement in work processes, lower productivity, and the emergence of destructive conflicts. The paper outlines approaches to designing digital twins and proposes organizational and methodological support for their development as socio-economic systems characterized by goal-setting, dynamism, reflection, and bounded rationality. The prototype of an employee’s digital twin is based on a hybrid model that integrates mathematical models, which enable computer simulation of physical processes, with data-driven models incorporating data mining and reinforcement learning methods to identify patterns in data that are useful for decision-making. Such intelligently managed digital twin merges these two classes of models and is closely tied to the concept of individual human capital, understood as the sum of professional, intellectual, and social resources that define a worker’s productivity and income. The digital twin incorporates both a human capital assessment model and a management model that supports the creation of personalized professional development trajectories. The management model applies reinforcement learning algorithms to generate an optimal management regime, consisting of measures and decisions aimed at employee development while accounting for dynamic personal characteristics such as health, professional and other competencies, and motivation. The implementation of an employee’s digital twin has practical significance, as it helps to mitigate potential risks, enhance employee productivity, and improve the overall efficiency of the enterprise.
Texto integral
Введение
Развитие предприятий в современной экономике связано с технологией «цифровой двойник» (ЦД), который представляет собой виртуальный прототип реальных процессов и изделий. В нормативно-технической документации, регламентирующей процессы разработки ЦД изделий [1], не учитывается согласование задач по описанию объекта моделирования и управления. Такое согласование может быть достигнуто применением системного подхода и проектированием объекта (процесса), учитывая назначение, выполняемые функции, уровень сложности, этапы жизненного цикла (ЖЦ) и др.
ЦД технических объектов являются достаточно проработанными [2-8], а проектирование ЦД организационных, социальных систем является новой и актуальной задачей [9]. ЦД работника предприятия представляет собой цифровую модель (ЦМ), характеризующую профессиональный профиль и включает его личностные, социальные и поведенческие характеристики при выполнении рабочих задач.
Технологической компанией Merlynn1 предложен обучаемый ЦД человека на основе искусственного интеллекта (ИИ), который позволяет создавать и обучать ЦД. ЦД может выполнять повторяющиеся, рутинные задачи (участие в совещаниях, ведение заметок, ответы на вопросы и др.). ЦД может обобщить все проделанные операции и представить отчёт, дополняя, а не заменяя работника. ПАО «Газпромнефть» в рамках проекта «Цифровой двойник месторождения»2 тестирует сценарии, в которых виртуальные работники помогают анализировать данные и принимать решения. В ПАО «Сбер» создана платформа3, на которой работники могут обучаться через интерактивные сценарии с ИИ-ассистентами, имитирующими коллег и клиентов. АО «Навигатор»4 использует ЦД для оптимизации работы команд и создания персонализированных стратегий развития сотрудников. В ИТМО разработан прототип ЦД рабочего на производстве5, обеспечивающего в режиме реального времени сбор данных о работе персонала на производстве с целью предотвращения травм рабочих и поломок техники. Создан цифровой профиль рабочего и единицы техники на производстве. Разработанная система поддержки принятия решений (СППР) ведёт автоматический учёт рабочего времени, уведомляет рабочих о потенциально опасных зонах.
Указанные разработки не включают подробный анализ особенностей человека как объекта моделирования и управления: целеполагание; целенаправленность поведения; возможность сознательного искажения информации; динамичность; рефлексия; ограниченная рациональность. Необходим подход, в котором учитываются особенности работника, отражаются условия цифровой экономики и обеспечивается синтез эффективных управленческих решений, направленных на улучшение производительности работников и эффективности предприятия в целом.
1 Подходы и методы проектирования цифрового двойника
Можно выделить три группы подходов и методов проектирования ЦД (см. таблицу 1):
- методы моделирования ЦД, основанные на математическом моделировании физических процессов (структурные модели объекта) [10-13];
- методы моделирования ЦД, основанные на данных [14-16];
- гибридные методы [17-20].
Таблица 1 – Характеристики подходов к моделированию цифрового двойника
Характеристика | Подход к моделированию | ||
Математическое моделирование | Моделирование, основанное на данных | Гибридное моделирование | |
Способ описания системы | Описывает законы функционирования объекта (процесса) и его связи с внешней средой | Строится на основании эмпирических данных с применением инструментов машинного обучения | Строится на основе законов функционирования и настраивается с учётом эмпирических данных |
Принцип моделирования | Модель «белого ящика», моделирование причинно-следственных связей | Модель «чёрного ящика», моделирование корреляций | Модель «серого ящика» |
Направление моделирования | Сверху вниз | Снизу вверх | Сверху вниз, снизу вверх |
Описание и степень определённости информации | Неопределённость информации контролируется входными данными и точностью моделирования. | Вероятностное описание информации на основе распределений данных в обучающих выборках | Детерминированное, вероятностное |
Методы моделирования | Численные методы, методы исследования операций, методы имитационного и ситуационного моделирования | Статистические методы, методы экстраполяции, методы машинного обучения, методы аналитики больших данных | Междисциплинарные модели |
Прогностическая способность | Прогнозирование в широких интервалах значений параметров, описываемых моделью | Трудность в предсказании редких событий, а также в условиях неполных данных и зашумлённой информации, а также за пределами обучающих выборок | Высокая прогностическая способность в пределах штатных / внештатных ситуаций |
Приоритетный подход к принятию решений и управлению | Принятие решений основано на анализе совокупной производительности (эффективности) системы. Формирование управленческих решений на основе решения обратных задач | Принятие решений основано на анализе данных мониторинга, диагностики. Формирование управленческих решений на основе прогнозирования и решения прямых задач | Решение как прямых, так и обратных задач управления |
Тип системы управления | Управление по отклонению, управление с адаптацией | Управление по отклонению, управление с адаптацией | Управление по отклонению с учётом слабых сигналов среды; рефлексивное управление |
Этап жизненного цикла системы | Все стадии | Эксплуатация | Стадии роста, стабильности |
Схема работы | Численное моделирование + датчики → сбор данных → IIoT (Industrial Internet of Things) - платформа | Датчики + IIoT-платформа → сбор данных → аналитика данных | Математическое моделирование + датчики → сбор данных → IIoT - платформа → аналитика |
Инструментальные средства | Matlab Simulink, ANSYS, AnyLogic, Ithink и др. | R, Python, Statictica, GPSS и др. | Междисциплинарные платформы |
Математическое моделирование обеспечивает отражение в модели физических свойств объекта / процесса. Построение таких моделей на практике связано с применением методов математического программирования [20], имитационного моделирования на основе разных парадигм и подходов – системно-динамического, дискретно-событийного или агентного моделирования [21]. Для создания моделей ЦД используются результаты численных расчётов, выполненных с применением междисциплинарных систем автоматизированного анализа. В зависимости от степени определённости исходной информации и учёта временного фактора, могут использоваться методы линейного, нелинейного, стохастического программирования, теоретико-игровые методы, методы нечёткой логики.
Особенностью систем имитационного моделирования является возможность интеграции разрабатываемых моделей с базами и хранилищами данных, а также с внешними программными модулями. Имитационные модели можно объединять с генетическими оптимизационными алгоритмами по целевым функционалам, что даёт возможность оптимизации характеристик моделируемого объекта в режиме реального времени [22].
Моделирование, основанное на данных, включает методы интеллектуального анализа данных, ИИ, анализ больших данных и др. Модели на основе интеллектуального анализа данных применяются для обнаружения в данных ранее неизвестных практически полезных и пригодных к интерпретации знаний, необходимых для принятия решений. ИИ и машинное обучение эффективно используются в задачах прогнозирования в ЦД.
Математическое моделирование объектов (процессов) в сочетании с моделями, основанными на данных, даёт больше возможностей, чем модели, основанные только на базе машинного обучения. Моделирование, основанное на данных, как правило, ограничено этапом эксплуатации продукта. Гибридные модели могут использоваться в неповторяющихся ситуациях, когда нет достаточных данных для применения статистических методов. На базе дополнительной информации, полученной на этапе эксплуатации, повышается уровень адекватности гибридной модели, т.е. ЦД обучается и позволяет в дальнейшем прогнозировать уровень возможных отклонений от штатных условий или оценить его остаточный ресурс [19].
На этапе разработки ЦД нет полноты информации об объекте, поскольку данные о нём могут быть получены только на основе моделирования процессов, определяющих его функционирование. По мере накопления данных об объекте, они могут использоваться для построения аналитических моделей.
2 Организационно-методическое обеспечение проектирования цифрового двойника
Следуя [23] и разделяя типы поведения реальной системы на прогнозируемое желательное, прогнозируемое нежелательное, непрогнозируемое желательное и непрогнозируемое нежелательное, проектируется прототип ЦД. Он содержит необходимые компоненты для описания и создания физической версии, которая является двойником виртуальной версии. Рассматривается стадия «разработка и инжиниринг» (концептуализация и проектирование) ЖЦ системы. На стадии создания ЖЦ системы важно предвидеть её возможные состояния и разработать СППР для нейтрализации последствий нежелательных событий.
Прототип ЦД может помочь выявить и устранить непрогнозируемые нежелательные состояния. Эта задача решается на основе изменения параметров моделирования в возможном диапазоне и исследования множества поведенческих моделей системы. Такое моделирование позволит проектировать физический объект с множеством возможностей и снизить последствия непрогнозируемых нежелательных состояний. Процесс построения ЦД является многостадийным и состоит из: концептуализации, проектирования, цифрового моделирования и испытаний.
ЦД определяется как система, состоящая из ЦМ физического объекта и двусторонних информационных связей с физическим объектом или его компонентами. В основе ЦД лежит ЦМ в виде математических и компьютерных моделей, а также документов, описывающих структуру, функциональные возможности и поведение объекта на разных этапах его ЖЦ. По результатам испытаний проводится оценка соответствия ЦМ определённым требованиям. Содержание и функциональность ЦМ зависят от стадии ЖЦ физического объекта. Оценка ЦМ физического объекта включает процедуру её валидации.
Разработанная технология обеспечивает организационно-методическую поддержку процесса разработки и эксплуатации ЦД объекта (см. таблицу 2) и объединяет этапы проектирования, методы и модели. Предлагаемая технология учитывает специфику объекта – работника предприятия как сложной системы, особенностями которой являются:
- самостоятельное целеполагание и целенаправленность поведения, в результате чего может возникнуть сознательное искажение информации, невыполнение требуемых обязательств;
- рефлексия и прогнозирование поведения субъекта управления;
- ограниченная рациональность, в результате чего обеспечивается принятие решений в условиях неопределённости и ограничений на объём обрабатываемой информации.
Таблица 2 – Технология разработки цифрового двойника объекта (организационной системы)
Стадия | Этап и задача этапа | Содержание этапа | Результаты этапа |
1. Концептуализация | 1.1. Выявление противоречий | 1.1.1. Аанализ противоречий между текущим и желаемым состоянием объекта | Противоречия, проблемы |
1.2. Определение целей и выбор критериев | 1.1.2. Формулировка целей развития объекта | Цели и критерии эффективности функционирования объекта | |
2. Проектирование | 2.1. Декомпозиция объекта | 2.1.1. Сбор исходной информации об объекте моделирования | Статистическая информация. Обзор литературы |
2.1.2. Статистический анализ состояния и динамики развития объекта моделирования | Основные тренды и факторы влияния | ||
2.1.3. Функциональная, структурная, информационная декомпозиция объекта, декомпозиция по жизненному циклу | Функциональная модель Организационная модель Информационная модель Модель жизненного цикла | ||
2.2. Анализ окружения объекта | 2.2.1. Анализ факторов внешней и внутренней среды, оказывающих влияние на функционирование объекта | Ранжирование факторов по степени важности | |
2.2.2. Определение возможных перспектив развития объекта | Прогнозные оценки результатов, сроков и мероприятий поддержки внедрения новых разработок Выбор важнейших направлений исследований | ||
2.2.3. Построение событийных карт | Определение возможных событий, которые могут изменить вероятный ход событий | ||
2.2.4. Выявление участников внутренней и внешней среды объекта и построение дорожной карты | Матрицы участников, дорожная карта для среднесрочного развития объекта | ||
2.3. Синтез альтернативных решений проблем (на качественном уровне) | 2.3.1. Описание результатов проекта в терминах существующих сильных и слабых сторон и будущих возможностей и угроз на базе стратегического планирования | Альтернативы решения проблем | |
2.3.2. Определение альтернативных путей достижения целей на основе сценарного анализа | Описание представления объекта в будущем | ||
3. Цифровое моделирование | 3.1. Выбор средств математического и компьютерного моделирования и защиты данных | 3.1.1. Обоснование выбора математических методов и моделей формализации объекта | Математические методы формализации объекта |
3.1.2. Обоснование выбора программного обеспечения | Программное обеспечение | ||
3.2. Построение математической модели (моделирование, оценка и оптимизация) | 3.2.1. Построение математической модели объекта, валидация и оценка адекватности | Математическая модель объекта | |
3.2.2. Синтез оптимальных решений. Исследование устойчивости и адекватности решений | Оптимальные решения | ||
3.3. Построение компьютерной модели | 3.3.1. Написание исходного кода программы | Первичный программный код | |
3.3.2. Отладка, тестирование, верификация кода на исходных данных | Компьютерная модель объекта | ||
3.4. Построение системы поддержки принятия решений | 3.4.1. Бесшовная интеграция блока управления в цифровую модель цифрового двойника | Система поддержки принятия решений | |
4. Испытания | 4.1. Проведение тестовых экспериментов | 4.1.1. Формирование тестовой выборки | Организация проведения эксперимента |
4.1.2. Проведение экспериментов | Количественные и качественные характеристики объекта в результате экспериментов |
Предложенный подход позволит: осуществлять системный анализ объекта моделирования и управления с учётом неопределённости внешней среды на базе разнородных инструментальных средств качественного и количественного анализа; сформировать адекватную математическую модель объекта с учётом результатов этапа концептуализации; создать компьютерную модель и осуществить её испытания. Этот подход используется для построения ЦД объекта и формирования СППР.
При рассмотрении физического объекта на стадии его ЖЦ «разработка», необходим прототип ЦД, содержащий компоненты для описания и создания физической версии объекта. На этом этапе задача состоит в том, чтобы предвидеть возможные состояния объекта и разработать СППР для нейтрализации последствий нежелательных событий.
Задача выявления и устранения нежелательных состояний решается на основе изменения параметров моделирования в возможных пределах и исследования множества различных ситуаций и разнообразных шаблонов поведения, которые могут привести к проблемам.
3 Предлагаемый подход и концептуальная схема моделирования
Концептуальная схема моделирования ЦД работника представлена на рисунке 1.
Рисунок 1 – Концептуальная схема моделирования цифрового двойника работника
Каждый работник обладает определённым человеческим капиталом (ЧК). Технология построения ЦД работника для решения задачи управления ЧК основана на модели оценки ЧК [24] и модели управления ЧК [25].
Модель оценки ЧК базируется на всестороннем учёте свойств ЧК, проявляющихся в цифровой экономике, и учитывает традиционные характеристики – возраст, образование, профессиональный опыт и компетенции, а также дополнительные характеристики – социальный капитал, уровень здоровья, надпрофессиональные компетенции, мотивацию и вовлечённость. Модель управления ЧК предназначена для формирования индивидуальных траекторий профессионального роста и развития работников (ИТР), выработка которых основана на полученной из модели оценки ЧК результатов и на использовании методов машинного обучения с подкреплением (МОП). Проектирование модели управления рассматривается как последовательное решение задачи принятия решений, которая вписывается в структуру МОП. Правила принятия решений эквивалентны политикам в МОП, а результаты управления выражаются функциями вознаграждения. Входными данными является совокупность данных о работниках: знания, умения, уровень здоровья, социальный капитал, инновационность, социально-демографические факторы и др. Выходные данные формируются в виде управленческих решений для каждого этапа (как состояния в МОП). Применение методов МОП для решения задачи управления ЧК и формирования ИТР позволяет:
- принимать наилучшее решение во времени для каждого работника в каждый момент времени с учётом его характеристик;
- улучшить долгосрочные результаты с учётом распределения во времени и отсроченного эффекта от воздействия (решения);
- проектировать функцию вознаграждения, которая является адаптивной и основывается на экспертных знаниях в данной предметной области;
- проводить оптимизацию по критериям эффективности и риска (например, для предприятия – потерять конкурентного работника, который может уйти к другому работодателю).
В основе модели управления лежит последовательность правил принятия решений для формирования действий в соответствии с текущими показателями деятельности работника и предшествующими воздействиями на него. Политика разработки ИТР может использоваться для выбора эффективных инструментов управления ЧК на предприятии. Эта политика представляет собой набор правил для определения мероприятий и программ в зависимости от характеристик работников, а также показателей эффективности воздействия выполненных программ. Оптимальный режим воздействия (управления), как последовательный набор программ, позволяет максимизировать средний ожидаемый доход за весь период реализации программ (управленческих решений).
Объектом управления является ЧК работников предприятия, оценка которого по отдельным работникам основана на методике [24], в которой каждый работник имеет определённую численную оценку его ЧК. Оценка производится по пяти группам показателей (блокам оценки): уровень здоровья, основные компетенции, надпрофессиональные компетенции, мотивация, вовлечённость; а также по поведенческим навыкам и социальному капиталу. В зависимости от итогового значения ЧК работник попадает в одну из пяти групп по каждому блоку оценки (каждый блок имеет пять градаций своих значений).
Оценка ЧК является основанием для формирования управленческих решений, направленных на развитие потенциала работников и качества ЧК. Управленческие решения носят персональный характер, зависят от существующего уровня ЧК, реализованы на основе динамического режима и формируют ИТР. Разработан перечень решений по каждому блоку оценки ЧК в зависимости от балла, набранного работником. ИТР определяется композицией управленческих решений из каждого блока.
Модель формирования ИТР работников основана на МОП, в ходе которого субъект управления (агент) обучается, взаимодействуя с объектом управления (средой). МОП реализует цикл управления с обратной связью (см. рисунок 2), где агент и среда обмениваются сигналами, при этом агент стремится максимизировать целевую функцию. Обе стороны взаимодействуют непрерывно: агент выбирает действия, а среда реагирует на эти действия и предлагает агенту новые ситуации. Среда генерирует вознаграждения – числовые значения, которые агент стремится максимизировать посредством выбора действий.
Рисунок 2 – Цикл управления в модели на основе МОП
Среда задаётся как марковский процесс принятия решений (MDP) [26]: , где S – пространство состояний, в котором определены состояния среды (работников предприятия) ; A – пространство действий, в котором определены действия агента (центра принятия решений предприятия) ; P – переходные вероятности MDP, на каждом временном шаге t следующее состояние берётся из распределения вероятностей P: ; R – функция вознаграждения, на каждом временном шаге t агент получает награду, зависящую от действия at, реализованного для состояния st и нового состояния st+1: ; γ – коэффициент дисконтирования, используемый для суммирования наград, . Далее равнозначно используются обозначения для состояний st=s, st+1=s′, для действий at=a и наград rt=r.
Сеть MDP состоит из множества вершин, соответствующих разным уровням качества ЧК. Состояния заданы в пятимерном пространстве по количеству показателей оценки ЧК. Изменение состояния происходит под действием 25 различных решений (по пять решений для каждого из пяти показателей оценки качества ЧК). Введено предположение, что для каждого работника в единицу времени возможна реализация решения (действия) из одного блока . Поэтому движение работника по его траектории при реализации определённого решения возможно на один уровень вперёд по определённому показателю (т.е. значение этого показателя ЧК растёт), назад по этому показателю (т.е. значение этого показателя снижается), неизменность показателя ЧК. Если в результате реализации действия at у работника увеличивается показатель ЧК, на улучшение которого направлено это действие, то агенту предоставляется награда rt(at). В каждом блоке показателей оценки ЧК для каждого из пяти уровней интегрального показателя в блоке имеется определённое управленческое решение по наращиванию уровня ЧК.
Взаимодействие со средой длится в течение T шагов. Процесс делится на эпизоды, в конце каждого из них среда переводится в начальное состояние, и взаимодействие начинается снова. Вознаграждения рассматриваются как компоненты аддитивного разложения функции полезности. В задаче с бесконечным горизонтом количество решений не ограничено и вводится коэффициент дисконтирования . Полезность (доход) определяется выражением , которое характеризует дисконтированную сумму вознаграждения, а коэффициент дисконтирования определяет известный подход: вознаграждение в настоящий момент стоит больше, чем вознаграждение в будущем.
Отдача R(τ) из эпизода имеет вид: . Тогда целевая функция агента представляется как математическое ожидание отдачи по нескольким траекториям: , где R(τ) - отдача как сумма дисконтированных вознаграждений за временные шаги t=0,...,T, целевая функция J(τ) - это отдача, усреднённая по нескольким эпизодам (повторным прогонам). Задача формирования оптимальной ИТР рассматривается как стационарный MDP, в котором вероятностная модель перехода из состояния в состояние при определённом действии и вероятностная модель вознаграждений не изменяются со временем.
Функция ценности действия a в состоянии s при стратегии π определяет ожидаемый доход, когда агент начинает работу из состояния s, предпринимает действие a и затем следует стратегии π: . Оптимальную стратегию можно найти, используя метод динамического программирования [27].
Уравнения оптимальности Беллмана для имеют вид: . Уравнения Беллмана представляют собой систему уравнений, записанных по одному для каждого состояния. Если имеется n состояний и n неизвестных, то система имеет единственное решение.
Целью МОП является поиск стратегии π*, которая максимизирует математическое ожидание суммарного ожидаемого дохода (т.е. достигается максимальная ожидаемая полезность, что согласуется с принципом принятия решения рациональным агентом при неполной информации о среде) для всех состояний s: . Алгоритм МОП представляет собой последовательность процедур, соответствующих изменению состояния системы. Стратегия построения ИТР, разработанная на основе МОП, изменяться с течением времени по мере накопления наблюдений от работников. Для этого используется алгоритм, основанный на оценках полезности, с помощью которого агент настраивает функцию ценности действия a в состоянии s при стратегии π (Q-функцию). Настроенная функция ценности используется для оценки пар (s,a) и порождения стратегии агента, а обучение на основе алгоритма МОП называется Q-обучением. Для решения задачи обучения агента тестируются алгоритмы, основанные на ценности (на глубоких Q-сетях – DQN и SARSA, двойных глубоких Q-сетях - DDQN), и комбинированные алгоритмы (PRO) [28, 29].
4 Результаты моделирования
Моделирование выполнено в программе Matlab2021b6 и включает три процесса: создание агента Q-обучения; обучение агента; тестирование. Обучение нейросети проводится в 200 эпизодов, каждый из которых включает 50 испытаний (шагов). Эксперименты проведены на данных крупного нефтеперабатывающего предприятия. Имеются данные об оценке ЧК по пяти показателям и производительности труда работников. Обобщённые значения количественных показателей работников по выборке представлены в таблице 3. Сформирован комплекс управленческих решений по воздействию на элементы ЧК.
Таблица 3 – Статистические характеристики показателей в экспериментальной выборке из 70 работников
Показатель | Среднее значение | Среднеквадратическое отклонение |
Возраст работников, лет | 41 | 5 |
Уровень здоровья, баллы. Максимально возможный балл 1000 | 564 | 61 |
Уровень профессиональных компетенций, баллы. Максимально возможный балл 1000 | 625 | 43 |
Уровень надпрофессиональных компетенций, баллы. Максимально возможный балл 1000 | 469 | 34 |
Уровень мотивации и вовлечённости, баллы. Максимально возможный балл 1000 | 692 | 51 |
Уровень социального капитала. Максимально возможный балл 1000 | 721 | 20 |
Индивидуальная производительность труда, руб./(чел. х час) | 543 | 62 |
Рассматриваются два показателя, формирующих ЧК, – уровень здоровья работника и уровень его профессиональных компетенций. Принято, что каждый из приведённых показателей имеет пять уровней. Задача решается на двумерной сетке 5х5, где по строкам отражаются уровни здоровья работника (показатель 1), по столбцам – уровни компетенций (показатель 2), а нумерация ячеек в сетке строится от верхнего левого угла сетки (см. рисунок 3).
Рисунок 3 – Представление задачи в виде сетки 5х5
По результатам оценки ЧК, выполненной по методике [25], каждый работник получает по каждому из показателей балл от 1 до 1000, попадает в одну из пяти групп по каждому из показателей и на сетке представляется в виде кружка.
На рисунке 3 в качестве примера представлены результаты оценки работника, отмеченные в ячейке (3,2), – это начальное состояние его ЧК. При определении цели, т.е. уровня потенциально возможного ЧК для конкретного работника, учитывается ряд ограничений, связанных с его особенностями. На рисунке показана область ограничений в виде ячеек, залитых чёрным цветом. Показано, что для этого работника существует возможность движения в сторону улучшения ЧК – цели, ячейка (5,5). Если для работника с учётом его текущего уровня образования и характеристик здоровья невозможно достичь максимально уровня (ячейка 5,5), то для него определяется другая цель. По совокупности факторов здоровья этому работнику не удастся добиться повышения уровня профессионализма в данной области (с учётом низких значений уровня здоровья). Т.е. условия профессии таковы, что достижение уровней 3 и 4 профессионального развития невозможно для работника с низкими показателя здоровья, ячейки (3,3), (3,4). При высоких показателях уровня здоровья работника ему доступен переход на высший уровень компетентности, т.е. быстрый переход на уровень 5 по показателю 2, ячейки (4,5), (5,5).
Работник представлен как среда, в которой заданы ограничения достижимости цели, начальное и конечное состояния, функции переходов состояний, награды за переходы. Возможны переходы вправо и вниз, что соответствует перемещению работника на следующий уровень показателя при выполнении управленческих решений в соответствующей группе. Действия дискретны и отражают одно из управленческих решений, предназначенных для данной категории работников. Под решением понимается осуществление определённого мероприятия (например, повышение квалификации, обеспечение занятия спортом и др.), направленного на рост ЧК. Возможно реализовать 24 различных решения при движении работника из ячейки (1,1) в ячейку (5,5). Каждый противоположный цели шаг имеет штраф -1 балл, достижение цели имеет награду 3, переход через область ограничений, например, перемещение из (4,3) в (4,5), награждается в размере 1 балл. Цель алгоритма – научить агента формировать последовательность управленческих решений, обеспечивающих за минимальное время достижение максимальной награды. Проведена серия обучающих экспериментов для ряда работников с разными характеристиками ЧК. Для обучения агента использовались алгоритмы DQN, DDQN, SARSA и PRO [20]. Результаты экспериментов в виде изменения средней награды по эпизодам представлены на рисунке 4.
Рисунок 4 – Результаты обучения агента, коэффициент дисконтирования γ = 0.99, вероятность случайного действия ε = 0.04: а) эксперимент 1 – обучение на основе алгоритма DQN; б) эксперимент 2 – обучение на основе алгоритма DDQN; в) эксперимент 3 – обучение на основе алгоритма SARSA; г) эксперимент 4 – обучение на основе алгоритма PRO
Алгоритмы оценивались по двум критериям – эффективность политики (средняя награда) и эффективность обучения агента (скорость сходимости). Значения средних наград рассчитаны за каждый из 200 эпизодов моделирования, осреднённых по 50 испытаниям. Наилучший результат показал алгоритм DDQN, обеспечивающий сравнительно быстрое обучение и положительную награду, таблица 4. Поэтому выработка ИТР в дальнейшем основывалась на DDQN-алгоритме.
Таблица 4 – Результаты оценки эффективности политик и эффективности обучения
Алгоритм | Эффективность политики - средняя награда | Эффективность обучения - скорость сходимости (число эпизодов) |
DQN | -0.15 | 0.27 (53) |
DDQN | 0.2 | 0.29 (58) |
SARSA | -3.1 | 0.59 (117) |
PRO | -52 | - |
На основе модельных экспериментов для каждого работника с учётом начального и конечного (целевого) состояний сформированы оптимальные стратегии в виде ИТР. Они отражают последовательность принятия управленческих решений, обеспечивающих рост уровня ЧК. На рисунке 5 по мере продвижения по сформированной траектории текущее состояние всё более затемняется.
Рисунок 5 – Оптимальные политики (ИТР): а) эксперимент 1, начальное состояние (1,1), целевое состояние (3,5); б) эксперимент 2, начальное состояние (1,2), целевое состояние (4,4)
Результаты моделирования показывают, что для первого работника (эксперимент 1) для достижения целевого состояния наилучшими решениями будет следующая последовательность действий. Сначала необходимо провести программные мероприятия, направленные на улучшение здоровья работника до второго уровня, затем осуществлять программы по обеспечению роста профессиональных компетенций до уровня 4, после этого применить меры по оздоровлению, и вновь обеспечить улучшение профессиональных компетенций. Для второго работника (эксперимент 2) траектория развития следующая: выполнение программы, обеспечивающей рост профессионализма до уровня 3; проведение пошаговых мероприятий по улучшению здоровья до уровня 4; применение мер по росту компетентности. Осуществление сформированных ИТР позволит повысить уровень ЧК, обеспечит рост эффективности труда работников.
Заключение
Рассмотрены подходы, методы проектирования и модели ЦД организационных систем. Предложена технология разработки ЦД работников предприятия, основанная на гибридной модели объекта и включающая: модели структурного (математического) и компьютерного моделирования физических процессов; модели, основанные на данных, позволяющие обнаружить полезные и доступные для интерпретации знания, необходимые для принятия решений. ЦД работника с интеллектуальным управлением совмещает оба класса моделей, усиливая преимущества каждого из них.
В ЦД учёт неопределённости на этапе описания ЧК и в процессе его развития достигается за счёт использования разных типов данных, вариативности математических инструментов и итеративных процедур валидации и верификации моделей.
1 Merlynn Intelligence Corporation. Digital Twin. https://www.merlynn-ai.com/.
2 ПАО Гапром нефть. https://www.gazprom-neft.ru/press-center/news/gazprom_neft_sozdala_tsifrovoy_dvoynik_mestorozhdeniya_imeni_aleksandra_zhagrina/ (дата обращения 14.07.2025)
3 Медиа-портал для предпринимателей https://sberbusiness.live/publications/iskusstvennii-intellekt-v-prodazhah-kak-ai-sdelal-rabotu-s-produktami-sbera-esche-udobnee (дата обращения 14.07.2025)
4 АО «Навигатор». Консалтинг и разработка в сфере ИИ. https://navigat.ru/.
5 Институт искусственного интеллекта ИТМО. https://iai.itmo.ru/.
Sobre autores
Ekaterina Orlova
Ufa University of Science and Technology
Autor responsável pela correspondência
Email: ekorl@mail.ru
ORCID ID: 0000-0001-6535-6727
Scopus Author ID: 57192170106
Researcher ID: E-8829-2014
D.Sc.Eng., Professor at the Department of Entrepreneurship Economics
Rússia, UfaBibliografia
- GOST R 57700.37-2021. Computer models and modeling. Digital twins of products. General provisions. [In Russian]. Moscow: Russian Institute of Standardization, 2021. 15 p.
- Malik AA, Masood T, Bilberg A. Virtual reality in manufacturing: Immersive and collaborative artificial-reality in design of human-robot workspace. International Journal of Computer Integrated Manufacturing. 2019; 33. doi: 10.1080/0951192X.2019.1690685.
- Tao F, Qi, Q.,Wang L., Nee A. Digital Twins and Cyber–Physical Systems toward Smart Manufacturing and Industry 4.0: Correlation and Comparison. Engineering. 2019; 5: 653-661. doi: 10.1016/j.eng.2019.01.014.
- Fonseca Í., Gaspar H., Mello P., Sasaki H. A Standards-Based Digital Twin of an Experiment with a Scale Model Ship. Computer-Aided Design. 2022; 145: 103191. doi: 10.1016/j.cad.2021.103191.
- Patterson E, Diamantakos I, Dvurecenska K, Greene R, Hack E, Labeas G, Lomnitz M, Siebert T. Validation of a structural model of an aircraft cockpit panel: an industrial case study. The Journal of Strain Analysis for Engineering Design. 2021. 030932472110590. doi: 10.1177/03093247211059084.
- Dembski F, Wössner U, Letzgus M, Ruddat M, Yamu C. Urban Digital Twins for Smart Cities and Citizens: The Case Study of Herrenberg, Germany. Sustainability. 2020; 12: 1-17. doi: 10.3390/su12062307.
- Maryasin OYu. Design of ontologies for a digital twin of buildings. [In Russian]. Ontology of designing. 2019; 9(4): 480-495. doi: 10.18287/2223-9537-2019-9-4-480-495.
- Massel LV, Vorozhtsova TN. Ontological approach to the construction of digital twins of energy objects and systems. [In Russian]. Ontology of designing. 2020; 10(3): 327-337. doi: 10.18287/2223-9537-2020-10-3-327-337.
- Soyfer VA. Human fActor. [In Russian]. Ontology of designing. 2021; 11(1): 8-19. doi: 10.18287/2223-9537-2021-11-1-8-19.
- Prokhorov A, Lysachev M, Borovkov A. Digital twin. Analysis, trends, world experience. [In Russian]. Moscow: OOO "AlliancePrint", 2020. 401 p.
- Petrov AV. Simulation modeling as a basis for digital twin technology. [In Russian]. Bulletin of Irkutsk State Technical University. 2018; 22(10): 56-66.
- Qi Q, Tao F, Hu T, Anwer N, Liu A, Wei Y, Wang L, Nee A. Enabling technologies and tools for digital twin. Journal of Manufacturing Systems. 2021; 58: 3-21. doi: 10.1016/j.jmsy.2019.10.001.
- Erikstad SO. Merging Physics, Big Data Analytics and Simulation for the Next-Generation Digital Twins. HIPER 2017, High-Performance Marine Vehicles, Zevenwacht, South-Africa, 11-13 September 2017. 138-149 p.
- Martínez-García AN. Artificial Intelligence for Sustainable Complex Socio-Technical-Economic Ecosystems. Computation 2022; 10. doi: 10.3390/computation10060095.
- Kim D, Jo D. Effects on Co-Presence of a Virtual Human: A Comparison of Display and Inter-action Types. Electronics. 2022; 11. doi: 10.3390/electronics11030367.
- Orlova E.V. Innovation in Company Labor Productivity Management: Data Science Methods Application. Applied Systems Innovation. 2021; 4(3): 68. doi: 10.3390/asi4030068.
- Boje C, Guerriero A, Kubicki S, Rezgui Y. Towards a semantic construction Digital Twin: Directions for future research. Automation in Construction. 2020; 114: 103179. doi: 10.1016/j.autcon.2020.103179
- Banerjee P. AI and ML: The Brave New World of Simulation, 2021. https://fluidcodes.com/news/ai-and-ml-the-brave-new-world-of-simulation/.
- Radanliev P, De Roure D, Nicolescu R, Huth M, Santos O. Digital twins: artificial intelligence and the IoT cyber-physical systems in Industry 4.0. International Journal of Intelligent Robotics and Applications. 2022; 6(1): 171-185. doi: 10.1007/s41315-021-00180-5.
- Orlova EV. Design Technology and AI-Based Decision Making Model for Digital Twin Engi-neering. Future Internet. 2022; 14(9): 248. doi: 10.3390/fi14090248.
- Orlova EV. Methods and models of data analysis and machine learning in the task of labor productivity management. [In Russian]. Software Engineering. 2020; 4: 219-229. doi: 10.17587/prin.11.219-229.
- Rudskoy AI. Digital industry based on digital twins. Devices. 2021; 249(3): 9-16.
- Grieves M, Vickers J. Digital Twin: Mitigating Unpredictable, Undesirable Emergent Behavior in Complex Systems. In: Trans-Disciplinary Perspectives on System Complexity, F.-J. Kahlen, S. Flumerfelt, and A. Alves, Editors. 2017, Springer: Switzerland. P.85-114.
- Orlova EV. Assessment of enterprise human capital and its management in the context of digital transformation of the economy. [In Russian]. Journal of Applied Economic Research. 2021. Vol. 20. No. 4. P. 666–700. doi: 10.15826/vestnik.2021.20.4.026.
- Orlova EV. Design of Personal Trajectories for Employees’ Professional Development in the Knowledge Society under Industry 5.0. Social Sciences. 2021; 10(11): 427. doi: 10.3390/socsci10110427.
- Markov AA. The Theory of Algorithms. Journal of Symbolic Logic. 1953; 18(4): 340-341.
- Bellman R. A Markovian decision process. Journal оf Mathematics and Mechanics. 1957; 6(4): 679–684.
- Orlova EV. Dynamic Regimes for Corporate Human Capital Development Used Reinforcement Learning Methods. Mathematics. 2023; 11(18): 3916. doi: 10.3390/math11183916.
- Ding Q, Jahanshahi H, Wang Y, Bekiros S, Alassafi MO. Optimal reinforcement learning-based control algorithm for a class of nonlinear macroeconomic systems. Mathematics. 2022; 10: 499. doi: 10.3390/math10030499.
Arquivos suplementares






