Using Open Data Online Vacancies in Comparison with Official Statistics to Monitor and Forecast Labor Market Dynamics

Cover Page
  • Authors: Altukhov V.V.1,2, Kudryavtsev A.D.1,2
  • Affiliations:
    1. Lomonosov Moscow State University
    2. Profilum
  • Issue: Vol 21, No 2 (2025): ДЕМОГРАФИЧЕСКОЕ РАЗВИТИЕ РОССИИ. ИДЕИ И СМЫСЛ ТРУДА. ОБЩЕСТВЕННЫЙ ДОГОВОР
  • Pages: 233-244
  • Section: Economic research
  • Submitted: 30.06.2025
  • Accepted: 30.06.2025
  • Published: 29.07.2025
  • URL: https://journals.rcsi.science/1999-9836/article/view/298143
  • ID: 298143

Cite item

Full Text

Abstract

Digitalization of labor processes and the growing popularity of online platforms open up new opportunities for monitoring and forecasting labor market dynamics. However, the issues related to the representativeness of online vacancies data, their timeliness and completeness remain unresolved. The scientific interest of the study lies in the development of approaches to the integration of data from online sources with official statistics, which will improve the accuracy of forecasting and promptness of labor market assessment. In traditional labor market analysis, vacancies are used to measure labor market tensions and can signal the presence of imbalances in the labor market, when supply and demand do not match each other (in terms of qualitative characteristics, geographically, etc.). The purpose of the article is to compare the data of online vacancies and official statistics to develop approaches to monitoring and forecasting labor market dynamics. The article gives an example of implementation of labor market monitoring based on big data and comparison of online vacancies data with the sources of official statistics. The main sources of data for comparison were Rosstat and hh.ru (open vacancy data). The author's methodology of aggregation of vacancy data into groups of professional spheres and professions based on official classifiers, as well as methods of calculation and estimation of salary levels were used in the comparison. As a result of the study, it was revealed that the obtained and aggregated data of the online job search portal hh.ru reliably correlates with the official quarterly and monthly statistics on the dynamics of the number of open vacancies and salaries. Finally, we discuss methods of forecasting labor market dynamics using machine learning methods based on open big data. According to the authors, the possibility of correlating the dynamics of the indicators of online portals with official statistics of enterprises could complement the methodology of labor market monitoring and increase the reliability of forecasts.

Full Text

Введение

Цифровизация трудовых процессов и рост популярности онлайн-платформ открывают новые возможности для мониторинга и прогнозирования динамики рынка труда. Однако остаются нерешёнными вопросы, связанные с репрезентативностью данных онлайн-вакансий, их оперативностью и полнотой. Научный интерес исследования заключается в развитии подходов к интеграции данных онлайн-источников с официальной статистикой, что позволит повысить точность прогнозирования и оперативность оценки состояния рынка труда.

Цель исследования — сопоставление данных онлайн-вакансий и официальной статистики для разработки подходов к мониторингу и прогнозированию динамики рынка труда.

Задачи исследования:

  1. Анализ существующих методологий мониторинга.
  1. Разработка алгоритмов обработки данных, включающих в себя классификацию вакансий по профессиональным отраслям и обработку заработных плат.
  2. Сравнение данных hh.ru с официальной статистикой Росстата.
  3. Оценка результатов, выработка подходов к мониторингу и прогнозированию показателей рынка труда на основе открытых данных.

 Объект исследования — показатели структуры и динамики рынка труда (вакансии и заработные платы).

Предмет исследования — данные по показателям (вакансиям и заработным платам из официальных и открытых источников), а также методы и инструменты мониторинга и прогнозирования структуры и динамики рынка труда.

Исследование вакансий представляет собой полезный срез информации и является перспективным источником данных. При традиционном анализе ситуации на рынке труда вакансии используются для измерения напряжённости на рынке труда, то есть для анализа соотношения неудовлетворённого спроса на труд и свободной рабочей силы (по данным Росстата). Таким образом, данные по вакансиям могут сигнализировать о наличии дисбалансов на рынке труда, когда спрос и предложение не соответствуют друг другу (по качественным характеристикам, географически и т. д.).

Также, согласно исследованиям [1], к 2025 году человечество начнет генерировать 175 зеттабайт данных. Такой большой объём данных мотивирует исследователей активно развивать методы анализа, основанные на анализе больших данных, не ограничиваясь только их частью или статистикой [2].

Гипотезой исследования является применимость данных онлайн-вакансий для мониторинга рынка труда. Различные данные Росстата собираются и подсчитываются помесячно или поквартально, однако с учётом развития онлайн-сервисов поиска работы становится актуальным принимать во внимание и их, а также рассматривать возможность соотнесения динамики показателей онлайн-порталов с официальной статистикой предприятий. Такой подход мог бы дополнить методологию мониторинга рынка труда и, возможно, помочь делать достоверные прогнозы на будущее.

Изучая научное поле вопроса достоверности данных порталов по поиску работы онлайн, стоит обратить внимание на ряд исследований, посвящённых сравнению данных официальной статистики (опросов работодателей) с массивом больших данных онлайн-вакансий. На выборке сразу нескольких стран Европейского союза [3; 4] проведены сравнительные исследования распределения вакансий онлайн-платформ и вакансий в отраслевом распределении (согласно европейскому статистическому отраслевому классификатору NACE), а также в разрезе профессиональных групп (согласно международной классификации профессий ISCO-08) на базе опросов официальной статистики в различных секторах. Авторы отмечают разрывы в данных, исходя из локации (географии стран) и отраслей, — количество вакансий на онлайн-платформах может быть примерно сравнимым с данными официальных опросов, но существуют и случаи несоответствия, когда вакансий может быть больше или значительно меньше в тех или иных видах деятельности, например, как в случае с государственным управлением, где традиционно меньше онлайн-вакансий. Однако в то же время исследователи отмечают преимущество анализа онлайн-вакансий в силу более оперативного получения информации и возможности охватить различные тренды рынка труда. Исследования, проведённые на выборке данных по отдельным странам — например, по Нидерландам [5], Италии [6] или Австралии [7], — указывают на статистическую значимость сходства между полученными данными онлайн-вакансий и официальной статистикой и являются, согласно выводам, надёжными предикторами трендов на рынке труда.

 

Теоретические и методологические положения

Исследования репрезентативности данных онлайн-вакансий имеют определенные ограничения, прежде всего в силу того, что не все представители рынка труда имеют равные шансы попасть в выборку в силу разных причин. Вакансии, открытые публично, не представляют весь неудовлетворённый спрос на рабочую силу (рисунок 1). Вакансии, опубликованные в открытом доступе, могут преследовать несколько целей: сделать поиск более эффективным, если другие инструменты этого не позволяют, либо увеличить охват потенциальных кандидатов, повысив таким образом конкуренцию; в некоторых случаях государственные компании обязаны публиковать вакансии на определённых платформах. Некоторые вакансии никогда не становятся публичными, а заполняются иными способами (через внутренние каналы поиска компании, рекрутинговые агентства, неформальные связи и т. д.).

Онлайн-вакансии являются источником множества данных и содержат: название компании, описание требований, необходимых навыков и образования, заработной платы. В то же время существуют некоторые ограничения или искажения при сборе и интерпретации данных [8].

Согласно ранее изученным данным на европейском рынке труда [9], вакансии, опубликованные на порталах поиска работы онлайн, составляют порядка 80–85% от всех опубликованных вакансий. Больше всего данный способ подходит при поиске менеджеров среднего звена, специалистов разного уровня, технического и административного персонала. Однако могут отсутствовать вакансии для работников низкоквалифицированного труда или, наоборот, для специалистов высшего звена, которые чаще всего нанимаются через рекрутинговые агентства или нетворкинг.

В исследовании на основе эмпирических данных опроса 1799 российских компаний [10], проведённого в 2015 г., было выявлено, что наиболее популярным способом найма новых сотрудников является поиск через интернет и через социальные сети (знакомых, коллег, родственников). Было выявлено, что порядка 76% компаний из представительной выборки российских предприятий (на момент проведения исследования) используют интернет для поиска сотрудников, и чаще всего в финансовой сфере и трейдинге, реже — в строительстве, промышленности, добыче. Стремительный переход компаний к использованию различных интернет-сервисов и платформ подчёркивает актуальность данного исследования.

Есть подтверждения, что на сайтах вакансий недопредставлены низкоквалифицированные и низкооплачиваемые профессии в такой профессиональной группе, как, например, специалисты в сельском хозяйстве, лесной промышленности и др., и излишне представлены профессии, требующие высокой квалификации [11].

Вакансии также могут быть смещены в сторону поиска высококвалифицированных кадров, а также в сторону предложений от компаний, уже успешно зарекомендовавших себя на рынке, или быстрорастущих компаний [12]. Исследования по рынку труда США [13] также говорят о смещённости данных в сторону вакансий, требующих высшего образования (диплом бакалавра), а также о других искажениях при сравнении онлайн-данных и данных официальной статистики. Вакансии в отрасли зависят также от скорости оборота в ней: чем выше оборот, тем больше увеличивается доля представленности — например, в торговле, ресторанном или гостиничном бизнесе оборот выше.

Среди других ограничений — данные открытых вакансий могут зависеть от региональной специфики, популярных ресурсов и платформ, а также от стратегий найма. Например, от возможности открывать вакансию сразу для нескольких кандидатов или для массового найма или, открывая вакансию, задаваться целью мониторинга потенциальных кандидатов, без планов нанимать работников.

На рынок труда может влиять и особенность эволюции институтов труда. Так, стоит упомянуть уже устоявшееся понятие «российская модель рынка труда»: когда в кризисные моменты экономики адаптация происходит в том числе за счёт снижения оплаты труда и сокращения рабочего времени работников [14].

Данные онлайн-вакансий активно применяются в аналитике [15; 16], однако, российский контекст остаётся недостаточно изученным. Основные пробелы включают отсутствие детальных сопоставлений данных порталов онлайн-вакансий с региональной статистикой Росстата. Кроме того, необходимо изучить преимущества и ограничения использования онлайн-источников для мониторинга трудового рынка.

Таким образом, принимая во внимание различные аспекты сопоставления «больших данных» онлайн-вакансий и источников официальной статистики, мы ставим перед собой проблему и задачу выполнить сравнительный анализ этих статистик на российском рынке труда.

 

Данные и методы работы с ними

На данный момент технологии сбора и обработки данных онлайн-вакансий, то есть «больших данных», уже достаточно изучены и опробованы. На зарубежном рынке примечателен проект Cedefop, который посвящён сразу 27 странам, входящим в Европейский союз (ЕС), а также Великобритании: распределение вакансий и навыков в отраслевом (по видам экономической деятельности) и профессиональном разрезах[1]. Схожий сервис, собирающий данные по вакансиям практически в режиме онлайн, — Lightcast (бывш. Burning Glass Technologies)[2] — уже зарекомендовал себя как надёжный аналитический сервис, использующийся как инструмент для проведения различных совместных исследований рынков труда США и ЕС. Также примечателен российский сервис, созданный «ВНИИ труда» Минтруда России — аналитическая система мониторинга вакансий и резюме[3]. В целом базовая схема работы заключается в сборе сырых данных, их обработке, преобразовании в структурированную базу данных и визуализацию полученных результатов (например, Cedefop[4]).

Целью нашей работы является соотнесение данных онлайн-вакансий на российском рынке труда с данными официальной статистики Росстата. Важность этой работы определяет дальнейшие шаги для проведения более фундаментальных исследовательских работ: если картина онлайн-вакансий схожа с официальной статистикой, это может в дальнейшем стать валидным инструментом при мониторинге и прогнозировании ситуации на рынке труда.

В своей работе мы будем опираться на несколько источников. Из официальной статистики Росстата будут использоваться следующие показатели:

  1. Заявленная работодателями потребность в работниках в течение отчётного периода (количество свободных вакансий, заявленных работодателями в органы службы занятости населения в течение отчётного периода, по данным служб занятости, доступно по РФ в целом, помесячно)[5].
  2. Численность требуемых работников списочного состава на вакантные рабочие места на конец отчётного квартала (численность работников списочного состава, которых предполагается принять на вакантные рабочие места, по состоянию на последнее число отчётного квартала, по данным отчётности сектора крупных и средних предприятий, доступна по регионам и отраслям)[6].
  3. Среднемесячная номинальная начисленная заработная плата работников по полному кругу организаций по субъектам Российской Федерации[7].

Эти показатели будут сопоставлены с собранными и проанализированными «Профилум» открытыми данными платформы по найму сотрудников hh.ru, крупнейшей платформы поиска работы и найма сотрудников в России[8], которая предоставляет открытый и публичный HTTP API. Период для анализа данных — с января по декабрь 2023 года.

Можно выделить следующие этапы сбора вакансий и выявления показателей заработной платы:

  1. Обработка названий вакансий и их общего количества. Было собрано более 16 млн вакансий по всем регионам страны. В текстах каждой вакансии проводился процесс удаления служебных частей речи и выделения лемм (начальных словарных форм слов). Затем вакансии были сгруппированы по названиям, тем самым был получен первоначальный список профессий. Также был экспертно сформирован список из двух тысяч профессий, основанный на анализе вакансий (наиболее часто встречаемые) и общероссийском классификаторе специальностей. Далее специалистами по рынку труда и профориентации были сопоставлены первоначальный и экспертный список профессий. Таким образом были классифицированы вакансии для дальнейшего анализа.
  2. Обработка заработных плат. Анализ данных по средней заработной плате указывает на проблему некорректно низких или высоких значений (выбросов) и недостаточной заполненности данных: доля пропусков, где отсутствует хотя бы один из пределов (минимум или максимум), составляет порядка 45%. Для решения первой проблемы для каждой профессии/вакансии рассчитывается 90%-й интервал, а выбросы заменяются крайними значениями (выбросы в меньшую сторону — 5% перцентилем, в большую — 95% перцентилем). Затем для заполнения пропусков модель обучается линейной регрессии и предсказывает отсутствующие значения. Таким образом были получены значения средней заработной платы всех доступных значений в вакансиях, а также средние заработные платы, когда значения были досчитаны в случае, когда работодатель их не указывал.

Для корректного отраслевого соотнесения статистических показателей (т. е. согласно ОКВЭД) и отраслевых категорий[9] портала hh.ru была осуществлена перекодировка значений портала в соответствии с разделами ОКВЭД[10].

Стоит также принять во внимание методологические ограничения при сравнении показателей Росстата и портала поиска работы hh.ru, которые могут вносить коррективы (таблица 1).

Результаты и обсуждение

Показатели динамики вакансий

Полученные и обработанные данные портала поиска работы hh.ru были сопоставлены с поквартальной и помесячной динамикой количества вакансий Росстата. В целом данные Росстата менее волатильны, особенно при сравнении кварталов в абсолютных и процентных значениях (например, в III квартале 2023 года, рисунок 2–3), однако при этом число вакансий, размещённых за квартал, одного порядка с числом доступных вакансий от Росстата с точки зрения восходящего/нисходящего трендов.

Проведённый корреляционный анализ поквартального распределения количества вакансий по регионам указывает на высокую положительную связь (r = 0,98, p<.001; Приложение, рисунок А), что указывает на пропорциональные изменения во времени двух источников вакансий.
Помесячная динамика более наглядна. Мы можем наблюдать схожие тренды от месяца к месяцу. Пик спроса вакансий на портале hh.ru приходится на август 2023 года, данные Росстата сопоставимы — пик приходится на май — август. Возможно, это является следствием сезонности. В целом начиная с августа данные уже более синхронны.

Сравнение отраслевой структуры вакансий

При сравнении отраслевой структуры вакансий портала hh.ru и Росстата (численность требуемых работников списочного состава на вакантные рабочие места на конец отчётного квартала) можно отметить некоторые различия в отраслевой структуре вакансий: онлайн-вакансии хуже отражают (недопредставлены) деятельность в сельском хозяйстве, государственные сервисы (здравоохранение, образование, государственное управление, культура). Сверхпредставлены рыночные услуги: административные услуги, профессиональная деятельность, финансы, информация и связь, гостиницы и общественное питание, и особенно торговля (рисунок 4). При этом сопоставимы данные в транспорте и логистике, строительстве, обрабатывающей промышленности, добыче полезных ископаемых, административной деятельности.

Сравнение источников данных о заработных платах

При сравнении источников заработной платы в целом по регионам страны стоит уточнить, что заработная плата от Росстата — это плата за стандартную продолжительность рабочего времени, фактически выплаченная, в то время как у hh.ru — предлагаемая работодателем, то есть некоторое усреднение (рисунок 5). 

Скорректированная средняя заработная плата по данным портала hh.ru, то есть с учётом смоделированных значений заработной платы в вакансиях (с помощью линейной регрессии), где эта информация была пропущена, в целом достаточно близки к значениям Росстата. А корреляционный анализ квартальных и помесячных заработных плат Росстата с данными, агрегированными с hh.ru, показывает также высокую положительную связь между данными (r = 0,85, p<.001 и r = 0,82, p<.001 соответственно; Приложение, рисунок Б-В).

С июля заработная плата, предлагаемая работодателями на hh.ru, выше фактически выплаченной Росстатом, за исключением декабря 2023 года — месяца премий, что может свидетельствовать о признаках нарастающего дефицита рабочей силы.

 

Отраслевое сравнение источников данных о заработных платах

Значения заработных плат по отраслям в целом близки, но внимание привлекает существенная недооценка зарплат в высокооплачиваемых отраслях в онлайн-вакансиях: финансовая деятельность, деятельность в области информации и связи — вероятно, это связано с тем, что часть предложений по заработной плате обсуждается на финальных стадиях найма, а также большим оборотом организаций. Видны и области, где предложение выше, чем в данных Росстата, — операции с недвижимостью, транспорт и логистика, строительство. Также отмечают отрасли с наиболее близкими значениями — торговля и добыча сырья (рисунок 6).

Заключение

  1. Полученные данные подтверждают, что онлайн-вакансии могут служить полезным дополнением к официальной статистике для мониторинга рынка труда. В будущем рекомендуется провести дополнительные исследования для учёта сезонных факторов и расширить использование методов машинного обучения, чтобы включить другие источники данных и платформы.
  2. Полученное отраслевое распределение данных hh.ru позволило получить осмысленное сопоставление с данными официальной статистики о вакантных рабочих местах и номинальной начисленной заработной платой.
  3. При сопоставлении вакансий в отраслевом разрезе можно отметить лишь некоторые виды экономической деятельности, когда данные онлайн-вакансий соотносятся с данными Росстата (например, транспорт и логистика, строительство, обрабатывающая промышленность, добыча полезных ископаемых, административная деятельность), в других случаях мы можем отметить несовпадение.
  4. При сопоставлении отраслевых показателей заработных плат также отмечаются зоны совпадения скорректированной заработной платы и номинальной начисленной зарплаты по Росстату: это деятельность в сфере торговли, добычи полезных ископаемых и др. В случаях, когда показатели онлайн-вакансий незначительно превышают данные Росстата, вероятно, можно предположить зоны дефицита рабочей силы, например в обрабатывающей промышленности, строительстве, транспортировке.
  5. В отраслевом разрезе также существуют некоторые аномалии, которые требуют дополнительного исследования: высокая доля вакансий в сфере торговли (с резким скачком в мае 2024 года); заниженные заработные платы в высокодоходных отраслях (финансовая деятельность, информация и связь).
  6. В дальнейшем необходимо провести анализ данных на более длительном временном отрезке, чтобы охватить как можно больше трендов, например явление сезонности за 2023–2024 гг.

Работа по анализу данных рынка труда с точки зрения публикуемых вакансий на порталах поиска работы в формате онлайн представляет огромный интерес, это можно отметить по возрастающему количеству проводимых исследований, а также возросшему числу таких платформ в России. Достоверность и валидность результатов сопоставления официальных статистик и данных онлайн-вакансий зависит от многих факторов и государственных политик стран: цифровизации сервисов, открытости экономики, используемых инструментов сбора и обработки данных.

Основным ограничивающим фактором, влияющим на восприятие полноты данных онлайн-вакансий, является их строгость (представлено ранее в таблице 1) — на одну вакансию может приходиться несколько открытых позиций, в то же время мы не можем достоверно знать, когда именно открываются и закрываются вакансии. В результате в исследовательском плане не вполне ясно, какую именно часть рынка труда представляют онлайн-вакансии: более оперативно отражают рынок труда или дополняют данные официальной статистики.

Между тем динамика данных, полученная после обработки почти 16 млн онлайн-вакансий, и её сопоставление с данными Росстата говорят о схожести трендов, на это также указывает положительная корреляция при сравнении как количества вакансий, так и заработной платы. Одним из полезных результатов является перекодировка экономических отраслей и ниш портала hh.ru в систему классификатора ОКВЭД, что позволит в дальнейшем использовать данный «словарь» для последующих сопоставлений.

В качестве дальнейших исследовательских шагов становится актуальным вопрос о прогнозировании потребности в кадрах на рынке труда на основании данных онлайн-вакансий и резюме при помощи статистических методов или машинного обучения. Для решения этой задачи применимы модели с авторегрессией и интегрированным скользящим средним (ARIMA). Прогнозная модель ARIMA для стационарного временного ряда представляет собой уравнение регрессионного типа, в котором предикторы состоят из лагов зависимой переменной и/или лагов ошибок прогноза [17].

Также перспективным методологическим инструментом для прогнозирования в данном вопросе может стать использование алгоритма градиентного бустинга XGBoost, где в качестве признаков используются данные спроса и предложения на рынке труда, а также исторические данные о нехватке рабочей силы [18]. Применённый алгоритм показывает высокую эффективность (F1 до 86%) и прогностическую ценность. Данный подход, в отличие от источников официальной статистики, позволит намного быстрее выполнять прогноз, опираясь на данные в открытом доступе.

[1]Cedefop: Skills-OVATE: Online Vacancy Analysis Tool for Europe // Сedefop: [сайт]. URL: https://www.cedefop.europa.eu/en/tools/skills-online-vacancies (дата обращения: 04.11.2024).

[2]Lightcast Data: Basic Overview // Lightcast: [сайт]. URL: https://kb.lightcast.io/en/articles/6957498-lightcast-data-basic-overview#h_31fa7af939 (дата обращения: 04.11.2024).

[3]ВНИИ труда представил аналитическую систему мониторинга вакансий и резюме // ВНИИ труда: [сайт]. URL: https://vcot.info/news/vnii-truda-predstavil-analiticeskuu-sistemu-monitoringa-vakansij-i-rezume (дата обращения: 04.11.2024).

[4]Cedefop. Online job vacancies and skills analysis: a Cedefop pan-European approach. Luxembourg: Publications Office, 2019 // Сedefop: [сайт]. URL: http://data.europa.eu/doi/10.2801/097022 (дата обращения: 04.11.2024).

[5]Росстат. Заявленная работодателями потребность в работниках в течение отчетного периода // Росстат: [сайт]. URL: https://www.fedstat.ru/indicator/43141 (дата обращения: 04.11.2024).

[6]Росстат. Численность требуемых работников списочного состава на вакантные рабочие места на конец отчетного квартала с 2017 г. // Росстат: [сайт]. URL: https://www.fedstat.ru/indicator/57768 (дата обращения: 04.11.2024).

[7]Росстат. Среднемесячная номинальная начисленная заработная плата работников по полному кругу организаций по субъектам Российской Федерации // Росстат: [сайт]. URL: https://rosstat.gov.ru/labor_market_employment_salaries (дата обращения: 04.11.2024).

[8]HeadHunter API // HeadHunter: [сайт]. URL: https://api.hh.ru/openapi/redoc#section/Obshaya-informaciya (дата обращения: 04.11.2024).

[9]Отраслевую принадлежность работодатель заполняет самостоятельно, исходя из специфики продукции или сервисов.

[10]Общероссийский классификатор видов экономической деятельности (утв. Приказом Росстандарта от 31.01.2014 N 14-ст) (ред. от 16.08.2024) // КонсультантПлюс: [сайт]. URL: https://www.consultant.ru/document/cons_doc_LAW_163320/ (дата обращения: 04.11.2024).

×

About the authors

V. V. Altukhov

Lomonosov Moscow State University;
Profilum

Email: vitaly@profilum.ru
ORCID iD: 0009-0000-9307-4276

Junior Research Fellow, Laboratory of Social and Economic Research «Technologies for the Development of Human Capital and the Construction of Institutional and Competence-Based Models of Human Development» at the Department of Labor and Personnel Economics, Faculty of Economics, Lomonosov Moscow State University; Director of Development and Research, Profilum

Russian Federation, Moscow, Russia; Moscow, Russia

A. D. Kudryavtsev

Lomonosov Moscow State University;
Profilum

Author for correspondence.
Email: kudryavtsev@profilum.ru

Junior Research Fellow, Laboratory of Social and Economic Research «Technologies for the Development of Human Capital and the Construction of Institutional and Competence-Based Models of Human Development» at the Department of Labor and Personnel Economics, Faculty of Economics, Lomonosov Moscow State University; Data Scientist, Profilum

Russian Federation, Moscow, Russia; Moscow, Russia

References

  1. Makshanov AV, Zhuravlev AE, Tyndykar’ LN. Bol'shie dannye. Big Data. Textbook for Universities. St. Peterburg; 2022. 188 p. ISBN 978-5-8114-9690-7 (In Russ.).
  2. Mikryukov АА, Granatov MG, Abdrakhmanova ZA. Big Data Analysis Methods. Obshchestvo, ekonomika, upravlenie=Society, economy, management. 2023;8(4):70-74. https://doi.org/10.47475/2618-9852-2023-8-4-70-74 (In Russ.)
  3. Napierala J., Kvetan V., Branka J. Assessing the Representativeness of Online Job Advertisements. Cedefop working paper. No. 17. Luxembourg: Publications Office of the European Union; 2022. 26 p. http://data.europa.eu/doi/10.2801/807500
  4. Vermeulen W., Gutierrez Amaros F. How Well do Online Job Postings Match National Sources in European Countries?: Benchmarking Lightcast Data against Statistical and Labour Agency Sources across Regions, Sectors and Occupation. OECD Local Economic and Employment Development (LEED) Papers. No. 2024/02. Paris: OECD Publishing; 2024. https://doi.org/10.1787/e1026d81-en
  5. De Pedraza P., Visintin S., Tijdens K., et al. Survey vs Scraped Data: Comparing Time Series Properties of Web and Survey Vacancy Data. IZA Journal of Labor Economics. 2019;8(1):1-23. https://doi.org/10.2478/izajole-2019-0004
  6. Lovaglio P.G., Mezzanzanica M., Colombo E. Comparing Time Series Characteristics of Official and Web Job Vacancy Data. Quality and Quantity. 2020;54(1):85-98. https://doi.org/10.1007/s11135-019-00940-3.
  7. Evans D., Mason C., Chen H., et al. An algorithm for Predicting Job Vacancies Using Online Job Postings in Australia. Humanities and Social Sciences Communications. 2023;10(102):1-9. https://doi.org/10.1057/s41599-023-01562-9
  8. Kureková L.M., Beblavý M., Thum-Thysen A. Using Online Vacancies and Web Surveys to Analyse the Labour Market: a Methodological Inquiry. IZA Journal of Labor Economics. 2015;4(18):1-20. https://doi.org/10.1186/s40172-015-0034-4
  9. Romanko O., O’Mahony M. The Use of Online Job Sites for Measuring Skills and Labour Market Trends: a Review. ESCoE Technical Report No. 2022-19. London; 2022. 48 p. ISSN 2515-4664
  10. Roshchin S., Solntsev S., Vasilyev D. Recruiting and Job Search Technologies in the Age of Internet. Foresight and STI Governance. 2017;11(4):33-43. https://doi.org/10.17323/2500-2597.2017.4.33.43.
  11. Cammeraat E., Squicciarini M. Burning Glass Technologies’ Data Use in Policy-relevant Analysis: an Occupation-level Assessment. OECD Science, Technology and Industry Working Papers. No. 2021/05. Paris: OECD Publishing; 2021. 69 p. https://doi.org/10.1787/cd75c3e7-en
  12. Davis S., Faberman R., Haltiwanger J. The Establishment-level behavior of Vacancies and Hiring. Quarterly Journal of Economics. 2013;128(2);581-622. https://doi.org/10.1093/qje/qjt002
  13. Carnevale A.P., Jayasundera T., Repnikov D. Understanding Online Job Ads Data: Technical Report. Georgetown: Center on Education and the Workforce; 2014. 28 p. http://dx.doi.org/10.13140/RG.2.2.13283.57124
  14. Kapeliushnikov R.I. The Russian Labor Market: a Statistical Portrait on the Crises Background. Voprosy Ekonomiki. 2023;(8):5-37. https://doi.org/10.32609/0042-8736-2023-8-5-37 (In Russ.)
  15. Gorina T., Natsak. O. Analyzing Supply and Demand in Tuva’s Labor Market: Professional and Gender Aspects Revisited. Byulleten' Kalmytskogo nauchnogo tsentra RAN=Bulletin of the Kalmyk Scientific Center of the RAS. 2022;(1):204–235. https://doi.org/10.22162/2587-6503-2022-1-21-204-235 (In Russ.)
  16. Ternikov A. A. Professional Standards and Demand in the Labor Market in the Sphere of Higher Management in Russia. Vestnik Sankt-Peterburgskogo universiteta. Menedzhment=Vestnik of Saint Petersburg University. Management. 2022;21(1);131–148. http://doi.org/10.21638/11701/spbu08.2022.106 (In Russ.)
  17. Aletdinova A., Bakaev M. Intelligent Data Analysis and Predictive Models for Regional Labor Markets. In: Digital Transformation and Global Society. 6th International Conference Proceedings; June 23–25, 2021; St. Petersburg, Russia. 2022:351-363. https://doi.org/10.1007/978-3-030-37858-5_29
  18. Dawson N., Rizoiu M. A., Johnston B., et al. Predicting Skill Shortages in Labor Markets: A Machine Learning Approach. IEEE International Conference on Big Data. Conference Proceedings; December 10-13, 2020; Atlanta, USA. 2020:3052-3061. https://doi.org/10.1109/BigData50022.2020.9377773

Supplementary files

Supplementary Files
Action
1. JATS XML


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».