Large quarterly Bayesian vector autoregression model for the modern Russian economy
- Autores: Zasmolin A.D.1
-
Afiliações:
- Novosibirsk State University of Economics and Management
- Edição: Volume 60, Nº 4 (2024)
- Páginas: 50-64
- Seção: Problems of national economy
- URL: https://journals.rcsi.science/0424-7388/article/view/269445
- DOI: https://doi.org/10.31857/S0424738824040059
- ID: 269445
Texto integral
Resumo
It is often difficult to choose the necessary variables when we are forecasting the economic dynamics. On the one hand, vector autoregression (VAR) models can solve this problem by taking into account a sufficiently large number of variables. However, on the other hand, excessive parametrization of such models is not always justified, because it is often possible to choose such a small combination of variables the predictive power of which will be no worse than unlimited VARs with a large number of variables and lags. Bayesian methods help to solve this problem by introducing a priori restrictions on the VAR coefficients. The main goal of this work is to build a Large quarterly Bayesian vector autoregression (QBVAR) for the modern Russian economy. The hypotheses of the study: 1) BVAR(p) models reveal their maximum potential with a small number of variables, but with a large number of lags, 2) The Minnesota prior distribution is not always the best option for the modern Russian economy in the BVAR(p) model. As a result of the analysis, it turned out that for a number of the most important macroeconomic variables (GDP, inflation, key rate, unemployment, wages), Normal-Flat / Wishart-type priors turned out to be the optimal. In case of 29 input variables and two lags, the predictive power of the QBVAR(2) model is worse than the equivalent frequency VAR(2) or VECM(2). However, when it was possible to find the optimal combinations of variables, QBVAR(p) turned to be several times more accurate than its analogous frequency VAR(p) for all important macro indicators. In addition, the stiffness parameters of the considered a priori distributions decreases with increasing lags entering the model, i. e. the higher the order of the model with the minimum optimal set of variables, the tighter the distribution is necessary to obtain more accurate predictions. For the Russian realities, it is necessary to use very tight priors, 6–8 variables and 9–12 lags in a quarterly representation.
Texto integral
1. ВВЕДЕНИЕ И ОБЗОР ЛИТЕРАТУРЫ
Байесовские методы нашли применение во многих дисциплинах, в том числе и прикладной экономике. Речь идет об анализе связей между переменными в виде многомерных макроэкономических временных рядов. Самым популярным инструментом для подобного анализа являются неограниченные векторные авторегрессии с экзогенными переменными UVARX(p) (unrestricted vector autoregression with exogenous variables), которые впервые были предложены в (Sims, 1980) и широко использовались зарубежными авторами для анализа денежно-кредитной политики и оценки влияния локальных/глобальных шоков (см., например, (Litterman, 1986; Kadiyala, Karlsson, 1993; Bernanke, Mihov, 1997, 1998; Bernanke, Boivin, Eliasz, 2005; Stock, Watson, 2005; Banbura, Giannone, Reichlin, 2010)).
Модели UVARX(p) применимы для характеристики динамики любого набора временных рядов при минимальном числе ограничений. Поскольку UVARX(p) представляют собой модели авторегрессий с распределенным лагом, то ограничения на их идентификации, мотивированные фундаментальной экономической теорией, необходимы для проведения качественного экономического анализа.
Подобные модели являются очень точными эмпирически благодаря возможности добавить в них большое число переменных. Однако степень информации, которая хранится в лагированных переменных, очень быстро убывает с ростом порядка лага. Поэтому VAR-модели в основном используются с порядком не больше 3–12 лагов (в зависимости от частоты изучаемых данных), — все, что выше двенадцатого лага, не приносит значимого прироста в прогностической силе модели (Lütkepohl, 2005).
Тем не менее UVARX в стандартном виде не всегда подходит для прогнозирования вне выборки. Чтобы попытаться аппроксимировать разложение Вольда, необходимо иметь UVARX с бесконечным числом лагов. Такая широкая параметризация означает, что UVARX не являются функциональной альтернативой ни стандартным макроэконометрическим структурным моделям, в которых незначимые коэффициенты удаляются из спецификации, ни фундаментальным эконометрическим моделям (например, RBC (real business cycle) или DSGE (dynamic stochastic model of general equilibrium)), поскольку при ограниченном числе степеней свободы оценки коэффициентов у UVARX достаточно неточны и прогнозы на их основе имеют значительные ошибки.
Для решения данной проблемы можно строить регрессии в совокупности исторической и априорной информации как статистического, так и экономического характера. UVARX используют априорную информацию: 1) при изначальном выборе эндогенных/экзогенных переменных для VAR; 2) при выборе длины лага модели; 3) при введении ограничений по идентификации. Из-за этого может произойти переобучение модели, когда набор данных короткий, информация о выборке слабая или число параметров велико.
Этот вопрос до сих пор остается актуальным для развивающихся экономик, в том числе и России, потому что длина и частотность экономической статистики не позволяют строить действительно большие структурные модели. В случае с байесовским подходом мы не только учитываем априорную информацию простой VAR, но еще и вводим дополнительные ограничения на ее коэффициенты, предполагая, что переменные ведут себя случайным образом. С помощью подобной техники мы частично решаем проблему параметризации VAR, сжимая пространство оцениваемых параметров, не теряя при этом экономической информации.
2. МЕТОДИЧЕСКИЙ АППАРАТ АНАЛИЗА
Основной многомерной эконометрической моделью для анализа связей между макроэкономическими переменными является неограниченная обобщенная векторная авторегрессия UVARX(p) открытого типа:
(1)
где — текущие эндогенные переменные; — лагированные эндогенные переменные; — текущие и лагированные экзогенные переменные; — некоторые случайные возмущения с нормальным распределением; — порядок лага эндогенных переменных.
Если нам не нужны экзогенные переменные, тогда модель UVARX(p) называется закрытой, в противном случае — открытой. Каждое уравнение UVARX(p) представляет собой модели авторегрессии с распределенным лагом (ARDL). Обычно экзогенные переменные выбирают без своих лаговых значений, т. е. при .
Модель (1) можно переписать в более упрощенном виде:
, (2)
где — вектор эндогенных переменных; — вектор лагированных эндогенных переменных; — вектор экзогенных переменных; — матрицы коэффициентов, требующих оценки; — вектор случайных возмущений с нормальным распределением.
Вернемся к векторизованной форме (2) и упростим ее еще больше:
, (3)
где , .
Зададим множество размерности модели (3), где — число эндогенных переменных; — число экзогенных переменных. Тогда (3) равносильно:
(4)
где vec — операция векторизации; — произведение Кронекера, в результате которого получается блочная матрица; ; , , , , — единичная матрица размерности .
Так как в правой части уравнения (1) стоят только лагированные эндогенные переменные, а ошибки не коррелируют друг с другом и нормально распределены, то выполняются все основные предпосылки теоремы Гаусса–Маркова. Следовательно, оценки обыкновенного метода наименьших квадратов (OLS) для матрицы β являются эффективными в классе линейных оценок.
Применяя к (4) OLS, получаем
(5)
При использовании VAR, согласно теореме Гаусса–Маркова, предполагается, что ошибки имеют многомерное нормальное распределение:
(6)
где
Байесовская оценка параметров модели (4) будет зависеть от выбора формы априорного распределения для матрицы β и параметра Σ. Используя теорему Байеса (Blake, Mumtaz, 2012), можно вывести набор инструментов для оценки параметров UVARX(p), которая пропорциональна произведению априорной плотности и функции правдоподобия:
(7)
где — апостериорная оценка коэффициентов параметров β для модели байесовской векторной авторегрессии (BVAR(p)); — функция правдоподобия для UVARX(p); — априорное распределение параметров β для BVAR(p); — частная (безусловная) функция плотности вероятности распределения данных (а она не зависит от параметров модели β, следовательно, не влияет на оценку и ее можно опустить); — оператор, означающий пропорциональность левой и правой частей выражения с точностью до сомножителя, не зависящего от β.
Чтобы вычислить , необходимо сначала определить приор . Для получения байесовских оценок β для UVARX(p) существуют следующие априорные распределения Minnesota–Litterman — нормальное распределение для β с фиксированной дисперсией Σ; Normal-flat — нормальное распределение для β, не зависящее от распределения дисперсии Σ; Normal-Wishart — нормальное распределение для β и распределение Уишарта для дисперсии Σ; Independent Normal–Wishart — нормальное распределение для β и распределение Уишарта для дисперсии Σ, где распределение каждого вектора коэффициентов при каждой из эндогенных переменных не зависит друг от друга (необходимо сэмплирование по Гиббсу); Sims–Zha normal-flat — аналог Normal-flat для структурной VAR; Sims–Zha normal-Wishart — аналог Normal–Wishart для структурной VAR. The Giannone, Lenza and Primiceri — гиперпараметры для Minnesota–Litterman — могут быть найдены с помощью оптимизационной процедуры.
Алгоритмы использования и построения этих априорных распределений описаны в ряде работ зарубежных авторов (Giannone, Lenza, Primiceri, 2012; Litterman, 1986; Sims, Zha, 1998). После определения и вычисления , которые в целом строятся по одной и той же схеме на основе LM-распределения, необходимо вычислить для UVARX(p).
Функция правдоподобия для (4) вычисляется (Canova, 1995) следующим образом:
(8)
Чтобы как-то упростить эту функцию, нужно запомнить несколько полезных соотношений:
(9)
(10)
где
Из этого следует:
(11)
Часть (при условии независимости β) выглядит как сумма квадратов ошибок регрессии по UVARX(p) (4); ESS — как остаточная сумма квадратов ошибок OLS для .
Объединяя все вышеописанное, для (4) имеем:
(12)
где — след матрицы. А это, в свою очередь, сводится к итоговой форме функции правдоподобия:
(13)
Фактически мы пришли к тому, что функция правдоподобия для UVARX(p) эквивалентна смеси нормального распределения с параметрами и , а также распределения Уишарта (многомерный случай гамма-распределения для матрицы ковариаций) с параметрами
и степенями свободы.
Таким образом, при соответствующих сопряженных априорных ограничениях мы можем аналитически вывести апостериорное распределение для коэффициентов BVAR(p).
3. ИСПОЛЬЗУЕМЫЕ ДАННЫЕ
Для оценки и калибровки модели использовался обширный пул статистических источников, в том числе ЦБ РФ, Росстат, Bureau of Economic statistics, Investing, Eurostat и Tradingeconomics. В модели используется 29 экономических переменных и макроиндикаторов в период с I квартала 2000 г. по I квартал 2023 г. (табл. 1).
Таблица 1. Входные данные
Название переменной | Единица измерения | Обозначение |
ВВП | Абсолютная величина | gdp |
Инфляция | % год к году | inflation |
Ключевая ставка | % | keyrate |
Средняя номинальная заработная плата | Абсолютная величина | wage |
Уровень безработицы | % | unemployment |
Индекс промышленного производства | % год к году | productionindex |
Активы иностранных банков в экономике РФ | Абсолютная величина | foreignbankingactives |
Чистая инвестиционная позиция РФ | Абсолютная величина | clearinvestmentsposition |
Торговый баланс РФ | Абсолютная величина | tradebalance |
Название переменной | Единица измерения | Обозначение |
Платежный баланс РФ | Абсолютная величина | paymentsbalance |
Внешний госдолг РФ | Абсолютная величина | governmentdebt |
Сальдо федерального бюджета РФ | Абсолютная величина | budgetbalance |
Золотовалютные резервы ЦБ РФ | Абсолютная величина | goldreserves |
Потребительские расходы РФ | Абсолютная величина | consumerspending |
Широкая денежная масса М3 | Абсолютная величина | m3 |
Наличная денежная масса M0 | Абсолютная величина | m0 |
Сумма выданных кредитов физическим и юридическим лицам | Абсолютная величина | creditsize |
Розничный оборот торговли в РФ | Абсолютная величина | retailsalesvalue |
Оптовый оборот торговли в РФ | Абсолютная величина | wholesalesvalue |
Валютная пара USD/RUB | Абсолютная величина | usdrub |
Цена на нефть Brent | Абсолютная величина | brent |
Цена на природный газ | Абсолютная величина | gasprice |
Индекс геополитических рисков от ФРС США | Пункт | gpri |
Индекс S&P500 | Пункт | spx |
Индекс волатильности VIX | Пункт | vix |
ВВП Евросоюза | Абсолютная величина | eugdp |
Индекс РТС | Абсолютная величина | irts |
ВВП США | Абсолютная величина | usagdp |
ВВП Китая | Абсолютная величина | chinagdp |
Большая часть данных в табл. 1 является средним значением за соответствующий квартал. Помимо этого, Россия является развивающимся государством, следовательно, статистическая макроэкономическая информация ограничена длиной рядов. Поэтому некоторая информация не может быть учтена. Была проведена работа для сведения всех данных к одному формату времени. Эту модель будем называть «большая квартальная байесовская векторная авторегрессия для российской экономики» (QBVAR(p)).
4. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
4.1. Калибровка и оценка модели
Рассмотрим сначала только три первых лага, так как лаги более высокого порядка редко хранят какую-то важную информацию. Лаги более высокого порядка в нашем случае недопустимы из-за ограничения на длину рядов . Часто по критериям AIC или BIC наибольший лаг оказывается оптимальным, что вынуждает исследователя тратить время на перепроверку результатов при выборе гиперпараметров априорного распределения.
В табл. 2 представлены результаты оценивания QBVAR(p) с различными априорными распределениями.
Таблица 2. Результаты оценивания QBVAR(p) с 29 переменными на основе средней процентной ошибки прогнозирования в период I квартал 2000 — I квартал 2023 г.
Переменная | Приор (значения гиперпараметров) | Порядок лага модели | ||
1 | 2 | 3 | ||
ВВП | LM (µ1 = 0,7; λ1 = 0,3; λ2 = 0,99; λ3 = 1; λ4 = ∞) | 1,2854 | 0,8019 | 0,8555 |
NF (µ1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29) | 1,2919 | 0,5445 | – | |
NW (µ1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29) | 1,2921 | 0,5442 | – | |
SZNF (µ1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞) | 1,2725 | 0,7805 | 0,8914 | |
SZNW (µ1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞; c3 = 29) | 1,2691 | 0,7803 | 0,8928 | |
Инфляция | LM (µ1 = 0,7; λ1 = 0,3; λ2 = 0,99; λ3 = 1; λ4 = ∞) | 9,5041 | 7,5149 | 10,3412 |
NF (µ1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29) | 10,5152 | 6,2135 | – | |
NW (µ1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29) | 10,5152 | 6,2152 | – | |
SZNF (µ1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞) | 9,5795 | 7,5173 | 10,4019 | |
SZNW (µ1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞; c3 = 29) | 9,5831 | 7,5122 | 10,4363 | |
Ключевая ставка | LM (µ1 = 0,7; λ1 = 0,3; λ2 = 0,99; λ3 = 1; λ4 = ∞) | 6,6753 | 5,5928 | 6,0611 |
NF (µ1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29) | 7,1054 | 5,1751 | – | |
NW (µ1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29) | 7,1048 | 5,1743 | – | |
SZNF (µ1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞) | 6,6332 | 5,5025 | 6,0857 | |
SZNW (µ1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞; c3 = 29) | 6,6332 | 5,5040 | 6,0853 | |
Уровень безработицы | LM (µ1 = 0,7; λ1 = 0,3; λ2 = 0,99; λ3 = 1; λ4 = ∞) | 4,1729 | 3,5794 | 4,9287 |
NF (µ1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29) | 4,0723 | 2,6916 | – | |
NW (µ1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29) | 4,0808 | 2,6915 | – | |
SZNF (µ1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞) | 4,1880 | 3,5768 | 4,9416 | |
SZNW (µ1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞; c3 = 29) | 4,1855 | 3,5802 | 4,9423 | |
Заработные платы | LM (µ1 = 0,7; λ1 = 0,3; λ2 = 0,99; λ3 = 1; λ4 = ∞) | 10,6990 | 10,1620 | 12,8402 |
NF (µ1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29) | 10,5367 | 8,4285 | – | |
NW (µ1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29) | 10,5379 | 8,4328 | – | |
SZNF (µ1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞) | 10,6938 | 10,0588 | 13,2342 | |
SZNW (µ1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞; c3 = 29) | 10,6921 | 10,0566 | 13,2373 | |
Примечание. В столбце «Приор» указаны стартовые гиперпараметры распределений. MAPE — средняя абсолютная ошибка в процентах; µ1 — AR(1)-коэффициент; λ0 — регуляризация остаточной ковариации (residual covariance tightness); λ1 — параметр общей регуляризации (overall tightness); λ2 — относительная важность коррелированных предикторов (relative cross-variable weight); λ3 — скорость затухания автокорреляционной функции (lag decay); λ4 — степень эндогенности переменных; λ5 — степень экзогенности переменных; c1 — скалярная величина для (S-scale); c2 — скалярная величина для (V-scale); c3 — число степеней свободы.
Согласно проведенному нами анализу, базовая QBVAR(p) в целом показывает неплохую прогностическую силу. Так, на основе метрики MAPE для показателя ВВП наилучшей моделью является NW-QBVAR(2); для ключевой ставки — SZNF-QBVAR(2), для уровня безработицы — NW-QBVAR(2) и для заработных плат — NF-QBVAR(2). Если мы повторим эту же процедуру для данных, которые были предварительно обработаны фильтром Ходрика–Прескотта с параметром λ = 1600, то кратно уменьшим ошибки прогнозирования.
Будем считать результаты из табл. 2 базовыми и будем улучшать прогноз с помощью выбора оптимальных гиперпараметров априорных распределений. Необходимо последовательно искать оптимум с дельтой по гиперпараметру.
В табл. 3 представлена эволюция MAPE для QBVAR(2).
Таблица 3. Эволюция метрики MAPE для QBVAR(2)
Переменная | Вариация значений гиперпараметров априорного распределения | Значение MAPE оптимального априорного распределения, % |
ВВП | NW (µ1 = 0,7; c1 = 0,9; c2 = 0,9; c3 = 29) | 0,5459 |
NW (µ1 = 0,7; c1 = 0,9; c2 = 0,1; c3 = 29) | 0,5455 | |
NW (µ1 = 0,7; c1 = 0,1; c2 = 1; c3 = 29) | 0,5346 | |
NW (µ1 = 0,7; c1 = 0; c2 = 1; c3 = 29) | 0,5324 | |
NW (µ1 = 0,1; c1 = 0; c2 = 1; c3 = 29) | 0,5321 | |
Инфляция | NF (µ1 = 1,3; λ1 = 0,3; c2 = 0,1; c3 = 29) | 6,2155 |
NF (µ1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29) | 6,2135 | |
NF (µ1 = 0,1; λ1 = 0,3; c2 = 0,1; c3 = 29) | 6,2120 | |
NF (µ1 = 0,1; λ1 = 0,3; c2 = 0,5; c3 = 29) | 6,2021 | |
NF (µ1 = 0,1; λ1 = 0,3; c2 = 1; c3 = 29) | 6,1861 | |
Ключевая ставка | SZNF (µ1 = 1,3; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞) | 5,6936 |
SZNF (µ1 = 0,1; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞) | 5,6297 | |
SZNF (µ1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞) | 5,5025 | |
SZNF (µ1 = 0,1; λ0 = 1; λ1 = 1; λ3 = 1; λ4 = λ5 = ∞) | 5,2066 | |
SZNF (µ1 = 0,1; λ0 = 1; λ1 = 1; λ3 = 0,1; λ4 = λ5 = ∞) | 5,1044 | |
Уровень безработицы | NW (µ1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29) | 2,6915 |
NW (µ1 = 1; c1 = 0,1; c2 = 0,1; c3 = 29) | 2,6911 | |
NW (µ1 = 1; c1 = 0,1; c2 = 1; c3 = 29) | 2,6887 | |
NW (µ1 = 1; c1 = 1; c2 = 1; c3 = 29) | 2,6879 | |
NW (µ1 = 0,8; c1 = 1; c2 = 1; c3 = 29) | 2,6820 | |
Заработные платы | NF (µ1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29) | 8,4285 |
NF (µ1 = 0,8; λ1 = 0,3; c2 = 0,1; c3 = 29) | 8,4223 | |
NF (µ1 = 0,8; λ1 = 0,3; c2 = 0,5; c3 = 29) | 8,3699 | |
NF (µ1 = 0,8; λ1 = 0,3; c2 = 1; c3 = 29) | 8,2878 | |
NF (µ1 = 0,9; λ1 = 1; c2 = 1; c3 = 29) | 8,2865 |
С помощью данной процедуры оптимизации удалось немного улучшить прогностическую силу модели. Оказалось, что параметр регуляризации λ1 для распределения NF тем лучше для оценки параметров QBVAR, чем он ближе к нулю. Это значит, что в случае оптимальных гиперпараметров априорных распределений для заработной платы и инфляции априорная информация из распределения сильно влияет на точность апостериорной оценки распределения параметров модели QBVAR, которое почти не зависит от функции правдоподобия . Априорные распределения тем жестче, чем ближе к нулю параметр регуляризации λ1. Так, если λ1 = 0, то апостериорное распределение параметров совпадает с априорным, и данные не влияют на оценку. Если λ1 =, то байесовская оценка совпадает с оценкой OLS.
Для параметра µ1 имеем схожую ситуацию. Так как большинство априорных распределений предполагают, что переменные в VAR(p) близки к динамике случайного блуждания то фактически — коэффициент автокорреляции AR(1). В процессе анализа оказалось, что параметр µ1 значительно повышает прогностическую силу модели. Причем нельзя утверждать, что для каждого априорного распределения данный параметр в наших данных является идентичным. К сожалению, нам не удалось использовать распределения INW и GLP из-за сингулярности матрицы оценок ковариации на начальном этапе ввиду большой размерности модели.
Для проверки QBVAR(2) на адекватность было проведено сравнение с рядом альтернатив, что представлено в табл. 4.
Таблица 4. Проверка QBVAR(p) на прогностическую силу на основе сравнения с оптимальными альтернативами
Переменная | MAPE альтернативных моделей, % | |||||||
QBVAR | Naive | RWWN | UVAR | VECM | AVAR | AR | HW | |
ВВП | 0,5321 | 3,7477 | 3,4697 | 0,1387 | 0,5566 | 0,8864 | 0,9744 | 0,9067 |
Инфляция | 6,1861 | 14,6324 | 14,5330 | 2,2185 | 6,0291 | 15,2414 | 12,1970 | 12,3490 |
Ставка ЦБ | 5,1044 | 7,9094 | 8,1448 | 1,2686 | 4,2777 | 15,2393 | 8,0864 | 7,0891 |
Безработица | 2,6820 | 6,6624 | 6,4251 | 0,1960 | 2,2535 | 5,5160 | 4,2716 | 4,3193 |
Заработные платы | 8,2865 | 17,1038 | 16,9928 | 1,6023 | 7,6219 | 18,0893 | 14,9893 | 16,6528 |
Примечание. Naive — наивный прогноз, сегодняшнее значение равно предыдущему; RWWN — случайное блуждание с шумом, наивный прогноз, дополненный винеровским процессом; UVAR — неограниченная векторная авторегрессия; VECM — векторная модель коррекции ошибок; AVAR — асимметричная (ограниченная) векторная авторегрессия; AR — одномерная авторегрессионная модель; HW — модель Хольта–Винтерса.
Сравнительный анализ показал, что QBVAR(2) можно применять в сценарном прогнозировании макроэкономических индикаторов. К схожему результату пришли и исследователи из ЦБ РФ (Дерюгина, Пономаренко, 2015), которые анализировали априорное распределение Миннесота (учитывая стационарность и коинтегрированность переменных) на квартальных данных для 14 показателей. Однако они не применяли процедуры выбора оптимальной комбинации переменных. В таком неоптимальном представлении они, как и мы, получили достаточно значимые ошибки прогнозирования средствами конкурирующих моделей. Причем эти авторы также сделали вывод, что простая UVARX(p) с большим числом переменных намного точнее, чем аналогичная ей BVAR(p) Литтермана.
В нашем случае (UVARX(3)), которая фактически является оптимальным вариантом по критерию AIC для каждой переменной, также показывает более высокую прогностическую способность. Сильную конкуренцию составила и модель исправления (коррекции) ошибок (VECM) с 28 коинтеграционными уравнениями, 1 лагом (больше выставить нельзя ввиду ограниченности длины временных рядов) и отдельными спецификациями на коинтеграционное уравнение. Для ВВП модель VECM(1) с константой в коинтеграции уступает QBVAR, в случае с остальными независимыми переменными, наоборот, — немного ее превосходит. Для инфляции использовалась спецификация VECM(1) с линейными трендами как в коинтеграции, так и в VAR-части, для ключевой ставки и заработных плат — VECM(1) с линейным трендом в коинтеграции, а для безработицы VECM(1) — только с константами в обоих частях коинтеграции и VAR. Оставшаяся асимметричная VAR (AVAR(3)) оценивалась исходя из результатов парного статистического теста Грэнджера на причинность. Если p-value теста оказывалось больше 5%, то соответствующий коэффициент матрицы коэффициентов β для UVARX(p) приравнивался к нулю, образуя линейное ограничение. Тем не менее подобное структурное уточнение для UVARX(3) не дало ничего полезного и даже снизило ее прогностическую силу.
Для одномерных моделей временных рядов наивный прогноз и случайное блуждание с белым шумом ожидаемо имеют самые высокие MAPE. Немного лучше показали себя модели класса Хольта–Винтерса, которые для ВВП использовались в виде трио параметров {мультипликативные ошибки, аддитивный тренд, без сезонности}, для инфляции {мультипликативные ошибки, мультипликативный ослабленный тренд (damped-тренд), без сезонности}, для ключевой ставки {аддитивные ошибки, аддитивный damped-тренд, без сезонности}, для безработицы {аддитивные ошибки, мультипликативный тренд, мультипликативная сезонность}, для заработных плат {аддитивные ошибки, мультипликативный тренд, без сезонности}. В свою очередь, одномерные авторегрессии (для ВВП — AR(6), для инфляции — AR(8) — для ключевой ставки — AR(7), для безработицы — AR(6), для заработные платы — AR(11)), лаги, по которым выбирались с помощью критерия AIC, оказались очень близкими по прогностической силе к своим векторным аналогам.
Еще одним интересным результатом обладает работа (Демешев, Малаховская, 2016). Ее авторы использовали распределение Миннесота и пришли к выводу, что BVAR(p) с большим числом переменных позволяет получить более точный прогноз, чем частотная UVARX(p). Было показано, что для важных макропоказателей (индекса промышленного производства, индекса потребительских цен и процентной ставки) независимо от числа переменных среднеквадратическая ошибка BVAR(p) ниже, чем аналогичная им UVARX(p). При этом BVAR(p) для инфляции и процентной ставки оказывается более точной, чем RWWN. В целом и здесь отсутствуют процедуры подбора эндогенных переменных для минимизации ошибок прогнозирования.
Исходя из этого, нам стоит попытаться снизить размерность QBVAR, идентифицировав ее с помощью UVARX(p) (ее оценка происходит гораздо быстрее BVAR).
Алгоритм дальнейших действий следующий: перебираем в цикле возможный набор эндогенных переменных до тех пор, пока не будет достигнута максимальная точность для выбранных макропеременных, превышающая большую UVARX(3) из 29 переменных, после чего для этих переменных выбирается наилучшее априорное распределение и повторяется процедура улучшения гиперпараметров финальной QBVAR.
В табл. 5 представлены оптимальные размерности для UVARX и их MAPE для соответствующих лагов.
Таблица 5. Результат снижения размерности UVARX для оценки QBVAR
Зависимая переменная | Оптимальный лаг для UVARX | Набор независимых переменных, минимизирующий MAPE для соответствующей зависимой переменной в UVARX | MAPE, % |
ВВП | 12 | Размер выданных кредитов физическим и юридическим лицам, денежная масса M0, заработные платы, уровень потребительских расходов, индекс РТС | 0,0739 |
Инфляция | 9 | Валютный курс USD/RUB, сальдо государственного бюджета, ВВП Евросоюза, оборот розничной торговли, потребительские расходы, геополитические риски, чистая инвестиционная позиция | 1,9618 |
Ключевая ставка ЦБ | 10 | Государственный долг, потребительские расходы, денежная масса M3, оборот розничной торговли, заработные платы, инфляция | 0,6240 |
Безработица | 12 | Размер выданных кредитов физическим и юридическим лицам, оборот оптовой торговли, ВВП Китая, индекс промышленного производства, заработные платы | 0,2046 |
Заработные платы | 9 | Активы иностранных банков в экономике РФ, выданных физическим и юридическим лицам, денежная масса M0, индекс VIX, геополитические риски, чистая инвестиционная позиция, золотовалютные резервы | 1,6081 |
Решение вопроса избыточной параметризации UVARX(p) действительно является проблемой (см. (Sims, 1980)). Для частичного ее разрешения можно воспользоваться либо уменьшением числа эндогенных переменных при увеличении их лагов, либо увеличением переменных при уменьшении лагов. Оба варианта удовлетворяют условию размерности входящих данных модели. В нашем случае мы прибегли к первому варианту.
Так как в нашем арсенале имеется 29 переменных с квартальной динамикой, то для вычисления минимальной MAPE простым перебором потребовалось бы большое количество ресурсов. Так, чтобы найти оптимальную UVARX(p), нам потребовалось бы o(n2) времени, что экспоненциально долго для больших n. Для нивелирования этого эффекта мы решили прибегнуть к сэмплированию с подвыборкой некоторого размера для случайных комбинаций переменных до тех пор, пока не будет найдена минимальная оценка MAPE для важного нам макроиндикатора. Сложность подобного алгоритма равна o(n), что намного быстрее, чем o(n2), но, к сожалению, описанный выше способ не всегда позволяет найти глобальный экстремум, подобрав 100%-оптимальную комбинацию независимых переменных
Для ВВП удалось снизить размерность модели с 29 переменных с 3 лагами до 6 переменных с 12 лагами, что привело к значительному росту точности по MAPE с 0,1387% до 0,0739%. В остальных случаях также удалось снизить размерность и повысить точность, однако слабее, чем в случае с ВВП. С точки зрения теории входящие переменные в большей степени выглядят логичными и в целом соответствуют основным концепциям экономической теории.
Теперь стоит преобразовать UVARX из табл. 5 в оптимальные QBVAR (табл. 6).
Таблица 6. Результат снижения числа входящих эндогенных переменных для QBVAR
Переменная | Параметры модели QBVAR | MAPE QBVAR | MAPE лучшей VAR, % | |
новый, % | старый, % | |||
ВВП | NF (µ1 = 0,1; λ1 = 0,1; c2 = 0,1; c3 = 7), lags = 12, M = 6 | 0,0077 | 0,5321 | 0,1387 |
Инфляция | NW (µ1 = 5; c1 = 1; c2 = 0,1; c3 = 9), lags = 9, M = 8 | 1,3296 | 6,1861 | 2,2185 |
Ключевая ставка | NF (µ1 = 1,3; λ1 = 0,3; c2 = 0,1; c3 = 8), lags = 10, M = 6 | 1,0099 | 5,1044 | 1,2686 |
Безработица | NW (µ1 = 0,1; c1 = 1; c2 = 0,1; c3 = 9), lags = 12, M = 6 | 0,3423 | 2,6820 | 0,1960 |
Заработная плата | NF (µ1 = 1; λ1 = 0,15; c2 = 0,1; c3 = 7), lags = 9, M = 8 | 1,3894 | 8,2865 | 1,6023 |
С помощью введения априорных ограничений на оценку коэффициентов UVARX удалось значительно повысить прогностическую силу QBVAR. Однако для параметра «безработица» хотя и удалось увеличить точность, но обыкновенная UVARX показала лучший результат, чем байесовский аналог. Для ВВП удалось найти практически безошибочную комбинацию переменных с априорным распределением NF. Указанная ошибка MAPE скорее является статистически незначимой, а динамика ВВП фактически полностью описывается с помощью размера выданных кредитов физическим и юридическим лицам, денежной массы M0, заработных плат, уровня потребительских расходов и динамики индекса РТС.
4.2. Проверка модели на адекватность
Последним этапом исследования можно назвать проверку модели на адекватность с помощью контрфактических симуляций и анализ функций импульсных откликов (IRF, impulse response function).
Так как до этого мы оценивали параметры модели с I квартала 2000 по I квартал 2023 г., то для реализации контрфактических симуляций следует переоценить модель с I квартала 2000 по IV квартал 2019 г. с уже найденными ранее оптимальными гиперпараметрами априорных распределений, т. е. до недавних шоков, вызванных пандемией коронавируса Covid-19 в 2020 г. и ведением СВО с 2022 г.
Применяя параметры, указанные в табл. 6, получаем результаты, представленные в графической форме на рис. 1.
Рис. 1. Контрфактическая симуляция QBVAR
Контрфактические симуляции показали, что QBVAR можно использовать для краткосрочного и среднесрочного сценарного прогнозирования вне выборки. Как и ожидалось, наилучшей точностью обладает QBVAR для ВВП, MAPE которой на вневыборочном интервале с I квартала 2020 по I квартал 2023 г. составил менее 2%. Однако в случае с остальными переменными MAPE достаточно высокий и варьирует от 7 до 13%. Мы это связываем с характером динамики временных рядов — ВВП имеет достаточно плавную кривую и низкое стандартное отклонение — в отличие от остальных переменных.
Переходим к функциям импульсных откликов. Чтобы вывести функциональный вид IRF, необходимо представить (1) в виде бесконечной скользящей средней с помощью разложения Вольда:
(14)
где — шок i на переменную ; — случайное возмущение в момент времени с нормальным распределением. Матрицы представляют собой функции реакции на импульсы для UVARX(p):
. (15)
Долгосрочное влияние ошибок на переменную можно выразить так:
(16)
На рис. 2–6 показаны IRF для UVARX(p) из табл. 5.
Рис. 2. IRF для ВВП
Рис. 3. IRF для инфляции
Рис. 4. IRF для ключевой ставки
Рис. 5. IRF для безработицы
Рис. 6. IRF для заработных плат
Согласно IRF, в каждой комбинации из табл. 5 присутствуют переменные, которые при единичном шоке выводят важные макроэкономические показатели из равновесного состояния. Речь, в том числе, идет обо всех переменных, имеющих отношение к ВВП: потребительские расходы и оборот розничной торговли в соотношении с инфляцией; государственный долг и M3 в соотношении с ключевой ставкой; размер выданных кредитов; ВВП Китая и заработные платы в соотношении с безработицей; активы зарубежных банков в экономике РФ; размер выданных кредитов; чистая инвестиционная позиция и золотовалютные резервы в соотношении с заработными платами. Остальные переменные находятся в равновесии со своими макроэкономическими показателями.
Байесовские методы оценки параметров VAR являются мощным инструментом анализа влияния денежно-кредитной политики ЦБ. С помощью специальных гиперпараметров можно контролировать жесткость априорных распределений, т. е. величину смещения оценки параметров UVARX(p) в сторону априорного распределения, или функции правдоподобия, которая фактически совпадает с OLS-оценками для UVARX(p) при условии обнуления влияния априорного распределения.
Важный вывод состоит в том, что QBVAR(p) для большого числа переменных и малого числа их лагов — менее точная модель, чем аналогичная UVARX(p), и не лучше, чем, например, AR(p), VECM(p) или AVAR(p). Однако в случае со снижением входящих переменных с целью увеличения их лагов модель QBVAR начинает значительно превосходить в точности прогнозирования, — как UVARX, так и ряд других конкурирующих моделей. При этом параметры жесткости рассмотренных априорных распределений уменьшаются с ростом входящих лагов в модель, т. е. чем выше порядок модели с минимальным оптимальным набором переменных, тем более жесткое распределение необходимо для получения более точных прогнозов.
5. ЗАКЛЮЧЕНИЕ
Для российской экономики была собрана информация о 29 макроэкономических индикаторах, включая важные, по мнению автора данной статьи. Набор данных содержит 29 рядов длиной в 93 квартала, начиная с I квартала 2000 и заканчивая I кварталом 2023 г. Данные предварительно никак не трансформировались и не фильтровались, чтобы иметь наиболее полную информацию. Сначала была построена обычная QBVAR(2) модель для 29 переменных с соответствующими априорными распределениями и стандартными гиперпараметрами, но ее прогностическая сила оказалась в разы меньше, чем UVARX(3), но выше, чем одномерные AR(p), AVAR(p), Holt–Winters, RWWN и Naive.
Чтобы получить максимальную точность прогноза модели, необходимо было снизить число входящих в нее переменных, выбрав наиболее важные из рассматриваемых макроэкономических показателей. Для этого был применен метод сэмплирования комбинаций заданного числа с целью ускорения процесса перебора всевозможных комбинаций, минимизирующих метрику MAPE для важных макроиндикаторов. После поиска необходимых комбинаций была проведена процедура оптимизации гиперпараметров априорных распределений для полученных оптимальных комбинаций. Оказалось, что QBVAR с меньшим числом переменных, но увеличенным числом лагов и оптимизированными априорными распределениями уже в несколько раз лучше, чем соответствующие оптимальные аналоги UVARX.
На основе комбинаций переменных, входящих в QBVAR, были построены функции импульсных откликов для UVARX, а также проведены контрфактические симуляции QBVAR для важных макроэкономических переменных. Контрфактические симуляции показали, что QBVAR можно использовать для краткосрочного и среднесрочного прогнозирования вне выборки. В случае с IRF в каждой комбинации из табл. 5 для UVARX(p) присутствуют переменные, которые при единичном шоке выводят важные макроэкономические показатели из равновесного состояния.
Итог: разработанная нами большая квартальная байесовская векторная авторегрессия QBVAR с найденными оптимальными гиперпараметрами априорных распределений вполне может быть использована для краткосрочного и среднесрочного прогнозирования и анализа влияния денежно-кредитной политики ЦБ РФ.
Sobre autores
A. Zasmolin
Novosibirsk State University of Economics and Management
Autor responsável pela correspondência
Email: zasmolin.98@mail.ru
Rússia, Novosibirsk
Bibliografia
- Демешев Б. Б., Малаховская О. А. (2016). Макроэкономическое прогнозирование с помощью BVAR Литтермана // Экономический журнал ВШЭ. Т. 20. Вып. 4. С. 691–710. [Demeshev B. B., Malakhovskaja O. A. (2016). Macroeconomic forecasting with a Litterman’s BVAR model. HSE Economic Journal, 20, 4, 691–710 (in Russian).]
- Дерюгина Е., Пономаренко А. (2015). Большая байесовская векторная авторегрессионная модель для российской экономики // Серия докладов об экономических исследованиях Банка России. Т. 6. Вып. 1. С. 5–20. [Deryugina E., Ponomarenko A. (2015). A large Bayesian vector autoregressive model for Russia. Bank of Russia Working Paper Series, 6, 1, 5–20 (in Russian).]
- Banbura M., Giannone D., Reichlin L. (2010). Large Bayesian VARs. Journal of Applied Econometrics, 25, 1, 71–92.
- Bernanke B. S., Boivin J., Eliasz P. (2005). Measuring the effects of monetary policy: A factor-augmented vector autoregressive (FAVAR) approach. The Quarterly Journal of Economics, 120, 1, 387–422.
- Bernanke B. S., Mihov I. (1998). Measuring monetary policy. The Quarterly Journal of Economics, 113, 3, 869–902.
- Blake A., Mumtaz H. (2012). Applied Bayesian econometrics for central bankers. Vol. 4. London: Bank of England.
- Canova F. (1995). VAR models: Specification, estimation, inference and forecasting. In: H. Pesaran, M. Wickens (eds.). Vol. 2. Handbook of Applied Econometrics: Macroeconomics. Oxford: Oxford Univ. Press., 73–138.
- Giannone D., Lenza M., Primiceri G. E. (2012). Prior selection for vector autoregressions. ECB Working Paper Series, 14, 1494, 5–21.
- Kadiyala K. R., Karlsson S. (1993). Forecasting with generalized Bayesian vector autoregressions. Journal of Forecasting, 12, 3–4, 365–378.
- Litterman R. B. (1986). Forecasting with Bayesian vector autoregressions — 5 years of experience. Journal of Business and Economic Statistics, 4, 1, 25–38.
- Lütkepohl H. (2005). New introduction to multiple time series analysis. Vol. 1. London: Springer.
- Sims C. A. (1980). Macroeconomics and reality. Econometrica, 48, 1, 1–48.
- Sims C., Zha T. (1998). Bayesian methods for dynamic multivariate models. International Economic Review, 39, 4, 949–968.
- Stock J. H., Watson M. W. (2005). Implications of dynamic factor models for VAR analysis. NBER Working Paper, 86, 11467, 1–43.








