Large quarterly Bayesian vector autoregression model for the modern Russian economy

Capa

Texto integral

Resumo

It is often difficult to choose the necessary variables when we are forecasting the economic dynamics. On the one hand, vector autoregression (VAR) models can solve this problem by taking into account a sufficiently large number of variables. However, on the other hand, excessive parametrization of such models is not always justified, because it is often possible to choose such a small combination of variables the predictive power of which will be no worse than unlimited VARs with a large number of variables and lags. Bayesian methods help to solve this problem by introducing a priori restrictions on the VAR coefficients. The main goal of this work is to build a Large quarterly Bayesian vector autoregression (QBVAR) for the modern Russian economy. The hypotheses of the study: 1) BVAR(p) models reveal their maximum potential with a small number of variables, but with a large number of lags, 2) The Minnesota prior distribution is not always the best option for the modern Russian economy in the BVAR(p) model. As a result of the analysis, it turned out that for a number of the most important macroeconomic variables (GDP, inflation, key rate, unemployment, wages), Normal-Flat / Wishart-type priors turned out to be the optimal. In case of 29 input variables and two lags, the predictive power of the QBVAR(2) model is worse than the equivalent frequency VAR(2) or VECM(2). However, when it was possible to find the optimal combinations of variables, QBVAR(p) turned to be several times more accurate than its analogous frequency VAR(p) for all important macro indicators. In addition, the stiffness parameters of the considered a priori distributions decreases with increasing lags entering the model, i. e. the higher the order of the model with the minimum optimal set of variables, the tighter the distribution is necessary to obtain more accurate predictions. For the Russian realities, it is necessary to use very tight priors, 6–8 variables and 9–12 lags in a quarterly representation.

Texto integral

1. ВВЕДЕНИЕ И ОБЗОР ЛИТЕРАТУРЫ

Байесовские методы нашли применение во многих дисциплинах, в том числе и прикладной экономике. Речь идет об анализе связей между переменными в виде многомерных макроэкономических временных рядов. Самым популярным инструментом для подобного анализа являются неограниченные векторные авторегрессии с экзогенными переменными UVARX(p) (unrestricted vector autoregression with exogenous variables), которые впервые были предложены в (Sims, 1980) и широко использовались зарубежными авторами для анализа денежно-кредитной политики и оценки влияния локальных/глобальных шоков (см., например, (Litterman, 1986; Kadiyala, Karlsson, 1993; Bernanke, Mihov, 1997, 1998; Bernanke, Boivin, Eliasz, 2005; Stock, Watson, 2005; Banbura, Giannone, Reichlin, 2010)).

Модели UVARX(p) применимы для характеристики динамики любого набора временных рядов при минимальном числе ограничений. Поскольку UVARX(p) представляют собой модели авторегрессий с распределенным лагом, то ограничения на их идентификации, мотивированные фундаментальной экономической теорией, необходимы для проведения качественного экономического анализа.

Подобные модели являются очень точными эмпирически благодаря возможности добавить в них большое число переменных. Однако степень информации, которая хранится в лагированных переменных, очень быстро убывает с ростом порядка лага. Поэтому VAR-модели в основном используются с порядком не больше 3–12 лагов (в зависимости от частоты изучаемых данных), — все, что выше двенадцатого лага, не приносит значимого прироста в прогностической силе модели (Lütkepohl, 2005).

Тем не менее UVARX в стандартном виде не всегда подходит для прогнозирования вне выборки. Чтобы попытаться аппроксимировать разложение Вольда, необходимо иметь UVARX с бесконечным числом лагов. Такая широкая параметризация означает, что UVARX не являются функциональной альтернативой ни стандартным макроэконометрическим структурным моделям, в которых незначимые коэффициенты удаляются из спецификации, ни фундаментальным эконометрическим моделям (например, RBC (real business cycle) или DSGE (dynamic stochastic model of general equilibrium)), поскольку при ограниченном числе степеней свободы оценки коэффициентов у UVARX достаточно неточны и прогнозы на их основе имеют значительные ошибки.

Для решения данной проблемы можно строить регрессии в совокупности исторической и априорной информации как статистического, так и экономического характера. UVARX используют априорную информацию: 1) при изначальном выборе эндогенных/экзогенных переменных для VAR; 2) при выборе длины лага модели; 3) при введении ограничений по идентификации. Из-за этого может произойти переобучение модели, когда набор данных короткий, информация о выборке слабая или число параметров велико.

Этот вопрос до сих пор остается актуальным для развивающихся экономик, в том числе и России, потому что длина и частотность экономической статистики не позволяют строить действительно большие структурные модели. В случае с байесовским подходом мы не только учитываем априорную информацию простой VAR, но еще и вводим дополнительные ограничения на ее коэффициенты, предполагая, что переменные ведут себя случайным образом. С помощью подобной техники мы частично решаем проблему параметризации VAR, сжимая пространство оцениваемых параметров, не теряя при этом экономической информации.

2. МЕТОДИЧЕСКИЙ АППАРАТ АНАЛИЗА

Основной многомерной эконометрической моделью для анализа связей между макроэкономическими переменными является неограниченная обобщенная векторная авторегрессия UVARX(p) открытого типа:

x1,t=a0,1+i=1pa1,ix1,ti+i=0p*b1,iyti+ε1,t,  xm,t=a0,m+i=1pam,ixm,ti+i=0p*bm,iyti+εm,t, (1)

где {x1,t;;xm,t} — текущие эндогенные переменные; {x1,ti;;xm,ti} — лагированные эндогенные переменные; {y1,ti;;ym,ti} — текущие и лагированные экзогенные переменные; {ε1,t;;εm,t} — некоторые случайные возмущения с нормальным распределением; t=1,...,T; p — порядок лага эндогенных переменных.

Если нам не нужны экзогенные переменные, тогда модель UVARX(p) называется закрытой, в противном случае — открытой. Каждое уравнение UVARX(p) представляет собой модели авторегрессии с распределенным лагом (ARDL). Обычно экзогенные переменные выбирают без своих лаговых значений, т. е. при p*=0.

Модель (1) можно переписать в более упрощенном виде:

Xt=A0+i=1pAiXti+BYt+Et, (2)

где Xt — вектор эндогенных переменных; Xti — вектор лагированных эндогенных переменных; Yt — вектор экзогенных переменных; A, B — матрицы коэффициентов, требующих оценки; Et — вектор случайных возмущений с нормальным распределением.

Вернемся к векторизованной форме (2) и упростим ее еще больше:

X=CZ+E, (3)

где Z=Xt1,...,Xti,YtiT, C=A0,...,Ati,B.

Зададим множество K=Mp+d размерности модели (3), где M — число эндогенных переменных; d — число экзогенных переменных. Тогда (3) равносильно:

x~=ZT IKβ+e~, (4)

где vec — операция векторизации;  — произведение Кронекера, в результате которого получается блочная матрица; x~=vecX; β=vecC, e~=vecE, ZT IK=e~e~T, e~~N0, IK — единичная матрица размерности K×K.

Так как в правой части уравнения (1) стоят только лагированные эндогенные переменные, а ошибки не коррелируют друг с другом и нормально распределены, то выполняются все основные предпосылки теоремы Гаусса–Маркова. Следовательно, оценки обыкновенного метода наименьших квадратов (OLS) для матрицы β являются эффективными в классе линейных оценок.

Применяя к (4) OLS, получаем

βOLS=ZZT1ZIKx~. (5)

При использовании VAR, согласно теореме Гаусса–Маркова, предполагается, что ошибки E имеют многомерное нормальное распределение:

X|β,  Σ~NZIKβ,  ITΣ, (6)

где ZIK=vecCTXT.

Байесовская оценка параметров модели (4) будет зависеть от выбора формы априорного распределения для матрицы β и параметра Σ. Используя теорему Байеса (Blake, Mumtaz, 2012), можно вывести набор инструментов для оценки параметров UVARX(p), которая пропорциональна произведению априорной плотности и функции правдоподобия:

pβ|x=px|βpβ/pxpx|βpβ, (7)

где pβ|x — апостериорная оценка коэффициентов параметров β для модели байесовской векторной авторегрессии (BVAR(p)); px|β — функция правдоподобия для UVARX(p); pβ — априорное распределение параметров β для BVAR(p); px — частная (безусловная) функция плотности вероятности распределения данных (а она не зависит от параметров модели β, следовательно, не влияет на оценку pβ|x и ее можно опустить);  — оператор, означающий пропорциональность левой и правой частей выражения с точностью до сомножителя, не зависящего от β.

Чтобы вычислить pβ|x, необходимо сначала определить приор pβ. Для получения байесовских оценок β для UVARX(p) существуют следующие априорные распределения pβ Minnesota–Litterman — нормальное распределение для β с фиксированной дисперсией Σ; Normal-flat — нормальное распределение для β, не зависящее от распределения дисперсии Σ; Normal-Wishart — нормальное распределение для β и распределение Уишарта для дисперсии Σ; Independent Normal–Wishart — нормальное распределение для β и распределение Уишарта для дисперсии Σ, где распределение каждого вектора коэффициентов при каждой из эндогенных переменных не зависит друг от друга (необходимо сэмплирование по Гиббсу); Sims–Zha normal-flat — аналог Normal-flat для структурной VAR; Sims–Zha normal-Wishart — аналог Normal–Wishart для структурной VAR. The Giannone, Lenza and Primiceri — гиперпараметры для Minnesota–Litterman — могут быть найдены с помощью оптимизационной процедуры.

Алгоритмы использования и построения этих априорных распределений описаны в ряде работ зарубежных авторов (Giannone, Lenza, Primiceri, 2012; Litterman, 1986; Sims, Zha, 1998). После определения и вычисления pβ, которые в целом строятся по одной и той же схеме на основе LM-распределения, необходимо вычислить px|β для UVARX(p).

Функция правдоподобия px|β для (4) вычисляется (Canova, 1995) следующим образом:

L=ΣIT1/2exp0,5XIMZβTΣ1ITXIMZβ. (8)

Чтобы как-то упростить эту функцию, нужно запомнить несколько полезных соотношений:

XIMZβTΣ1ITXIMZβ=Σ1/2ITXIMZβTΣ1/2IT××XIMZβ=Σ1/2ITXΣ1/2ZβTΣ1/2ITXΣ1/2Zβ, (9)

Σ1/2ITXΣ1/2Zβ=Σ1/2ITXΣ1/2ZβOLS+Σ1/2ZβOLSβ, (10)

где βOLS=Σ1ZTZ1Σ1/2IT1ZTX.

Из этого следует:

XIMZβTΣ1ITXIMZβ=Σ1/2ITXΣ1/2ZβOLST××Σ1/2ITXΣ1/2ZβOLS+βOLSβTΣ1ZTZβOLSβ=RSS+ESS. (11)

Часть RSS (при условии независимости β) выглядит как сумма квадратов ошибок регрессии по UVARX(p) (4); ESS — как остаточная сумма квадратов ошибок OLS для βOLS.

Объединяя все вышеописанное, px|β для (4) имеем:

Lβ,Σ=ΣIT1/2exp0,5ββOLSTΣ1ZTZββOLS0,5Σ1/2ITXΣ1/2ZβOLSTΣ1/2ITXΣ1/2ZβOLS==Σ2k/2exp0,5ββOLSTΣ1ZTZββOLS××ΣTk/2exp0,5TrΣ1/2ITXΣ1/2ZβOLSTΣ1/2ITXΣ1/2ZβOLS, (12)

где Tr — след матрицы. А это, в свою очередь, сводится к итоговой форме функции правдоподобия:

Lβ,LUVARXpβ|βOLS,ΣΣ1|βOLS,TMk1. (13)

Фактически мы пришли к тому, что функция правдоподобия для UVARX(p) эквивалентна смеси нормального распределения с параметрами βOLS и Σ, а также распределения Уишарта (многомерный случай гамма-распределения для матрицы ковариаций) с параметрами

XΣ1/2ZβOLSTXΣ1/2ZβOLS1

и TMk1 степенями свободы.

Таким образом, при соответствующих сопряженных априорных ограничениях мы можем аналитически вывести апостериорное распределение для коэффициентов BVAR(p).

3. ИСПОЛЬЗУЕМЫЕ ДАННЫЕ

Для оценки и калибровки модели использовался обширный пул статистических источников, в том числе ЦБ РФ, Росстат, Bureau of Economic statistics, Investing, Eurostat и Tradingeconomics. В модели используется 29 экономических переменных и макроиндикаторов в период с I квартала 2000 г. по I квартал 2023 г. (табл. 1).

 

Таблица 1. Входные данные

Название переменной

Единица измерения

Обозначение

ВВП

Абсолютная величина

gdp

Инфляция

% год к году

inflation

Ключевая ставка

%

keyrate

Средняя номинальная заработная плата

Абсолютная величина

wage

Уровень безработицы

%

unemployment

Индекс промышленного производства

% год к году

productionindex

Активы иностранных банков в экономике РФ

Абсолютная величина

foreignbankingactives

Чистая инвестиционная позиция РФ

Абсолютная величина

clearinvestmentsposition

Торговый баланс РФ

Абсолютная величина

tradebalance

Название переменной

Единица измерения

Обозначение

Платежный баланс РФ

Абсолютная величина

paymentsbalance

Внешний госдолг РФ

Абсолютная величина

governmentdebt

Сальдо федерального бюджета РФ

Абсолютная величина

budgetbalance

Золотовалютные резервы ЦБ РФ

Абсолютная величина

goldreserves

Потребительские расходы РФ

Абсолютная величина

consumerspending

Широкая денежная масса М3

Абсолютная величина

m3

Наличная денежная масса M0

Абсолютная величина

m0

Сумма выданных кредитов физическим и юридическим лицам

Абсолютная величина

creditsize

Розничный оборот торговли в РФ

Абсолютная величина

retailsalesvalue

Оптовый оборот торговли в РФ

Абсолютная величина

wholesalesvalue

Валютная пара USD/RUB

Абсолютная величина

usdrub

Цена на нефть Brent

Абсолютная величина

brent

Цена на природный газ

Абсолютная величина

gasprice

Индекс геополитических рисков от ФРС США

Пункт

gpri

Индекс S&P500

Пункт

spx

Индекс волатильности VIX

Пункт

vix

ВВП Евросоюза

Абсолютная величина

eugdp

Индекс РТС

Абсолютная величина

irts

ВВП США

Абсолютная величина

usagdp

ВВП Китая

Абсолютная величина

chinagdp

 

Большая часть данных в табл. 1 является средним значением за соответствующий квартал. Помимо этого, Россия является развивающимся государством, следовательно, статистическая макроэкономическая информация ограничена длиной рядов. Поэтому некоторая информация не может быть учтена. Была проведена работа для сведения всех данных к одному формату времени. Эту модель будем называть «большая квартальная байесовская векторная авторегрессия для российской экономики» (QBVAR(p)).

4. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

4.1. Калибровка и оценка модели

Рассмотрим сначала только три первых лага, так как лаги более высокого порядка редко хранят какую-то важную информацию. Лаги более высокого порядка в нашем случае недопустимы из-за ограничения на длину рядов K=Mp+d=29×3+0=87<T=93. Часто по критериям AIC или BIC наибольший лаг оказывается оптимальным, что вынуждает исследователя тратить время на перепроверку результатов при выборе гиперпараметров априорного распределения.

В табл. 2 представлены результаты оценивания QBVAR(p) с различными априорными распределениями.

 

Таблица 2. Результаты оценивания QBVAR(p) с 29 переменными на основе средней процентной ошибки прогнозирования в период I квартал 2000 — I квартал 2023 г.

Переменная

Приор (значения гиперпараметров)

Порядок лага модели

1

2

3

ВВП

LM1 = 0,7; λ1 = 0,3; λ2 = 0,99; λ3 = 1; λ4 = ∞)

1,2854

0,8019

0,8555

NF1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29)

1,2919

0,5445

NW1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29)

1,2921

0,5442

SZNF1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞)

1,2725

0,7805

0,8914

SZNW1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞; c3 = 29)

1,2691

0,7803

0,8928

Инфляция

LM1 = 0,7; λ1 = 0,3; λ2 = 0,99; λ3 = 1; λ4 = ∞)

9,5041

7,5149

10,3412

NF1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29)

10,5152

6,2135

NW1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29)

10,5152

6,2152

SZNF1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞)

9,5795

7,5173

10,4019

SZNW1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞; c3 = 29)

9,5831

7,5122

10,4363

Ключевая ставка

LM1 = 0,7; λ1 = 0,3; λ2 = 0,99; λ3 = 1; λ4 = ∞)

6,6753

5,5928

6,0611

NF1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29)

7,1054

5,1751

NW1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29)

7,1048

5,1743

SZNF1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞)

6,6332

5,5025

6,0857

SZNW1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞; c3 = 29)

6,6332

5,5040

6,0853

Уровень безработицы

LM1 = 0,7; λ1 = 0,3; λ2 = 0,99; λ3 = 1; λ4 = ∞)

4,1729

3,5794

4,9287

NF1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29)

4,0723

2,6916

NW1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29)

4,0808

2,6915

SZNF1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞)

4,1880

3,5768

4,9416

SZNW1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞; c3 = 29)

4,1855

3,5802

4,9423

Заработные платы

LM1 = 0,7; λ1 = 0,3; λ2 = 0,99; λ3 = 1; λ4 = ∞)

10,6990

10,1620

12,8402

NF1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29)

10,5367

8,4285

NW1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29)

10,5379

8,4328

SZNF1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞)

10,6938

10,0588

13,2342

SZNW1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞; c3 = 29)

10,6921

10,0566

13,2373

Примечание. В столбце «Приор» указаны стартовые гиперпараметры распределений. MAPE — средняя абсолютная ошибка в процентах; µ1 — AR(1)-коэффициент; λ0 — регуляризация остаточной ковариации (residual covariance tightness); λ1 — параметр общей регуляризации (overall tightness); λ2 — относительная важность коррелированных предикторов (relative cross-variable weight); λ3 — скорость затухания автокорреляционной функции (lag decay); λ4 — степень эндогенности переменных; λ5 — степень экзогенности переменных; c1 — скалярная величина для (S-scale); c2 — скалярная величина для (V-scale); c3 — число степеней свободы.

 

Согласно проведенному нами анализу, базовая QBVAR(p) в целом показывает неплохую прогностическую силу. Так, на основе метрики MAPE для показателя ВВП наилучшей моделью является NW-QBVAR(2); для ключевой ставки — SZNF-QBVAR(2), для уровня безработицы — NW-QBVAR(2) и для заработных плат — NF-QBVAR(2). Если мы повторим эту же процедуру для данных, которые были предварительно обработаны фильтром Ходрика–Прескотта с параметром λ = 1600, то кратно уменьшим ошибки прогнозирования.

Будем считать результаты из табл. 2 базовыми и будем улучшать прогноз с помощью выбора оптимальных гиперпараметров априорных распределений. Необходимо последовательно искать оптимум с дельтой по гиперпараметру.

В табл. 3 представлена эволюция MAPE для QBVAR(2).

 

Таблица 3. Эволюция метрики MAPE для QBVAR(2)

Переменная

Вариация значений гиперпараметров априорного распределения

Значение MAPE оптимального априорного распределения, %

ВВП

NW1 = 0,7; c1 = 0,9; c2 = 0,9; c3 = 29)

0,5459

NW1 = 0,7; c1 = 0,9; c2 = 0,1; c3 = 29)

0,5455

NW1 = 0,7; c1 = 0,1; c2 = 1; c3 = 29)

0,5346

NW1 = 0,7; c1 = 0; c2 = 1; c3 = 29)

0,5324

NW1 = 0,1; c1 = 0; c2 = 1; c3 = 29)

0,5321

Инфляция

NF1 = 1,3; λ1 = 0,3; c2 = 0,1; c3 = 29)

6,2155

NF1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29)

6,2135

NF1 = 0,1; λ1 = 0,3; c2 = 0,1; c3 = 29)

6,2120

NF1 = 0,1; λ1 = 0,3; c2 = 0,5; c3 = 29)

6,2021

NF1 = 0,1; λ1 = 0,3; c2 = 1; c3 = 29)

6,1861

Ключевая ставка

SZNF1 = 1,3; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞)

5,6936

SZNF1 = 0,1; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞)

5,6297

SZNF1 = 0,7; λ0 = 1; λ1 = 0,3; λ3 = 1; λ4 = λ5 = ∞)

5,5025

SZNF1 = 0,1; λ0 = 1; λ1 = 1; λ3 = 1; λ4 = λ5 = ∞)

5,2066

SZNF1 = 0,1; λ0 = 1; λ1 = 1; λ3 = 0,1; λ4 = λ5 = ∞)

5,1044

Уровень безработицы

NW1 = 0,7; c1 = 0,1; c2 = 0,1; c3 = 29)

2,6915

NW (µ1 = 1; c1 = 0,1; c2 = 0,1; c3 = 29)

2,6911

NW1 = 1; c1 = 0,1; c2 = 1; c3 = 29)

2,6887

NW1 = 1; c1 = 1; c2 = 1; c3 = 29)

2,6879

NW1 = 0,8; c1 = 1; c2 = 1; c3 = 29)

2,6820

Заработные платы

NF1 = 0,7; λ1 = 0,3; c2 = 0,1; c3 = 29)

8,4285

NF1 = 0,8; λ1 = 0,3; c2 = 0,1; c3 = 29)

8,4223

NF1 = 0,8; λ1 = 0,3; c2 = 0,5; c3 = 29)

8,3699

NF1 = 0,8; λ1 = 0,3; c2 = 1; c3 = 29)

8,2878

NF1 = 0,9; λ1 = 1; c2 = 1; c3 = 29)

8,2865

 

С помощью данной процедуры оптимизации удалось немного улучшить прогностическую силу модели. Оказалось, что параметр регуляризации λ1 для распределения NF тем лучше для оценки параметров QBVAR, чем он ближе к нулю. Это значит, что в случае оптимальных гиперпараметров априорных распределений для заработной платы и инфляции априорная информация из распределения сильно влияет на точность апостериорной оценки распределения параметров модели QBVAR, которое почти не зависит от функции правдоподобия . Априорные распределения тем жестче, чем ближе к нулю параметр регуляризации λ1. Так, если λ1 = 0, то апостериорное распределение параметров совпадает с априорным, и данные не влияют на оценку. Если λ1 =, то байесовская оценка совпадает с оценкой OLS.

Для параметра µ1 имеем схожую ситуацию. Так как большинство априорных распределений предполагают, что переменные в VAR(p) близки к динамике случайного блуждания yt=μ0+μ1yt1+εt, то фактически μ1 — коэффициент автокорреляции AR(1). В процессе анализа оказалось, что параметр µ1 значительно повышает прогностическую силу модели. Причем нельзя утверждать, что для каждого априорного распределения данный параметр в наших данных является идентичным. К сожалению, нам не удалось использовать распределения INW и GLP из-за сингулярности матрицы оценок ковариации на начальном этапе ввиду большой размерности модели.

Для проверки QBVAR(2) на адекватность было проведено сравнение с рядом альтернатив, что представлено в табл. 4.

 

Таблица 4. Проверка QBVAR(p) на прогностическую силу на основе сравнения с оптимальными альтернативами

Переменная

MAPE альтернативных моделей, %

QBVAR

Naive

RWWN

UVAR

VECM

AVAR

AR

HW

ВВП

0,5321

3,7477

3,4697

0,1387

0,5566

0,8864

0,9744

0,9067

Инфляция

6,1861

14,6324

14,5330

2,2185

6,0291

15,2414

12,1970

12,3490

Ставка ЦБ

5,1044

7,9094

8,1448

1,2686

4,2777

15,2393

8,0864

7,0891

Безработица

2,6820

6,6624

6,4251

0,1960

2,2535

5,5160

4,2716

4,3193

Заработные платы

8,2865

17,1038

16,9928

1,6023

7,6219

18,0893

14,9893

16,6528

Примечание. Naive — наивный прогноз, сегодняшнее значение равно предыдущему; RWWN — случайное блуждание с шумом, наивный прогноз, дополненный винеровским процессом; UVAR — неограниченная векторная авторегрессия; VECM — векторная модель коррекции ошибок; AVAR — асимметричная (ограниченная) векторная авторегрессия; AR — одномерная авторегрессионная модель; HW — модель Хольта–Винтерса.

 

Сравнительный анализ показал, что QBVAR(2) можно применять в сценарном прогнозировании макроэкономических индикаторов. К схожему результату пришли и исследователи из ЦБ РФ (Дерюгина, Пономаренко, 2015), которые анализировали априорное распределение Миннесота (учитывая стационарность и коинтегрированность переменных) на квартальных данных для 14 показателей. Однако они не применяли процедуры выбора оптимальной комбинации переменных. В таком неоптимальном представлении они, как и мы, получили достаточно значимые ошибки прогнозирования средствами конкурирующих моделей. Причем эти авторы также сделали вывод, что простая UVARX(p) с большим числом переменных намного точнее, чем аналогичная ей BVAR(p) Литтермана.

В нашем случае (UVARX(3)), которая фактически является оптимальным вариантом по критерию AIC для каждой переменной, также показывает более высокую прогностическую способность. Сильную конкуренцию составила и модель исправления (коррекции) ошибок (VECM) с 28 коинтеграционными уравнениями, 1 лагом (больше выставить нельзя ввиду ограниченности длины временных рядов) и отдельными спецификациями на коинтеграционное уравнение. Для ВВП модель VECM(1) с константой в коинтеграции уступает QBVAR, в случае с остальными независимыми переменными, наоборот, — немного ее превосходит. Для инфляции использовалась спецификация VECM(1) с линейными трендами как в коинтеграции, так и в VAR-части, для ключевой ставки и заработных плат — VECM(1) с линейным трендом в коинтеграции, а для безработицы VECM(1) — только с константами в обоих частях коинтеграции и VAR. Оставшаяся асимметричная VAR (AVAR(3)) оценивалась исходя из результатов парного статистического теста Грэнджера на причинность. Если p-value теста оказывалось больше 5%, то соответствующий коэффициент матрицы коэффициентов β для UVARX(p) приравнивался к нулю, образуя линейное ограничение. Тем не менее подобное структурное уточнение для UVARX(3) не дало ничего полезного и даже снизило ее прогностическую силу.

Для одномерных моделей временных рядов наивный прогноз и случайное блуждание с белым шумом ожидаемо имеют самые высокие MAPE. Немного лучше показали себя модели класса Хольта–Винтерса, которые для ВВП использовались в виде трио параметров {мультипликативные ошибки, аддитивный тренд, без сезонности}, для инфляции {мультипликативные ошибки, мультипликативный ослабленный тренд (damped-тренд), без сезонности}, для ключевой ставки {аддитивные ошибки, аддитивный damped-тренд, без сезонности}, для безработицы {аддитивные ошибки, мультипликативный тренд, мультипликативная сезонность}, для заработных плат {аддитивные ошибки, мультипликативный тренд, без сезонности}. В свою очередь, одномерные авторегрессии (для ВВП — AR(6), для инфляции — AR(8) — для ключевой ставки — AR(7), для безработицы — AR(6), для заработные платы — AR(11)), лаги, по которым выбирались с помощью критерия AIC, оказались очень близкими по прогностической силе к своим векторным аналогам.

Еще одним интересным результатом обладает работа (Демешев, Малаховская, 2016). Ее авторы использовали распределение Миннесота и пришли к выводу, что BVAR(p) с большим числом переменных позволяет получить более точный прогноз, чем частотная UVARX(p). Было показано, что для важных макропоказателей (индекса промышленного производства, индекса потребительских цен и процентной ставки) независимо от числа переменных среднеквадратическая ошибка BVAR(p) ниже, чем аналогичная им UVARX(p). При этом BVAR(p) для инфляции и процентной ставки оказывается более точной, чем RWWN. В целом и здесь отсутствуют процедуры подбора эндогенных переменных для минимизации ошибок прогнозирования.

Исходя из этого, нам стоит попытаться снизить размерность QBVAR, идентифицировав ее с помощью UVARX(p) (ее оценка происходит гораздо быстрее BVAR).

Алгоритм дальнейших действий следующий: перебираем в цикле возможный набор эндогенных переменных до тех пор, пока не будет достигнута максимальная точность для выбранных макропеременных, превышающая большую UVARX(3) из 29 переменных, после чего для этих переменных выбирается наилучшее априорное распределение и повторяется процедура улучшения гиперпараметров финальной QBVAR.

В табл. 5 представлены оптимальные размерности для UVARX и их MAPE для соответствующих лагов.

 

Таблица 5. Результат снижения размерности UVARX для оценки QBVAR

Зависимая переменная

Оптимальный лаг для UVARX

Набор независимых переменных, минимизирующий MAPE для соответствующей зависимой переменной в UVARX

MAPE, %

ВВП

12

Размер выданных кредитов физическим и юридическим лицам, денежная масса M0, заработные платы, уровень потребительских расходов, индекс РТС

0,0739

Инфляция

9

Валютный курс USD/RUB, сальдо государственного бюджета, ВВП Евросоюза, оборот розничной торговли, потребительские расходы, геополитические риски, чистая инвестиционная позиция

1,9618

Ключевая ставка ЦБ

10

Государственный долг, потребительские расходы, денежная масса M3, оборот розничной торговли, заработные платы, инфляция

0,6240

Безработица

12

Размер выданных кредитов физическим и юридическим лицам, оборот оптовой торговли, ВВП Китая, индекс промышленного производства, заработные платы

0,2046

Заработные платы

9

Активы иностранных банков в экономике РФ, выданных физическим и юридическим лицам, денежная масса M0, индекс VIX, геополитические риски, чистая инвестиционная позиция, золотовалютные резервы

1,6081

 

Решение вопроса избыточной параметризации UVARX(p) действительно является проблемой (см. (Sims, 1980)). Для частичного ее разрешения можно воспользоваться либо уменьшением числа эндогенных переменных при увеличении их лагов, либо увеличением переменных при уменьшении лагов. Оба варианта удовлетворяют условию размерности входящих данных модели. В нашем случае мы прибегли к первому варианту.

Так как в нашем арсенале имеется 29 переменных с квартальной динамикой, то для вычисления минимальной MAPE простым перебором потребовалось бы большое количество ресурсов. Так, чтобы найти оптимальную UVARX(p), нам потребовалось бы o(n2) времени, что экспоненциально долго для больших n. Для нивелирования этого эффекта мы решили прибегнуть к сэмплированию с подвыборкой некоторого размера для случайных комбинаций переменных до тех пор, пока не будет найдена минимальная оценка MAPE для важного нам макроиндикатора. Сложность подобного алгоритма равна o(n), что намного быстрее, чем o(n2), но, к сожалению, описанный выше способ не всегда позволяет найти глобальный экстремум, подобрав 100%-оптимальную комбинацию независимых переменных

Для ВВП удалось снизить размерность модели с 29 переменных с 3 лагами до 6 переменных с 12 лагами, что привело к значительному росту точности по MAPE с 0,1387% до 0,0739%. В остальных случаях также удалось снизить размерность и повысить точность, однако слабее, чем в случае с ВВП. С точки зрения теории входящие переменные в большей степени выглядят логичными и в целом соответствуют основным концепциям экономической теории.

Теперь стоит преобразовать UVARX из табл. 5 в оптимальные QBVAR (табл. 6).

 

Таблица 6. Результат снижения числа входящих эндогенных переменных для QBVAR

Переменная

Параметры модели QBVAR

MAPE QBVAR

MAPE лучшей VAR, %

новый, %

старый, %

ВВП

NF1 = 0,1; λ1 = 0,1; c2 = 0,1; c3 = 7), lags = 12, M = 6

0,0077

0,5321

0,1387

Инфляция

NW1 = 5; c1 = 1; c2 = 0,1; c3 = 9), lags = 9, M = 8

1,3296

6,1861

2,2185

Ключевая ставка

NF1 = 1,3; λ1 = 0,3; c2 = 0,1; c3 = 8), lags = 10, M = 6

1,0099

5,1044

1,2686

Безработица

NW1 = 0,1; c1 = 1; c2 = 0,1; c3 = 9), lags = 12, M = 6

0,3423

2,6820

0,1960

Заработная плата

NF1 = 1; λ1 = 0,15; c2 = 0,1; c3 = 7), lags = 9, M = 8

1,3894

8,2865

1,6023

 

С помощью введения априорных ограничений на оценку коэффициентов UVARX удалось значительно повысить прогностическую силу QBVAR. Однако для параметра «безработица» хотя и удалось увеличить точность, но обыкновенная UVARX показала лучший результат, чем байесовский аналог. Для ВВП удалось найти практически безошибочную комбинацию переменных с априорным распределением NF. Указанная ошибка MAPE скорее является статистически незначимой, а динамика ВВП фактически полностью описывается с помощью размера выданных кредитов физическим и юридическим лицам, денежной массы M0, заработных плат, уровня потребительских расходов и динамики индекса РТС.

4.2. Проверка модели на адекватность

Последним этапом исследования можно назвать проверку модели на адекватность с помощью контрфактических симуляций и анализ функций импульсных откликов (IRF, impulse response function).

Так как до этого мы оценивали параметры модели с I квартала 2000 по I квартал 2023 г., то для реализации контрфактических симуляций следует переоценить модель с I квартала 2000 по IV квартал 2019 г. с уже найденными ранее оптимальными гиперпараметрами априорных распределений, т. е. до недавних шоков, вызванных пандемией коронавируса Covid-19 в 2020 г. и ведением СВО с 2022 г.

Применяя параметры, указанные в табл. 6, получаем результаты, представленные в графической форме на рис. 1.

 

Рис. 1. Контрфактическая симуляция QBVAR

 

Контрфактические симуляции показали, что QBVAR можно использовать для краткосрочного и среднесрочного сценарного прогнозирования вне выборки. Как и ожидалось, наилучшей точностью обладает QBVAR для ВВП, MAPE которой на вневыборочном интервале с I квартала 2020 по I квартал 2023 г. составил менее 2%. Однако в случае с остальными переменными MAPE достаточно высокий и варьирует от 7 до 13%. Мы это связываем с характером динамики временных рядов — ВВП имеет достаточно плавную кривую и низкое стандартное отклонение — в отличие от остальных переменных.

Переходим к функциям импульсных откликов. Чтобы вывести функциональный вид IRF, необходимо представить (1) в виде бесконечной скользящей средней с помощью разложения Вольда:

xt=i=0ψiεti, (14)

где ψi — шок i на переменную xt; εti — случайное возмущение в момент времени  с нормальным распределением. Матрицы ψi представляют собой функции реакции на импульсы для UVARX(p):

ψi=xt/εti. (15)

Долгосрочное влияние ошибок на переменную можно выразить так:

M=limsi=0sψi=i=0ψi. (16)

На рис. 2–6 показаны IRF для UVARX(p) из табл. 5.

 

Рис. 2. IRF для ВВП

 

Рис. 3. IRF для инфляции

 

Рис. 4. IRF для ключевой ставки

 

Рис. 5. IRF для безработицы

 

Рис. 6. IRF для заработных плат

 

Согласно IRF, в каждой комбинации из табл. 5 присутствуют переменные, которые при единичном шоке выводят важные макроэкономические показатели из равновесного состояния. Речь, в том числе, идет обо всех переменных, имеющих отношение к ВВП: потребительские расходы и оборот розничной торговли в соотношении с инфляцией; государственный долг и M3 в соотношении с ключевой ставкой; размер выданных кредитов; ВВП Китая и заработные платы в соотношении с безработицей; активы зарубежных банков в экономике РФ; размер выданных кредитов; чистая инвестиционная позиция и золотовалютные резервы в соотношении с заработными платами. Остальные переменные находятся в равновесии со своими макроэкономическими показателями.

Байесовские методы оценки параметров VAR являются мощным инструментом анализа влияния денежно-кредитной политики ЦБ. С помощью специальных гиперпараметров можно контролировать жесткость априорных распределений, т. е. величину смещения оценки параметров UVARX(p) в сторону априорного распределения, или функции правдоподобия, которая фактически совпадает с OLS-оценками для UVARX(p) при условии обнуления влияния априорного распределения.

Важный вывод состоит в том, что QBVAR(p) для большого числа переменных и малого числа их лагов — менее точная модель, чем аналогичная UVARX(p), и не лучше, чем, например, AR(p), VECM(p) или AVAR(p). Однако в случае со снижением входящих переменных с целью увеличения их лагов модель QBVAR начинает значительно превосходить в точности прогнозирования, — как UVARX, так и ряд других конкурирующих моделей. При этом параметры жесткости рассмотренных априорных распределений уменьшаются с ростом входящих лагов в модель, т. е. чем выше порядок модели с минимальным оптимальным набором переменных, тем более жесткое распределение необходимо для получения более точных прогнозов.

5. ЗАКЛЮЧЕНИЕ

Для российской экономики была собрана информация о 29 макроэкономических индикаторах, включая важные, по мнению автора данной статьи. Набор данных содержит 29 рядов длиной в 93 квартала, начиная с I квартала 2000 и заканчивая I кварталом 2023 г. Данные предварительно никак не трансформировались и не фильтровались, чтобы иметь наиболее полную информацию. Сначала была построена обычная QBVAR(2) модель для 29 переменных с соответствующими априорными распределениями и стандартными гиперпараметрами, но ее прогностическая сила оказалась в разы меньше, чем UVARX(3), но выше, чем одномерные AR(p), AVAR(p), Holt–Winters, RWWN и Naive.

Чтобы получить максимальную точность прогноза модели, необходимо было снизить число входящих в нее переменных, выбрав наиболее важные из рассматриваемых макроэкономических показателей. Для этого был применен метод сэмплирования комбинаций заданного числа с целью ускорения процесса перебора всевозможных комбинаций, минимизирующих метрику MAPE для важных макроиндикаторов. После поиска необходимых комбинаций была проведена процедура оптимизации гиперпараметров априорных распределений для полученных оптимальных комбинаций. Оказалось, что QBVAR с меньшим числом переменных, но увеличенным числом лагов и оптимизированными априорными распределениями уже в несколько раз лучше, чем соответствующие оптимальные аналоги UVARX.

На основе комбинаций переменных, входящих в QBVAR, были построены функции импульсных откликов для UVARX, а также проведены контрфактические симуляции QBVAR для важных макроэкономических переменных. Контрфактические симуляции показали, что QBVAR можно использовать для краткосрочного и среднесрочного прогнозирования вне выборки. В случае с IRF в каждой комбинации из табл. 5 для UVARX(p) присутствуют переменные, которые при единичном шоке выводят важные макроэкономические показатели из равновесного состояния.

Итог: разработанная нами большая квартальная байесовская векторная авторегрессия QBVAR с найденными оптимальными гиперпараметрами априорных распределений вполне может быть использована для краткосрочного и среднесрочного прогнозирования и анализа влияния денежно-кредитной политики ЦБ РФ.

×

Sobre autores

A. Zasmolin

Novosibirsk State University of Economics and Management

Autor responsável pela correspondência
Email: zasmolin.98@mail.ru
Rússia, Novosibirsk

Bibliografia

  1. Демешев Б. Б., Малаховская О. А. (2016). Макроэкономическое прогнозирование с помощью BVAR Литтермана // Экономический журнал ВШЭ. Т. 20. Вып. 4. С. 691–710. [Demeshev B. B., Malakhovskaja O. A. (2016). Macroeconomic forecasting with a Litterman’s BVAR model. HSE Economic Journal, 20, 4, 691–710 (in Russian).]
  2. Дерюгина Е., Пономаренко А. (2015). Большая байесовская векторная авторегрессионная модель для российской экономики // Серия докладов об экономических исследованиях Банка России. Т. 6. Вып. 1. С. 5–20. [Deryugina E., Ponomarenko A. (2015). A large Bayesian vector autoregressive model for Russia. Bank of Russia Working Paper Series, 6, 1, 5–20 (in Russian).]
  3. Banbura M., Giannone D., Reichlin L. (2010). Large Bayesian VARs. Journal of Applied Econometrics, 25, 1, 71–92.
  4. Bernanke B. S., Boivin J., Eliasz P. (2005). Measuring the effects of monetary policy: A factor-augmented vector autoregressive (FAVAR) approach. The Quarterly Journal of Economics, 120, 1, 387–422.
  5. Bernanke B. S., Mihov I. (1998). Measuring monetary policy. The Quarterly Journal of Economics, 113, 3, 869–902.
  6. Blake A., Mumtaz H. (2012). Applied Bayesian econometrics for central bankers. Vol. 4. London: Bank of England.
  7. Canova F. (1995). VAR models: Specification, estimation, inference and forecasting. In: H. Pesaran, M. Wickens (eds.). Vol. 2. Handbook of Applied Econometrics: Macroeconomics. Oxford: Oxford Univ. Press., 73–138.
  8. Giannone D., Lenza M., Primiceri G. E. (2012). Prior selection for vector autoregressions. ECB Working Paper Series, 14, 1494, 5–21.
  9. Kadiyala K. R., Karlsson S. (1993). Forecasting with generalized Bayesian vector autoregressions. Journal of Forecasting, 12, 3–4, 365–378.
  10. Litterman R. B. (1986). Forecasting with Bayesian vector autoregressions — 5 years of experience. Journal of Business and Economic Statistics, 4, 1, 25–38.
  11. Lütkepohl H. (2005). New introduction to multiple time series analysis. Vol. 1. London: Springer.
  12. Sims C. A. (1980). Macroeconomics and reality. Econometrica, 48, 1, 1–48.
  13. Sims C., Zha T. (1998). Bayesian methods for dynamic multivariate models. International Economic Review, 39, 4, 949–968.
  14. Stock J. H., Watson M. W. (2005). Implications of dynamic factor models for VAR analysis. NBER Working Paper, 86, 11467, 1–43.

Declaração de direitos autorais © Russian Academy of Sciences, 2024

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».