2020/05/23

時系列分析 (4) - 多変量の時系列分析

複数の変量が相互作用を持って発展していく形の時系列は珍しくありません。こういったデータは、各変量を個別にモデル化しようとしてもうまくいきません。このような場合は、ベクトル自己回帰 (Vector Autoregressive / VAR) モデルが有効な場合があります。VAR モデルは、AR モデルを多変量に拡張したものです。今回は VAR モデルについて簡単に触れたいと思います。



ベクトル過程

VAR モデルの構築にあたっては、観測データをベクトルの時系列 (ベクトル過程) とみなすことから始めます。
$n$個の変量からなる観測データの時点$t$における値を$n$行$1$列のベクトル$Y_t = (y_{1,t}, y_{2,t}, \ldots, y_{n,t})'$と考え、観測データ全体をこのベクトルからなるベクトル過程として捉えます。その上で、スカラー観測値を対象に構築された各種概念をベクトル観測値に拡張して適用します。

期待値、自己共分散のベクトル過程への拡張

期待値の拡張としての期待値ベクトル$E(Y_t)$は、各変量の期待値からなるベクトル、すなわち$E(Y_t) = (E(y_{1,t}), E(y_{2,t}), \ldots, E(y_{n,t}))'$と定めます。
自己共分散の拡張は自己共分散行列となります。$k$次-自己共分散行列$Cov(Y_t, Y_{t-k})$は、$Cov(Y_t, Y_{t-k}) = (Cov(y_{i,t}, y_{j,t-k}))_{ij}$となります。これは$n$行$n$列の正方行列で、対角成分は各変量の自己共分散に等しくなっています。また、$0$次-自己共分散行列は、各変量を通常の確率変数として見たときの分散共分散行列にあたります。$k$の関数として見て、自己共分散関数と呼ぶこともできます。

ベクトル過程の弱定常性

期待値と自己共分散が定義できたので、これでベクトル過程の弱定常性が定義できます。ベクトル過程$Y_t$の期待値ベクトルと自己共分散関数が時点$t$に依存しないとき、$Y_t$は弱定常ベクトル過程と呼ばれます。弱定常過程においては、期待値ベクトルも自己共分散関数もともに$t$に依存しないので、以後それぞれ$\mu, \Gamma_k$で表すことにします。

自己相関行列

自己共分散と同様、自己共分散行列も変量の大きさに依存していますので、関係の強弱を比較しづらいものとなっています。そのため、自己相関のように基準化する必要があります。ベクトル過程に対する自己共分散行列を基準化したものを自己相関行列と呼びます。自己相関行列$\rho_k$は$\rho_k = (Corr(y_{i,t}, y_{j,t-k}))_{ij}$と定義されます。
$\rho_k$は、以下のようにも書けます。$$
\rho_k = D^{-\frac{1}{2}}\Gamma_kD^{-\frac{1}{2}}
$$ただし、$D = diag(Var(y_1), \ldots, Var(y_n)))$です。$diag()$は対角行列の意味です。

ベクトルホワイトノイズ

ホワイトノイズの定義もベクトルに拡張しておきましょう。ベクトル過程 $\epsilon_t$が、$$
\begin{eqnarray*}
E(\epsilon_t) &=& 0 \\
E(\epsilon_t\epsilon_{t-k}') &=& \begin{cases}
\Sigma &(k = 0)  (\Sigmaは正定値で\epsilon_tの分散共分散行列にあたる)\\
0 &(k \ne 0)
\end{cases}
\end{eqnarray*}
$$であるとき、$\epsilon_t$はベクトルホワイトノイズであると言い、$\epsilon_t \sim WN(\Sigma)$と表記します。$\Sigma$は対角行列でなくともかまいません。このことは、異なる時点間ではどの変量においても他の変量とも自分自身とも相関を持っていてはならないが、同一時点内において変量間に相関があることは許容されるということを意味します。

VAR モデル

VAR モデルは、AR モデルをベクトルに拡張したものです。$VAR(p)$は$p$時点まで遡った値で回帰したモデルということになります。数式で書くと以下のようになります。$$
Y_t = c + \Phi_1Y_{t-1} + \ldots + \Phi_pY_{t-p} + \epsilon_t, \epsilon_t \sim WN(\Sigma)
$$ $c$は$n$行$1$列の定数ベクトル、$\Phi_1$から$\Phi_p$は$n$行$n$列の行列となります。
$n$変量の$VAR(p)$モデルは、実質的には$n$本の回帰式からなり、各回帰式が$np$個の回帰係数と$1$個の定数を持っています。また、攪乱項の分散共分散行列 (\Sigma) の中に$\frac{n(n+1)}{2}$個のパラメータがあるので、トータルで$(p + \frac{1}{2}) n^2 + \frac{3n}{2}$という膨大な数のパラメータを持っていることになります。最もパラメータ数の少ない$2$変量$VAR(1)$でもパラメータ数は$9$個あります。

VAR モデルの定常条件

VAR モデルの定常性は、AR 特性方程式をベクトルに拡張したもので判定できます。すなわち、$|I_n - \Phi_1z - \ldots - \Phi_pz^p| = 0$の全ての解の絶対値が1より大きいことが定常条件です ($I_n$は$n$行$n$列の単位行列です)。

VMA モデルと VARMA モデル

MA モデル、ARMA モデルも VAR と同様にベクトルに拡張することができます。VAR を $VMA(\infty)$に書き直すこともできます。
VARMA モデルは VAR よりもさらに膨大なパラメータ数になるので、あまり使われません。

VAR モデルの推定

VAR モデルにおいては、各回帰式を独立に最小二乗法で推定したものが最良の線形不偏推定量となることが分かっており、攪乱項が多変量正規分布に従う場合は最尤推定量とも一致します。次数は基本的には情報量規準に基づいて選択すれば良いのですが、パラメータ数が多いことから、あまり有意でないパラメータがオーバーフィッティングを起こし、小さすぎる次数のモデルが選択される恐れがあります。予め定性的に高い次数が必要とされることが分かっている場合は、それを考慮にいれて推定を行うべきです。