2.8 Autocorrelation
相関が2つの変数の間の線形関係の程度を測定するように、自己相関は時系列のラグ値の間の線形関係を測定します。 例えば、\(y_{t}\)と\(y_{t-1}\)との関係を表す\(r_{1}\)、\(y_{t-2}\)との関係を表すathy(r_{2}\)などがあります。
\(r_{k}\)の値は、時系列の長さを表すと次のように書くことができます。
ビール生産量データの最初の9つの自己相関係数は次の表のようになります。
\(r_1\) | sexual(r_2\) | sexual(r_3\) | sexual(r_4\) | sexual(r_5⑅)th | ||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
-0.102 | -0.657 | -0.060 | -0.869 | -0.635 | -0.054 | -0.832 | -0.108 |
これらは、図2.13の9つの散布図に対応しています。 自己相関係数をプロットして、自己相関関数(ACF)を示しています。
ggAcf(beer2)
図2.14: 四半期ごとのビール生産量の自己相関関数
このグラフでは
- \(r_{4}\)が他のラグに比べて高いことがわかります。
- ″r_{2}\″は他のラグに比べて負の値を示していますが、これはピークが4四半期、トラフが4四半期であるためです。
ACFプロットにおけるトレンドと季節性
データにトレンドがある場合、時間的に近い観測値はサイズも近いため、小さなラグの自己相関は大きく正の値になる傾向があります。
データに季節性がある場合、自己相関は季節性のあるラグ (季節性の周波数の倍数) で他のラグよりも大きくなります。
データにトレンドと季節性がある場合、これらの効果が組み合わされます。 図2.15にプロットされているオーストラリアの電力需要の月次シリーズは、トレンドと季節性の両方を示しています。
aelec <- window(elec, start=1980)autoplot(aelec) + xlab("Year") + ylab("GWh")
図2.15: Monthly Australian electricity demand from 1980-1995.
ggAcf(aelec, lag=48)
図2.16: ACF of monthly Australian electricity demand.
ラグの増加に伴いACFが緩やかに減少しているのはトレンドによるもので、「帆立貝」のような形状は季節性によるものです。