2.8 Autocorrélation
De même que la corrélation mesure l’étendue d’une relation linéaire entre deux variables, l’autocorrélation mesure la relation linéaire entre les valeurs retardées d’une série temporelle.
Il existe plusieurs coefficients d’autocorrélation, correspondant à chaque panneau du graphique des retards. Par exemple, \(r_{1}\) mesure la relation entre \(y_{t}\) et \(y_{t-1}\), \(r_{2}\) mesure la relation entre \(y_{t}\) et \(y_{t-2}\), et ainsi de suite.
La valeur de \(r_{k}\) peut s’écrire comme suit : où \(T\) est la longueur de la série chronologique.
Les neuf premiers coefficients d’autocorrélation pour les données de production de bière sont donnés dans le tableau suivant.
\(r_1\) | (r_2\) | (r_3\) | (r_4\) | (r_5\) | \(r_6\) | (r_7\) | (r_8\) | (r_9\) |
---|---|---|---|---|---|---|---|---|
-0.102 | -0,657 | -0,060 | 0,869 | -0,089 | -0,635 | -0,054 | 0,832 | -0.108 |
Ils correspondent aux neuf nuages de points de la figure 2.13. Les coefficients d’autocorrélation sont tracés pour montrer la fonction d’autocorrélation ou ACF. Ce graphique est également appelé corrélogramme.
ggAcf(beer2)
Figure 2.14 : Fonction d’autocorrélation de la production trimestrielle de bière.
Dans ce graphique :
- \(r_{4}\) est plus élevé que pour les autres retards. Cela est dû au schéma saisonnier des données : les pics ont tendance à être espacés de quatre trimestres et les creux de quatre trimestres.
- La \(r_{2}\) est plus négative que pour les autres retards car les creux ont tendance à être deux trimestres derrière les pics.
- Les lignes bleues en pointillés indiquent si les corrélations sont significativement différentes de zéro. Celles-ci sont expliquées dans la section 2.9.
Tendance et saisonnalité dans les tracés d’ACF
Lorsque les données ont une tendance, les autocorrélations pour les petits retards ont tendance à être grandes et positives parce que les observations proches dans le temps sont également proches en taille. Ainsi, l’ACF des séries chronologiques à tendance a tendance à avoir des valeurs positives qui diminuent lentement à mesure que les retards augmentent.
Lorsque les données sont saisonnières, les autocorrélations seront plus grandes pour les retards saisonniers (à des multiples de la fréquence saisonnière) que pour les autres retards.
Lorsque les données sont à la fois à tendance et saisonnières, vous voyez une combinaison de ces effets. La série mensuelle de demande d’électricité australienne tracée à la figure 2.15 présente à la fois une tendance et une saisonnalité. Son ACF est présenté à la figure 2.16.
aelec <- window(elec, start=1980)autoplot(aelec) + xlab("Year") + ylab("GWh")
Figure 2.15 : Demande mensuelle d’électricité australienne de 1980 à 1995.
ggAcf(aelec, lag=48)
Figure 2.16 : ACF de la demande mensuelle d’électricité australienne.
La lente diminution de l’ACF à mesure que les lags augmentent est due à la tendance, tandis que la forme « festonnée » est due à la saisonnalité.
.