Calcul de la statistique du chi-deux pour les tableaux croisés
La statistique du chi-deux est calculée en calculant d’abord une valeur de chi-deux pour chaque cellule individuelle du tableau, puis en les additionnant pour former une valeur de chi-deux totale pour le tableau. La valeur du chi carré pour la cellule est calculée comme suit : (valeur observée – valeur attendue)2 / (valeur attendue). Les calculs du chi-deux sont surlignés en gris.
Dans cet exemple de tableau, nous observons que la valeur du chi-deux pour le tableau est de 19,35, et a une probabilité associée de se produire par hasard moins d’une fois sur 1000. Nous rejetons donc l’hypothèse nulle d’absence de différence et concluons qu’il doit y avoir une relation entre les variables. Nous pouvons observer cette relation à deux endroits dans le tableau.
Le plus évident est dans la valeur du chi carré calculée pour chaque cellule. Nous observons que les cellules » Chaussettes rouges et Boston « , » Blue Jays et Montréal » et » Chaussettes rouges et Montpellier, Vermont » sont les trois cellules où le nombre de répondants observés était supérieur à celui attendu. Nous remarquons en outre que lorsque nous examinons les fréquences attendues et observées, les fréquences « Yankees et Montréal », « Chaussettes rouges et Montpellier, Vermont » et « Chaussettes rouges et Montréal » étaient inférieures à celles attendues.
Comme le chi-deux de la cellule et les valeurs attendues ne sont souvent pas affichés, on peut observer ces mêmes relations en comparant le pourcentage du total de la colonne au pourcentage de la cellule (du total de la ligne). Dans la cellule « Chaussettes rouges et Boston », nous pourrions comparer 41,10 % à 64,71 % et observer que les fans des Chaussettes rouges sont plus nombreux que prévu à aimer Boston. Il convient d’être prudent lors de l’interprétation des relations trouvées dans toute analyse statistique. Nous désirons souvent « expliquer » ou conclure à une « causalité » à partir d’analyses alors que les données ne sont pas conçues pour, ou n’ont pas la puissance nécessaire pour soutenir de telles conclusions.
Dans le tableau actuel, nous observons que « Chaussettes rouges et Boston » avait le plus grand delta entre le nombre de répondants observés et attendus, pour toute préférence d’équipe et ville de résidence. Cependant, nous devons être prudents en concluant que les chaussettes rouges ont poussé les répondants à déménager à Boston, ou que Boston en tant que ville de résidence cause la loyauté des fans. Les chaussettes rouges et Boston sont la relation entre les fans et la ville la plus observée, mais il est fort probable qu’elles soient totalement indépendantes lorsqu’on considère d’autres concepts ou relations.
Les tableaux croisés et le chi-carré sont des moyens puissants d’analyser vos données d’enquête. Un autre outil populaire qui a un impact sur la recherche est l’analyse Conjointe.
L’analyse Conjointe.