Obliczanie statystyki chi kwadrat dla tabel krzyżowych
Statystykę chi kwadrat oblicza się, obliczając najpierw wartość chi kwadrat dla każdej komórki tabeli, a następnie sumując je, aby uzyskać całkowitą wartość chi kwadrat dla tabeli. Wartość chi kwadrat dla komórki jest obliczana jako: (Wartość obserwowana – Wartość oczekiwana)2 / (Wartość oczekiwana). Obliczenia chi kwadrat są zaznaczone na szaro.
W tej przykładowej tabeli obserwujemy, że wartość chi kwadrat dla tabeli wynosi 19,35 i ma powiązane prawdopodobieństwo wystąpienia przypadkowo mniej niż jeden raz na 1000. Odrzucamy zatem hipotezę zerową o braku różnicy i stwierdzamy, że musi istnieć związek między zmiennymi. Zależność tę możemy zaobserwować w dwóch miejscach tabeli.
Najbardziej oczywista jest wartość chi kwadrat obliczona dla każdej komórki. Zauważamy, że komórki „Red Socks i Boston”, „Blue Jays i Montreal” oraz „Red Socks i Montpellier, Vermont” były trzema komórkami, w których liczba obserwowanych respondentów była większa niż oczekiwana. Zauważmy, że gdy zbadamy oczekiwane i obserwowane częstości, częstości „Jankesów i Montrealu”, „Czerwonych Skarpet i Montpellier, Vermont” oraz „Czerwonych Skarpet i Montrealu” były mniejsze niż oczekiwane.
Ponieważ chi kwadrat komórek i wartości oczekiwane często nie są wyświetlane, te same zależności można zaobserwować, porównując procenty sumy kolumn z procentami komórek (sumy wierszy). W komórce „Red Socks i Boston” porównalibyśmy 41,10% z 64,71% i zauważylibyśmy, że więcej fanów Red Socks lubi Boston niż oczekiwano. Zaleca się ostrożność przy interpretacji zależności znalezionych w jakiejkolwiek analizie statystycznej. Często chcemy „wyjaśniać” lub wnioskować o „przyczynowości” z analiz, gdy dane albo nie są do tego przeznaczone, albo nie mają mocy, by potwierdzić takie wnioski.
W obecnej tabeli zauważamy, że „Red Socks i Boston” miał największą deltę między liczbą obserwowanych i oczekiwanych respondentów, dla każdej preferencji drużyny i miasta zamieszkania. Jednak musimy być ostrożni we wnioskowaniu, że Red Socks spowodowali, że respondenci przeprowadzili się do Bostonu, lub że Boston jako miasto zamieszkania powoduje lojalność fanów. Red Socks i Boston są najbardziej obserwowaną relacją między kibicem a miastem, ale najprawdopodobniej są całkowicie niezależne, jeśli weźmiemy pod uwagę inne koncepcje lub relacje.
Crosstabs i chi kwadrat to potężne sposoby na analizę danych ankietowych. Innym popularnym narzędziem, które ma wpływ na badania jest Conjoint Analysis.