Obliczanie statystyki chi kwadrat dla tabel krzyżowych

Statystykę chi kwadrat oblicza się, obliczając najpierw wartość chi kwadrat dla każdej komórki tabeli, a następnie sumując je, aby uzyskać całkowitą wartość chi kwadrat dla tabeli. Wartość chi kwadrat dla komórki jest obliczana jako: (Wartość obserwowana – Wartość oczekiwana)2 / (Wartość oczekiwana). Obliczenia chi kwadrat są zaznaczone na szaro.

W tej przykładowej tabeli obserwujemy, że wartość chi kwadrat dla tabeli wynosi 19,35 i ma powiązane prawdopodobieństwo wystąpienia przypadkowo mniej niż jeden raz na 1000. Odrzucamy zatem hipotezę zerową o braku różnicy i stwierdzamy, że musi istnieć związek między zmiennymi. Zależność tę możemy zaobserwować w dwóch miejscach tabeli.

Najbardziej oczywista jest wartość chi kwadrat obliczona dla każdej komórki. Zauważamy, że komórki „Red Socks i Boston”, „Blue Jays i Montreal” oraz „Red Socks i Montpellier, Vermont” były trzema komórkami, w których liczba obserwowanych respondentów była większa niż oczekiwana. Zauważmy, że gdy zbadamy oczekiwane i obserwowane częstości, częstości „Jankesów i Montrealu”, „Czerwonych Skarpet i Montpellier, Vermont” oraz „Czerwonych Skarpet i Montrealu” były mniejsze niż oczekiwane.

Ponieważ chi kwadrat komórek i wartości oczekiwane często nie są wyświetlane, te same zależności można zaobserwować, porównując procenty sumy kolumn z procentami komórek (sumy wierszy). W komórce „Red Socks i Boston” porównalibyśmy 41,10% z 64,71% i zauważylibyśmy, że więcej fanów Red Socks lubi Boston niż oczekiwano. Zaleca się ostrożność przy interpretacji zależności znalezionych w jakiejkolwiek analizie statystycznej. Często chcemy „wyjaśniać” lub wnioskować o „przyczynowości” z analiz, gdy dane albo nie są do tego przeznaczone, albo nie mają mocy, by potwierdzić takie wnioski.

W obecnej tabeli zauważamy, że „Red Socks i Boston” miał największą deltę między liczbą obserwowanych i oczekiwanych respondentów, dla każdej preferencji drużyny i miasta zamieszkania. Jednak musimy być ostrożni we wnioskowaniu, że Red Socks spowodowali, że respondenci przeprowadzili się do Bostonu, lub że Boston jako miasto zamieszkania powoduje lojalność fanów. Red Socks i Boston są najbardziej obserwowaną relacją między kibicem a miastem, ale najprawdopodobniej są całkowicie niezależne, jeśli weźmiemy pod uwagę inne koncepcje lub relacje.

Crosstabs i chi kwadrat to potężne sposoby na analizę danych ankietowych. Innym popularnym narzędziem, które ma wpływ na badania jest Conjoint Analysis.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *