Calcolo della statistica del chi-quadro per le tabelle di tabulazione incrociata
La statistica del chi-quadro è calcolata calcolando prima un valore del chi-quadro per ogni singola cella della tabella e poi sommandoli per formare un valore totale del chi-quadro per la tabella. Il valore del chi-quadro per la cella è calcolato come: (Valore osservato – Valore atteso)2 / (Valore atteso). I calcoli del chi-quadro sono evidenziati in grigio.
In questa tabella di esempio, osserviamo che il valore del chi-quadro per la tabella è 19,35, e ha una probabilità associata di verificarsi per caso meno di una volta su 1000. Rifiutiamo quindi l’ipotesi nulla di nessuna differenza e concludiamo che ci deve essere una relazione tra le variabili. Possiamo osservare la relazione in due punti della tabella.
Il più ovvio è nel valore del chi-quadro calcolato per ogni cella. Osserviamo che le celle “Red Socks e Boston”, “Blue Jays e Montreal” e “Red Socks e Montpellier, Vermont” erano le tre celle in cui il numero di intervistati osservati era maggiore del previsto. Notiamo inoltre che quando esaminiamo le frequenze attese e osservate, le frequenze di “Yankees e Montreal”, “Red Socks e Montpellier, Vermont” e “Red Socks e Montreal” erano inferiori al previsto.
Perché il chi-quadro della cella e i valori attesi spesso non sono visualizzati, queste stesse relazioni possono essere osservate confrontando la percentuale del totale della colonna con la percentuale della cella (del totale della riga). Nella cella “Red Socks e Boston” confrontiamo il 41,10% con il 64,71% e osserviamo che i tifosi dei Red Socks amano Boston più del previsto. La cautela è necessaria quando si interpretano le relazioni trovate in qualsiasi analisi statistica. Spesso desideriamo “spiegare” o concludere la “causalità” dalle analisi quando i dati non sono progettati per, o non hanno il potere di sostenere tali conclusioni.
Nella tabella attuale, osserviamo che “Red Socks e Boston” ha avuto il più grande delta tra il numero di intervistati osservati e previsti, per qualsiasi preferenza di squadra e città di residenza. Tuttavia, dobbiamo essere cauti nel concludere che i Red Socks abbiano indotto gli intervistati a trasferirsi a Boston, o che Boston come città di residenza causi la fedeltà dei tifosi. I Red Socks e Boston sono la relazione più osservata tra tifosi e città, ma molto probabilmente sono totalmente indipendenti quando si considerano altri concetti o relazioni.
Le tabelle incrociate e il chi-quadro sono modi potenti per analizzare i dati del sondaggio. Un altro strumento popolare che ha un impatto sulla ricerca è la Conjoint Analysis.