Cálculo del estadístico chi-cuadrado para las tablas de tabulación cruzada
El estadístico chi-cuadrado se calcula calculando primero un valor chi-cuadrado para cada celda individual de la tabla y luego sumándolos para formar un valor chi-cuadrado total para la tabla. El valor de chi-cuadrado para la celda se calcula como: (Valor observado – Valor esperado)2 / (Valor esperado). Los cálculos de chi-cuadrado están resaltados en gris.
En esta tabla de ejemplo, observamos que el valor de chi-cuadrado para la tabla es de 19,35, y tiene una probabilidad asociada de ocurrir por azar menos de una vez en 1000. Por tanto, rechazamos la hipótesis nula de ausencia de diferencias y concluimos que debe haber una relación entre las variables. Podemos observar la relación en dos lugares de la tabla.
El más obvio es en el valor de chi-cuadrado calculado para cada celda. Observamos que las celdas «Red Socks y Boston», «Blue Jays y Montreal» y «Red Socks y Montpellier, Vermont» fueron las tres celdas en las que el número de encuestados observados fue mayor de lo esperado. Además, observamos que cuando examinamos las frecuencias esperadas y observadas, las frecuencias de «Yankees y Montreal», «Red Socks y Montpellier, Vermont» y «Red Socks y Montreal» fueron menores de lo esperado.
Debido a que el chi-cuadrado de la celda y los valores esperados a menudo no se muestran, estas mismas relaciones se pueden observar comparando el porcentaje del total de la columna con el porcentaje de la celda (del total de la fila). En la celda «Medias Rojas y Boston» compararíamos el 41,10% con el 64,71% y observaríamos que a los aficionados de las Medias Rojas les gusta Boston más de lo esperado. Hay que tener cuidado al interpretar las relaciones encontradas en cualquier análisis estadístico. A menudo deseamos «explicar» o concluir la «causalidad» de los análisis cuando los datos o bien no están diseñados para ello, o bien no tienen el poder para apoyar tales conclusiones.
En la tabla actual, observamos que «Red Socks y Boston» tuvo el mayor delta entre el número de encuestados observados y esperados, para cualquier preferencia de equipo y ciudad de residencia. Sin embargo, debemos ser cautos a la hora de concluir que los Red Socks provocaron que los encuestados se trasladaran a Boston, o que Boston como ciudad de residencia provoca la fidelidad de los aficionados. Los Red Socks y Boston son la relación más observada entre el aficionado y la ciudad, pero lo más probable es que sean totalmente independientes cuando se consideran otros conceptos o relaciones.
Los crosstabs y la chi-cuadrado son formas potentes de analizar los datos de las encuestas. Otra herramienta popular que tiene un impacto en la investigación es el análisis conjunto.