Computation of the Chi-Square Statistic for Cross-Tabulation Tables
De chi-kwadraatstatistiek wordt berekend door eerst een chi-kwadraatwaarde te berekenen voor elke afzonderlijke cel van de tabel en deze vervolgens op te tellen tot een totale chi-kwadraatwaarde voor de tabel. De chi-kwadraatwaarde voor de cel wordt berekend als: (Waargenomen waarde – Verwachte waarde)2 / (Verwachte waarde). De chi-kwadraatberekeningen zijn grijs gemarkeerd.
In deze voorbeeldtabel zien we dat de chi-kwadraatwaarde voor de tabel 19,35 is, en een bijbehorende waarschijnlijkheid heeft dat deze minder dan één keer op 1000 bij toeval voorkomt. Wij verwerpen dus de nulhypothese van geen verschil en concluderen dat er een verband moet bestaan tussen de variabelen. We kunnen het verband op twee plaatsen in de tabel waarnemen.
Het meest voor de hand liggend is de chi-kwadraatwaarde die voor elke cel wordt berekend. We zien dat de cellen “Red Socks en Boston”, “Blue Jays en Montreal” en “Red Socks en Montpellier, Vermont” de drie cellen zijn waar het aantal geobserveerde respondenten groter was dan verwacht. We merken verder op dat wanneer we de verwachte en waargenomen frequenties bekijken, de frequenties van “Yankees en Montreal”, “Red Socks en Montpellier, Vermont” en “Red Socks en Montreal” lager waren dan verwacht.
Omdat de celchi-kwadraat en de verwachte waarden vaak niet worden weergegeven, kunnen dezelfde relaties worden waargenomen door het percentage van het kolomtotaal te vergelijken met het percentage van de cel (van het rijtotaal). In de cel “Red Socks en Boston” zouden we 41,10% vergelijken met 64,71% en zien dat meer Red Socks fans van Boston houden dan verwacht. Voorzichtigheid is geboden bij het interpreteren van relaties die gevonden worden in een statistische analyse. We willen vaak “verklaren” of “causaliteit” concluderen uit analyses, terwijl de gegevens daar niet voor bedoeld zijn of niet de kracht hebben om dergelijke conclusies te ondersteunen.
In de huidige tabel zien we dat “Red Socks en Boston” de grootste delta had tussen het aantal geobserveerde en het verwachte aantal respondenten, voor elke teamvoorkeur en woonplaats. We moeten echter voorzichtig zijn met de conclusie dat de Red Socks ervoor zorgden dat respondenten naar Boston verhuisden, of dat Boston als woonplaats de oorzaak is van fan loyaliteit. Red Socks en Boston zijn de meest waargenomen relatie tussen fans en steden, maar zijn hoogstwaarschijnlijk volledig onafhankelijk wanneer we andere concepten of relaties in overweging nemen.
Crosstabs en chi-kwadraten zijn krachtige manieren om uw enquêtegegevens te analyseren. Een andere populaire tool die van invloed is op onderzoek is Conjoint Analysis.