Autor: Trent Buskirk, PhD.
Wie in Geschichte, Literatur, Kriminologie und vielen anderen Bereichen ist der Kontext in der Statistik wichtig. Zu wissen, woher die Daten kommen, gibt Hinweise darauf, was man mit den Daten machen kann und welche Schlüsse man daraus ziehen kann.
Bei Umfragestichproben ist der Kontext entscheidend, weil er Sie darüber informiert, wie die Stichprobe ausgewählt wurde und aus welcher Grundgesamtheit sie ausgewählt wurde.
Nicht jede ausgewählte Stichprobe ist eine einfache Zufallsstichprobe, so dass die Kenntnis des Stichprobendesigns den notwendigen Kontext liefert, der es den Forschern ermöglicht, korrekte Schätzungen zu erstellen und korrekte und projizierbare Schlussfolgerungen zu generieren.
Einer der allerersten Schritte bei der Arbeit mit Umfragedaten ist es also, das Stichprobendesign zu verstehen. Es gibt ein paar Schlüsselkonzepte, die Sie nicht nur im Allgemeinen verstehen, sondern auch in Ihrer Stichprobe definieren müssen, um den richtigen Kontext für die Berechnung von Schätzungen und das Ziehen von Schlussfolgerungen zu schaffen.
Das erste ist die Stichprobeneinheit.
Dies ist die tatsächliche Einheit, die wir in unsere Stichprobe aufnehmen. Normalerweise bezieht sich diese Einheit auf eine einzelne Person, aber es könnte auch ein Unternehmen, eine Schule oder eine Nachbarschaft sein, je nachdem, was Sie messen und wie Sie es messen.
Setzen Sie nun die Stichprobeneinheiten in ihren richtigen Kontext und Sie haben den Stichprobenrahmen, der aus einer Auflistung aller möglichen Stichprobeneinheiten besteht.
Die Zielpopulation liefert den Gesamtzusammenhang und stellt die Sammlung von Personen, Wohneinheiten, Schulen usw. dar, über die Rückschlüsse und Schätzungen gewünscht sind.
Im Idealfall deckt sich der Stichprobenrahmen perfekt mit der Zielpopulation. Natürlich ist das Ideal nicht immer möglich. Manchmal wird der Rahmen größer oder kleiner sein, abhängig von den praktischen Möglichkeiten, mit jedem Mitglied der Stichprobe in Kontakt zu treten.
Warum Stichprobenrahmen so wichtig sind
Angenommen, Sie machen eine Studie über die Meinungen von US-Erwachsenen zu aktuellen Politikern.
Natürlich haben Sie nicht die Telefonnummern von *allen* Erwachsenen in den USA. Aber Sie sind in der Lage, einen Master-Frame aller verfügbaren Handynummern zu erhalten, den Sie mit Hilfe von Random Digit Dialing beproben können.
Die Zielpopulation (US-Erwachsene) wird zu einem großen Teil durch den Sampling-Frame „abgedeckt“ (diejenigen in den Handy-Banken).
Einige Handynummern in der Bank gehören jedoch Kindern, die nicht Teil der Zielpopulation sind.
Gleichermaßen werden Erwachsene, die nur ein Festnetztelefon oder gar kein Telefon besitzen, von diesem Stichprobenrahmen nicht abgedeckt.
Wenn sich diese Erwachsenen in irgendeiner Weise von denjenigen unterscheiden, die in unseren Umfrageergebnissen ein Mobiltelefon besitzen, dann kann es zu einer Selektionsverzerrung kommen. In diesem speziellen Fall spricht man von einem Coverage Bias.
Es kann sein, dass Sie keine bessere Option für einen Stichprobenrahmen haben oder dass der Rahmen von jemand anderem festgelegt wurde, bevor die Daten für Sie verfügbar waren. In jedem Fall ist es wichtig, dass Sie wissen, wie die Stichprobe gewonnen wurde und dass der Stichprobenrahmen möglicherweise nicht die gesamte Zielpopulation abdeckt.
Wenn Sie diese Informationen kennen, können Sie vernünftige statistische Schätzungen ableiten und, was vielleicht noch wichtiger ist, Sie können Schlussfolgerungen ziehen, die in den richtigen Kontext gestellt werden können.