Auteur: Trent Buskirk, PhD.
Net als in de geschiedenis, literatuur, criminologie en vele andere gebieden, is context belangrijk in de statistiek. Als je weet waar je gegevens vandaan komen, geeft dat aanwijzingen over wat je met die gegevens kunt doen en welke conclusies je eruit kunt trekken.
Bij enquêtemonsters is de context van cruciaal belang, omdat die je informeert over hoe de steekproef is getrokken en uit welke populatie die is getrokken.
Niet elke steekproef is een eenvoudige aselecte steekproef, dus informatie over de steekproefopzet biedt de noodzakelijke context die onderzoekers in staat stelt om goede schattingen te maken en correcte en projecteerbare conclusies te trekken.
Eén van de allereerste stappen in het werken met enquêtegegevens is dus het begrijpen van de steekproefopzet. Er zijn een paar sleutelconcepten die je niet alleen in het algemeen moet begrijpen, maar die je ook in je steekproef moet definiëren om de juiste context te bieden voor het berekenen van schattingen en het trekken van inferenties.
Het eerste begrip is de steekproefeenheid.
Dit is de eigenlijke eenheid die we in onze steekproef opnemen. Gewoonlijk verwijst deze eenheid naar een individuele persoon, maar het kan ook een bedrijf, een school of een buurt zijn, afhankelijk van wat je meet en hoe je het meet.
Nu plaats je de steekproefeenheden in hun juiste context en heb je het steekproefkader, dat bestaat uit een lijst van alle mogelijke steekproefeenheden.
De doelpopulatie biedt de algemene context en vertegenwoordigt de verzameling mensen, wooneenheden, scholen enz. waarover conclusies en schattingen worden gewenst.
In het ideale geval valt het steekproefkader perfect samen met de doelpopulatie. Dit ideaal is natuurlijk niet altijd mogelijk. Soms zal het steekproefkader groter of kleiner zijn, afhankelijk van praktische manieren om met elk lid van de steekproef in contact te komen.
Waarom steekproefkaders zo belangrijk zijn
Laten we zeggen dat je een onderzoek doet naar de mening van Amerikaanse volwassenen over de huidige politici.
U hebt natuurlijk niet de telefoonnummers van *alle* volwassenen in de VS. Maar je kunt wel een master frame krijgen van alle beschikbare mobiele telefoonnummers, die je kunt bemonsteren met behulp van random digit dialing.
De doelpopulatie (Amerikaanse volwassenen) zal voor een groot deel worden “gedekt” door het steekproefkader (de nummers in de mobiele telefoonbanken).
Echter, sommige mobiele telefoonnummers in de bank zijn eigendom van kinderen, die geen deel uitmaken van de doelpopulatie.
Ook volwassenen die alleen een vaste telefoonlijn of helemaal geen telefoon hebben, vallen niet onder dit steekproefkader.
Als deze volwassenen op een of andere manier verschillen van degenen die een mobiele telefoon bezitten in onze enquête-uitkomsten, dan kan er sprake zijn van selectievertekening. In dit specifieke geval heet dat dekkingsvertekening.
Het kan zijn dat u geen betere optie hebt voor een steekproefkader of dat het kader door iemand anders is bepaald voordat de gegevens voor u beschikbaar waren. Hoe dan ook, het is van vitaal belang dat u weet hoe de steekproef is verkregen en dat het steekproefkader mogelijk niet de gehele doelpopulatie heeft gedekt.
Wanneer u deze informatie kent, kunt u redelijke statistische schattingen afleiden en, wat misschien nog belangrijker is, kunt u conclusies trekken die in de juiste context kunnen worden geplaatst.