Sampling bias si verifica quando alcuni membri di una popolazione hanno sistematicamente più probabilità di essere selezionati in un campione rispetto ad altri. Viene anche chiamato bias di accertamento in campo medico.
Il bias di campionamento limita la generalizzabilità dei risultati perché è una minaccia alla validità esterna, in particolare alla validità della popolazione. In altre parole, i risultati provenienti da campioni distorti possono essere generalizzati solo a popolazioni che condividono le caratteristiche del campione.
Cause del bias di campionamento
La vostra scelta del disegno di ricerca o del metodo di raccolta dei dati può portare al bias di campionamento. La distorsione del campionamento può verificarsi sia nel campionamento probabilistico che in quello non probabilistico.
La distorsione del campionamento nei campioni probabilistici
Nel campionamento probabilistico, ogni membro della popolazione ha una probabilità nota di essere selezionato. Per esempio, potete usare un generatore di numeri casuali per selezionare un semplice campione casuale dalla vostra popolazione.
Anche se questa procedura riduce il rischio di distorsione del campionamento, potrebbe non eliminarlo. Se la vostra struttura di campionamento – la lista effettiva di individui da cui il campione è tratto – non corrisponde alla popolazione, questo può risultare in un campione distorto.
Improbabilità di campionamento nei campioni non probabilistici
Un campione non probabilistico è selezionato in base a criteri non casuali. Per esempio, in un campione di convenienza, i partecipanti sono selezionati in base all’accessibilità e alla disponibilità.
Il campionamento non probabilistico spesso risulta in campioni distorti perché alcuni membri della popolazione hanno più probabilità di essere inclusi di altri.
Tipi di errore di campionamento
Tipo | Spiegazione | Esempio |
---|---|---|
Self-selezione | Le persone con caratteristiche specifiche hanno maggiori probabilità di accettare di prendere parte ad uno studio rispetto ad altre. | Le persone che sono più propense al brivido hanno più probabilità di prendere parte a studi di ricerca sul dolore. Questo può distorcere i dati. |
Non-risposta | Le persone che rifiutano di partecipare o si ritirano da uno studio differiscono sistematicamente da quelle che vi prendono parte. | In uno studio sullo stress e il carico di lavoro, gli impiegati con carichi di lavoro elevati hanno meno probabilità di partecipare. Il campione risultante potrebbe non variare molto in termini di carico di lavoro. |
Sottocopertura | Alcuni membri di una popolazione sono rappresentati in modo inadeguato nel campione. | La gestione di indagini nazionali generali online può mancare gruppi con accesso limitato a Internet, come gli anziani e le famiglie a basso reddito. |
Sopravvivenza | Le osservazioni, le persone e gli oggetti che hanno avuto successo hanno più probabilità di essere rappresentati nel campione rispetto a quelli che non hanno avuto successo. | Nelle riviste scientifiche, c’è un forte pregiudizio di pubblicazione verso risultati positivi. I risultati delle ricerche di successo sono pubblicati molto più spesso dei risultati nulli. |
Pre-screening o pubblicità | Il modo in cui i partecipanti sono pre-selezionati o dove uno studio è pubblicizzato può influenzare un campione. | Quando si cercano volontari per testare un nuovo intervento sul sonno, si può finire con un campione che è più motivato a migliorare le loro abitudini di sonno rispetto al resto della popolazione. Di conseguenza, potrebbero aver avuto la probabilità di migliorare le loro abitudini di sonno indipendentemente dagli effetti del vostro intervento. |
Utente sano | I volontari per interventi preventivi sono più propensi a perseguire comportamenti e attività che favoriscono la salute rispetto ad altri membri della popolazione. | Un campione in un intervento preventivo ha una dieta migliore, livelli di attività fisica più elevati, si astiene dall’alcol, ed evita il fumo più della maggior parte della popolazione. I risultati sperimentali possono essere il risultato del trattamento che interagisce con queste caratteristiche del campione, piuttosto che il trattamento stesso. |
Come evitare o correggere gli errori di campionamento
L’utilizzo di un attento disegno di ricerca e di procedure di campionamento può aiutare ad evitare gli errori di campionamento.
- Definire una popolazione di riferimento e un quadro di campionamento (la lista di individui da cui il campione sarà estratto). Fate corrispondere il più possibile il quadro di campionamento alla popolazione target per ridurre il rischio di distorsioni del campionamento.
- Rendete i sondaggi online il più brevi e accessibili possibile.
- Seguite chi non risponde.
- Evitare il campionamento di convenienza.
Oversampling per evitare distorsioni
Il sovracampionamento può essere utilizzato per evitare distorsioni di campionamento in situazioni in cui i membri di gruppi definiti sono sottorappresentati (sottocopertura). Si tratta di un metodo per selezionare gli intervistati di alcuni gruppi in modo che costituiscano una quota maggiore di un campione rispetto alla popolazione.
Dopo che tutti i dati sono stati raccolti, le risposte dei gruppi sovracampionati vengono ponderate in base alla loro quota effettiva nella popolazione per rimuovere qualsiasi distorsione del campionamento.
Domande frequenti sul bias di campionamento
Un campione è un sottoinsieme di individui di una popolazione più ampia. Campionare significa selezionare il gruppo da cui raccoglierai effettivamente i dati nella tua ricerca. Per esempio, se stai facendo una ricerca sulle opinioni degli studenti della tua università, potresti fare un sondaggio su un campione di 100 studenti.
In statistica, il campionamento ti permette di testare un’ipotesi sulle caratteristiche di una popolazione.
L’errore di campionamento si verifica quando alcuni membri di una popolazione hanno sistematicamente più probabilità di essere selezionati in un campione rispetto ad altri.
L’errore di campionamento è una minaccia alla validità esterna – limita la generalizzabilità dei tuoi risultati a un gruppo più ampio di persone.
Alcuni tipi comuni di distorsione del campionamento includono l’autoselezione, la non risposta, la sottocopertura, la sopravvivenza, il pre-screening o la pubblicità, e il bias dell’utente sano.
Utilizzare un’attenta progettazione della ricerca e procedure di campionamento può aiutare a evitare gli errori di campionamento. Il sovracampionamento può essere usato per correggere il bias di sottocopertura.
I campioni sono usati per fare inferenze sulle popolazioni. I campioni sono più facili da raccogliere dati perché sono pratici, economici, convenienti e gestibili.