Sampling bias si verifica quando alcuni membri di una popolazione hanno sistematicamente più probabilità di essere selezionati in un campione rispetto ad altri. Viene anche chiamato bias di accertamento in campo medico.

Il bias di campionamento limita la generalizzabilità dei risultati perché è una minaccia alla validità esterna, in particolare alla validità della popolazione. In altre parole, i risultati provenienti da campioni distorti possono essere generalizzati solo a popolazioni che condividono le caratteristiche del campione.

Cause del bias di campionamento

La vostra scelta del disegno di ricerca o del metodo di raccolta dei dati può portare al bias di campionamento. La distorsione del campionamento può verificarsi sia nel campionamento probabilistico che in quello non probabilistico.

La distorsione del campionamento nei campioni probabilistici

Nel campionamento probabilistico, ogni membro della popolazione ha una probabilità nota di essere selezionato. Per esempio, potete usare un generatore di numeri casuali per selezionare un semplice campione casuale dalla vostra popolazione.

Anche se questa procedura riduce il rischio di distorsione del campionamento, potrebbe non eliminarlo. Se la vostra struttura di campionamento – la lista effettiva di individui da cui il campione è tratto – non corrisponde alla popolazione, questo può risultare in un campione distorto.

Esempio di distorsione di campionamento in un campione casuale semplice
Vuoi studiare i livelli di procrastinazione e di ansia sociale negli studenti universitari utilizzando un campione casuale semplice. Assegni un numero ad ogni studente nel database dei partecipanti alla ricerca da 1 a 1500 e usi un generatore di numeri casuali per selezionare 120 numeri.

Anche se hai usato un campione casuale, non tutti i membri della tua popolazione target – studenti universitari – hanno avuto la possibilità di essere selezionati. Al tuo campione manca chiunque non si sia iscritto per essere contattato per partecipare alla ricerca. Questo può influenzare il tuo campione verso persone che hanno meno ansia sociale e sono più disposte a partecipare alla ricerca.

Improbabilità di campionamento nei campioni non probabilistici

Un campione non probabilistico è selezionato in base a criteri non casuali. Per esempio, in un campione di convenienza, i partecipanti sono selezionati in base all’accessibilità e alla disponibilità.

Il campionamento non probabilistico spesso risulta in campioni distorti perché alcuni membri della popolazione hanno più probabilità di essere inclusi di altri.

Esempio di distorsione del campionamento in un campione di convenienza
Vuoi studiare la popolarità degli alimenti a base vegetale tra gli studenti della tua università. Per comodità, invii un sondaggio a tutti gli iscritti ai corsi di Introduzione alla psicologia della tua università. Lo completano tutti in cambio dei crediti del corso.

Perché questo è un campione di convenienza, non è rappresentativo della tua popolazione di riferimento. Le persone che seguono questo corso potrebbero essere più liberali e attratte da cibi a base di piante rispetto ad altri nella tua università.

Tipi di errore di campionamento

Tipo Spiegazione Esempio
Self-selezione Le persone con caratteristiche specifiche hanno maggiori probabilità di accettare di prendere parte ad uno studio rispetto ad altre. Le persone che sono più propense al brivido hanno più probabilità di prendere parte a studi di ricerca sul dolore. Questo può distorcere i dati.
Non-risposta Le persone che rifiutano di partecipare o si ritirano da uno studio differiscono sistematicamente da quelle che vi prendono parte. In uno studio sullo stress e il carico di lavoro, gli impiegati con carichi di lavoro elevati hanno meno probabilità di partecipare. Il campione risultante potrebbe non variare molto in termini di carico di lavoro.
Sottocopertura Alcuni membri di una popolazione sono rappresentati in modo inadeguato nel campione. La gestione di indagini nazionali generali online può mancare gruppi con accesso limitato a Internet, come gli anziani e le famiglie a basso reddito.
Sopravvivenza Le osservazioni, le persone e gli oggetti che hanno avuto successo hanno più probabilità di essere rappresentati nel campione rispetto a quelli che non hanno avuto successo. Nelle riviste scientifiche, c’è un forte pregiudizio di pubblicazione verso risultati positivi. I risultati delle ricerche di successo sono pubblicati molto più spesso dei risultati nulli.
Pre-screening o pubblicità Il modo in cui i partecipanti sono pre-selezionati o dove uno studio è pubblicizzato può influenzare un campione. Quando si cercano volontari per testare un nuovo intervento sul sonno, si può finire con un campione che è più motivato a migliorare le loro abitudini di sonno rispetto al resto della popolazione. Di conseguenza, potrebbero aver avuto la probabilità di migliorare le loro abitudini di sonno indipendentemente dagli effetti del vostro intervento.
Utente sano I volontari per interventi preventivi sono più propensi a perseguire comportamenti e attività che favoriscono la salute rispetto ad altri membri della popolazione. Un campione in un intervento preventivo ha una dieta migliore, livelli di attività fisica più elevati, si astiene dall’alcol, ed evita il fumo più della maggior parte della popolazione. I risultati sperimentali possono essere il risultato del trattamento che interagisce con queste caratteristiche del campione, piuttosto che il trattamento stesso.

Qual è il tuo punteggio di plagio?

  • Miglior verificatore di plagio del 2020
  • Rapporto di plagio & percentuale
  • Più grande database di plagio

Scribbr Plagiarism Checker

Come evitare o correggere gli errori di campionamento

L’utilizzo di un attento disegno di ricerca e di procedure di campionamento può aiutare ad evitare gli errori di campionamento.

  • Definire una popolazione di riferimento e un quadro di campionamento (la lista di individui da cui il campione sarà estratto). Fate corrispondere il più possibile il quadro di campionamento alla popolazione target per ridurre il rischio di distorsioni del campionamento.
  • Rendete i sondaggi online il più brevi e accessibili possibile.
  • Seguite chi non risponde.
  • Evitare il campionamento di convenienza.

Oversampling per evitare distorsioni

Il sovracampionamento può essere utilizzato per evitare distorsioni di campionamento in situazioni in cui i membri di gruppi definiti sono sottorappresentati (sottocopertura). Si tratta di un metodo per selezionare gli intervistati di alcuni gruppi in modo che costituiscano una quota maggiore di un campione rispetto alla popolazione.

Dopo che tutti i dati sono stati raccolti, le risposte dei gruppi sovracampionati vengono ponderate in base alla loro quota effettiva nella popolazione per rimuovere qualsiasi distorsione del campionamento.

Esempio di sovracampionamento per evitare le distorsioni del campionamento
Un ricercatore vuole studiare le opinioni politiche di diversi gruppi etnici negli Stati Uniti e concentrarsi in modo approfondito sugli asiatici americani, che costituiscono solo il 5,6% della popolazione statunitense. Il ricercatore vuole studiare ogni gruppo etnico separatamente, ma anche raccogliere abbastanza dati sugli asiatici americani per trarre conclusioni precise.

Raccoglie un campione rappresentativo a livello nazionale, con 1500 intervistati, che sovracampiona gli asiatici americani. Per contattare le famiglie americane si usa la composizione casuale delle cifre, e i campioni sproporzionatamente più grandi sono presi dalle regioni con più asiatici americani. Dei 1500 intervistati, 336 sono asiatici americani. Sulla base di questa dimensione del campione, il ricercatore può essere sicuro dei suoi risultati sugli asiatici americani.

La ponderazione viene applicata per garantire che le risposte degli asiatici americani rappresentino il 5,6% del totale. Questo permette di ottenere stime accurate del campione nel suo complesso.

Domande frequenti sul bias di campionamento

Cos’è il campionamento?

Un campione è un sottoinsieme di individui di una popolazione più ampia. Campionare significa selezionare il gruppo da cui raccoglierai effettivamente i dati nella tua ricerca. Per esempio, se stai facendo una ricerca sulle opinioni degli studenti della tua università, potresti fare un sondaggio su un campione di 100 studenti.

In statistica, il campionamento ti permette di testare un’ipotesi sulle caratteristiche di una popolazione.

Cos’è il bias di campionamento?

L’errore di campionamento si verifica quando alcuni membri di una popolazione hanno sistematicamente più probabilità di essere selezionati in un campione rispetto ad altri.

Perché è importante l’errore di campionamento?

L’errore di campionamento è una minaccia alla validità esterna – limita la generalizzabilità dei tuoi risultati a un gruppo più ampio di persone.

Quali sono alcuni tipi di errore di campionamento?

Alcuni tipi comuni di distorsione del campionamento includono l’autoselezione, la non risposta, la sottocopertura, la sopravvivenza, il pre-screening o la pubblicità, e il bias dell’utente sano.

Come si evita la distorsione del campionamento?

Utilizzare un’attenta progettazione della ricerca e procedure di campionamento può aiutare a evitare gli errori di campionamento. Il sovracampionamento può essere usato per correggere il bias di sottocopertura.

Perché si usano i campioni nella ricerca?

I campioni sono usati per fare inferenze sulle popolazioni. I campioni sono più facili da raccogliere dati perché sono pratici, economici, convenienti e gestibili.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *