Autore: Trent Buskirk, PhD.
Come nella storia, nella letteratura, nella criminologia e in molte altre aree, il contesto è importante nella statistica. Sapere da dove provengono i tuoi dati ti dà indizi su cosa puoi fare con quei dati e quali deduzioni puoi trarne.
Nei campioni dei sondaggi il contesto è fondamentale perché ti informa su come il campione è stato selezionato e da quale popolazione è stato selezionato.
Non tutti i campioni selezionati sono semplici campioni casuali, quindi conoscere le informazioni sul disegno di campionamento fornisce il contesto necessario che permette ai ricercatori di creare stime adeguate e generare inferenze corrette e proiettabili.
Uno dei primissimi passi, quindi, nel lavorare con i dati dell’indagine è capire il disegno di campionamento. Ci sono alcuni concetti chiave che è necessario non solo comprendere in generale, ma anche definire nel proprio campione, al fine di fornire il contesto adeguato per calcolare le stime e trarre inferenze.
Il primo è l’unità di campionamento.
Questa è l’unità effettiva che includiamo nel nostro campione. Di solito questa unità si riferisce a una singola persona, ma potrebbe essere un’azienda, una scuola o un quartiere, a seconda di ciò che si sta misurando e di come lo si sta misurando.
Ora mettete le unità di campionamento nel loro giusto contesto e avrete il quadro del campione che consiste in un elenco di tutte le possibili unità di campionamento.
La popolazione target fornisce il contesto generale e rappresenta l’insieme di persone, unità abitative, scuole ecc. su cui si vogliono fare inferenze e stime.
In teoria, il quadro di campionamento coincide perfettamente con la popolazione target. Naturalmente, l’ideale non è sempre possibile. A volte la cornice sarà più grande o più piccola, a seconda dei modi pratici di entrare in contatto con ogni membro del campione.
Perché le cornici di campionamento sono così importanti
Diciamo che state facendo uno studio sulle opinioni degli adulti americani sui politici attuali.
Ovviamente, non avete i numeri di telefono di *tutti* gli adulti negli Stati Uniti. Ma siete in grado di ottenere un master frame di tutti i numeri di cellulare disponibili, che potete campionare usando la composizione casuale delle cifre.
La popolazione target (adulti americani) sarà in gran parte “coperta” dal frame di campionamento (quelli nelle banche dei cellulari).
Tuttavia, alcuni numeri di cellulare nella banca sono posseduti da bambini, che non fanno parte della popolazione target.
Allo stesso modo, gli adulti che possiedono solo un telefono fisso o nessun telefono non saranno coperti da questo quadro di campionamento.
Se questi adulti sono diversi in qualche modo da quelli che possiedono un telefono cellulare sui risultati della nostra indagine, allora potrebbe risultare un errore di selezione. In questo caso particolare, si chiama bias di copertura.
Potreste non avere un’opzione migliore per un quadro di campionamento o il quadro potrebbe essere stato deciso da qualcun altro prima che i dati fossero disponibili per voi. In ogni caso, è fondamentale sapere come è stato ottenuto il campione e come il quadro di campionamento potrebbe non aver coperto l’intera popolazione di riferimento.
Conoscere queste informazioni vi permette di ricavare stime statistiche ragionevoli e, cosa forse ancora più importante, vi permette di fare inferenze che possono essere messe nel giusto contesto.