Sampling bias występuje, gdy niektórzy członkowie populacji są systematycznie częściej wybierani do próby niż inni. W medycynie nazywane jest to również ascertainment bias.
Sampling bias ogranicza możliwość generalizacji wyników, ponieważ stanowi zagrożenie dla wiarygodności zewnętrznej, a konkretnie wiarygodności populacyjnej. Innymi słowy, wyniki badań z prób tendencyjnych mogą być uogólnione tylko na populacje, które mają cechy wspólne z próbą.
Przyczyny błędu doboru próby
Wybór projektu badawczego lub metody zbierania danych może prowadzić do błędu doboru próby. Skłonność do próbkowania może wystąpić zarówno w próbkowaniu probabilistycznym jak i nieprobabilistycznym.
Skłonność do próbkowania w próbkach probabilistycznych
W próbkowaniu probabilistycznym, każdy członek populacji ma znaną szansę bycia wybranym. Na przykład, można użyć generatora liczb losowych, aby wybrać prostą próbę losową z populacji.
Ale ta procedura zmniejsza ryzyko błędu losowego, ale może go nie wyeliminować. Jeśli operat losowania – rzeczywista lista osób, z których pobierana jest próba – nie pasuje do populacji, może to skutkować tendencyjnością próby.
Sampling bias w próbach nieprobabilistycznych
Próba nieprobabilistyczna jest wybierana na podstawie nielosowych kryteriów. Na przykład, w próbie dogodnej, uczestnicy są wybierani na podstawie dostępności i osiągalności.
Próba nieprobabilistyczna często skutkuje próbami tendencyjnymi, ponieważ niektórzy członkowie populacji mają większe szanse być włączeni do próby niż inni.
Typy błędu próby
Typ | Wyjaśnienie | Przykład |
---|---|---|
Self-selection | People with specific characteristics are more likely to agree to take part in a study than others. | Osoby, które są bardziej spragnione wrażeń, prawdopodobnie wezmą udział w badaniach nad bólem. Może to zniekształcić dane. |
Brak odpowiedzi | Osoby, które odmawiają udziału w badaniu lub rezygnują z niego, systematycznie różnią się od tych, które biorą w nim udział. | W badaniu dotyczącym stresu i obciążenia pracą pracownicy o dużym obciążeniu pracą rzadziej biorą udział. Próba wynikowa może nie różnić się zbytnio pod względem obciążenia pracą. |
Nieuwzględnienie | Niektórzy członkowie populacji są nieodpowiednio reprezentowani w próbie. | Administrowanie ogólnokrajowymi badaniami online może pominąć grupy z ograniczonym dostępem do Internetu, takie jak osoby starsze i gospodarstwa domowe o niższych dochodach. |
Przeżycia | Pomyślne obserwacje, ludzie i przedmioty są częściej reprezentowane w próbie niż te nieudane. | W czasopismach naukowych istnieje silna tendencja do publikowania pozytywnych wyników. Pomyślne wyniki badań są publikowane znacznie częściej niż wyniki zerowe. |
Kontrola wstępna lub reklama | Sposób, w jaki uczestnicy są poddawani kontroli wstępnej lub gdzie badanie jest reklamowane, może wpływać na tendencyjność próby. | Gdy poszukujesz ochotników do przetestowania nowej interwencji dotyczącej snu, możesz trafić na próbę, która jest bardziej zmotywowana do poprawy swoich nawyków związanych ze snem niż reszta populacji. W rezultacie mogą oni być skłonni do poprawy swoich nawyków związanych ze snem niezależnie od efektów interwencji. |
Zdrowy użytkownik | Wolontariusze interwencji profilaktycznych są bardziej skłonni do zachowań i działań prozdrowotnych niż inni członkowie populacji. | Próba w interwencji profilaktycznej ma lepszą dietę, wyższy poziom aktywności fizycznej, powstrzymuje się od alkoholu i unika palenia bardziej niż większość populacji. Wyniki eksperymentalne mogą być wynikiem interakcji leczenia z tymi cechami próbki, a nie tylko samego leczenia. |
Jak uniknąć lub skorygować tendencyjność próbkowania
Używanie starannego projektu badań i procedur próbkowania może pomóc w uniknięciu tendencyjności próbkowania.
- Zdefiniuj populację docelową i operat losowania (listę osób, z których zostanie wylosowana próba). Dopasuj operat losowania do populacji docelowej tak bardzo, jak to możliwe, aby zredukować ryzyko błędu losowania.
- Uczyń ankiety online tak krótkimi i przystępnymi, jak to tylko możliwe.
- Śledź osoby, które nie odpowiedziały na ankietę.
- Unikaj wygodnego doboru próby.
Powtórny dobór próby w celu uniknięcia błędu systematycznego
Powtórny dobór próby może być stosowany w celu uniknięcia błędu systematycznego w sytuacjach, gdy członkowie określonych grup są niedoreprezentowani (undercoverage). Jest to metoda wyboru respondentów z niektórych grup tak, aby stanowili oni większy udział w próbie niż w populacji.
Po zebraniu wszystkich danych, odpowiedzi z nadpróbkowanych grup są ważone do ich rzeczywistego udziału w populacji, aby usunąć wszelkie błędy w doborze próby.
Często zadawane pytania dotyczące błędu doboru próby
Próbka to podzbiór osób z większej populacji. Dobór próby oznacza wybór grupy, z której faktycznie zbierane będą dane w badaniach. Na przykład, jeśli badasz opinie studentów na swojej uczelni, możesz przeprowadzić ankietę na próbie 100 studentów.
W statystyce, dobór próby pozwala na testowanie hipotezy dotyczącej cech populacji.
Sampling bias występuje wtedy, gdy niektórzy członkowie populacji są systematycznie częściej wybierani do próby niż inni.
Sampling bias stanowi zagrożenie dla wiarygodności zewnętrznej – ogranicza możliwość uogólnienia wyników badań na szerszą grupę osób.
Kilka typowych rodzajów błędu doboru próby obejmuje samoselekcję, brak odpowiedzi, niedostateczne pokrycie, przetrwanie, wstępne badania lub reklamę oraz błąd zdrowego użytkownika.
Używanie starannego projektu badania i procedur doboru próby może pomóc w uniknięciu błędu doboru próby. Nadpróbkowanie może być wykorzystane do skorygowania błędu niedostatecznego pokrycia.
Próbki są wykorzystywane do wnioskowania o populacjach. Próbki są łatwiejsze do zbierania danych, ponieważ są praktyczne, opłacalne, wygodne i możliwe do zarządzania.