Bez ohľadu na použitú metodiku alebo skúmanú disciplínu musia výskumníci zabezpečiť, aby používali reprezentatívne vzorky, ktoré odrážajú charakteristiky skúmanej populácie. V tomto článku sa budeme zaoberať konceptom výberového skreslenia, jeho rôznymi typmi a spôsobmi uplatňovania a osvedčenými postupmi na zmiernenie jeho účinkov.
Čo je to skreslenie výberu vzorky?
Skreslenie výberu vzorky sa vzťahuje na situáciu, keď sú niektorí jednotlivci alebo skupiny v populácii s väčšou pravdepodobnosťou zahrnutí do vzorky ako ostatní, čo vedie k skresleniu alebo nereprezentatívnosti vzorky. Môže k tomu dôjsť z rôznych dôvodov, ako sú napríklad nenáhodné metódy výberu vzorky, skreslenie vlastného výberu alebo skreslenie výskumníka.
Inými slovami, skreslenie výberu môže narušiť platnosť a zovšeobecniteľnosť výsledkov výskumu tým, že vzorka je skreslená v prospech určitých charakteristík alebo hľadísk, ktoré nemusia byť reprezentatívne pre väčšiu populáciu.
V ideálnom prípade musíte všetkých účastníkov prieskumu vybrať náhodným spôsobom. V praxi však môže byť ťažké urobiť náhodný výber účastníkov kvôli obmedzeniam, ako sú náklady a dostupnosť respondentov. Aj keď nerobíte náhodný výber údajov, je nevyhnutné uvedomiť si potenciálne skreslenia, ktoré by sa mohli vyskytnúť vo vašich údajoch.
Medzi príklady skreslenia výberu vzorky patria:
- Predpojatosť dobrovoľníkov: Účastníci, ktorí sa dobrovoľne zúčastnia na štúdii, môžu mať iné charakteristiky ako tí, ktorí sa dobrovoľne nezúčastnia, čo vedie k nereprezentatívnej vzorke.
- Nenáhodný výber vzoriek: Ak výskumník vyberá účastníkov len z určitých miest alebo len účastníkov s určitými charakteristikami, môže to viesť k neobjektívnej vzorke.
- Predsudok o prežití: K tomu dochádza vtedy, keď vzorka zahŕňa len jednotlivcov, ktorí prežili alebo uspeli v určitej situácii, pričom sa vynechajú tí, ktorí neprežili alebo neuspeli.
- Výhodný odber vzoriek: Tento typ výberu vzorky zahŕňa výber ľahko dostupných účastníkov, napríklad tých, ktorí sa nachádzajú v blízkosti, alebo tých, ktorí odpovedajú na online prieskum, čo nemusí reprezentovať väčšiu populáciu.
- Potvrdzujúca zaujatosť: Výskumníci môžu nevedome alebo zámerne vybrať účastníkov, ktorí podporujú ich hypotézu alebo výskumnú otázku, čo vedie k neobjektívnym výsledkom.
- Hawthornov efekt: Účastníci môžu zmeniť svoje správanie alebo odpovede, keď vedia, že sú skúmaní alebo pozorovaní, čo vedie k nereprezentatívnym výsledkom.
Ak ste si vedomí týchto skreslení, môžete ich zohľadniť v analýze, aby ste vykonali korekciu skreslenia a lepšie pochopili populáciu, ktorú vaše údaje reprezentujú.
Typy skreslenia výberu vzorky
- Predpojatosť pri výbere: nastáva vtedy, keď vzorka nie je reprezentatívna pre populáciu.
- Skreslenie merania: nastáva vtedy, keď sú zozbierané údaje nepresné alebo neúplné.
- Predpojatosť pri podávaní správ: nastáva vtedy, keď respondenti poskytnú nepresné alebo neúplné informácie.
- Neodpovedanie na otázky: nastáva vtedy, keď niektorí členovia populácie na prieskum neodpovedajú, čo vedie k nereprezentatívnej vzorke.
Príčiny skreslenia výberu vzorky
- Výhodný odber vzoriek: výber vzorky na základe výhodnosti namiesto použitia vedeckej metódy.
- Predpojatosť vlastného výberu: do prieskumu sú zahrnutí len tí, ktorí sa ho dobrovoľne zúčastnili, čo nemusí byť reprezentatívne pre celú populáciu.
- Skreslenie výberového rámca: keď výberový súbor použitý na výber vzorky nie je reprezentatívny pre populáciu.
- Predsudok o prežití: keď sa na prieskume zúčastňujú len niektorí členovia populácie, čo vedie k nereprezentatívnej vzorke. Napríklad, ak výskumníci robia prieskum len u žijúcich ľudí, nemusia získať informácie od ľudí, ktorí zomreli pred uskutočnením štúdie.
- Skreslenie výberu vzorky v dôsledku nedostatočných znalostí: nerozpoznanie zdrojov variability, ktoré môžu viesť k skresleným odhadom.
- Skreslenie výberu vzorky v dôsledku chýb pri podávaní vzorky: nepoužitie vhodného alebo dobre fungujúceho rámca výberu vzorky alebo odmietnutie účasti na štúdii vedúce k neobjektívnemu výberu vzorky.
Predpojatosť pri výbere vzorky v klinických skúškach
Klinické skúšky slúžia na testovanie účinnosti novej liečby alebo liekov na konkrétnej populácii. Sú dôležitou súčasťou procesu vývoja liekov a určujú, či je liečba bezpečná a účinná pred jej uvoľnením pre širokú verejnosť. Klinické skúšky sú však tiež náchylné na výberové skreslenie.
K výberovému skresleniu dochádza vtedy, keď vzorka použitá na štúdiu nie je reprezentatívna pre populáciu, ktorú má reprezentovať. V prípade klinických štúdií sa výberové skreslenie môže vyskytnúť, keď sú účastníci buď selektívne vybraní na účasť, alebo sú vybraní sami.
Povedzme, že farmaceutická spoločnosť vykonáva klinické skúšanie s cieľom otestovať účinnosť nového lieku proti rakovine. Rozhodne sa na štúdiu získavať účastníkov prostredníctvom inzerátov v nemocniciach, na klinikách a v podporných skupinách pre liečbu rakoviny, ako aj prostredníctvom online žiadostí. Vzorka, ktorú zhromažďujú, však môže byť zaujatá tými, ktorí sú viac motivovaní zúčastniť sa na skúške alebo ktorí majú určitý typ rakoviny. To môže sťažiť zovšeobecnenie výsledkov štúdie na väčšiu populáciu.
Aby sa minimalizovalo skreslenie výberu v klinických štúdiách, výskumníci musia zaviesť prísne kritériá zaradenia a vylúčenia a postupy náhodného výberu. Tým sa zabezpečí, že vzorka účastníkov vybraných do štúdie je reprezentatívna pre väčšiu populáciu, čím sa minimalizuje akékoľvek skreslenie zozbieraných údajov.
Problémy spôsobené skreslením výberu vzorky
Výberové skreslenie je problematické, pretože je možné, že štatistika vypočítaná zo vzorky je systematicky chybná. Môže to viesť k systematickému nadhodnoteniu alebo podhodnoteniu príslušného parametra v populácii. Vyskytuje sa v praxi, pretože prakticky nie je možné zabezpečiť dokonalú náhodnosť pri výbere vzorky.
Ak je miera skreslenia malá, vzorku možno považovať za primeranú aproximáciu náhodnej vzorky. Okrem toho, ak sa vzorka výrazne nelíši v meranej veličine, potom môže byť skreslená vzorka stále primeraným odhadom.
Hoci niektorí jednotlivci môžu zámerne použiť neobjektívnu vzorku, aby dosiahli zavádzajúce výsledky, častejšie je neobjektívna vzorka len odrazom ťažkostí pri získavaní skutočne reprezentatívnej vzorky alebo neznalosti neobjektívnosti v ich procese merania alebo analýzy.
Extrapolácia: mimo rozsahu
V štatistike sa vyvodzovanie záverov o niečom, čo presahuje rozsah údajov, nazýva extrapolácia. Vyvodzovanie záverov zo skreslenej vzorky je jednou z foriem extrapolácie: keďže metóda výberu vzorky systematicky vylučuje určité časti skúmanej populácie, závery sa vzťahujú len na vybranú subpopuláciu.
K extrapolácii dochádza aj vtedy, ak sa napríklad záver založený na vzorke vysokoškolákov aplikuje na starších dospelých alebo na dospelých, ktorí majú len osemročné vzdelanie. Extrapolácia je bežnou chybou pri uplatňovaní alebo interpretácii štatistiky. Niekedy je extrapolácia kvôli ťažkostiam alebo nemožnosti získať kvalitné údaje to najlepšie, čo môžeme urobiť, ale vždy ju treba brať aspoň s rezervou - a často s veľkou dávkou neistoty
Z vedy do pseudovedy
Ako sa uvádza vo Wikipédii, príkladom toho, ako môže existovať neznalosť zaujatosti, je rozšírené používanie pomeru (tzv. fold change) ako miery rozdielu v biológii. Keďže je ľahšie dosiahnuť veľký pomer pri dvoch malých číslach s daným rozdielom a relatívne ťažšie dosiahnuť veľký pomer pri dvoch veľkých číslach s väčším rozdielom, pri porovnávaní relatívne veľkých číselných meraní sa môžu prehliadnuť veľké významné rozdiely.
Niektorí to nazývajú "demarkačným skreslením", pretože použitie pomeru (delenia) namiesto rozdielu (odčítania) posúva výsledky analýzy z vedy do pseudovedy.
Niektoré vzorky používajú skreslený štatistický dizajn, ktorý však umožňuje odhad parametrov. Napríklad Národné centrum pre zdravotnú štatistiku USA v mnohých svojich celoštátnych prieskumoch zámerne vyberá nadmerné vzorky menšinového obyvateľstva, aby dosiahlo dostatočnú presnosť odhadov v rámci týchto skupín.
Tieto prieskumy si vyžadujú použitie vážených vzoriek, aby sa dosiahli správne odhady vo všetkých etnických skupinách. Ak sú splnené určité podmienky (najmä ak sú váhy vypočítané a použité správne), tieto vzorky umožňujú presný odhad parametrov populácie.
Osvedčené postupy na zmiernenie skreslenia výberu vzorky
Je veľmi dôležité zvoliť vhodnú metódu výberu vzorky, aby výsledné údaje presne odrážali skúmanú populáciu.
- Techniky náhodného výberu vzoriek: Použitie techník náhodného výberu vzorky zvyšuje pravdepodobnosť, že vzorka je reprezentatívna pre populáciu. Táto technika pomáha zabezpečiť, aby vzorka bola čo najreprezentatívnejšia pre danú populáciu, a teda aby bola menej pravdepodobná jej neobjektívnosť.
- Výpočet veľkosti vzorky: Výpočet veľkosti vzorky by sa mal vykonať tak, aby bola k dispozícii primeraná sila na testovanie štatisticky významných hypotéz. Čím väčšia je veľkosť vzorky, tým lepšie je zastúpená populácia.
- Analýza trendov: Hľadanie alternatívnych zdrojov údajov a analýza všetkých pozorovaných trendov v údajoch, ktoré môžu byť nevybrané.
- Kontrola zaujatosti: Výskyt zaujatosti by sa mal monitorovať s cieľom identifikovať systematické vylučovanie alebo nadmerné zahrnutie konkrétnych údajov.
Pozor na vzorky
Skreslenie výberu vzorky je významným faktorom pri vykonávaní výskumu. Bez ohľadu na použitú metodiku alebo skúmanú disciplínu musia výskumníci zabezpečiť, aby používali reprezentatívne vzorky, ktoré odrážajú charakteristiky skúmanej populácie.
Pri tvorbe výskumných štúdií je nevyhnutné venovať veľkú pozornosť procesu výberu vzorky, ako aj metodike použitej na zber údajov zo vzorky. Mali by sa používať osvedčené postupy, ako sú techniky náhodného výberu vzoriek, výpočet veľkosti vzorky, analýza trendov a kontrola zaujatosti, aby sa zabezpečilo, že výsledky výskumu budú platné a spoľahlivé, čím sa zvýši pravdepodobnosť, že ovplyvnia politiku a prax.
Pútavé vedecké infografiky za pár minút
Mind the Graph je výkonný online nástroj pre vedcov, ktorí potrebujú vytvárať vysokokvalitnú vedeckú grafiku a ilustrácie. Platforma je užívateľsky prívetivá a prístupná vedcom s rôznou úrovňou technických znalostí, takže je ideálnym riešením pre výskumníkov, ktorí potrebujú vytvárať grafiku pre svoje publikácie, prezentácie a iné vedecké komunikačné materiály.
Či už ste výskumník v oblasti prírodných, fyzikálnych alebo technických vied, Mind the Graph ponúka širokú škálu zdrojov, ktoré vám pomôžu zrozumiteľne a vizuálne presvedčivo komunikovať výsledky vášho výskumu.
Prihláste sa na odber nášho newslettera
Exkluzívny vysokokvalitný obsah o efektívnom vizuálnom
komunikácia vo vede.