Независимо от използваната методология или изучаваната дисциплина, изследователите трябва да гарантират, че използват представителни извадки, които отразяват характеристиките на изследваната популация. В тази статия ще бъде разгледана концепцията за пристрастност на извадката, различните видове и начини на нейното прилагане, както и най-добрите практики за смекчаване на последиците от нея.
Какво представлява отклонението на извадката?
Пристрастността на извадката се отнася до ситуация, при която определени лица или групи от населението е по-вероятно да бъдат включени в извадката, отколкото други, което води до пристрастна или непредставителна извадка. Това може да се случи по различни причини, като например неслучайни методи за подбор на извадка, пристрастие към самоизбора или пристрастие на изследователя.
С други думи, отклонението от извадката може да подкопае валидността и обобщаването на резултатите от изследването, като изкриви извадката в полза на определени характеристики или гледни точки, които може да не са представителни за по-голямата популация.
В идеалния случай трябва да изберете всички участници в проучването на случаен принцип. На практика обаче може да се окаже трудно да се направи случаен подбор на участниците поради ограничения като разходи и наличност на респонденти. Дори и да не извършвате случайно събиране на данни, изключително важно е да сте наясно с потенциалните отклонения, които биха могли да присъстват в данните ви.
Някои примери за грешка при формирането на извадката включват:
- Пристрастност на доброволците: Участниците, които доброволно се съгласяват да участват в дадено проучване, може да имат различни характеристики от тези, които не се съгласяват, което води до непредставителна извадка.
- Неслучайна извадка: Ако изследователят подбира участници само от определени места или само участници с определени характеристики, това може да доведе до необективна извадка.
- Предразсъдъци относно преживяемостта: Това се случва, когато извадката включва само лица, които са оцелели или са успели в определена ситуация, като се пропускат тези, които не са оцелели или не са успели.
- Удобно вземане на проби: Този вид извадка включва избор на леснодостъпни участници, като например тези, които се намират наблизо, или тези, които отговарят на онлайн проучване, което може да не представлява по-голяма част от населението.
- Пристрастие към потвърждаване: Изследователите могат да подберат - несъзнателно или умишлено - участници, които подкрепят тяхната хипотеза или изследователски въпрос, което води до необективни резултати.
- Ефектът на Хоторн: Участниците могат да променят поведението или отговорите си, когато знаят, че са обект на изследване или наблюдение, което води до непредставителни резултати.
Ако сте наясно с тези отклонения, можете да ги вземете предвид при анализа, за да коригирате отклоненията и да разберете по-добре популацията, която представляват вашите данни.
Видове отклонения на извадката
- Изкривяване на подбора: възниква, когато извадката не е представителна за популацията.
- Измервателна грешка: възниква, когато събраните данни са неточни или непълни.
- Пристрастност при докладването: възниква, когато респондентите предоставят неточна или непълна информация.
- Пристрастност при липса на отговор: възниква, когато някои членове на населението не отговарят на проучването, което води до непредставителна извадка.
Причини за отклонението на извадката
- Удобно вземане на проби: подбор на извадка въз основа на удобство, а не чрез използване на научен метод.
- Пристрастие към самоизбора: включени са само тези, които доброволно са участвали в проучването, което може да не е представително за населението.
- Изкривяване на рамката на извадката: когато рамката на извадката, използвана за избор на извадката, не е представителна за популацията.
- Пристрастие към оцеляването: когато участват само някои членове на населението, което води до непредставителна извадка. Например, ако изследователите анкетират само живи хора, те може да не получат информация от хора, които са починали преди провеждането на проучването.
- Изкривяване на извадката поради липса на знания: да не се разпознават източниците на променливост, които могат да доведат до изкривяване на оценките.
- Изкривяване на извадката, дължащо се на грешки при управлението на извадката: неизползване на подходяща или добре функционираща рамка на извадката или отказ от участие в проучването, което води до необективен подбор на извадката.
Изкривяване на извадката при клинични изпитвания
Клиничните изпитвания са предназначени за проверка на ефективността на ново лечение или медикамент върху определена група от населението. Те са съществена част от процеса на разработване на лекарства и определят дали дадено лечение е безопасно и ефективно, преди да бъде пуснато в продажба на широката общественост. Клиничните изпитвания обаче също са податливи на отклонения в подбора.
Изкривяване на подбора възниква, когато извадката, използвана за дадено проучване, не е представителна за популацията, която трябва да се представи. При клиничните изпитвания отклонението в подбора може да възникне, когато участниците са избрани да участват или са самоизбрани.
Да кажем, че фармацевтична компания провежда клинично изпитване, за да провери ефикасността на ново лекарство за лечение на рак. Тя решава да набере участници в проучването чрез реклами в болници, клиники и групи за подкрепа на болни от рак, както и чрез онлайн заявления. Въпреки това извадката, която събират, може да е предубедена към тези, които са по-мотивирани да участват в изпитването или които имат определен вид рак. Това може да затрудни обобщаването на резултатите от проучването за по-голямата част от населението.
За да се сведе до минимум отклонението при подбора в клиничните изпитвания, изследователите трябва да прилагат строги критерии за включване и изключване и процеси на случаен подбор. Това ще гарантира, че извадката от участници, подбрани за проучването, е представителна за по-голямата популация, като се свежда до минимум всякакво отклонение в събраните данни.
Проблеми, дължащи се на отклонението на извадката
Пристрастността на извадката е проблематична, тъй като е възможно статистиката, изчислена на базата на извадката, да е систематично погрешна. Това може да доведе до систематично надценяване или подценяване на съответния параметър в популацията. Това се случва на практика, тъй като на практика е невъзможно да се осигури съвършена случайност при извадката.
Ако степента на неправилно представяне е малка, извадката може да се разглежда като разумно приближение до случайна извадка. Освен това, ако извадката не се различава значително по отношение на измерваната величина, тогава една предубедена извадка все още може да бъде разумна оценка.
Макар че някои хора могат умишлено да използват необективна извадка, за да получат подвеждащи резултати, по-често необективната извадка е просто отражение на трудностите при получаването на наистина представителна извадка или на незнанието за необективността в процеса на измерване или анализ.
Екстраполация: извън обхвата
В статистиката правенето на заключение за нещо извън обхвата на данните се нарича екстраполация. Една от формите на екстраполация е извеждането на заключение от предубедена извадка: тъй като методът на извадката систематично изключва определени части от разглежданата популация, изводите се отнасят само за подпопулацията, включена в извадката.
Екстраполация се получава и когато например извод, основан на извадка от студенти, се прилага към по-възрастни хора или към възрастни с образование само от осми клас. Екстраполацията е често срещана грешка при прилагането или тълкуването на статистиката. Понякога, поради трудността или невъзможността да се получат добри данни, екстраполацията е най-доброто, което можем да направим, но тя винаги трябва да се приема поне с известна доза сол, а често и с голяма доза несигурност.
От наука към псевдонаука
Както е посочено в Уикипедия, пример за това как може да съществува незнание за пристрастие е широко разпространеното използване на съотношението (известно още като "fold change") като мярка за разликата в биологията. Тъй като е по-лесно да се постигне голямо съотношение с две малки числа с дадена разлика и сравнително по-трудно да се постигне голямо съотношение с две големи числа с по-голяма разлика, при сравняване на сравнително големи числови измервания могат да се пропуснат големи значителни разлики.
Някои наричат това "демаркационно отклонение", тъй като използването на съотношение (деление) вместо на разлика (изваждане) превръща резултатите от анализа от наука в псевдонаука.
При някои извадки се използва необективен статистически дизайн, който обаче позволява оценяване на параметрите. Например Националният център за здравна статистика на САЩ умишлено прави прекалено големи извадки от малцинствата в много от своите национални проучвания, за да постигне достатъчна прецизност на оценките в рамките на тези групи.
Тези проучвания изискват използването на извадкови тегла, за да се получат правилни оценки за всички етнически групи. Ако са изпълнени определени условия (най-вече ако теглата са изчислени и използвани правилно), тези извадки позволяват точна оценка на параметрите на населението.
Най-добри практики за намаляване на отклоненията в извадката
От решаващо значение е да се избере подходящ метод на извадка, за да се гарантира, че получените данни отразяват точно изследваната съвкупност.
- Техники за вземане на случайни извадки: Използването на техники за случайна извадка увеличава вероятността извадката да е представителна за популацията. Тази техника помага да се гарантира, че извадката е възможно най-представителна за въпросната популация и по този начин е по-малко вероятно да съдържа предубеждения.
- Изчисляване на размера на извадката: Изчисляването на размера на извадката трябва да се извърши така, че да е налице достатъчна сила за проверка на статистически значими хипотези. Колкото по-голям е размерът на извадката, толкова по-добре е представена популацията.
- Анализ на тенденциите: Търсене на алтернативни източници на данни и анализиране на всички наблюдавани тенденции в данните, които може да не са избрани.
- Проверка за предубеденост: Случаите на пристрастие трябва да се наблюдават, за да се установи системно изключване или прекомерно включване на определени точки от данни.
Обърнете внимание на пробите
Изкривяването на извадката е важен фактор при провеждането на изследвания. Независимо от използваната методология или изучаваната дисциплина, изследователите трябва да гарантират, че използват представителни извадки, които отразяват характеристиките на изследваната популация.
При създаването на изследователски проучвания е изключително важно да се обърне специално внимание на процеса на подбор на извадката, както и на методологията, използвана за събиране на данни от извадката. Трябва да се използват най-добрите практики, като например техники за случайна извадка, изчисляване на размера на извадката, анализ на тенденциите и проверка за отклонения, за да се гарантира, че резултатите от изследванията са валидни и надеждни, като по този начин се увеличава вероятността те да повлияят на политиката и практиката.
Привличащи вниманието научни инфографики за минути
Mind the Graph е мощен онлайн инструмент за учени, които трябва да създават висококачествени научни графики и илюстрации. Платформата е лесна за използване и достъпна за учени с различни нива на технически познания, което я прави идеално решение за изследователи, които трябва да създават графики за своите публикации, презентации и други материали за научна комуникация.
Независимо дали сте изследовател в областта на природните, физическите или инженерните науки, Mind the Graph предлага широк набор от ресурси, които да ви помогнат да съобщите резултатите от изследванията си по ясен и визуално привлекателен начин.
Абонирайте се за нашия бюлетин
Ексклузивно висококачествено съдържание за ефективни визуални
комуникация в областта на науката.