Незалежно від використовуваної методології або досліджуваної дисципліни, дослідники повинні переконатися, що вони використовують репрезентативні вибірки, які відображають характеристики популяції, яку вони вивчають. У цій статті ми розглянемо поняття похибки вибірки, її різні типи та способи застосування, а також найкращі практики для пом'якшення її наслідків.
Що таке зміщення вибірки?
Упередженість вибірки - це ситуація, коли певні особи або групи населення мають більше шансів потрапити до вибірки, ніж інші, що призводить до упередженості або нерепрезентативності вибірки. Це може статися з різних причин, наприклад, через невипадковість методів відбору, упередженість самовідбору або упередженість дослідника.
Іншими словами, упередженість вибірки може підірвати достовірність та узагальнюваність результатів дослідження, оскільки вибірка зміщується на користь певних характеристик або поглядів, які можуть не бути репрезентативними для більшої частини населення.
В ідеалі всі учасники опитування мають бути відібрані випадковим чином. Однак на практиці може бути важко здійснити випадковий відбір учасників через такі обмеження, як вартість і доступність респондентів. Навіть якщо ви не збираєте дані у випадковому порядку, важливо пам'ятати про потенційні упередження, які можуть бути присутніми у ваших даних.
Деякі приклади зміщення вибірки включають
- Упереджене ставлення до волонтерів: Учасники, які добровільно беруть участь у дослідженні, можуть мати інші характеристики, ніж ті, хто не є добровільними, що призводить до нерепрезентативності вибірки.
- Невипадкова вибірка: Якщо дослідник відбирає учасників тільки з певних місць або тільки з певними характеристиками, це може призвести до упередженої вибірки.
- Упередженість щодо виживання: Це відбувається, коли до вибірки включаються лише ті особи, які вижили або досягли успіху в певній ситуації, не враховуючи тих, хто не вижив або зазнав невдачі.
- Зручний відбір проб: Цей тип вибірки передбачає відбір легкодоступних учасників, наприклад, тих, хто опинився поруч, або тих, хто відповів на онлайн-опитування, що може не репрезентувати більшу частину населення.
- Упередженість підтвердження: Дослідники можуть відбирати - несвідомо чи свідомо - учасників, які підтримують їхню гіпотезу або дослідницьке питання, що призводить до упереджених результатів.
- Ефект Готорна: Учасники можуть змінювати свою поведінку або відповіді, коли знають, що їх вивчають або спостерігають, що може призвести до нерепрезентативних результатів.
Якщо ви знаєте про ці упередження, ви можете врахувати їх під час аналізу, щоб зробити корекцію упереджень і краще зрозуміти групу населення, яку представляють ваші дані.
Типи зміщення вибірки
- Упередженість відбору: виникає, коли вибірка не є репрезентативною для населення.
- Упередженість вимірювання: виникає, коли зібрані дані є неточними або неповними.
- Упередженість у висвітленні подійПомилка: виникає, коли респонденти надають неточну або неповну інформацію.
- Упередженість щодо відсутності відповідейНепредставницька вибірка: виникає, коли частина населення не відповідає на опитування, що призводить до нерепрезентативності вибірки.
Причини зміщення вибірки
- Зручний відбір пробвибір вибірки на основі зручності, а не використання наукового методу.
- Упередженість щодо самовиборудо опитування включаються лише ті, хто добровільно погодився взяти участь в опитуванні, що може не бути репрезентативним для населення.
- Зсув вибіркової сукупностіколи вибіркова сукупність, що використовується для відбору вибірки, не є репрезентативною для населення.
- Упередженість щодо виживанняколи в дослідженні беруть участь лише певні члени населення, що призводить до нерепрезентативності вибірки. Наприклад, якщо дослідники опитують лише живих людей, вони можуть не отримати інформацію від людей, які померли до проведення дослідження.
- Упередженість вибірки через брак знаньнездатність розпізнати джерела мінливості, що може призвести до упереджених оцінок.
- Зсув вибірки через помилки в адмініструванні вибіркиНевикористання належної або добре функціонуючої основи вибірки або відмова від участі в дослідженні, що призводить до упередженого відбору вибірки.
Упередженість вибірки в клінічних дослідженнях
Клінічні випробування відповідають за перевірку ефективності нового методу лікування або ліків на певній групі населення. Вони є невід'ємною частиною процесу розробки ліків і визначають, чи є лікування безпечним та ефективним, перш ніж його випустять на широкий загал. Однак клінічні випробування також схильні до упередженого відбору.
Похибка відбору виникає, коли вибірка, що використовується для дослідження, не є репрезентативною для популяції, яку вона має репрезентувати. У випадку клінічних випробувань похибка відбору може виникнути, коли учасників або вибірково відбирають для участі, або вони самі обирають собі учасників.
Уявімо, що фармацевтична компанія проводить клінічне дослідження для перевірки ефективності нових ліків від раку. Вона вирішує набрати учасників дослідження за допомогою оголошень у лікарнях, клініках та групах підтримки онкохворих, а також через онлайн-заявки. Однак зібрана вибірка може бути упередженою щодо тих, хто більш вмотивований брати участь у дослідженні або має певний тип раку. Це може ускладнити узагальнення результатів дослідження на більшу кількість населення.
Щоб мінімізувати упередженість відбору в клінічних випробуваннях, дослідники повинні застосовувати суворі критерії включення і виключення та випадкові процеси відбору. Це гарантує, що вибірка учасників, відібраних для дослідження, буде репрезентативною для всієї популяції, мінімізуючи будь-яку упередженість у зібраних даних.
Проблеми через зміщення вибірки
Зсув вибірки є проблематичним, оскільки існує ймовірність того, що статистика, обчислена за вибіркою, є систематично помилковою. Це може призвести до систематичного завищення або заниження відповідного параметра в генеральній сукупності. Це відбувається на практиці, оскільки практично неможливо забезпечити ідеальну випадковість вибірки.
Якщо ступінь викривлення невеликий, то вибірку можна розглядати як розумне наближення до випадкової вибірки. Крім того, якщо вибірка не відрізняється помітно за величиною, що вимірюється, то зміщена вибірка все одно може бути розумною оцінкою.
Хоча деякі особи можуть навмисно використовувати упереджену вибірку для отримання оманливих результатів, частіше за все, упереджена вибірка є лише відображенням труднощів в отриманні справді репрезентативної вибірки або незнання упередженості в процесі вимірювання чи аналізу.
Екстраполяція: за межами діапазону
У статистиці висновок про щось, що виходить за межі даних, називається екстраполяцією. Однією з форм екстраполяції є висновок на основі упередженої вибірки: оскільки метод вибірки систематично виключає певні частини досліджуваної сукупності, висновки стосуються лише відібраної підгрупи населення.
Екстраполяція також відбувається, якщо, наприклад, висновок, зроблений на основі вибірки студентів університету, застосовується до людей старшого віку або до дорослих, які мають лише восьмирічну освіту. Екстраполяція є поширеною помилкою при застосуванні або інтерпретації статистичних даних. Іноді, через складність або неможливість отримання якісних даних, екстраполяція - це найкраще, що ми можемо зробити, але до неї завжди потрібно ставитися з обережністю - і часто з великою дозою невизначеності
Від науки до псевдонауки
Як зазначено у ВікіпедіїПрикладом того, як може існувати незнання про упередженість, є широке використання співвідношення (так званої "складової зміни") як міри різниці в біології. Оскільки легше досягти великого співвідношення з двома малими числами з заданою різницею, і відносно складніше досягти великого співвідношення з двома великими числами з більшою різницею, великі значні відмінності можуть бути пропущені при порівнянні відносно великих числових вимірювань.
Дехто називає це "демаркаційним упередженням", оскільки використання відношення (ділення) замість різниці (віднімання) переводить результати аналізу з науки в псевдонауку.
Деякі вибірки використовують зміщений статистичний дизайн, який, тим не менш, дозволяє оцінити параметри. Наприклад, Національний центр статистики охорони здоров'я США навмисно збільшує вибірку меншин у багатьох своїх загальнонаціональних опитуваннях, щоб отримати достатню точність для оцінок у цих групах.
Ці дослідження вимагають використання вагових коефіцієнтів вибірки для отримання належних оцінок для всіх етнічних груп. За дотримання певних умов (головним чином, правильного розрахунку та використання вагових коефіцієнтів) ці вибірки дають змогу точно оцінити параметри генеральної сукупності.
Найкращі практики для зменшення похибки вибірки
Дуже важливо вибрати відповідний метод вибірки, щоб гарантувати, що отримані дані точно відображають досліджувану популяцію.
- Методи випадкової вибірки: Використання методів випадкового відбору підвищує ймовірність того, що вибірка буде репрезентативною для населення. Цей метод допомагає гарантувати, що вибірка є максимально репрезентативною для досліджуваної сукупності, а отже, з меншою ймовірністю міститиме упередження.
- Розрахунок обсягу вибірки: Розрахунок обсягу вибірки повинен здійснюватися таким чином, щоб забезпечити достатню потужність для перевірки статистично значущих гіпотез. Чим більший обсяг вибірки, тим краще вона репрезентує населення.
- Аналіз тенденцій: Пошук альтернативних джерел даних та аналіз будь-яких спостережуваних тенденцій у даних, які можуть бути невибраними.
- Перевірка на упередженість: Випадки упередженості слід відстежувати, щоб виявити систематичне виключення або надмірне включення конкретних точок даних.
Обережно, зразки
Упередженість вибірки є важливим фактором при проведенні досліджень. Незалежно від використовуваної методології або досліджуваної дисципліни, дослідники повинні переконатися, що вони використовують репрезентативні вибірки, які відображають характеристики популяції, яку вони вивчають.
При створенні наукових досліджень дуже важливо приділяти пильну увагу процесу відбору вибірки, а також методології, яка використовується для збору даних з цієї вибірки. Найкращі практики, такі як методи випадкової вибірки, розрахунок обсягу вибірки, аналіз тенденцій та перевірка на упередженість, повинні використовуватися для того, щоб результати дослідження були достовірними та надійними, а отже, з більшою ймовірністю впливати на політику та практику.
Приваблива наукова інфографіка за лічені хвилини
Mind the Graph це потужний онлайн-інструмент для науковців, які потребують створення високоякісної наукової графіки та ілюстрацій. Платформа зручна у використанні та доступна для науковців з різним рівнем технічної підготовки, що робить її ідеальним рішенням для дослідників, які потребують створення графіки для своїх публікацій, презентацій та інших наукових комунікаційних матеріалів.
Незалежно від того, чи є ви дослідником в галузі наук про життя, фізичних наук або інженерії, Mind the Graph пропонує широкий спектр ресурсів, які допоможуть вам представити результати ваших досліджень у зрозумілій та візуально переконливій формі.
Підпишіться на нашу розсилку
Ексклюзивний високоякісний контент про ефективну візуальну
комунікація в науці.