Regressioonanalüüs on lähenemisviis ühe või mitme sõltumatu muutuja ja sõltuva muutuja vahelise seose kindlakstegemiseks ja analüüsimiseks. Seda meetodit kasutatakse laialdaselt mitmetes valdkondades, sealhulgas tervishoius, sotsiaalteadustes, inseneriteadustes, majanduses ja äris. Regressioonanalüüsi abil saate uurida andmete põhilisi seoseid ja töötada välja prognoosimudelid, mis aitavad teil teha teadlikke otsuseid.
See artikkel annab teile põhjaliku ülevaate regressioonanalüüsist, sealhulgas selle toimimisest, lihtsasti mõistetava näite ja selgitab, kuidas see erineb korrelatsioonianalüüsist.
Mis on regressioonanalüüs?
Regressioonanalüüs on statistiline meetod sõltuva muutuja ja ühe või mitme sõltumatu muutuja vahelise seose kindlakstegemiseks ja kvantifitseerimiseks. Lühidalt öeldes aitab see mõista, kuidas ühe või mitme sõltumatu muutuja muutused on seotud sõltuva muutuja muutustega.
Regressioonanalüüsist põhjaliku arusaamise saamiseks peate kõigepealt mõistma järgmisi mõisteid:
- Sõltuv muutuja: See on muutuja, mille analüüsimisest või prognoosimisest te olete huvitatud. See on tulemusmuutuja, mida püüate mõista ja selgitada.
- Sõltumatud muutujad: Need on muutujad, mis teie arvates mõjutavad sõltuvat muutujat. Neid nimetatakse sageli prognoosimuutujateks, kuna neid kasutatakse sõltuva muutuja muutuste prognoosimiseks või selgitamiseks.
Regressioonanalüüsi saab kasutada mitmesugustel juhtudel, sealhulgas sõltuva muutuja tulevaste väärtuste prognoosimiseks, sõltumatute muutujate mõju mõistmiseks sõltuvale muutujale ning kõrvalekallete või ebatavaliste juhtumite leidmiseks andmete kogumisel.
Regressioonanalüüsi võib liigitada mitmeks tüübiks, sealhulgas ühekordne lineaarne regressioon, logistiline regressioon, polünoomne regressioon ja mitmekordne regressioon. Sobiv regressioonimudel määratakse kindlaks andmete iseloomu ja uuritava teema järgi.
Kuidas toimib regressioonanalüüs?
Regressioonanalüüsi eesmärk on leida kõige paremini sobiv joon või kõver, mis kajastab seost sõltumatute muutujate ja sõltuva muutuja vahel. See kõige paremini sobiv joon või kõver genereeritakse statistiliste meetodite abil, mis vähendavad erinevusi andmekogumi eeldatavate ja tegelike väärtuste vahel.
Siin on esitatud kahe kõige levinuma regressioonianalüüsi tüübi valemid:
Ühtne lineaarne regressioon
Lihtsa lineaarse regressiooni puhul kasutate kahe muutuja - sõltumatu muutuja (x) ja sõltuva muutuja (y) - vahelise seose näitamiseks parima sobivuse joont.
Parima sobivuse joont võib esitada võrrandiga: y = a + bx.
Siin on a lõikepunkt, b on joone kalle. Kalde arvutamiseks kasutatakse valemit: b = (nΣ(xy) - ΣxΣy) / (nΣ(x2) - (Σx)2), kus n on vaatluste arv, Σxy on x ja y summa, Σx ja Σy on vastavalt x ja y summad ja Σ(x2) on x ruutude summa.
Lõikepunkti arvutamiseks kasutatakse valemit: a = (Σy - bΣx) / n.
Mitmekordne regressioon
Mitmekordne lineaarne regressioon:
Mitme lineaarse regressioonimudeli võrrandi valem on:
y = b0 + b1x1 + b2x2 + ... + bnxn
kus y on sõltuv muutuja, x1, x2, ..., xn on sõltumatud muutujad ja b0, b1, b2, ..., bn on sõltumatute muutujate koefitsiendid.
Koefitsientide hindamise valem tavapäraste vähimate ruutude abil on järgmine:
β = (X'X)(-1)X'y
kus β on koefitsientide veeruvektor, X on sõltumatute muutujate disainimaatriks, X' on X transponeeritud ja y on sõltuva muutuja vaatluste vektor.
Regressioonanalüüsi näide
Oletame, et soovite uurida seost inimese keskmise hinde (GPA) ja nädalas õpitud tundide arvu vahel. Te kogute teavet mitmete üliõpilaste kohta, sealhulgas nende õppetundide arvu ja keskmise hinde kohta.
Seejärel kasutage regressioonianalüüsi, et näha, kas mõlema muutuja vahel on lineaarne seos, ja kui see on nii, saate koostada mudeli, mis ennustab õpilase GPA-d nende nädalas õpitud tundide arvu põhjal.
Kui andmed joonistada hajuvuskaardile, ilmneb, et õppetundide ja GPA vahel on soodne lineaarne seos. Seejärel hinnatakse lihtsa lineaarse regressioonimudeli abil parima sobivuse joone tõusu ja lõikepunkti. Lõplik lahendus võiks välja näha selline:
GPA = 2,0 + 0,3 (õppetunnid nädalas)
See võrrand ütleb, et iga lisatunni eest nädalas tõuseb õpilase keskmine hinne 0,3 punkti võrra, kusjuures kõik muu on samaväärne. Seda algoritmi saab kasutada õpilase GPA prognoosimiseks selle põhjal, mitu tundi ta nädalas õpib, ning samuti selleks, et teha kindlaks, millistel õpilastel on nende õpirutiini põhjal oht, et nad jäävad alla.
Kasutades näites esitatud andmeid, on väärtused jaoks b ja a on järgmised:
n = 10 (vaatluste arv)
Σx = 30 (õppetundide summa)
Σy = 25 (GPAde summa)
Σxy = 149 (õppetundide ja GPAde summa)
Σ(x)2 = 102 (õppetundide ruutude summa)
Kasutades neid väärtusi, arvutage b nagu:
b = (nΣ(xy) - ΣxΣy) / (nΣ(x2) - (Σx)2)
= (10 * 149 – 30 * 25) / (10 * 102 – 302)
= 0.3
Ja arvutada a nagu:
a = (Σy - bΣx) / n
= (25 – 0.3 * 30) / 10
= 2.0
Seega on parima sobivuse joone võrrand:
GPA = 2,0 + 0,3 (õppetunnid nädalas)
Mis vahe on korrelatsioonil ja regressioonil?
Nii korrelatsioon kui ka regressioon on statistilised meetodid kahe muutuja vahelise seose uurimiseks. Nad teenivad erinevaid eesmärke ja annavad erinevat liiki teavet.
Korrelatsioon on kahe muutuja vahelise seose tugevuse ja kulgemise mõõt. See ulatub -1-st kuni +1-ni, kusjuures -1 tähistab täiuslikku negatiivset korrelatsiooni, 0 tähistab korrelatsiooni puudumist ja +1 tähistab täiuslikku positiivset korrelatsiooni. Korrelatsioon näitab, mil määral on kaks muutujat omavahel seotud, kuid see ei näita põhjust ega ennustatavust.
Regressioon on seevastu meetod kahe muutuja vahelise seose modelleerimiseks, tavaliselt selleks, et prognoosida või selgitada ühte muutujat teise muutuja põhjal. Regressioonanalüüsiga saab anda hinnanguid seose suuruse ja suuna kohta, samuti statistilise olulisuse teste, usaldusvahemikke ja tulevaste tulemuste prognoose.
Teie looming, valmis mõne minutiga
Mind the Graph on veebiplatvorm, mis pakub teile ulatuslikku raamatukogu teaduslikke illustratsioone ja infograafilisi kujundusi, mida saab lihtsalt muuta vastavalt teie unikaalsetele vajadustele. Valmistage professionaalse välimusega graafikuid, plakateid ja graafilisi kokkuvõtteid minutitega, kasutades drag-and-drop-liidest ning mitmesuguseid tööriistu ja funktsioone.
Tellige meie uudiskiri
Eksklusiivne kvaliteetne sisu tõhusa visuaalse
teabevahetus teaduses.