Regressioonanalüüs on lähenemine, mille abil saab tuvastada ja analüüsida seost ühe või mitme sõltumatu muutujad ja sõltuv muutuja. Seda meetodit kasutatakse laialdaselt mitmetel erialadel, sealhulgas tervishoius, sotsiaalteadustes, insener, majandus ja äri. Saate kasutada regressioonanalüüsi, et uurida andmete põhilisi seoseid ja töötada välja prognoosimudelid, mis aitavad teil teha teadlikke otsuseid.

See artikkel annab teile põhjaliku ülevaate regressioonanalüüsist, sealhulgas selle toimimisest, lihtsasti mõistetava näite ja selgitab, kuidas see erineb korrelatsioonianalüüsist.

Mis on regressioonanalüüs?

Regressioonanalüüs on statistiline meetod sõltuva muutuja ja ühe või mitme sõltumatu muutuja vahelise seose kindlakstegemiseks ja kvantifitseerimiseks. Lühidalt öeldes aitab see mõista, kuidas ühe või mitme sõltumatu muutuja muutused on seotud sõltuva muutuja muutustega.

Regressioonanalüüsist põhjaliku arusaamise saamiseks peate kõigepealt mõistma järgmisi mõisteid:

  • Sõltuv muutuja: See on muutuja, mille analüüsimisest või prognoosimisest te olete huvitatud. See on tulemusmuutuja, mida püüate mõista ja selgitada.
  • Sõltumatud muutujad: Need on muutujad, mis teie arvates mõjutavad sõltuvat muutujat. Neid nimetatakse sageli prognoosimuutujateks, kuna neid kasutatakse sõltuva muutuja muutuste prognoosimiseks või selgitamiseks.

Regressioonanalüüsi saab kasutada mitmesugustel juhtudel, sealhulgas sõltuva muutuja tulevaste väärtuste prognoosimiseks, sõltumatute muutujate mõju mõistmiseks sõltuvale muutujale ning kõrvalekallete või ebatavaliste juhtumite leidmiseks andmete kogumisel.

Regressioonanalüüsi võib jagada mitmeks tüübid, sealhulgas ühekordne lineaarne regressioon, logistiline regressioon, polünoomiregressioon ja mitmikregressioon. Sobiva regressioonimudeli määrab kindlaks loodus andmete ja uuritava teema kohta.

Kuidas toimib regressioonanalüüs?

Regressioonanalüüsi eesmärk on leida kõige paremini sobiv joon või kõver, mis kajastab seost sõltumatute muutujate ja sõltuva muutuja vahel. See kõige paremini sobiv joon või kõver genereeritakse statistiliste meetodite abil, mis vähendavad erinevusi andmekogumi eeldatavate ja tegelike väärtuste vahel.

Siin on esitatud kahe kõige levinuma regressioonianalüüsi tüübi valemid:

Ühtne lineaarne regressioon

Lihtsa lineaarse regressiooni puhul kasutate kahe muutuja - sõltumatu muutuja (x) ja sõltuva muutuja (y) - vahelise seose näitamiseks parima sobivuse joont.

Parima sobivuse joont võib esitada võrrandiga: y = a + bx.

Siin on a lõikepunkt, b on joone kalle. Kalde arvutamiseks kasutatakse valemit: b = (nΣ(xy) - ΣxΣy) / (nΣ(x2) - (Σx)2), kus n on vaatluste arv, Σxy on x ja y summa, Σx ja Σy on vastavalt x ja y summad ja Σ(x2) on x ruutude summa.

Lõikepunkti arvutamiseks kasutatakse valemit: a = (Σy - bΣx) / n.

Mitmekordne regressioon 

Mitmekordne lineaarne regressioon:

Mitme lineaarse regressioonimudeli võrrandi valem on:

y = b0 + b1x1 + b2x2 + ... + bnxn

kus y on sõltuv muutuja, x1, x2, ..., xn on sõltumatud muutujad ja b0, b1, b2, ..., bn on sõltumatute muutujate koefitsiendid.

Koefitsientide hindamise valem tavapäraste vähimate ruutude abil on järgmine:

β = (X'X)(-1)X'y

kus β on koefitsientide veeruvektor, X on sõltumatute muutujate disainimaatriks, X' on X transponeeritud ja y on sõltuva muutuja vaatluste vektor.

Regressioonanalüüsi näide

Oletame, et soovite uurida seost inimese keskmise hinde (GPA) ja nädalas õpitud tundide arvu vahel. Te kogute teavet mitmete üliõpilaste kohta, sealhulgas nende õppetundide arvu ja keskmise hinde kohta.

Seejärel kasutage regressioonianalüüsi, et näha, kas mõlema muutuja vahel on lineaarne seos, ja kui see on nii, saate koostada mudeli, mis ennustab õpilase GPA-d nende nädalas õpitud tundide arvu põhjal.

Regressioonanalüüsi kasutamine keeruliste seoste mõistmiseks
Pilt saadaval aadressil alchemer.com

Kui andmed joonistada hajuvuskaardile, ilmneb, et õppetundide ja GPA vahel on soodne lineaarne seos. Seejärel hinnatakse lihtsa lineaarse regressioonimudeli abil parima sobivuse joone tõusu ja lõikepunkti. Lõplik lahendus võiks välja näha selline:

GPA = 2,0 + 0,3 (õppetunnid nädalas)

Regressioonanalüüsi kasutamine keeruliste seoste mõistmiseks
Pilt saadaval aadressil alchemer.com

See võrrand ütleb, et iga lisatunni eest nädalas tõuseb õpilase keskmine hinne 0,3 punkti võrra, kusjuures kõik muu on samaväärne. Seda algoritmi saab kasutada õpilase GPA prognoosimiseks selle põhjal, mitu tundi ta nädalas õpib, ning samuti selleks, et teha kindlaks, millistel õpilastel on nende õpirutiini põhjal oht, et nad jäävad alla. 

Kasutades näites esitatud andmeid, on väärtused jaoks b ja a on järgmised:

n = 10 (vaatluste arv)

Σx = 30 (õppetundide summa)

Σy = 25 (GPAde summa)

Σxy = 149 (õppetundide ja GPAde summa)

Σ(x)2 = 102 (õppetundide ruutude summa)

Kasutades neid väärtusi, arvutage b nagu:

b = (nΣ(xy) - ΣxΣy) / (nΣ(x2) - (Σx)2)

= (10 * 149 - 30 * 25) / (10 * 102 - 302)

= 0.3

Ja arvutada a nagu:

a = (Σy - bΣx) / n

= (25 - 0.3 * 30) / 10

= 2.0

Seega on parima sobivuse joone võrrand: 

GPA = 2,0 + 0,3 (õppetunnid nädalas)

Mis vahe on korrelatsioonil ja regressioonil?

Nii korrelatsioon kui ka regressioon on statistilised meetodid kahe muutuja vahelise seose uurimiseks. Nad teenivad erinevaid eesmärke ja annavad erinevat liiki teavet.

Korrelatsioon on kahe muutuja vahelise seose tugevuse ja kulgemise mõõt. See ulatub -1-st kuni +1-ni, kusjuures -1 tähistab täiuslikku negatiivset korrelatsiooni, 0 tähistab korrelatsiooni puudumist ja +1 tähistab täiuslikku positiivset korrelatsiooni. Korrelatsioon näitab, mil määral on kaks muutujat omavahel seotud, kuid see ei näita põhjust ega ennustatavust.

Regressioon on seevastu meetod kahe muutuja vahelise seose modelleerimiseks, tavaliselt selleks, et prognoosida või selgitada ühte muutujat teise muutuja põhjal. Regressioonanalüüs võib anda hinnanguid seose suuruse ja suuna kohta, samuti statistilisi tähendus testid, usaldusvahemikud ja tulevaste tulemuste prognoosid.

Teie looming, valmis mõne minutiga

Mind the Graph on veebipõhine platvorm, mis pakub teile ulatuslikku raamatukogu teaduslik illustratsioonid ja infograafia disainilahendused, mida saab lihtsalt muuta, et need vastaksid teie ainulaadsetele vajadustele. Tehke professionaalse välimusega graafikuid, plakateid ja graafiline abstraktsed minutitega, kasutades drag-and-drop-liidest ning laia valikut tööriistu ja funktsioone. 

Regressioonanalüüsi kasutamine keeruliste seoste mõistmiseks
logo-subscribe

Tellige meie uudiskiri

Eksklusiivne kvaliteetne sisu tõhusa visuaalse
teabevahetus teaduses.

- Eksklusiivne juhend
- Disaini näpunäited
- Teaduslikud uudised ja suundumused
- Juhendid ja mallid