Regresijas analīze ir pieeja, ar kuras palīdzību nosaka un analizē saistību starp vienu vai vairākiem neatkarīgajiem mainīgajiem un atkarīgo mainīgo. Šo metodi plaši izmanto dažādās disciplīnās, tostarp veselības aprūpē, sociālajās zinātnēs, inženierzinātnēs, ekonomikā un uzņēmējdarbībā. Jūs varat izmantot regresijas analīzi, lai izpētītu fundamentālas datu sakarības un izstrādātu prognozēšanas modeļus, kas palīdzēs jums pieņemt pamatotus lēmumus.
Šajā rakstā sniegts visaptverošs regresijas analīzes pārskats, tostarp tās darbības principi, viegli saprotams piemērs, kā arī paskaidrots, ar ko tā atšķiras no korelācijas analīzes.
Kas ir regresijas analīze?
Regresijas analīze ir statistikas metode, ar kuras palīdzību nosaka un kvantitatīvi nosaka saistību starp atkarīgo mainīgo un vienu vai vairākiem neatkarīgajiem mainīgajiem. Īsāk sakot, tā palīdz saprast, kā izmaiņas vienā vai vairākos neatkarīgajos mainīgajos ir saistītas ar izmaiņām atkarīgajā mainīgajā.
Lai gūtu padziļinātu izpratni par regresijas analīzi, vispirms ir jāizprot šādi termini:
- Atkarīgais mainīgais: Tas ir mainīgais lielums, kuru jūs vēlaties analizēt vai prognozēt. Tas ir iznākuma mainīgais lielums, kuru jūs mēģināt saprast un izskaidrot.
- Neatkarīgie mainīgie: Tie ir mainīgie lielumi, kas, jūsuprāt, ietekmē atkarīgo mainīgo lielumu. Tos bieži dēvē par prognozējošajiem mainīgajiem, jo tie tiek izmantoti, lai prognozētu vai izskaidrotu atkarīgā mainīgā izmaiņas.
Regresijas analīzi var izmantot dažādos gadījumos, tostarp atkarīgā mainīgā lieluma nākotnes vērtību prognozēšanai, neatkarīgo mainīgo lielumu ietekmes uz atkarīgo mainīgo izpratnei un noviržu vai neparastu parādību atklāšanai datu vākšanā.
Regresijas analīzi var iedalīt vairākos veidos, tostarp vienkāršā lineārā regresija, loģiskā regresija, polinomiskā regresija un daudzkārtējā regresija. Piemēroto regresijas modeli nosaka atkarībā no datu rakstura un aplūkojamā pētījuma priekšmeta.
Kā darbojas regresijas analīze?
Regresijas analīzes mērķis ir noteikt vispiemērotāko līniju vai līkni, kas atspoguļo saistību starp neatkarīgajiem mainīgajiem un atkarīgo mainīgo. Šo vispiemērotāko līniju vai līkni ģenerē, izmantojot statistikas metodes, kas samazina atšķirības starp sagaidāmajām un reālajām vērtībām datu kopā.
Šeit ir sniegtas divu visbiežāk sastopamo regresijas analīzes veidu formulas:
Viena lineārā regresija
Vienkāršajā lineārajā regresijā, lai parādītu sakarību starp diviem mainīgajiem lielumiem: neatkarīgo mainīgo (x) un atkarīgo mainīgo (y), tiek izmantota līnija, kas vislabāk atbilst.
Vislabāk atbilstīgo līniju var attēlot ar vienādojumu: y = a + bx.
Šeit a ir pārtveršanas punkts, b ir līnijas slīpums. Lai aprēķinātu slīpumu, izmanto formulu: b = (nΣ(xy) - ΣxΣy) / (nΣ(x2) - (Σx)2), kur n ir novērojumu skaits, Σxy ir x un y reizinājuma summa, Σx un Σy ir attiecīgi x un y summas, un Σ(x2) ir x kvadrātu summa.
Lai aprēķinātu intercepciju, izmanto formulu: a = (Σy - bΣx) / n.
Vairākkārtēja regresija
Vairākkārtēja lineārā regresija:
Daudzkārtējās lineārās regresijas modeļa vienādojuma formula ir šāda:
y = b0 + b1x1 + b2x2 + ... + bnxn
kur y ir atkarīgais mainīgais, x1, x2, ..., xn ir neatkarīgie mainīgie, un b0, b1, b2, ..., bn ir neatkarīgo mainīgo koeficienti.
Koeficientu novērtēšanas formula, izmantojot parasto mazāko kvadrātu metodi, ir šāda:
β = (X'X)(-1)X'y
kur β ir koeficientu kolonnas vektors, X ir neatkarīgo mainīgo konstrukcijas matrica, X' ir X transpozīcija un y ir atkarīgā mainīgā novērojumu vektors.
Regresijas analīzes piemērs
Pieņemsim, ka vēlaties izpētīt saistību starp indivīda vidējo vērtējumu (GPA) un stundu skaitu, ko viņš nedēļā mācās. Jūs apkopojat informāciju no studentu kopas, ieskaitot viņu mācību stundu skaitu un vidējo vērtējumu.
Pēc tam ar regresijas analīzes palīdzību noskaidrojiet, vai starp abiem mainīgajiem ir lineāra sakarība, un, ja ir, varat izveidot modeli, kas paredz skolēna GPA, pamatojoties uz mācību stundu skaitu nedēļā.
Ja datus attēlo izkliedes kartē, redzams, ka pastāv labvēlīga lineāra sakarība starp mācību stundām un GPA. Pēc tam, izmantojot vienkāršu lineārās regresijas modeli, tiek novērtēts labākās atbilstības līnijas slīpums un krustpunkts. Galīgais risinājums varētu izskatīties šādi:
GPA = 2,0 + 0,3 (mācību stundas nedēļā)
Šis vienādojums nosaka, ka par katru papildu mācību stundu nedēļā studenta GPA palielināsies par 0,3 punktiem, bet viss pārējais ir līdzvērtīgs. Šo algoritmu var izmantot, lai prognozētu studenta GPA, pamatojoties uz to, cik stundu nedēļā viņš mācās, kā arī lai noteiktu, kuriem studentiem ir risks, ka viņu mācību rutīnas dēļ viņi uzrādīs sliktākus rezultātus.
Izmantojot piemērā sniegtos datus, vērtības b un a ir šādi:
n = 10 (novērojumu skaits)
Σx = 30 (mācību stundu summa)
Σy = 25 (GPA summa)
Σxy = 149 (studiju stundu un GPA reizinājuma summa)
Σ(x)2 = 102 (mācību stundu kvadrātu summa)
Izmantojot šīs vērtības, aprēķiniet b kā:
b = (nΣ(xy) - ΣxΣy) / (nΣ(x2) - (Σx)2)
= (10 * 149 – 30 * 25) / (10 * 102 – 302)
= 0.3
Un aprēķiniet a kā:
a = (Σy - bΣx) / n
= (25 – 0.3 * 30) / 10
= 2.0
Tāpēc vislabākās atbilstības līnijas vienādojums ir:
GPA = 2,0 + 0,3 (mācību stundas nedēļā)
Kāda ir atšķirība starp korelāciju un regresiju?
Gan korelācija, gan regresija ir statistikas metodes, ar kurām pārbauda saikni starp diviem mainīgajiem. Tās kalpo dažādiem mērķiem un sniedz dažāda veida informāciju.
Korelācija ir divu mainīgo lielumu savstarpējās saiknes stipruma un gaitas mērs. Tā variē no -1 līdz +1, kur -1 ir pilnīga negatīva korelācija, 0 ir bez korelācijas, bet +1 ir pilnīga pozitīva korelācija. Korelācija norāda, cik lielā mērā divi mainīgie ir saistīti, bet tā nenorāda cēloni vai prognozējamību.
Savukārt regresija ir metode, ar kuru modelē saikni starp diviem mainīgajiem lielumiem, parasti, lai prognozētu vai izskaidrotu vienu mainīgo, pamatojoties uz otru. Regresijas analīze var sniegt aplēses par saistības lielumu un virzienu, kā arī statistiskā nozīmīguma testus, ticamības diapazonus un nākotnes rezultātu prognozes.
Jūsu darbi, gatavi dažu minūšu laikā
Mind the Graph ir tiešsaistes platforma, kas piedāvā plašu zinātnisko ilustrāciju un infografikas dizainu bibliotēku, ko var vienkārši pārveidot atbilstoši jūsu unikālajām vajadzībām. Izveidojiet profesionāla izskata diagrammas, plakātus un grafiskus kopsavilkumus dažu minūšu laikā, izmantojot vilkšanas un nomešanas saskarni un plašu rīku un funkciju klāstu.
Abonēt mūsu biļetenu
Ekskluzīvs augstas kvalitātes saturs par efektīvu vizuālo
komunikācija zinātnē.