Pearson korreláció: Mind the Graph Blog

A Pearson-féle korreláció egy alapvető statisztikai módszer, amelyet két folytonos változó közötti lineáris kapcsolatok megértésére használnak. A Pearson-féle korrelációs együttható ezen kapcsolatok erősségét és irányát számszerűsítve kritikus betekintést nyújt, amely széles körben alkalmazható különböző területeken, beleértve a kutatást, az adattudományt és a mindennapi döntéshozatalt. Ez a cikk a Pearson-féle korreláció alapjait ismerteti, beleértve a definíciót, a számítási módszereket és a gyakorlati alkalmazásokat. Megvizsgáljuk, hogy ez a statisztikai eszköz hogyan világíthat rá az adatokon belüli mintákra, milyen fontos megérteni a korlátait, valamint a pontos értelmezés legjobb gyakorlatait.

Mi az a Pearson-korreláció?

A Pearson-féle korrelációs együttható vagy Pearson r számszerűsíti a két folytonos változó közötti lineáris kapcsolat erősségét és irányát. Az értékek a következő értékek között mozognak -1-től 1-ig, ez az együttható azt jelzi, hogy a szórásdiagramon szereplő adatpontok milyen szorosan illeszkednek az egyeneshez.

Az 1-es érték tökéletes pozitív lineáris kapcsolatot jelent, ami azt jelenti, hogy az egyik változó növekedésével a másik is következetesen növekszik.
A következő érték -1 azt jelzi, hogy tökéletes negatív lineáris kapcsolat, ahol az egyik változó nő, miközben a másik csökken.
A következő érték 0 javasolja a nincs lineáris korreláció, ami azt jelenti, hogy a változók nem állnak lineáris kapcsolatban.

A Pearson-féle korrelációt széles körben használják a természettudományokban, a közgazdaságtanban és a társadalomtudományokban annak meghatározására, hogy két változó együtt mozog-e és milyen mértékben. Segít felmérni, hogy a változók milyen erősen kapcsolódnak egymáshoz, így az adatelemzés és -értelmezés alapvető eszköze.

Hogyan számítsuk ki a Pearson korrelációs együtthatót?

A Pearson-féle korrelációs együtthatót (r) a következő képlettel számítják ki:

A Pearson-féle korrelációs együttható képlete, amely a két változó közötti lineáris kapcsolat mérésére használt egyenletet mutatja. — Pearson korrelációs együttható képlet a kulcsfontosságú változók magyarázatával.

Hol:

x és y a két összehasonlítandó változó.
n az adatpontok száma.
∑xy a párosított pontszámok szorzatának összege (x és y).
∑x² és ∑y² az egyes változók négyzetösszegei.

Lépésről lépésre történő számítás:

Adatgyűjtés: A változók párosított értékeinek összegyűjtése x és y.
Példa:

x=[1,2,3]

y=[4,5,6]

Számítsa ki az x és y összegét:

∑x a következő értékek összege x.

∑y a következő értékek összege y.

A példa esetében:
∑x=1+2+3=6
∑y=4+5+6=15

Szorozd meg x és y minden egyes pár esetében:

Szorozzuk meg az x és y értékek minden egyes párját, és találjuk meg a ∑ értéket.xy.

xy=[1×4,2×5,3×6]=[4,10,18]
∑xy=4+10+18=32

Négyzet Minden x és y érték:

Keressük meg az egyes x és y értékek négyzetét, majd összegezzük őket, hogy megkapjuk a ∑ értéket.x² és ∑y².

x²=[1²,2²,3²]=[1,4,9]
∑x²=1+4+9=14
y²=[4²,5²,6²]=[16,25,36]
∑y²=16+25+36=77

Töltse be az értékeket a Pearson-képletbe: Most helyettesítse az értékeket a Pearson-féle korrelációs képletbe:

r = (n∑xy - ∑x∑y) / √[(n∑x² - (∑x)²) * (n∑y² - (∑y)²)]

r = (3 × 32 - 6 × 15) / √[(3 × 14 - (6)²) × (3 × 77 - (15)²)]

r = (96 - 90) / √[(42 - 36) × (231 - 225)]

r = 6 / √[6 × 6]

r = 6 / 6 = 1

Ebben a példában a Pearson-féle korrelációs együttható a következő 1, ami azt jelzi, hogy a változók között tökéletes pozitív lineáris kapcsolat áll fenn. x és y.

Ez a lépésről lépésre történő megközelítés bármely adathalmazra alkalmazható a Pearson-korreláció kézi kiszámításához. Azonban a szoftvereszközök, mint például az Excel, Python, vagy statisztikai csomagok gyakran automatizálják ezt a folyamatot nagyobb adathalmazok esetében.

Miért fontos a Pearson korreláció a statisztikai elemzésben?

A kutatásban

A Pearson korreláció a kutatás egyik legfontosabb statisztikai eszköze két folytonos változó közötti lineáris kapcsolatok erősségének és irányának azonosítására és számszerűsítésére. Segít a kutatóknak megérteni, hogy két változó mennyire és milyen erősen kapcsolódik egymáshoz, ami betekintést nyújthat az adathalmazokon belüli mintákba és tendenciákba.

A Pearson-féle korreláció segít a kutatóknak meghatározni, hogy a változók következetesen, pozitív vagy negatív irányban mozognak-e együtt. Például a tanulási időt és a vizsgaeredményeket mérő adathalmazban az erős pozitív Pearson-korreláció azt sugallja, hogy a megnövekedett tanulási idő magasabb vizsgaeredményekkel jár. Ezzel szemben a negatív korreláció azt jelezné, hogy az egyik változó növekedésével a másik csökken.

Példák a különböző kutatási területeken történő felhasználásra:

Pszichológia: A Pearson-féle korrelációt gyakran használják az olyan változók közötti kapcsolatok feltárására, mint a stresszszint és a kognitív teljesítmény. A kutatók felmérhetik, hogy a stressz növekedése hogyan hat a memóriára vagy a problémamegoldó képességekre.

Közgazdaságtan: A közgazdászok a Pearson-féle korrelációt használják az olyan változók közötti kapcsolat vizsgálatára, mint a jövedelem és a fogyasztás, vagy az infláció és a munkanélküliség, ami segít megérteni, hogy a gazdasági tényezők hogyan befolyásolják egymást.

Gyógyszer: Az orvosi kutatásban a Pearson-féle korrelációval azonosítható a különböző egészségügyi mérőszámok közötti kapcsolat. A kutatók például vizsgálhatják a vérnyomásszintek és a szívbetegségek kockázata közötti összefüggést, ami segíthet a korai felismerésben és a megelőző ellátási stratégiákban.

Környezettudomány: A Pearson-féle korreláció hasznos a környezeti változók, például a hőmérséklet és a terméshozam közötti kapcsolatok feltárásában, lehetővé téve a tudósok számára, hogy modellezzék az éghajlatváltozás mezőgazdaságra gyakorolt hatásait.

Összességében a Pearson-féle korreláció a legkülönbözőbb kutatási területeken nélkülözhetetlen eszköz az értelmes kapcsolatok feltárásához és a jövőbeli tanulmányok, beavatkozások vagy szakpolitikai döntések irányításához.

A mindennapi életben

A megértése Pearson korreláció hihetetlenül hasznos lehet a mindennapi döntéshozatalban, mivel segít azonosítani a rutinjainkat és döntéseinket befolyásoló különböző változók közötti mintákat és kapcsolatokat.

Gyakorlati alkalmazások és példák:

Fitness és egészség: A Pearson-féle korreláció alkalmazható annak értékelésére, hogy a különböző tényezők, például az edzés gyakorisága és a fogyás hogyan függnek össze. Például a testmozgási szokások és a testsúly időbeli követése pozitív összefüggést mutathat a rendszeres testmozgás és a testsúlycsökkenés között.

Személyes pénzügyek: A költségvetés-tervezésben a Pearson-féle korreláció segíthet a költési szokások és a megtakarítások közötti kapcsolat elemzésében. Ha valaki nyomon követi havi kiadásait és megtakarításait, negatív korrelációt találhat, ami azt jelzi, hogy a kiadások növekedésével a megtakarítások csökkennek.

Időjárás és hangulat: A korreláció másik mindennapi felhasználása az időjárás hangulatra gyakorolt hatásának megértése lehet. Például pozitív korreláció állhat fenn a napsütéses napok és a jobb hangulat között, míg az esős napok alacsonyabb energiaszinttel vagy szomorúsággal korrelálhatnak.

Időgazdálkodás: A Pearson-féle korreláció azáltal, hogy összehasonlítja az egyes feladatokra fordított órákat (pl. a tanulási időt) és a termelékenységet vagy a teljesítményt (pl. a jegyeket vagy a munka hatékonyságát), segíthet az egyéneknek megérteni, hogy az időbeosztás hogyan befolyásolja az eredményeket.

Az összefüggések megértésének előnyei gyakori forgatókönyvekben:

Jobb döntéshozatal: A változók összefüggéseinek ismerete lehetővé teszi az egyének számára, hogy megalapozott döntéseket hozzanak. Például az étrend és az egészség közötti összefüggés megértése jobb étkezési szokásokhoz vezethet, amelyek elősegítik a jólétet.

Az eredmények optimalizálása: Az emberek az összefüggéseket felhasználhatják rutinjaik optimalizálására, például felfedezhetik, hogy az alvás időtartama hogyan függ össze a termelékenységgel, és ennek megfelelően állíthatják be az alvási ütemtervet a hatékonyság maximalizálása érdekében.

A minták azonosítása: A mindennapi tevékenységek mintáinak felismerése (például a képernyő előtt töltött idő és a szem megterhelésének összefüggése) segíthet az egyéneknek a viselkedésmódosításban a negatív hatások csökkentése és az általános életminőség javítása érdekében.

A Pearson-féle korreláció koncepciójának alkalmazása a mindennapi életben lehetővé teszi az emberek számára, hogy értékes betekintést nyerjenek abba, hogy rutinjuk különböző aspektusai hogyan hatnak egymásra, lehetővé téve számukra, hogy olyan proaktív döntéseket hozzanak, amelyek javítják az egészséget, a pénzügyeket és a jólétet.

A Pearson-korreláció értelmezése

Értékek és jelentőség

A Pearson korrelációs együttható (r) a következő tartományok között mozog -1-től 1-ig, és minden egyes érték betekintést nyújt a két változó közötti kapcsolat természetébe és erősségébe. Ezen értékek megértése segít a korreláció irányának és mértékének értelmezésében.

Együttható értékek:

1: Egy érték +1 azt jelzi, hogy tökéletes pozitív lineáris kapcsolat két változó között, ami azt jelenti, hogy az egyik változó növekedésével a másik is tökéletesen arányosan növekszik.

-1: Egy érték -1 azt jelzi, hogy tökéletes negatív lineáris kapcsolat, ahol az egyik változó növekedésével a másik tökéletesen arányosan csökken.

0: Egy érték 0 javasolja a nincs lineáris kapcsolat a változók között, vagyis az egyik változóban bekövetkező változások nem jelzik előre a másik változóban bekövetkező változásokat.

Pozitív, negatív és nulla korrelációk:

Pozitív korreláció: When r pozitív (pl. 0,5), ez azt jelenti, hogy mindkét változó hajlamos ugyanabba az irányba mozogni. Például a hőmérséklet emelkedésével a fagylalteladások növekedhetnek, ami pozitív korrelációt mutat.

Negatív korreláció: When r negatív (pl. -0,7), azt sugallja, hogy a változók ellentétes irányban mozognak. Erre példa lehet az edzés gyakorisága és a testzsírszázalék közötti kapcsolat: ahogy nő a testmozgás, úgy csökken a testzsír.

Nulla korreláció: An r 0 azt jelenti, hogy van nincs felismerhető lineáris kapcsolat a változók között. Például előfordulhat, hogy a cipőméret és az intelligencia között nincs lineáris összefüggés.

Általánosságban:

0,7 és 1 vagy -0,7 és -1 között azt jelzi, hogy erős korreláció.

0,3-0,7 vagy -0,3-0,7 tükrözi a mérsékelt korreláció.

0 és 0,3 vagy -0,3 és 0 között azt jelenti, hogy gyenge korreláció.

Ezen értékek megértése lehetővé teszi a kutatók és az egyének számára annak meghatározását, hogy két változó milyen szoros kapcsolatban áll egymással, és hogy a kapcsolat elég jelentős-e ahhoz, hogy további figyelmet vagy intézkedést igényeljen.

Korlátozások

Míg a Pearson korreláció hatékony eszköz a változók közötti lineáris kapcsolatok értékelésére, de vannak korlátai, és nem biztos, hogy minden esetben megfelelő.

Olyan helyzetek, amikor a Pearson-korreláció nem megfelelő:

Nem lineáris kapcsolatok: A Pearson-korreláció csak a következőket méri lineáris kapcsolatok, így nem biztos, hogy pontosan tükrözi az összefüggés erősségét olyan esetekben, amikor a változók közötti kapcsolat görbe vagy nem lineáris. Például, ha a változók között kvadratikus vagy exponenciális kapcsolat áll fenn, a Pearson-féle korreláció alábecsülheti vagy nem képes megragadni a valódi kapcsolatot.

Outliers: A jelenléte kiugró értékek (szélsőértékek) jelentősen torzíthatják a Pearson-korrelációs eredményeket, félrevezető képet adva a változók közötti általános kapcsolatról. Egyetlen kiugró érték mesterségesen felfújhatja vagy leeresztheti a korrelációs értéket.

Nem folytonos változók: A Pearson-féle korreláció feltételezi, hogy mindkét változó folytonos és normális eloszlású. Nem biztos, hogy megfelelő kategorikus vagy ordinális adatok, ahol az összefüggések nem feltétlenül lineárisak vagy számszerűek.

Heteroszkedaszticitás: Ha az egyik változó változékonysága eltér a másik változó tartományában (azaz ha az adatpontok szórása nem állandó), a Pearson-korreláció pontatlanul mérheti a kapcsolatot. Ezt az állapotot nevezzük heteroszkedaszticitás, és ez torzíthatja az együtthatót.

Kizárólag lineáris kapcsolatokra vonatkozó korlátozás: A Pearson-féle korreláció kifejezetten az erősségét és irányát méri a lineáris kapcsolatok. Ha a változók nem lineárisan kapcsolódnak egymáshoz, a Pearson-féle korreláció ezt nem fogja érzékelni. Például, ha az egyik változó egy másikhoz képest növekvő ütemben növekszik (mint egy exponenciális vagy logaritmikus kapcsolatban), a Pearson-korreláció gyenge vagy nulla korrelációt mutathat, annak ellenére, hogy erős kapcsolat áll fenn.

E korlátozások kezelésére a kutatók más módszereket is alkalmazhatnak, például Spearman-féle rangkorreláció ordinális adatok esetén vagy nemlineáris regressziós modellek az összetett összefüggések jobb megragadására. Lényegében, bár a Pearson-féle korreláció értékes a lineáris kapcsolatok esetében, óvatosan kell alkalmazni, biztosítva, hogy az adatok megfeleljenek a pontos értelmezéshez szükséges feltételezéseknek.

Hogyan használjuk a Pearson korrelációt

Eszközök és szoftverek

A számítás a Pearson korreláció kézzel is elvégezhető, de sokkal hatékonyabb és praktikusabb statisztikai eszközöket és szoftvereket használni. Ezek az eszközök gyorsan ki tudják számítani a Pearson-féle korrelációs együtthatót, nagy adathalmazokat tudnak kezelni, és további statisztikai funkciókat kínálnak az átfogó elemzéshez. A Pearson-korreláció kiszámításához számos népszerű szoftver és eszköz áll rendelkezésre:

Microsoft Excel: Széles körben használt eszköz, amely beépített funkciókkal rendelkezik a Pearson-korreláció kiszámításához, így az alapvető statisztikai feladatokhoz is használható.

SPSS (statisztikai csomag a társadalomtudományok számára): Ezt a nagy teljesítményű szoftvert statisztikai elemzésre tervezték, és gyakran használják a társadalomtudományokban és az orvosi kutatásban.

R programozási nyelv: Kifejezetten adatelemzésre és statisztikára tervezett, ingyenes és nyílt forráskódú programozási nyelv. Az R széleskörű rugalmasságot és testreszabhatóságot kínál.

Python (olyan könyvtárakkal, mint a Pandas és a NumPy): A Python egy másik nagy teljesítményű, nyílt forráskódú adatelemző nyelv, amely felhasználóbarát könyvtárakkal egyszerűsíti a Pearson-féle korreláció kiszámítását.

GraphPad Prism: Ez a biológiai tudományokban népszerű szoftver intuitív felületet kínál a statisztikai elemzéshez, beleértve a Pearson-féle korrelációt is.

Alapvető útmutató ezen eszközök elemzési célú használatához:

Microsoft Excel:

Adja be az adatokat két oszlopba, egy-egy változóhoz.
A beépített =CORREL(array1, array2) függvénnyel kiszámíthatja a Pearson-féle korrelációt a két adathalmaz között.

SPSS:

Importálja az adatokat az SPSS-be.
Menjen a Elemzés > Korreláció > Bivariate (kétváltozós), és válassza ki az elemzendő változókat.
Válassza a "Pearson" opciót a korrelációs együttható beállításai között, majd kattintson az "OK" gombra.

R programozás:

Adja be az adatokat az R-be vektorok vagy adatkeretek formájában.
Használja a cor(x, y, method = "pearson") függvényt a Pearson-korreláció kiszámításához.

Python (Pandas/NumPy):

Töltse be az adatokat a Pandas segítségével.
A df['változó1'].corr(df['változó2']) segítségével kiszámíthatja a Pearson-féle korrelációt két oszlop között.

GraphPad Prism:

Adja be adatait a szoftverbe.
Válassza a "Korreláció" elemzési lehetőséget, válassza a Pearson-korrelációt, és a szoftver létrehozza a korrelációs együtthatót, valamint egy vizuális szórásdiagramot.

Ezek az eszközök nemcsak a Pearson-féle korrelációs együtthatót számítják ki, hanem grafikus kimeneteket, p-értékeket és más statisztikai mérőszámokat is biztosítanak, amelyek segítenek az adatok értelmezésében. Ezen eszközök használatának megértése lehetővé teszi a hatékony és pontos korrelációelemzést, ami elengedhetetlen a kutatáshoz és az adatvezérelt döntéshozatalhoz.

Itt találhat Infografika és vizuális tervezés statisztikákat

Gyakorlati tippek a Pearson korreláció használatához

Adatelőkészítés és ellenőrzések a korreláció kiszámítása előtt:

Adatminőség biztosítása: Ellenőrizze, hogy az adatok pontosak és teljesek-e. Ellenőrizze és kezelje a hiányzó értékeket, mivel ezek torzíthatják az eredményeket. A hiányos adatok helytelen korrelációs együtthatókhoz vagy félrevezető értelmezésekhez vezethetnek.

Linearitás ellenőrzése: A Pearson-féle korreláció lineáris kapcsolatokat mér. A számítás előtt ábrázolja az adatait szórásdiagram segítségével, hogy vizuálisan értékelje, lineáris-e a változók közötti kapcsolat. Ha az adatok nem lineáris mintázatot mutatnak, fontolja meg alternatív módszerek, például a Spearman-féle rangkorreláció vagy a nemlineáris regresszió alkalmazását.

Normális állapot ellenőrzése: A Pearson-féle korreláció feltételezi, hogy az egyes változók adatai megközelítőleg normális eloszlásúak. Bár ez a módszer némileg robusztus a normalitástól való eltérésekkel szemben, a jelentős eltérések befolyásolhatják az eredmények megbízhatóságát. Használjon hisztogramokat vagy normalitásvizsgálatokat az adatok eloszlásának ellenőrzésére.

Az adatok szabványosítása: Ha a változókat különböző mértékegységekben vagy skálákon mérik, fontolja meg azok szabványosítását. Ez a lépés biztosítja, hogy az összehasonlítást ne torzítsa a mérési skála, bár maga a Pearson-korreláció skálafüggetlen.

Az eredmények értelmezésekor elkerülendő gyakori hibák:

Az erő túlbecsülése: A magas Pearson-féle korrelációs együttható nem jelent ok-okozati összefüggést. A korreláció csak a lineáris kapcsolat erősségét méri, azt nem, hogy az egyik változó okozza-e a másik változó változását. Kerülje az ok-okozati összefüggésekre vonatkozó következtetések levonását kizárólag a korreláció alapján.

A kiugró értékek figyelmen kívül hagyása: A kiugró értékek aránytalanul nagy mértékben befolyásolhatják a Pearson-féle korrelációs együtthatót, ami félrevezető eredményekhez vezethet. Határozza meg és értékelje a kiugró értékek hatását az elemzésre. Néha a kiugró értékek eltávolítása vagy kiigazítása tisztább képet adhat az összefüggésről.

A nulla korreláció félreértelmezése: A nulla Pearson-korreláció azt jelzi, hogy nincs lineáris kapcsolat, de ez nem jelenti azt, hogy egyáltalán nincs kapcsolat. A változók között még mindig lehet nem lineáris kapcsolat, ezért ha nem lineáris kapcsolatra gyanakszik, fontolja meg más statisztikai módszerek alkalmazását.

Az összefüggés és az ok-okozati összefüggés összekeverése: Ne feledje, hogy a korreláció nem jelent ok-okozati összefüggést. Két változó korrelálhat egy harmadik, nem megfigyelt változó hatása miatt. Mindig vegye figyelembe a tágabb összefüggéseket, és használjon további módszereket a lehetséges ok-okozati összefüggések feltárására.

A minta méretének elhanyagolása: A kis mintanagyságok instabil és megbízhatatlan korrelációs becslésekhez vezethetnek. Győződjön meg arról, hogy a minta mérete elegendő a korreláció megbízható méréséhez. A nagyobb minták általában pontosabb és stabilabb korrelációs együtthatókat biztosítanak.

Főbb tanulságok és megfontolások

A Pearson-féle korreláció egy alapvető statisztikai eszköz, amelyet két folytonos változó közötti lineáris kapcsolat erősségének és irányának mérésére használnak. Értékes betekintést nyújt különböző területeken, a kutatástól a mindennapi életig, segít azonosítani és számszerűsíteni az adatokban lévő kapcsolatokat. A Pearson-korreláció helyes kiszámításának és értelmezésének megértése lehetővé teszi a kutatók és az egyének számára, hogy megalapozott döntéseket hozzanak a változók közötti kapcsolatok erőssége alapján.

Ugyanakkor döntő fontosságú, hogy felismerjük korlátait, különösen a lineáris kapcsolatokra való összpontosítását és a kiugró értékekre való érzékenységét. A pontos elemzéshez elengedhetetlen a megfelelő adatelőkészítés és a gyakori buktatók elkerülése - például a korreláció és az ok-okozati összefüggés összekeverése -. A Pearson-korreláció megfelelő használata és korlátainak figyelembevétele lehetővé teszi, hogy hatékonyan kihasználja ezt az eszközt, hogy értelmes betekintést nyerjen és jobb döntéseket hozzon.

Böngésszen 75.000+ tudományosan pontos illusztráció között 80+ népszerű területen

Mind the Graph egy hatékony eszköz, amelyet arra terveztek, hogy segítse a tudósokat az összetett kutatási eredmények vizuális közlésében. A több mint 80+ népszerű terület több mint 75 000 tudományosan pontos illusztrációjához való hozzáféréssel a kutatók könnyen megtalálhatják azokat a vizuális elemeket, amelyek javítják prezentációikat, tanulmányaikat és jelentéseiket. A platform illusztrációk széles választéka biztosítja, hogy a tudósok világos, magával ragadó, a saját kutatási területükre szabott vizuális anyagokat készíthessenek, legyen szó akár biológiáról, kémiáról, orvostudományról vagy más tudományágakról. Ez a hatalmas könyvtár nemcsak időt takarít meg, hanem lehetővé teszi az adatok hatékonyabb kommunikációját is, így a tudományos információk mind a szakértők, mind a nagyközönség számára hozzáférhetővé és érthetővé válnak.

Regisztráljon ingyenesen

"Az Mind the Graph-n elérhető több mint 80 tudományos területet bemutató animált GIF, köztük a biológiát, a kémiát, a fizikát és az orvostudományt, amely a platform sokoldalúságát mutatja a kutatók számára." — Az Mind the Graph által lefedett tudományterületek széles skáláját bemutató animált GIF.

Pearson korreláció: A kapcsolatok mögötti matematika megértése