Regresyon analizi, bir veya daha fazla bağımsız değişken ile bağımlı değişken arasındaki bağlantıyı belirlemeye ve analiz etmeye yönelik bir yaklaşımdır. Bu yöntem sağlık, sosyal bilimler, mühendislik, ekonomi ve işletme gibi çeşitli disiplinlerde yaygın olarak kullanılmaktadır. Regresyon analizini, verilerdeki temel ilişkileri araştırmak ve bilinçli kararlar almanıza yardımcı olacak öngörücü modeller geliştirmek için kullanabilirsiniz.

Bu makale size regresyon analizinin nasıl çalıştığını, kolay anlaşılır bir örneğini ve korelasyon analizinden farkını da içeren kapsamlı bir genel bakış sunacaktır.

Regresyon Analizi Nedir?

Regresyon analizi, bir bağımlı değişken ile bir veya daha fazla bağımsız değişken arasındaki bağlantıyı tanımlamak ve ölçmek için kullanılan istatistiksel bir yöntemdir. Özetle, bir veya daha fazla bağımsız değişkendeki değişikliklerin bağımlı değişkendeki değişikliklerle nasıl ilişkili olduğunu anlamanıza yardımcı olur.

Regresyon analizini tam olarak anlamak için öncelikle aşağıdaki terimleri anlamanız gerekir:

  • Bağımlı Değişken: Bu, analiz etmek veya tahmin etmekle ilgilendiğiniz değişkendir. Anlamaya ve açıklamaya çalıştığınız sonuç değişkenidir.
  • Bağımsız Değişkenler: Bunlar bağımlı değişken üzerinde etkisi olduğuna inandığınız değişkenlerdir. Bağımlı değişkendeki değişiklikleri tahmin etmek veya açıklamak için kullanıldıklarından, genellikle tahmin edici değişkenler olarak adlandırılırlar.

Regresyon analizi, bağımlı değişkenin gelecekteki değerlerinin tahmin edilmesi, bağımsız değişkenlerin bağımlı değişken üzerindeki etkisinin anlaşılması ve veri toplamada aykırı değerlerin veya olağandışı olayların bulunması gibi çeşitli durumlarda kullanılabilir.

Regresyon analizi, tek doğrusal regresyon, lojistik regresyon, polinom regresyon ve çoklu regresyon gibi çeşitli türlerde sınıflandırılabilir. Uygun regresyon modeli, verilerin niteliğine ve incelenen araştırma konusuna göre belirlenir.

Regresyon Analizi Nasıl Çalışır?

Regresyon analizinin amacı, bağımsız değişkenler ile bağımlı değişken arasındaki bağlantıyı yansıtan en uygun doğruyu veya eğriyi belirlemektir. Bu en uygun çizgi veya eğri, veri toplamada beklenen ve gerçek değerler arasındaki farklılıkları azaltan istatistiksel yöntemler kullanılarak oluşturulur.

İşte en yaygın iki regresyon analizi türü için formüller:

Tek Doğrusal Regresyon

Basit Doğrusal Regresyonda, iki değişken arasındaki ilişkiyi göstermek için en uygun doğruyu kullanırsınız: bağımsız değişken (x) ve bağımlı değişken (y).

En iyi uyum doğrusu şu denklemle gösterilebilir: y = a + bx.

Burada a kesişim, b ise doğrunun eğimidir. Eğimi hesaplamak için şu formülü kullanırsınız: b = (nΣ(xy) - ΣxΣy) / (nΣ(x2) - (Σx)2), burada n gözlem sayısı, Σxy x ve y'nin çarpımının toplamı, Σx ve Σy sırasıyla x ve y'nin toplamları ve Σ(x2) x'in karelerinin toplamıdır.

Kesişme noktasını hesaplamak için şu formülü kullanırsınız: a = (Σy - bΣx) / n.

Çoklu Regresyon 

Çoklu Doğrusal Regresyon:

Çoklu doğrusal regresyon modelinin denklemi için formül şöyledir:

y = b0 + b1x1 + b2x2 + ... + bnxn

Burada y bağımlı değişken, x1, x2, ..., xn bağımsız değişkenler ve b0, b1, b2, ..., bn bağımsız değişkenlerin katsayılarıdır.

Sıradan en küçük kareler kullanarak katsayıları tahmin etmek için formül şöyledir:

β = (X'X)(-1)X'y

Burada β katsayıların sütun vektörü, X bağımsız değişkenlerin tasarım matrisi, X' X'in transpozesi ve y bağımlı değişkenin gözlem vektörüdür.

Regresyon Analizi Örneği

Bir bireyin not ortalaması (GPA) ile haftada çalıştığı saat sayısı arasındaki bağlantıyı incelemek istediğinizi varsayalım. Bir dizi öğrenciden çalışma saatleri ve not ortalamaları dahil olmak üzere bilgi topluyorsunuz.

Ardından, her iki değişken arasında doğrusal bir bağlantı olup olmadığını görmek için regresyon analizini kullanın ve eğer varsa, bir öğrencinin haftada kaç saat çalıştığına bağlı olarak not ortalamasını tahmin eden bir model oluşturabilirsiniz.

Resim şurada mevcut alchemer.com

Veriler bir dağılım haritası üzerine çizildiğinde, çalışma saatleri ile not ortalaması arasında uygun bir doğrusal bağlantı olduğu görülmektedir. En iyi uyum çizgisinin eğimi ve kesişimi daha sonra basit bir doğrusal regresyon modeli kullanılarak tahmin edilir. Nihai çözüm şu şekilde olabilir:

GPA = 2.0 + 0.3 (haftada çalışılan saat)

Resim şurada mevcut alchemer.com

Bu denklem, haftada fazladan çalışılan her saat için, öğrencinin not ortalamasının 0,3 puan artacağını, diğer her şeyin eşit olduğunu belirtir. Bu algoritma, bir öğrencinin haftada kaç saat çalıştığına bağlı olarak not ortalamasını tahmin etmek ve çalışma rutinlerine bağlı olarak hangi öğrencilerin düşük performans gösterme riski altında olduğunu belirlemek için kullanılabilir. 

Örnekteki verileri kullanarak, aşağıdakiler için değerler b ve a aşağıdaki gibidir:

n = 10 (gözlem sayısı)

Σx = 30 (çalışma saatlerinin toplamı)

Σy = 25 (not ortalamalarının toplamı)

Σxy = 149 (çalışma saatleri ve not ortalamalarının çarpımının toplamı)

Σ(x)2 = 102 (çalışma saatlerinin karelerinin toplamı)

Bu değerleri kullanarak şunları hesaplayın b gibi:

b = (nΣ(xy) - ΣxΣy) / (nΣ(x2) - (Σx)2)

= (10 * 149 – 30 * 25) / (10 * 102 – 302)

= 0.3

Ve hesapla a gibi:

a = (Σy - bΣx) / n

= (25 – 0.3 * 30) / 10

= 2.0

Bu nedenle, en iyi uyum doğrusunun denklemi şöyledir: 

GPA = 2.0 + 0.3 (haftada çalışılan saat)

Korelasyon ve regresyon arasındaki fark nedir?

Hem korelasyon hem de regresyon, iki değişken arasındaki bağlantıyı incelemek için kullanılan istatistiksel yöntemlerdir. Farklı amaçlara hizmet ederler ve farklı türde bilgiler sağlarlar.

Korelasyon, iki değişken arasındaki bağlantının gücü ve seyrinin bir ölçüsüdür. Korelasyon -1 ile +1 arasında değişir; -1 mükemmel negatif korelasyonu, 0 korelasyon olmadığını ve +1 mükemmel pozitif korelasyonu temsil eder. Korelasyon, iki değişkenin ne derece bağlantılı olduğunu gösterir, ancak neden veya öngörülebilirliği göstermez.

Öte yandan regresyon, tipik olarak bir değişkeni diğerine bağlı olarak tahmin etmek veya açıklamak için iki değişken arasındaki bağlantıyı modelleme yöntemidir. Regresyon analizi, ilişkinin boyutu ve yönü hakkında tahminlerin yanı sıra istatistiksel anlamlılık testleri, güven aralıkları ve gelecekteki sonuç tahminleri sağlayabilir.

Kreasyonlarınız, dakikalar içinde hazır

Mind the Graph size benzersiz ihtiyaçlarınızı karşılamak için kolayca değiştirilebilen kapsamlı bir bilimsel illüstrasyon ve infografik tasarım kütüphanesi sunan çevrimiçi bir platformdur. Sürükle-bırak arayüzü ve çok çeşitli araç ve özellikleri kullanarak dakikalar içinde profesyonel görünümlü çizelgeler, posterler ve grafik özetler oluşturun. 

logo-abone ol

Haber bültenimize abone olun

Etkili görseller hakkında özel yüksek kaliteli içerik
bilimde iletişim.

- Özel Rehber
- Tasarım ipuçları
- Bilimsel haberler ve trendler
- Öğreticiler ve şablonlar