Analisis regresi adalah pendekatan untuk mengidentifikasi dan menganalisis hubungan antara satu atau lebih variabel independen dan variabel dependen. Metode ini digunakan secara luas dalam berbagai disiplin ilmu, termasuk perawatan kesehatan, ilmu sosial, teknik, ekonomi, dan bisnis. Anda dapat menggunakan analisis regresi untuk menyelidiki hubungan mendasar dalam data dan mengembangkan model prediktif yang akan membantu Anda dalam mengambil keputusan yang tepat.
Artikel ini akan memberi Anda gambaran umum yang komprehensif tentang analisis regresi, termasuk cara kerjanya, contoh yang mudah dipahami, dan akan menjelaskan perbedaannya dengan analisis korelasi.
Apa Itu Analisis Regresi?
Analisis regresi adalah metode statistik untuk mengidentifikasi dan mengukur hubungan antara variabel dependen dan satu atau lebih variabel independen. Singkatnya, metode ini membantu Anda memahami bagaimana perubahan pada satu atau lebih variabel independen terkait dengan perubahan pada variabel dependen.
Untuk mendapatkan pemahaman menyeluruh mengenai analisis regresi, Anda harus terlebih dahulu memahami istilah-istilah berikut ini:
- Variabel Dependen: Ini adalah variabel yang ingin Anda analisis atau prediksi. Ini adalah variabel hasil yang ingin Anda pahami dan jelaskan.
- Variabel Independen: Ini adalah variabel-variabel yang Anda yakini berpengaruh pada variabel dependen. Variabel ini sering disebut sebagai variabel prediktor, karena digunakan untuk memprediksi atau menjelaskan perubahan pada variabel dependen.
Analisis regresi dapat digunakan untuk berbagai keadaan, termasuk memprediksi nilai variabel dependen di masa depan, memahami pengaruh variabel independen terhadap variabel dependen, dan menemukan outlier atau kejadian yang tidak biasa dalam pengumpulan data.
Analisis regresi dapat diklasifikasikan ke dalam beberapa jenis, termasuk regresi linier tunggal, regresi logistik, regresi polinomial, dan regresi berganda. Model regresi yang sesuai ditentukan oleh sifat data dan subjek investigasi yang sedang dipertimbangkan.
Bagaimana Cara Kerja Analisis Regresi?
Tujuan dari analisis regresi adalah untuk mengidentifikasi garis atau kurva yang paling sesuai yang mencerminkan hubungan antara variabel independen dan variabel dependen. Garis atau kurva yang paling sesuai ini dihasilkan dengan menggunakan metode statistik yang mengurangi perbedaan antara nilai yang diharapkan dan nilai nyata dalam pengumpulan data.
Berikut adalah rumus untuk dua jenis analisis regresi yang paling umum:
Regresi Linier Tunggal
Dalam Regresi Linier Sederhana, Anda menggunakan garis yang paling sesuai untuk menunjukkan hubungan antara dua variabel: variabel independen (x) dan variabel dependen (y).
Garis kecocokan terbaik dapat diwakili oleh persamaan: y = a + bx.
Di sini, a adalah intersep, b adalah kemiringan garis. Untuk menghitung kemiringan, Anda menggunakan rumus: b = (nΣ(xy) - ΣxΣy) / (nΣ(x2) - (Σx)2), di mana n adalah jumlah pengamatan, Σxy adalah jumlah hasil kali x dan y, Σx dan Σy masing-masing adalah jumlah x dan y, dan Σ(x2) adalah jumlah kuadrat dari x.
Untuk menghitung intersep, Anda menggunakan rumus: a = (Σy - bΣx) / n.
Regresi Berganda
Regresi Linier Berganda:
Rumus persamaan model regresi linier berganda adalah:
y = b0 + b1x1 + b2x2 + ... + bnxn
di mana y adalah variabel dependen, x1, x2, ..., xn adalah variabel independen, dan b0, b1, b2..., bn adalah koefisien dari variabel-variabel independen.
Rumus untuk mengestimasi koefisien menggunakan kuadrat terkecil biasa adalah:
β = (X'X)(-1)X'y
di mana β adalah vektor kolom koefisien, X adalah matriks desain variabel independen, X' adalah transposisi dari X, dan y adalah vektor observasi variabel dependen.
Contoh Analisis Regresi
Anggaplah Anda ingin melihat hubungan antara indeks prestasi kumulatif (IPK) seseorang dengan jumlah jam belajar per minggu. Anda mengumpulkan informasi dari sekumpulan siswa, termasuk jumlah jam belajar dan indeks prestasi kumulatif mereka.
Kemudian, gunakan analisis regresi untuk melihat apakah ada hubungan linier antara kedua variabel dan jika ya, Anda dapat membangun model yang memprediksi IPK siswa berdasarkan jumlah jam belajar per minggu.
Ketika data diplot pada peta sebaran, terlihat bahwa ada hubungan linier yang baik antara jam belajar dan IPK. Kemiringan dan intersep dari garis kecocokan terbaik kemudian diestimasi dengan menggunakan model regresi linier sederhana. Hasil akhirnya bisa terlihat seperti ini:
IPK = 2.0 + 0.3 (jam belajar per minggu)
Persamaan ini menyatakan bahwa untuk setiap jam belajar tambahan per minggu, IPK mahasiswa akan naik 0,3 poin, dengan semua hal lain dianggap setara. Algoritme ini dapat digunakan untuk meramalkan IPK mahasiswa berdasarkan berapa jam mereka belajar per minggu, serta untuk mengidentifikasi mahasiswa mana yang berisiko berkinerja buruk berdasarkan rutinitas belajar mereka.
Dengan menggunakan data dari contoh, nilai untuk b dan a adalah sebagai berikut:
n = 10 (jumlah pengamatan)
Σx = 30 (jumlah jam belajar)
Σy = 25 (jumlah IPK)
Σxy = 149 (jumlah hasil kali jam belajar dan IPK)
Σ(x)2 = 102 (jumlah kuadrat dari jam belajar)
Dengan menggunakan nilai-nilai ini, hitunglah b sebagai:
b = (nΣ(xy) - ΣxΣy) / (nΣ(x2) - (Σx)2)
= (10 * 149 – 30 * 25) / (10 * 102 – 302)
= 0.3
Dan menghitung a sebagai:
a = (Σy - bΣx) / n
= (25 – 0.3 * 30) / 10
= 2.0
Oleh karena itu, persamaan garis kecocokan terbaik adalah:
IPK = 2.0 + 0.3 (jam belajar per minggu)
Apa perbedaan antara korelasi dan regresi?
Korelasi dan regresi adalah metode statistik untuk memeriksa hubungan antara dua variabel. Kedua metode ini memiliki tujuan yang berbeda dan memberikan jenis informasi yang berbeda pula.
Korelasi adalah ukuran kekuatan dan arah hubungan antara dua variabel. Korelasi berkisar antara -1 hingga +1, dengan -1 menunjukkan korelasi negatif sempurna, 0 menunjukkan tidak ada korelasi, dan +1 menunjukkan korelasi positif sempurna. Korelasi menunjukkan sejauh mana dua variabel terhubung, tetapi tidak menunjukkan penyebab atau prediktabilitas.
Regresi, di sisi lain, adalah metode untuk memodelkan hubungan antara dua variabel, biasanya untuk meramalkan atau menjelaskan satu variabel berdasarkan variabel lainnya. Analisis regresi dapat memberikan estimasi ukuran dan arah hubungan, serta uji signifikansi statistik, rentang kepercayaan, dan perkiraan hasil di masa depan.
Kreasi Anda, siap dalam hitungan menit
Mind the Graph adalah platform online yang menawarkan perpustakaan ilustrasi ilmiah dan desain infografis yang luas yang dapat dimodifikasi dengan mudah untuk memenuhi kebutuhan unik Anda. Buat bagan, poster, dan abstrak grafis yang terlihat profesional dalam hitungan menit dengan menggunakan antarmuka seret dan lepas serta berbagai alat dan fitur.
Berlangganan buletin kami
Konten eksklusif berkualitas tinggi tentang visual yang efektif
komunikasi dalam sains.