Halo, statistician! Pernahkah kamu berpikir bagaimana cara memprediksi sesuatu yang hasilnya hanya dua kemungkinan? Misalnya, apakah mahasiswa akan lulus tepat waktu atau tidak, apakah konsumen akan membeli produk atau tidak, atau apakah seseorang sehat atau sakit?. Untuk kasus seperti ini, regresi linier tidak cocok digunakan, karena hasil prediksinya bisa berupa angka di luar rentang 0–1. Nah, di sinilah regresi logistik menjadi solusi.
Apa itu Regresi Logistik?
Regresi logistik adalah metode statistik yang digunakan untuk menganalisis hubungan antara variabel bebas (independen) dengan variabel terikat (dependen) yang bersifat kategorik. Berbeda dengan regresi linier (Ordinary Least Squares) yang digunakan untuk memprediksi nilai kontinu seperti pendapatan, nilai ujian, atau tinggi badan, sementara itu regresi logistik digunakan untuk memprediksi probabilitas suatu kejadian yang nilainya selalu berada pada rentang 0–1.
Perbedaan Model Regresi Linier dan Regresi Logistik
Pada regresi linier biasa (Ordinary Least Squares), model yang digunakan adalah:
![]()
Keterangan:
Y = variabel dependen (kontinu).
β0 = konstanta.
β1 = koefisien regresi.
e = error (residual).
Namun, pada regresi logistik tidak bisa memakai model ini karena variabel Y berupa kategori (0 atau 1). Oleh karena itu, digunakan transformasi ke bentuk probabilitas:
![]()
Keterangan:
π(x) = Peluang terjadinya kejadian (probabilitas).
e = Bilangan eksponensial (2,718).
α = Konstanta/intersep.
β = Koefisien regresi.
x = Variabel independen.
Dengan model ini, hasil prediksi selalu berada pada rentang 0 sampai 1 sehingga cocok untuk data kategorik.
Interpretasi dalam Regresi Logistik
- Logit
Transformasi untuk mengubah hubungan non-linear menjadi linear:

Artinya, logit adalah logaritma dari rasio peluang sukses dibanding gagal. - Odds
Rasio peluang sukses terhadap peluang gagal:

- Odds Ratio (OR)
Perbandingan odds antara dua kondisi.
OR > 1 → meningkatkan peluang kejadian.
OR < 1 → menurunkan peluang kejadian.
Jenis Analisis Regresi Logistik
Dalam literatur, regresi logistik dibagi menjadi tiga jenis:
- Regresi Logistik Biner
Variabel dependen berbentuk nominal biner (2 kategori).
Contoh: lulus/tidak lulus, membeli/tidak membeli. - Regresi Logistik untuk Data Nominal
Variabel dependen berbentuk nominal dengan lebih dari 2 kategori.
Contoh: moda transportasi (motor, mobil, bus, kereta).
Catatan: dalam beberapa literatur, analisis ini disebut juga Regresi Logistik Multinomial. - Regresi Logistik untuk Data Ordinal
Variabel dependen berbentuk ordinal (ada urutan).
Contoh: tingkat kepuasan (sangat tidak puas → sangat puas).
Nah, itu dia gambaran umum tentang regresi logistik. Metode ini jadi andalan kalau kita berhadapan dengan data kategorik dan ingin memahami peluang suatu kejadian. Dengan memahami konsep probabilitas, logit, odds, dan odds ratio, kita bisa melihat bagaimana faktor-faktor tertentu memengaruhi hasil yang hanya punya dua kemungkinan atau lebih.







