Halo, Statistician! Dalam dunia statistik, memahami bentuk distribusi data adalah langkah awal yang sangat penting. Banyak metode analisis statistik, seperti regresi atau uji hipotesis, mensyaratkan distribusi tertentu (misalnya normal atau binomial). Oleh karena itu, perlu dilakukan identifikasi distribusi data agar teknik analisis yang digunakan sesuai dan hasilnya valid.
Tahapan Identifikasi Distribusi Data
Menurut White et al. (1975), proses identifikasi distribusi data terdiri dari tiga tahap utama:
- Data Collection : Pengumpulan dan ringkasan data awal. Pada tahap ini, data divisualisasikan menggunakan grafik seperti histogram, boxplot, atau kurva frekuensi. Tujuannya adalah mengamati bentuk distribusi secara kasar dan menentukan kemungkinan distribusi teoritis (seperti simetris, miring, atau menyebar lebar).
- Parameter Estimation: Setelah distribusi yang mungkin telah dikenali, langkah berikutnya adalah mengestimasi parameter dari distribusi tersebut, seperti: Rata-rata (μ) dan standar deviasi (σ) untuk distribusi normal dan Lambda (λ) untuk distribusi Poisson. Estimasi parameter ini akan digunakan dalam tahap pengujian kesesuaian.
- Goodness of Fit Test. Langkah terakhir adalah Uji Kebaikan Suai (Goodness of Fit Test), yaitu pengujian statistik untuk menentukan apakah data yang dikumpulkan memang sesuai dengan distribusi yang dihipotesiskan. Di sinilah beberapa uji statistik digunakan.
Jenis-Jenis Uji Goodness of Fit
- Chi-Square Test (Uji Khi-Kuadrat)
Menurut Walpole (1995), uji khi-kuadrat digunakan untuk menguji apakah distribusi frekuensi dari suatu sampel sesuai dengan distribusi teoritis. Biasanya digunakan untuk distribusi diskrit seperti:
- Binomial
- Poisson
- Normal (dalam bentuk kategori)
Rumus Uji:
Keterangan:
X^2 = Nilai chi-Square
Oi = Hasil Pengamatan
Ei = Nilai yang diharapkan
Asumsi:
- Data merupakan sampel acak dan bebas
- Skala data minimal nominal
- Data dapat dikelompokkan ke dalam r kategori
- Frekuensi harapan idealnya ≥ 5 untuk setiap kategori
- Kolmogorov-Smirnov Test (K-S Test)
Untuk data berskala kontinu, uji Kolmogorov-Smirnov lebih tepat digunakan. Uji ini membandingkan distribusi kumulatif dari data sampel dengan distribusi kumulatif dari distribusi teoritik.
Cocok digunakan untuk menguji distribusi:
- Normal
- Uniform
- Eksponensial
- Poisson
Pengolahan Data menggunakan SPSS:
- Buka file baru. Klik File → New → Data
- Selanjutnya klik analyze → nonparametric test → one sample.
- Klik fields dan isi kolom test fields dengan variabel nilai yan diinginkan
- Klik setting kemudian beri centang (√) pada Kolmogorov – Smirnov test.
- Klik option pada Kolmogorov – Smirnov Test. Pilih distribusi normal.
Sumber :
Modul Praktikum Analisis Data 1 Program Studi Statistika FMIPA, Universitas Islam Bandung