Goodness-of-Fit

Apa Goodness-of-Fit?

Uji kesesuaian merupakan uji hipotesis statistik untuk melihat seberapa baik data sampel sesuai dengan suatu distribusi dari suatu populasi yang berdistribusi normal. Dengan kata lain, pengujian ini menunjukkan apakah data sampel Anda mewakili data yang Anda harapkan akan ditemukan dalam populasi sebenarnya atau jika data itu tidak jelas. Goodness-of-fit menetapkan perbedaan antara nilai yang diamati dan nilai yang diharapkan dari model dalam kasus distribusi normal.

Ada beberapa metode untuk menentukan kesesuaian. Beberapa metode paling populer yang digunakan dalam statistik termasuk uji chi-square, uji Kolmogorov-Smirnov, uji Anderson-Darling, dan uji Shipiro-Wilk.

Poin Penting

  • Uji kesesuaian adalah uji statistik yang bertujuan untuk menentukan apakah sekumpulan nilai yang diamati cocok dengan yang diharapkan dalam model yang berlaku.
  • Ada beberapa jenis pengujian kesesuaian, tetapi yang paling umum adalah uji chi-square.
  • Pengujian ini dapat menunjukkan apakah sampel data Anda sesuai dengan kumpulan data yang diharapkan dari populasi dengan distribusi normal.




Memahami Goodness-Of-Fit

Uji kesesuaian adalah metode statistik yang sering digunakan untuk membuat kesimpulan tentang nilai yang diamati. Pengujian ini menentukan bagaimana nilai aktual terkait dengan nilai prediksi dalam model, dan saat digunakan dalam pengambilan keputusan, pengujian kesesuaian dapat membantu memprediksi tren dan pola masa depan.

Uji kesesuaian yang paling umum adalah uji chi-kuadrat, biasanya digunakan untuk distribusi terpisah. Uji chi-square digunakan secara eksklusif untuk data yang dimasukkan ke dalam kelas (bins), dan membutuhkan ukuran sampel yang cukup untuk menghasilkan hasil yang akurat.

Referensi cepat

Uji kesesuaian biasanya digunakan untuk menguji normalitas residu atau untuk menentukan apakah dua sampel dikumpulkan dari distribusi yang identik.

Jenis Tes Goodness-Of-Fit

Uji Chi-Square

Uji chi-square, juga dikenal sebagai uji chi-square untuk independensi, adalah metode statistik inferensial yang menguji validitas klaim yang dibuat tentang suatu populasi berdasarkan sampel acak. Namun, ini tidak menunjukkan jenis atau intensitas hubungan tersebut. Misalnya, tidak menyimpulkan apakah hubungannya positif atau negatif.


Untuk menghitung kesesuaian chi-square, perlu untuk menetapkan tingkat signifikansi alfa yang diinginkan (misalnya, jika tingkat kepercayaan Anda 95% atau 0,95, maka alfa adalah 0,05), identifikasi variabel kategori untuk menguji, dan mendefinisikan pernyataan hipotesis tentang hubungan di antara mereka. The hipotesis nol menegaskan bahwa tidak ada hubungan ada antara variabel, dan hipotesis alternatif mengasumsikan bahwa ada hubungan. Frekuensi nilai yang diamati diukur dan selanjutnya digunakan dengan nilai yang diharapkan dan derajat kebebasan untuk menghitung chi-square. Jika hasilnya lebih rendah dari alfa, hipotesis nol tidak valid, yang menunjukkan adanya hubungan antara variabel.

Tes Kolmogorov-Smirnov

Dinamai menurut ahli matematika Rusia Andrey Kolmogorov dan Nikolai Smirnov, uji Kolmogorov-Smirnov (juga dikenal sebagai uji KS) adalah metode statistik yang menentukan apakah sampel berasal dari distribusi tertentu dalam suatu populasi. Uji Kolmogorov-Smirnov — direkomendasikan untuk sampel besar (mis., Lebih dari 2000) —is non-parametrik, artinya tidak bergantung pada distribusi apa pun agar valid. Ini berfokus Tujuannya adalah untuk membuktikan hipotesis nol, yang merupakan sampel berdistribusi normal.

Berlawanan dengan uji chi-kuadrat, uji Kolmogorov-Smirnov berlaku untuk distribusi kontinu. Seperti chi-square, ini menggunakan hipotesis nol dan alternatif serta tingkat signifikansi alfa. Nihil menunjukkan bahwa data mengikuti distribusi tertentu dalam populasi, dan alternatif menunjukkan bahwa data tidak mengikuti distribusi tertentu dalam populasi. Alfa digunakan untuk menentukan nilai kritis yang digunakan dalam pengujian.

Statistik uji yang dihitung, sering dilambangkan sebagai D, menentukan apakah hipotesis nol diterima atau ditolak. Jika D lebih besar dari nilai kritis pada alfa, hipotesis nol ditolak. Jika D kurang dari nilai kritis, hipotesis nol diterima, menunjukkan

Uji Shipiro-Wilk

Uji Shipiro-Wilk menentukan apakah sampel mengikuti distribusi normal. Menggunakan sampel dengan satu variabel data kontinu, uji Shipiro-Wilk hanya memeriksa normalitas. Direkomendasikan untuk ukuran sampel kecil hingga 2000. Sama seperti yang lain, ini menggunakan alfa dan membentuk dua hipotesis: nol dan alternatif. Hipotesis nol menyatakan bahwa sampel berasal dari distribusi normal, sedangkan hipotesis alternatif menyatakan sampel tidak berasal dari distribusi normal.

Uji Shipiro-Wilk menggunakan plot probabilitas yang disebut QQ Plot. Scatterplot ini secara visual menampilkan dua set kuantil pada sumbu y, disusun dari yang terkecil hingga terbesar. Jika setiap kuantil berasal dari distribusi yang sama, diagram sebar akan menampilkan serangkaian plot linier. Uji Shipiro-Wilk menggunakan QQ Plot untuk memperkirakan varians. Menggunakan varians QQ Plot bersama dengan varians yang diperkirakan dari populasi, seseorang dapat menentukan apakah sampel termasuk dalam distribusi normal. Jika hasil bagi kedua varians sama atau mendekati 1 untuk, maka hipotesis nol dapat diterima. Jika jauh lebih rendah dari 1, maka dapat ditolak.

FAQ Goodness-of-Fit

Apa Arti Goodness-of-Fit?

Goodness-of-Fit adalah uji hipotesis statistik yang digunakan untuk melihat seberapa dekat data yang diamati mencerminkan data yang diharapkan. Uji Goodness-of-Fit dapat membantu menentukan apakah sampel mengikuti distribusi normal, jika variabel kategori terkait, atau jika sampel acak berasal dari distribusi yang sama.

Mengapa Goodness-of-Fit Penting?

Tes Goodness-of-Fit membantu menentukan apakah data yang diamati sesuai dengan yang diharapkan. Keputusan dapat diambil berdasarkan hasil uji hipotesis yang dilakukan. Misalnya, pengecer ingin tahu penawaran produk apa yang menarik bagi kaum muda. Pengecer mensurvei sampel acak orang tua dan muda untuk mengidentifikasi produk mana yang lebih disukai. Dengan menggunakan chi-square, mereka mengidentifikasi bahwa, dengan keyakinan 95%, ada hubungan antara produk A dan orang-orang Anda. Berdasarkan hasil tersebut dapat ditentukan bahwa sampel ini mewakili populasi dewasa muda. Pemasar ritel dapat menggunakan ini untuk mereformasi kampanye mereka.

Apa yang Dimaksud dengan Goodness-of-Fit dalam Uji Chi-Square?

Uji chi-square apakah ada hubungan antara variabel kategori dan apakah sampel mewakili keseluruhan. Ini memperkirakan seberapa dekat data yang diamati mencerminkan data yang diharapkan, atau seberapa cocok mereka.

Bagaimana Anda Melakukan Tes Kecocokan?

Uji Goodness-of-FIt terdiri dari metode pengujian yang berbeda. Tujuan dari pengujian ini akan membantu menentukan metode mana yang akan digunakan. Misalnya, jika tujuannya adalah untuk menguji normalitas pada sampel yang relatif kecil, uji Shipiro-Wilk mungkin cocok. Jika ingin menentukan apakah suatu sampel berasal dari distribusi tertentu dalam suatu populasi, uji Kolmogorov-Smirnov akan digunakan. Setiap tes menggunakan rumus uniknya sendiri. Namun, keduanya memiliki kesamaan, seperti hipotesis nol dan tingkat signifikansi.

Contoh Tes Kecocokan

Misalnya, gym komunitas kecil mungkin beroperasi dengan asumsi memiliki kehadiran tertinggi pada hari Senin, Selasa dan Sabtu, kehadiran rata-rata pada hari Rabu dan Kamis, dan kehadiran terendah pada hari Jumat dan Minggu. Berdasarkan asumsi ini, gym mempekerjakan sejumlah anggota staf setiap hari untuk check-in anggota, membersihkan fasilitas, menawarkan layanan pelatihan, dan mengajar kelas.

Namun, gym tidak berkinerja baik secara finansial dan pemiliknya ingin tahu apakah asumsi kehadiran dan tingkat kepegawaian ini benar. Pemilik memutuskan untuk menghitung jumlah peserta gym setiap hari selama enam minggu. Dia kemudian dapat membandingkan asumsi kehadiran gym dengan kehadiran yang diamati menggunakan uji chi-square goodness-of-fit misalnya. Dengan data baru, dia dapat menentukan cara terbaik mengelola gym dan meningkatkan profitabilitas.