Statistik Nonparametrik: Gambaran Umum

Apa Statistik Nonparametrik: Gambaran Umum?

Statistik nonparametrik mengacu pada metode statistik di mana data tidak diasumsikan berasal dari model yang ditentukan yang ditentukan oleh sejumlah kecil parameter; contoh model tersebut antara lain model distribusi normal dan model regresi linier. Statistik nonparametrik terkadang menggunakan data yang ordinal, artinya tidak bergantung pada angka, melainkan pada peringkat atau urutan macam. Misalnya, survei yang menyampaikan preferensi konsumen mulai dari suka hingga tidak suka akan dianggap sebagai data ordinal.

Statistik nonparametrik meliputi statistik deskriptif nonparametrik, model statistik, inferensi, dan uji statistik. Struktur model model nonparametrik tidak ditentukan secara apriori tetapi ditentukan dari data. Istilah nonparametrik tidak dimaksudkan untuk menyiratkan bahwa model seperti itu sama sekali tidak memiliki parameter, melainkan bahwa jumlah dan sifat parameter bersifat fleksibel dan tidak ditetapkan sebelumnya. Histogram adalah contoh perkiraan nonparametrik dari distribusi probabilitas.

Poin Penting

  • Statistik nonparametrik mudah digunakan tetapi tidak menawarkan akurasi model statistik lainnya.
  • Jenis analisis ini sering kali paling cocok ketika mempertimbangkan urutan sesuatu, di mana meskipun data numerik berubah, hasilnya kemungkinan besar akan tetap sama.

Memahami Statistik Nonparametrik

Dalam statistik, statistik parametrik mencakup parameter seperti mean, deviasi standar, korelasi Pearson, varians, dll. Bentuk statistik ini menggunakan data yang diamati untuk memperkirakan parameter distribusi. Dalam statistik parametrik, data sering diasumsikan berasal dari distribusi normal dengan parameter yang tidak diketahui μ (mean populasi) dan σ2 (varians populasi), yang kemudian diestimasi menggunakan mean sampel dan varians sampel.

Referensi cepat

Statistik nonparametrik tidak membuat asumsi tentang ukuran sampel atau apakah data yang diamati bersifat kuantitatif.

Statistik nonparametrik tidak mengasumsikan bahwa data diambil dari distribusi normal. Sebaliknya, bentuk distribusi diperkirakan dengan bentuk pengukuran statistik ini. Meskipun ada banyak situasi di mana distribusi normal dapat diasumsikan, ada juga beberapa skenario di mana proses pembuatan data yang sebenarnya jauh dari distribusi normal.

Contoh Statistik Nonparametrik

Dalam contoh pertama, pertimbangkan seorang analis keuangan yang ingin memperkirakan nilai risiko (VaR) dari suatu investasi. Analis mengumpulkan data pendapatan dari 100-an investasi serupa selama jangka waktu yang sama. Daripada mengasumsikan bahwa penghasilan mengikuti distribusi normal, dia menggunakan histogram untuk memperkirakan distribusi secara nonparametrik. Persentil ke-5 dari histogram ini kemudian memberikan perkiraan nonparametrik VaR kepada analis.

Untuk contoh kedua, pertimbangkan peneliti lain yang ingin mengetahui apakah rata-rata jam tidur terkait dengan seberapa sering seseorang jatuh sakit. Karena banyak orang jarang jatuh sakit, dan kadang-kadang orang lain jauh lebih sering sakit daripada kebanyakan orang lain, distribusi frekuensi penyakit jelas tidak normal, miring ke kanan dan rawan outlier. Dengan demikian, daripada menggunakan metode yang mengasumsikan distribusi frekuensi penyakit yang normal, seperti yang dilakukan dalam analisis regresi klasik, misalnya, peneliti memutuskan untuk menggunakan metode nonparametrik seperti analisis regresi kuantitatif.

Pertimbangan Khusus

Statistik nonparametrik telah mendapatkan apresiasi karena kemudahan penggunaannya. Karena kebutuhan akan parameter dikurangi, data menjadi lebih dapat diterapkan untuk berbagai jenis pengujian. Jenis statistik ini dapat digunakan tanpa mean, ukuran sampel, deviasi standar, atau estimasi parameter terkait lainnya jika tidak ada informasi yang tersedia.

Karena statistik nonparametrik membuat lebih sedikit asumsi tentang data sampel, penerapannya lebih luas cakupannya daripada statistik parametrik. Dalam kasus di mana pengujian parametrik lebih sesuai, metode nonparametrik akan menjadi kurang efisien. Ini karena statistik nonparametrik membuang beberapa informasi yang tersedia dalam data, tidak seperti statistik parametrik.