Distribusi Sampling

Apa Distribusi Sampling?

Distribusi pengambilan sampel adalah distribusi probabilitas statistik yang diperoleh dari sejumlah besar sampel yang diambil dari populasi tertentu. Distribusi pengambilan sampel dari populasi tertentu adalah distribusi frekuensi dari berbagai hasil berbeda yang mungkin terjadi untuk statistik suatu populasi .

Dalam  statistik, populasi adalah keseluruhan kumpulan dari mana sampel statistik   diambil. Populasi dapat merujuk pada seluruh kelompok orang, objek, peristiwa, kunjungan rumah sakit, atau pengukuran. Dengan demikian, populasi dapat dikatakan sebagai observasi agregat dari subjek yang dikelompokkan bersama oleh fitur umum.

Referensi cepat

  • Distribusi pengambilan sampel adalah statistik yang diperoleh melalui pengambilan sampel berulang dari populasi yang lebih besar.
  • Ini menjelaskan berbagai hasil yang mungkin dari statistik, seperti mean atau mode beberapa variabel, karena itu benar-benar ada suatu populasi.
  • Mayoritas data yang dianalisis oleh peneliti sebenarnya diambil dari sampel, dan bukan populasi.

Memahami Distribusi Sampling

Banyak data yang diambil dan digunakan oleh akademisi, ahli statistik, peneliti, pemasar, analis, dll. Sebenarnya adalah sampel, bukan populasi. Sampel adalah bagian dari populasi. Misalnya, seorang peneliti medis yang ingin membandingkan berat rata-rata semua bayi yang lahir di Amerika Utara dari 1995 hingga 2005 dengan bayi yang lahir di Amerika Selatan dalam periode waktu yang sama tidak dapat menarik data untuk seluruh populasi dalam jangka waktu yang wajar. lebih dari satu juta persalinan yang terjadi selama jangka waktu sepuluh tahun. Dia malah hanya akan menggunakan berat, katakanlah, 100 bayi, di setiap benua untuk membuat kesimpulan. Bobot 200 bayi yang digunakan sebagai sampel dan bobot rata-rata yang dihitung adalah mean sampel.

Sekarang anggaplah bahwa alih-alih hanya mengambil satu sampel dari 100 bayi baru lahir dari setiap benua, peneliti medis mengambil sampel acak berulang dari populasi umum, dan menghitung rata-rata sampel untuk setiap kelompok sampel. Jadi, untuk Amerika Utara, dia mengambil data untuk 100 anak baru lahir yang tercatat di AS, Kanada dan Meksiko sebagai berikut: empat 100 sampel dari rumah sakit terpilih di AS, lima 70 sampel dari Kanada dan tiga 150 catatan dari Meksiko, dengan total dari 1200 bobot bayi baru lahir dikelompokkan dalam 12 set. Ia juga mengumpulkan data sampel 100 bayi lahir berat dari masing-masing 12 negara di Amerika Selatan.

Referensi cepat

Setiap sampel memiliki mean sampelnya sendiri dan distribusi mean sampel dikenal sebagai distribusi sampel.

Bobot rata-rata yang dihitung untuk setiap set sampel adalah distribusi sampling dari mean. Tidak hanya mean yang dapat dihitung dari sampel. Statistik lain , seperti deviasi standar, varian, proporsi, dan rentang dapat dihitung dari data sampel. Standar deviasi dan varians mengukur variabilitas distribusi sampling.

Jumlah observasi dalam suatu populasi, jumlah observasi dalam sampel dan prosedur yang digunakan untuk menggambar set sampel menentukan variabilitas distribusi sampling. Simpangan baku dari distribusi sampling disebut kesalahan standar. Meskipun rata-rata distribusi sampel sama dengan rata-rata populasi, kesalahan standar bergantung pada deviasi standar populasi, ukuran populasi dan ukuran sampel.

Mengetahui seberapa jauh sebaran mean dari masing-masing set sampel satu sama lain dan dari mean populasi akan memberikan indikasi seberapa dekat mean sampel dengan mean populasi. Kesalahan standar dari distribusi pengambilan sampel menurun dengan bertambahnya ukuran sampel.

Pertimbangan Khusus

Populasi atau satu kumpulan nomor sampel akan berdistribusi normal. Namun, karena distribusi sampling mencakup beberapa set pengamatan, tidak harus berbentuk kurva lonceng .

Mengikuti contoh kami, rata-rata populasi berat bayi di Amerika Utara dan di Amerika Selatan memiliki distribusi normal karena beberapa bayi akan mengalami berat badan kurang (di bawah rata-rata) atau kelebihan berat badan (di atas rata-rata), dengan sebagian besar bayi berada di antaranya (sekitar rata-rata ). Jika berat rata-rata bayi baru lahir di Amerika Utara adalah tujuh pon, berat rata-rata sampel di masing-masing dari 12 set pengamatan sampel yang dicatat untuk Amerika Utara juga akan mendekati tujuh pon.

Namun, jika Anda membuat grafik untuk setiap rata-rata yang dihitung di masing-masing 1.200 kelompok sampel, bentuk yang dihasilkan dapat menghasilkan distribusi yang seragam, tetapi sulit untuk memprediksi dengan pasti seperti apa bentuk sebenarnya nantinya. Semakin banyak sampel yang digunakan peneliti dari populasi lebih dari satu juta angka bobot, semakin banyak grafik akan mulai membentuk distribusi normal.