Korelasi palsu

Apa Korelasi palsu?

Dalam statistik, korelasi palsu, atau kepalsuan, mengacu pada hubungan antara dua variabel yang tampak kausal tetapi sebenarnya tidak. Hubungan palsu sering kali terlihat seperti satu variabel yang mempengaruhi variabel lainnya. Korelasi palsu ini sering kali disebabkan oleh faktor ketiga yang tidak nampak pada saat pemeriksaan, kadang disebut faktor perancu.

Poin Penting

  • Spurious Correlation, atau spuriousness, terjadi ketika dua faktor tampak berhubungan biasa tetapi sebenarnya tidak.
  • Kemunculan hubungan kausal sering kali disebabkan oleh pergerakan serupa pada grafik yang ternyata kebetulan atau disebabkan oleh faktor “perancu” ketiga.
  • Korelasi Palsu sering kali dapat disebabkan oleh ukuran sampel yang kecil atau titik akhir yang berubah-ubah.

Bagaimana Korelasi Palsu Bekerja

Ketika dua variabel acak melacak satu sama lain secara dekat pada grafik, mudah untuk mencurigai adanya korelasi, atau hubungan antara dua faktor, di mana perubahan mempengaruhi yang lain. Mengesampingkan “sebab-akibat”, topik lain, pengamatan ini dapat membuat pembaca grafik percaya bahwa pergerakan variabel A terkait dengan pergerakan di variabel B atau sebaliknya. tetapi terkadang, setelah pemeriksaan statistik yang lebih dekat, pergerakan yang selaras itu kebetulan atau disebabkan oleh faktor ketiga yang memengaruhi dua yang pertama. Ini adalah korelasi palsu. Penelitian yang dilakukan dengan ukuran sampel kecil atau titik akhir sewenang-wenang rentan terhadap spuriousness.

Contoh Korelasi Palsu

Tidaklah terlalu menantang untuk menemukan korelasi yang menarik. Namun, banyak yang ternyata palsu. Untuk spesies jantan di Wall Street, dua korelasi palsu yang populer melibatkan wanita dan olahraga. Berasal pada tahun 1920-an adalah teori panjang rok, yang menyatakan bahwa panjang rok dan arah pasar saham berkorelasi. Jika rok panjang, itu berarti pasar saham sedang turun; jika mereka pendek, pasar akan naik. Sekitar akhir Januari ada pembicaraan tentang apa yang disebut indikator Super Bowl, yang menunjukkan bahwa kemenangan oleh tim AFC kemungkinan berarti bahwa pasar saham akan turun di tahun mendatang, sedangkan kemenangan oleh tim NFC menandakan kenaikan dalam pasar. Sejak 1966, indikator ini memiliki tingkat akurasi 80%. Ini adalah bagian percakapan yang menyenangkan tetapi mungkin bukan sesuatu yang akan direkomendasikan oleh penasihat keuangan yang serius sebagai strategi investasi untuk klien.

Berikut beberapa contoh korelasi palsu yang umum:

  • Tenggelam meningkat saat penjualan es krim meningkat. Tampaknya peningkatan penjualan es krim menyebabkan lebih banyak orang tenggelam, tetapi kenyataannya, panas yang meningkat dapat menyebabkan lebih banyak orang berenang, serta membeli lebih banyak es krim.
  • Tingkat pembunuhan di AS dari 2006-2011 turun pada tingkat yang sama dengan penggunaan Microsoft Internet Explorer.
  • Para eksekutif yang mengucapkan tolong dan terima kasih lebih sering menikmati kinerja saham yang lebih baik.
  • Orang yang memakai perlengkapan tim Oakland Raiders lebih cenderung melakukan kejahatan.

Bagaimana Mengenali Korelasi Palsu

Ahli statistik dan ilmuwan lain yang menganalisis data harus selalu mencari hubungan palsu. Ada banyak metode yang mereka gunakan, termasuk:

  • Memastikan sampel perwakilan yang tepat.
  • Mendapatkan ukuran sampel yang memadai.
  • Waspada terhadap titik akhir yang sewenang-wenang.
  • Mengontrol sebanyak mungkin variabel luar.
  • Menggunakan hipotesis nol dan memeriksa nilai p yang kuat.