Jumlah kuadrat.

Apa Jumlah kuadrat?

Jumlah kuadrat adalah teknik statistik yang digunakan dalam analisis regresi untuk menentukan penyebaran titik data. Dalam analisis regresi, tujuannya adalah untuk menentukan seberapa baik rangkaian data dapat dipasang ke fungsi yang dapat membantu menjelaskan bagaimana rangkaian data dihasilkan. Jumlah kuadrat digunakan sebagai cara matematis untuk menemukan fungsi yang paling cocok (paling tidak bervariasi) dari data.

Rumus Jumlah Kuadrat Adalah

For a set X of n items:Sum of squares=∑saya=0n(Xsaya-X‾)2where:Xsaya=The sayath item in the setX‾=The mean of suatull items in the set(Xsaya-X‾)=The deviation of each item from the mean\ begin {aligned} & \ text {For a set} X \ text {of} n \ text {items:} \\ & \ text {Jumlah kotak} = \ sum_ {i = 0} ^ {n} \ kiri (X_i- \ overline {X} \ right) ^ 2 \\ & \ textbf {di mana:} \\ & X_i = \ text {The} i ^ {th} \ text {item dalam set} \\ & \ overline { X} = \ text {Rata-rata semua item dalam set} \\ & \ left (X_i- \ overline {X} \ right) = \ text {Penyimpangan setiap item dari mean} \\ \ end {rata } orang Untuk satu set  X dari  n item:Jumlah kotak=i=0∑n orang (Xsaya orang -X

Jumlah kuadrat juga dikenal sebagai variasi.

Apa Jumlah Kuadrat Beritahu Anda?

Jumlah kuadrat adalah ukuran penyimpangan dari mean. Dalam statistik, mean adalah rata-rata dari sekumpulan angka dan merupakan ukuran tendensi sentral yang paling umum digunakan. Rata-rata aritmatika hanya dihitung dengan menjumlahkan nilai-nilai dalam kumpulan data dan membaginya dengan jumlah nilai.

Misalkan harga penutupan Microsoft (MSFT) dalam lima hari terakhir adalah 74,01, 74,77, 73,94, 73,61, dan 73,40 dalam dolar AS. Jumlah dari total harga adalah $ 369.73 dan mean atau harga rata-rata buku teks menjadi $ 369.73 / 5 = $ 73.95.

Tetapi mengetahui mean dari suatu set pengukuran tidak selalu cukup. Terkadang, mengetahui berapa banyak variasi yang ada dalam satu set pengukuran sangat membantu. Seberapa jauh nilai individu dari mean dapat memberikan beberapa wawasan tentang seberapa cocok observasi atau nilai dengan model regresi yang dibuat.

Misalnya, jika seorang analis ingin mengetahui apakah harga saham MSFT bergerak seiring dengan harga Apple (AAPL), ia dapat membuat daftar pengamatan untuk proses kedua saham tersebut selama periode tertentu, misalnya 1, 2 , atau 10 tahun dan buat model linier dengan masing-masing observasi atau pengukuran direkam. Jika hubungan antara kedua variabel (yaitu, harga AAPL dan harga MSFT) tidak berupa garis lurus, maka ada variasi dalam kumpulan data yang perlu dicermati.

Dalam statistik berbicara, jika garis dalam model linier yang dibuat tidak melewati semua pengukuran nilai, maka beberapa variabilitas yang telah diamati pada harga saham tidak dapat dijelaskan. Jumlah kuadrat digunakan untuk menghitung apakah ada hubungan linier antara dua variabel, dan setiap variabilitas yang tidak dapat dijelaskan disebut sebagai jumlah sisa kuadrat .

Jumlah kuadrat adalah jumlah kuadrat variasi, di mana variasi didefinisikan sebagai sebaran antara setiap nilai individu dan rata-rata. Untuk menentukan jumlah kuadrat, jarak antara setiap titik data dan garis yang paling sesuai dikuadratkan lalu dijumlahkan. Garis yang paling sesuai akan meminimalkan nilai ini.

Bagaimana Menghitung Jumlah Kuadrat

Sekarang Anda dapat melihat mengapa pengukuran itu disebut jumlah simpangan kuadrat, atau singkatnya jumlah kuadrat. Menggunakan contoh MSFT kami di atas, jumlah kuadrat dapat dihitung sebagai:

  • SS = (74,01 – 73,95) 2 + (74,77 – 73,95) 2 + (73,94 – 73,95) 2 + (73,61 – 73,95) 2 + (73,40 – 73,95) 2
  • SS = (0,06) 2 + (0,82) 2 + (-0,01) 2 + (-0,34) 2 + (-0,55) 2
  • SS = 1,0942

Menambahkan jumlah simpangan saja tanpa mengkuadratkan akan menghasilkan angka yang sama dengan atau mendekati nol karena simpangan negatif hampir secara sempurna mengimbangi simpangan positif. Untuk mendapatkan angka yang lebih realistis, jumlah penyimpangan harus dikuadratkan. Jumlah kuadrat akan selalu berupa bilangan positif karena kuadrat dari bilangan apa pun, baik positif maupun negatif, selalu positif.

Contoh Cara Menggunakan Jumlah Kuadrat

Berdasarkan hasil perhitungan MSFT, jumlah kuadrat yang tinggi menunjukkan bahwa sebagian besar nilai berada jauh dari mean, sehingga terdapat variabilitas yang besar dalam data tersebut. Jumlah kotak yang rendah mengacu pada variabilitas rendah dalam kumpulan pengamatan.

Pada contoh di atas, 1.0942 menunjukkan bahwa variabilitas harga saham MSFT dalam lima hari terakhir sangat rendah dan investor yang ingin berinvestasi pada saham yang ditandai dengan stabilitas harga dan volatilitas yang rendah dapat memilih MSFT.

Poin Penting

  • Jumlah kotak mengukur penyimpangan titik data dari nilai rata-rata.
  • Hasil jumlah kuadrat yang lebih tinggi menunjukkan tingkat variabilitas yang besar dalam kumpulan data, sedangkan hasil yang lebih rendah menunjukkan bahwa data tidak terlalu berbeda dari nilai rata-rata.

Batasan Penggunaan Jumlah Kuadrat

Membuat keputusan investasi tentang saham apa yang akan dibeli membutuhkan lebih banyak pengamatan daripada yang tercantum di sini. Seorang analis mungkin harus bekerja dengan data bertahun-tahun untuk mengetahui dengan kepastian yang lebih tinggi seberapa tinggi atau rendah variabilitas suatu aset. Semakin banyak poin data yang ditambahkan ke himpunan, jumlah kuadrat menjadi lebih besar karena nilainya akan lebih tersebar.

Pengukuran variasi yang paling banyak digunakan adalah deviasi standar dan varians. Namun, untuk menghitung salah satu dari dua metrik tersebut, jumlah kuadrat harus dihitung terlebih dahulu. Varians adalah rata-rata dari jumlah kuadrat (yaitu, jumlah kuadrat dibagi dengan jumlah pengamatan). Simpangan baku adalah akar kuadrat dari varians.

Ada dua metode analisis regresi yang menggunakan jumlah kuadrat: metode kuadrat terkecil linier dan metode kuadrat terkecil non-linier. Metode kuadrat terkecil mengacu pada fakta bahwa fungsi regresi meminimalkan jumlah kuadrat varian dari titik data aktual. Dengan cara ini, dimungkinkan untuk menggambar fungsi yang secara statistik paling sesuai untuk data. Perhatikan bahwa fungsi regresi dapat berupa linier (garis lurus) atau non-linier (garis melengkung).