Analisis korélasi
Jroning téori probabilitas lan statistika, korélasi, uga diarani koéfisien korélasi, iku aji sing nuduhaké kakuwatan lan arah hubungan linièr antara loro pangowah acak (random variable).
| Korélasi dhuwur | Dhuwur | Asor | Asor | Tanpa korélasi | Ora ana korélasi (acak) | Tanpa korélasi | Asor | Asor | Dhuwur | Korélasi dhuwur |
|---|---|---|---|---|---|---|---|---|---|---|
| −1 | < −0.9 | > −0.9 | < −0.4 | > −0.4 | 0 | < +0.4 | > +0.4 | < +0.9 | > +0.9 | +1 |
Salah siji jinis korélasi sing paling populèr yaiku koèfisièn korélasi momèn-prodhuk Pearson, sing dikasilaké saka mara kovarians kaloro variabel kanthi ping-pingan simpangan bakuné. Senadyan nduwèni jeneng Pearson, metodhe iki pisanan dikenalaké déning Francis Galton.
Koèfisièn korélasi momèn-prodhuk Pearson [sunting]
Sipat-sipat matematis [sunting]
Korélasi ρX, Y antara loro pangowah acak X lan Y kanthi aji sing dikarepaké μX lan μY lan simpangan baku σX lan σY didhéfinisi minangka:
Amarga μX = E(X), σX2 = E(X2) − E2(X) lan semono uga tumrap Y, mula bisa uga ditulis
Korélasi bisa diitung yèn simpangan baku finit lan kaloroné ora padha karo nol. Jroning pambuktèn Nir pepadhan Cauchy-Schwarz, koèfisièn korélasi ora bakal ngluwihi saka 1 jroning aji absolut. Korélasi mawa aji 1 yèn ana hubungan linier sing positif, mawa aji -1 yèn ana hubungan linier sing negatif, lan antara -1 lan +1 sing nuduhaké tingkat dhépendhènsi linièr antara loro variabel. Tansaya cedhak karo -1 utawa +1, tansaya kuwat korélasi antara kaloro variabel kasebut.
Yèn variabel-variabel kasebut silih bébas, aji korélasi padha karo 0. Nanging ora mangkono kanggo suwaliké, amarga koèfisièn korélasi mung ndhétèksi kagumantungan linièr antara kaloro variabel. Umpamané, pangowah acak X mawa dhistribusi uniform ing interval antara -1 lan +1, lan Y = X2. Kanthi mangkono aji Y ditemtokaké mung déning X.'
Koèfisièn korélasi non-paramètrik [sunting]
Koèfisièn korélasi Pearson minangka statistik paramètrik, lan kurang nggambaraké korélasi yèn asumsi dhasar normalitas sawiji data dilanggar. Métodhe korélasi non-paramètrik kaya ρ Spearman lan τ Kendall migunani nalika dhistribusi ora normal. Koèfisièn korélasi non-paramètrik isih kurang kuwat yèn dibandhingaké karo métodhe paramètrik yèn asumsi normalitas data dikebaki, nanging cenderung mènèhi asil distrosi nalika asumsi kasebut ora dikebaki.
Métodhe pangukuran sing liya kanggo meruhi dhépendhènsi antara loro pangowah acak [sunting]
Kanggo ngantukaké sawiji pangukuran ngenani dependensi data (uga nonlinier), bisa dipigunakaké rasio korélasi, sing mampu ndhétèksi amèh kabèh dependensi fungsional
Kopula lan korélasi [sunting]
Akèh wong sing klèru nganggep yèn informasi sing diwènèhaké déning sawiji koèfisièn korélasi wis cukup ndhéfinisin struktur kagumantungan (dependensi) antara pangowah acak. Nanging kanggo meruhi anané kagumantungan antara pangowah acak kudu ditimbang uga kopula antara kaloroné. Koèfisièn korélasi bisa didhéfinisi minangka struktur kagumantungan mung ana ing sawetara kasus, umpamané jroning fungsi distribusi kumulatif ing distribusi normal multivariat.
Matriks korélasi [sunting]
Matriks korélasi n pangowah acak X1, ..., Xn ya iku n × n matrik ing ngendi i,j ya iku corr(Xi, Xj). Yèn ukuran korélasi sing dipigunakaké arupa koèfisièn momèn-prodhuk, matriks korélasi bakal padha karo matriks kovarians pangowah acak sing wis distandaraké Xi /SD(Xi) untuk i = 1, ..., n. Saéngga, matriks korélasi minangka matriks definit ora-negatif.
Matriks korélasi tansah simètris, yakuwi korélasi antara
lan
ya iku padha karo korélasi antara
lan
).
"Korélasi ora mesthi sebab-akibat" [sunting]
Diktum konvensi yèn "korélasi ora tansah ateges sebab-akibat" dibahas jroning artikel hubungan artifisial (spurious relationship). Deleng uga korélasi ngarah menyang hubungan sebab-akibat (kakliruan logis). Kepiyé waé, korélasi ora diasumsi tansah akausal, senadyan panyebab kasebut bisa uga ora diweruhi.
Ngitung korélasi sacara akurat nganggo métode numerik [sunting]
Ing ngisor iki algoritma (jroning pseudocode) sing bakal mènèhi èstimasi korélasi kanthi migunakaké metodhe mumerik
sum_sq_x = 0
sum_sq_y = 0
sum_coproduct = 0
mean_x = x[1]
mean_y = y[1]
last_x = x[1]
last_y = y[1]
for i in 2 to N:
sweep = (i - 1.0) / i
delta_x = x[i] - mean_x
delta_y = y[i] - mean_y
sum_sq_x += delta_x * delta_x * sweep
sum_sq_y += delta_y * delta_y * sweep
sum_coproduct += delta_x * delta_y * sweep
mean_x += delta_x / i
mean_y += delta_y / i
pop_sd_x = sqrt( sum_sq_x / N )
pop_sd_y = sqrt( sum_sq_y / N )
cov_x_y = sum_coproduct / N
correlation = cov_x_y / (pop_sd_x * pop_sd_y)
Pranala njaba [sunting]
- Understanding Correlation - Materi pegantar
- Statsoft Electronic Textbook
- Pearson's Correlation Coefficient
- Learning by Simulations - Distribusi koèfisièn korélasi
- Jasa analisis statistik penelitian - Jasa analisis statistik penelitian
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

