Analisis korélasi

Saka Wikipédia, Bauwarna Mardika abasa Jawa / Saking Wikipédia, Bauwarna Mardika abasa Jawi
Langsung menyang: pandhu arah, pados
Jinis-jinis korélasi

Jroning téori probabilitas lan statistika, korélasi, uga diarani koéfisien korélasi, iku aji sing nuduhaké kakuwatan lan arah hubungan linièr antara loro pangowah acak (random variable).

Koèfisien korélasi
Korélasi dhuwur Dhuwur Asor Asor Tanpa korélasi Ora ana korélasi (acak) Tanpa korélasi Asor Asor Dhuwur Korélasi dhuwur
−1 < −0.9 > −0.9 < −0.4 > −0.4 0 < +0.4 > +0.4 < +0.9 > +0.9 +1

Salah siji jinis korélasi sing paling populèr yaiku koèfisièn korélasi momèn-prodhuk Pearson, sing dikasilaké saka mara kovarians kaloro variabel kanthi ping-pingan simpangan bakuné. Senadyan nduwèni jeneng Pearson, metodhe iki pisanan dikenalaké déning Francis Galton.

Koèfisièn korélasi momèn-prodhuk Pearson[sunting | sunting sumber]

Sipat-sipat matematis[sunting | sunting sumber]

Korélasi linier antara 1000 pasang pengamatan. Dhata digambaraké ing bagéyan kiwa ngisor lan koèfisièn korelasiné dituduhaké ing pérangan tengen ndhuwur. Saben titik pengamatan duwé korélasi maksimum karo awaké dhéwé, kaya ditudhuhaké ing dhiagonal (kabèh korélasi = +1).

Korélasi ρX, Y antara loro pangowah acak X lan Y kanthi aji sing dikarepaké μX lan μY lan simpangan baku σX lan σY didhéfinisi minangka:


\rho_{X,Y}={\mathrm{cov}(X,Y) \over \sigma_X \sigma_Y} ={E((X-\mu_X)(Y-\mu_Y)) \over \sigma_X\sigma_Y}.

Amarga μX = E(X), σX2 = E(X2) − E2(X) lan semono uga tumrap Y, mula bisa uga ditulis


\rho_{X,Y}=\frac{E(XY)-E(X)E(Y)}{\sqrt{E(X^2)-E^2(X)}~\sqrt{E(Y^2)-E^2(Y)}}

Korélasi bisa diitung yèn simpangan baku finit lan kaloroné ora padha karo nol. Jroning pambuktèn Nir pepadhan Cauchy-Schwarz, koèfisièn korélasi ora bakal ngluwihi saka 1 jroning aji absolut. Korélasi mawa aji 1 yèn ana hubungan linier sing positif, mawa aji -1 yèn ana hubungan linier sing negatif, lan antara -1 lan +1 sing nuduhaké tingkat dhépendhènsi linièr antara loro variabel. Tansaya cedhak karo -1 utawa +1, tansaya kuwat korélasi antara kaloro variabel kasebut.

Yèn variabel-variabel kasebut silih bébas, aji korélasi padha karo 0. Nanging ora mangkono kanggo suwaliké, amarga koèfisièn korélasi mung ndhétèksi kagumantungan linièr antara kaloro variabel. Umpamané, pangowah acak X mawa dhistribusi uniform ing interval antara -1 lan +1, lan Y = X2. Kanthi mangkono aji Y ditemtokaké mung déning X.'

Koèfisièn korélasi non-paramètrik[sunting | sunting sumber]

Anscombe's quartet 3.svg

Koèfisièn korélasi Pearson minangka statistik paramètrik, lan kurang nggambaraké korélasi yèn asumsi dhasar normalitas sawiji data dilanggar. Métodhe korélasi non-paramètrik kaya ρ Spearman lan τ Kendall migunani nalika dhistribusi ora normal. Koèfisièn korélasi non-paramètrik isih kurang kuwat yèn dibandhingaké karo métodhe paramètrik yèn asumsi normalitas data dikebaki, nanging cenderung mènèhi asil distrosi nalika asumsi kasebut ora dikebaki.

Métodhe pangukuran sing liya kanggo meruhi dhépendhènsi antara loro pangowah acak[sunting | sunting sumber]

Kanggo ngantukaké sawiji pangukuran ngenani dependensi data (uga nonlinier), bisa dipigunakaké rasio korélasi, sing mampu ndhétèksi amèh kabèh dependensi fungsional

Kopula lan korélasi[sunting | sunting sumber]

Akèh wong sing klèru nganggep yèn informasi sing diwènèhaké déning sawiji koèfisièn korélasi wis cukup ndhéfinisin struktur kagumantungan (dependensi) antara pangowah acak. Nanging kanggo meruhi anané kagumantungan antara pangowah acak kudu ditimbang uga kopula antara kaloroné. Koèfisièn korélasi bisa didhéfinisi minangka struktur kagumantungan mung ana ing sawetara kasus, umpamané jroning fungsi distribusi kumulatif ing distribusi normal multivariat.

Matriks korélasi[sunting | sunting sumber]

Matriks korélasi n pangowah acak X1, ..., Xn ya iku n  ×  n matrik ing ngendi i,j ya iku corr(XiXj). Yèn ukuran korélasi sing dipigunakaké arupa koèfisièn momèn-prodhuk, matriks korélasi bakal padha karo matriks kovarians pangowah acak sing wis distandaraké Xi /SD(Xi) untuk i = 1, ..., n. Saéngga, matriks korélasi minangka matriks definit ora-negatif.

Matriks korélasi tansah simètris, yakuwi korélasi antara X_i lan X_j ya iku padha karo korélasi antara X_j lan X_i).

"Korélasi ora mesthi sebab-akibat"[sunting | sunting sumber]

Diktum konvensi yèn "korélasi ora tansah ateges sebab-akibat" dibahas jroning artikel hubungan artifisial (spurious relationship). Deleng uga korélasi ngarah menyang hubungan sebab-akibat (kakliruan logis). Kepiyé waé, korélasi ora diasumsi tansah akausal, senadyan panyebab kasebut bisa uga ora diweruhi.

Ngitung korélasi sacara akurat nganggo métode numerik[sunting | sunting sumber]

Ing ngisor iki algoritma (jroning pseudocode) sing bakal mènèhi èstimasi korélasi kanthi migunakaké metodhe mumerik

sum_sq_x = 0
sum_sq_y = 0
sum_coproduct = 0
mean_x = x[1]
mean_y = y[1]
last_x = x[1]
last_y = y[1]
for i in 2 to N:
    sweep = (i - 1.0) / i
    delta_x = x[i] - mean_x
    delta_y = y[i] - mean_y
    sum_sq_x += delta_x * delta_x * sweep
    sum_sq_y += delta_y * delta_y * sweep
    sum_coproduct += delta_x * delta_y * sweep
    mean_x += delta_x / i
    mean_y += delta_y / i 
pop_sd_x = sqrt( sum_sq_x / N )
pop_sd_y = sqrt( sum_sq_y / N )
cov_x_y = sum_coproduct / N
correlation = cov_x_y / (pop_sd_x * pop_sd_y)


Pranala njaba[sunting | sunting sumber]


Sumber artikel punika saking kaca situs web: "http://jv.wikipedia.org/w/index.php?title=Analisis_korélasi&oldid=833202"