Statistika

Saka Wikipédia Jawa, bauwarna bébas abasa Jawa
Dhistribusi normal
Gretl, salah siji program komputer statistik

Statistika iku èlmu sing nyinaoni cara gawé rencana, ngumpulaké, nganalisis, gawé interpretasi, lan présentasi data. Cekaké, statistika iku èlmu sing magepokan karo data. Istilah 'statistika' (basa Inggris: statistics) béda karo 'statistik' (statistic). Statistika minangka èlmu sing magepokan karo data, déné statistik iku data, informasi, utawa asil panerapan algoritma statistika ing sawijining data. Saka kumpulan data, statistika bisa dipigunakaké kanggo nyimpulaké utawa ndèskripsi data; bab iki diarani statistika dhèskriptif. Sapérangan gedhé konsèp dhasar statistika duwé asumsi téyori probabilitas. Sawetara istilah statistika antarané: populasi, sampel, unit sampel, lan probabilitas.

Statistika akèh dipatrapaké sajeroning manéka disiplin èlmu, ya iku èlmu-èlmu alam (umpamané astronomi lan biologi lan uga èlmu-èlmu sosial (kalebu sosiologi lan psikologi), lan ing babagan bisnis, ékonomi, lan indhustri. Statistika uga dipigunakaké sajeroning pamaréntahan kanggo manéka tujuan; sènsus padunung minangka salah siji prosedhur sing paling misuwur. Aplikasi statistika liyané sing saiki populèr ya iku prosedhur jajag panemu utawa polling (umpamané diayahi sadurungé pamilihan umum), sarta jajag rikat (pétungan rikat asil pemilu) utawa quick count. Ing babagan komputasi, statistika bisa uga dipatrapaké sajeroning pangenalan pola utawa kacerdhasan gawéan.

Sajarah[besut | besut sumber]

Panggunaan istilah statistika ngoyot saka istilah istilah sajeroning basa latin modhèrn statisticum collegium ("dewan nagara") lan basa Italia statista ("nagarawan" utawa "pulitikus").

Gottfried Achenwall (1749) migunakaké Statistik sajeroning basa Jerman kanggo sing sepisanan minangka jeneng saka kagiatan analisis data kanagaraan, kanthi makna "èlmu ngenani nagara (state)". Ing wiwitan abad kaping-19 wis ana pergeseran makna dadi "èlmu ngenani pangumpulan lan klasifikasi data". Sir John Sinclair ngenalaké jeneng (Statistics) lan pangertèn iki sajeroning basa Inggris. Mula, statistika sacara prinsip wiwitané mung ngurus data sing dianggo lembaga-lembaga administratif lan pamaréntahan. Pangumpulan data terus lumaku, mliginé liwat sènsus sing diayahi sacara lumintu kanggo mènèhi informasi kapadunungan sing owah saben wektu.

Ing abad kaping-19 lan wiwitan abad kaping-20 statistika wiwit akèh migunakaké babagan-babagan sajeroning matématika, mligi peluang. Cawang statistika sing saiki wis akèh dipigunakaké kanggo ndhukung métodhe èlmiah, statistika inferènsi, dikembangaké ing paruh kapindho abad kaping-19 lan wiwitan abad kaping-20 déning Ronald Fisher (sing masang dhasar statistika inferensi), Karl Pearson (métodhe régrèsi linear), lan William Sealey Gosset (nliti problem sampel ukuran cilik). Panggunaan statistika ing mangsa saiki wis nyentuh kabèh babagan èlmu, wiwit saka astronomi nganti linguistika. Babagan-babagan ékonomi, biologi lan cabang-cabang terapané, sarta psikologi akèh diprebawani déning statistika sajeroning metodologiné. Akibaté banjur lair èlmu-èlmu gabungan kaya ékonomètrika, biomètrika (utawa biostatistika), lan psikomètrika.

Sanajan nda pihak sing nganggep statistika minangka cawang saka matématika, ananging sapérangan pihak liyané nganggep statistika minangka babagan sing akèh kagandhèng karo matématika ndeleng saka sajarah lan aplikasiné. Ing Indonésia, kajian statistika sapérangan gedhé mlebu sajeroning fakultas matématika lan èlmu alam, ana ing dhépartemen sing madeg dhéwé utawa kagabung karo matématika.

Konsep dhasar[besut | besut sumber]

Sajeroning aplikasi statistika ing permasalahan sains, indhustri, utawa sosial, diwiwiti kanthi nyinaoni populasi. Makna populasi sajeroning statistika bisa ateges populasi barang urip, barang mati, utawa barang abstrak. Populasi uga bisa arupa pangukuran sawijining prosès sajeroning wektu sing béda-béda, ya iku misuwur kanthi istilah dhèrèt wektu.

Ngayahi pendataan (pangumpulan data) kabèh populasi dijenengaké sènsus. Sawiji sènsus wis mesthi mbutuhaké wektu lan biaya sing dhuwur. Mula, sajeroning statistika kerep diayahi panjupukan sampel (sampling), ya iku sapérangan cilik saka populasi, sing bisa makili kabèh populasi. Analisis data saka sampel sabanjuré dipigunakaké gawé generalisasi kabèh populasi.

Yèn sampel sing dijupuk cukup representatif, inferensial (panjupukan kaputusan) lan simpulan sing digawé saka sampel bisa dipigunakaké kanggo nggambaraké populasi sacara sakabèhané. Métodhe statistika ngenani cara njupuk sampel sing tepat dijenengaké tèhnik sampling.

Analisis statistik akèh migunakaké probabilitas minangka konsep dhasaré. Bab iki katon saka akèhé nganggo uji statistika sing njupuk dhasar ing sebaran peluang. Déné matématika statistika minangka cawang saka matématika terapan sing migunakaké téyori probabilitas lan analisis matématika kanggo ngantukaké dhasar-dhasar téyori statistika.

Ana rong jinis statistika, ya iku statistika dhèskriptif lan statistika inferensial. Statistika dhèskriptif magepokan karo dhèskripsi data, umpamané saka ngitung rata-rata lan varians saka data mentah; migunakaké tabel-tabel utawa grafik saéngga data mentah luwih gampang “diwaca” lan luwih duwé makna. Déné statistika inferensial punjul iku, umpamané ngayahi pangujian hipotèsis, ngayahi prédhiksi observasi mangsa ngarep, utawa gawé modhèl régrèsi.

  • Statistika dhèskriptif magepokan karo cara data bisa digambaraké didhèskripsi) utawa disimpulaké, sacara numerik (umpamané ngitung rata-rata lan déviasi baku) utawa sacara grafis (sajeroning wangun tabel utawa grafik), kanggo antuk gambaran sekilas ngenani data kasebut, saéngga luwih gampang diwaca lan duwé makna.
  • Statistika inferènsial magepokan karo pamodhèlan data lan ngayahi panjupukan kaputusan adhedhasar analisis data, umpamané ngayahi pangujian hipotèsis, ngayahi èstimasi pengamatan mangsa ngarep (èstimasi utawa prédhiksi), gawé pamodhèlan gayutan (korélasi, régrèsi, ANOVA, dhèrèt wektu), lan sapanunggalané.

Métodhe Statistika[besut | besut sumber]

Loro jinis panelitèn: èksperimèn lan survé[besut | besut sumber]

Ana rong jinis utama panelitèn: èksperimen lan survei. Kaloroné padha-padha nyinaoni prabawa owah-owahan ing peubah penjelas lan perilaku pangowah rèspon akibat owah-owahan kasebut. Béda kaloroné dumunung ing cara kajiané.

Sawiji èksperimèn nglibataké pangukuran marang sistem sing dikaji, mènèhi perlakuan marang sistem, lan banjur ngayahi pangukuran (manèh) kanthi cara sing padha marang sistem sing wis diperlakukan kanggo meruhi apa perlakuan ngowahi aji pangukuran apa ora. Bisa uga perlakuan diayahi sacara simultan lan prabawané diukur sajeroning wektu sing uga bebarengan. Métodhe statistika sing gegandhèngan karo lumakuné sawijining èksperimèn disinaoni sajeroning rancangan pacoban (désain èksperimèn).

Sajeroning survey,, ora diayahi manipulasi tmarang sistem sing dikaji. Data dikumpulaké lan gayutan (korélasi) antara manéka peubah diselidhiki kanggo mènèhi gambaran marang objèk panelitèn. Tèknik-tèhnik survai disinaoni sajeroning métodhe survei.

Panelitèn jinis eksperimen akèh diayahi ing èlmu-èlmu rekayasa, umpamané tèhnik, èlmu pangan, agronomi, farmasi, pemasaran (marketing), lan psikologi èksperimèn.

Panelitèn jinis observasi paling kerep diayahi ing babagan èlmu-èlmu sosial utawa magepokan karo perilaku sadina-dina, umpamané ékonomi, psikologi lan pédagogi, kedhokteran masarakat, lan indhustri.

Tipe pangukuran[besut | besut sumber]

Ana papat jinis pangukuran utawa skala pangukuran sing dipigunakaké sajeroning statistika, ya iku: nominal, ordinal, interval, lan rasio. Kapapat skala pangukuran kasebut duwé tingkat panggunaan sing béda sajeroning riset statistik.

  • Skala nominal mung bisa mbédakaké samubarang sing asipat kualitatif (umpamané: jinis kelamin, agama, werna kulit).
  • Skala ordinal saliyané mbédakaké uga nuduhaké tataran (umpamané: pendhidhikan, tingkat kepuasan).
  • Skala interval arupa angka kuantitatif nanging ora duwé aji nol mutlak (umpamané: taun, suhu sajeroning Celcius).
  • Skala rasio arupa angka kuantitatif sing duwé aji nol mutlak.

Istilah wigati sajeroning statistika[besut | besut sumber]

Null hypothesis[besut | besut sumber]

Interpretasi marang informasi statistik kerep nglibataké anané null hypothesis kanthi asumsi apa sing diusulaké minangka jalaran ‘’’ora’’’ duwé prabawa marang variabel sing diukur.

Minangka ilustrasi sing prasaja ya iku kahanan sing diadhepi para juri ing sawijining pangadilan. Null hypothesis, H0, negasaké yèn wong sing kadakwa ora salah, déné hypothesis alternatif, H1, nyatakaké yèn wong sing kadakwa iku salah. Dakwan ana amarga kasujanan ananékasalahan. H0 (status quo) ana ing posisi lelawanan karo H1 lan bakal dianggep bener kajaba H1 didhukung déning bukti-bukti sing nyata ( "beyond a reasonable doubt"). Sanajan mangkono, kagagalan nulak H0 ("failure to reject H0") ing perkara iki ora ateges ora salah, nanging mung anané bukti-bukti ora cukup. Mula para juri ora perlu nampa H0 nanging gagal nulak (fails to reject) H0. Sauntara sawenèh wong ora bisa mbuktèkaké sawijining null hypothesis nanging bisa nguji cedhak orané saka kasunyatan nganggo uji kakuwatan, sing nguji kasalahan jinis loro (type II errors).

Error[besut | besut sumber]

Kanthi nganggo null hypothesis tinemu anané loro wangun kasalahan (errorr):

  • Kasalahan jinis 1, ya iku nalika null hypothesis salah nulak kanthi mènèhi sawijining "false positive".
  • Kasalahan jinis loro, ya iku nalika null hypothesis gagal ditulak lan sawijining prabédan aktual antara populasi mènèhi sawijining "false negative".

Èstimasi interval[besut | besut sumber]

Studi statistika mung njupuk sapérangan saka populasi amarga saka iku asilé ora makili sacara wutuh saka populasi sakabèhané. Èstimasi sing diantukaké saka sampel mung kira-kira ("approximate" ) saka aji populasi. "Confidence intervals " agawé para statistikawan bisa nyatakaké sepira cedhaké asil ngira-ira saka sampel bisa cocog karo aji sing sabeneré ing populasi. Kerep dinyatakaké minangka expressed as 95% confidence interval. Sacara formal, sawijining pratélan 95% confidence interval tumrap sawjining aji iku rentangan (range), yèn sampling lan analisis dibolan-balèni ana ing kondhisi sing padha (yielding a different dataset), interval bakal kalebu aji sing sakbeneré 95 % saka kabèh pangujèn. Bab iki ora ateges yèn probabilitas aji sakbeneré ana ing confidence interval 95%. Saka perspèktif frequentist, klaim kasebut ora nalar, amarga aji sabeneré iku dudu sawijining " random variable ".

Signifikansi[besut | besut sumber]

Statistika arang mènèhi sawijining jawaban prasaja jinis ya utawa ora. Interpretasi kerep tiba marang tataran signifikansi statistik (level of statistical significance) sing dipatrapaké marang angka lan kerep ngarujuk marang probabilitas saka aji sing sacara akurat nulak null hypothesis (kadhangkala ingaran minangka p-value).

Signifikansi statistik ora mesthi ateges yèn asilé signifikan sajeroning kahanan nyata. Tuladha, sajeroning pasinaon ngenani usada manawa nuduhaké yèn sawijining obat duwé signifikansi statistik ananging mung duwé èfèk nguntungaké sethithik, amarga saka iku obat kasebut kaya-kaya ora bakal mbantu pasien sacara nyata.

Tèknik-tèhnik statistika[besut | besut sumber]

Sawetara pangujian lan prosedur sing akèh dipigunakaké sajeroning panelitèn antarané:

Statistika Terapan[besut | besut sumber]

Sawetara èlmu sing migunakaké statistika terapan saéngga duwé tèrminologi sing mligi. Disiplin èlmu kasebut antarané:

  • Aktuaria (panerapan statistika sajeroning babagan asuransi)
  • Biostatistika utawa biometrika (panerapan statistika sajeroning èlmu biologi)
  • Statistika bisnis
  • Ékonomètrika
  • Psikomètrika
  • Statistika sosial
  • Statistika tèhnik utawa tèknometrika
  • Fisika statistik
  • Dhémografi
  • Eksplorasi data (pangenalan pola)
  • Literasi statistik
  • Analisis prosès lan kemometrika (kanggo analisis data kimia analis lan tèhnik kimia)

Statistika mènèhi piranti analisis data tumrap manéka babagan èlmu. Kagunané werna-werna: nyinaoni keragaman akibat pangukuran, ngendhalèkaké prosès, ngrumusaké informasi saka data, lan mbiyantu panjupukan kaputusan adhedhasar data. Statistika, amarga sipaté sing objèktif, kerep dadi siji-sijiné piranti sing bisa diandelaké kanggo kaperluan-kaperluan ing ndhuwur.

Piranti alus[besut | besut sumber]

Pétungan statistika modhèrn akèh diayahi déning komputer, lan malah sawetara pétungan mung bisa diayahi déning komputer mawa karikatan dhuwur, umpamané jaringan saraf tiron. Révolusi komputer wis nggawa implikasi perkembangan statistika ing mangsa ngarep, kanthi panekanan anyar marang statistika èksperimèntal lan èmpirik.

Sawetara kontributor statistika[besut | besut sumber]

Uga delengen[besut | besut sumber]

Rujukan[besut | besut sumber]

Lindley, D. Making Decisions. John Wiley. Second Edition 1985. ISBN 0-471-90808-8

Pranala njaba[besut | besut sumber]

Situs umum lan organisasi[besut | besut sumber]

Kumpulan pranala[besut | besut sumber]

Pelajaran lan Buku Teks Online[besut | besut sumber]

Piranti alus statistika[besut | besut sumber]

Sumber liya[besut | besut sumber]