Bioinformatika: Béda antara owahan

Saka Wikipédia Jawa, bauwarna mardika basa Jawa
Konten dihapus Konten ditambahkan
Tanpa ringkesan besutan
Robbot (parembugan | pasumbang)
Larik 121: Larik 121:
[[ru:Биоинформатика]]
[[ru:Биоинформатика]]
[[sh:Bioinformatika]]
[[sh:Bioinformatika]]
[[si:ජෛව ‍තොරතුරු විද්‍යාව]]
[[simple:Bioinformatics]]
[[simple:Bioinformatics]]
[[sk:Bioinformatika]]
[[sk:Bioinformatika]]

Révisi kala 2 Januari 2013 20.04

Sequence alignment; salah siji aplikasi dhasar bioinformatika. Sekuens biologis sing dianalisis ing bab iki yaiku sekuens asam amino saka papat protein hemoglobin.

Bioinformatika (basa Inggris: bioinformatics) iku (èlmu sing nyinaoni) panrapan tèknik komputasional kanggo nglola lan nganalisis informasi biologis. Bidang iki nyakup panrapan métodhe-métodhe matématika, statistika, lan informatika kanggo mecahaké masalah-masalah biologis, utamané kanthi migunaaké sekuens DNA lan asam amino sarta informasi sing ana kaitané. Conto topik utama bidang iki ngliputi basis data kanggo ngelola informasi biologis, panyejajaran sekuens (sequence alignment), prédiksi struktur kanggo ngramalaké wangun struktur protein uga struktur sékundhèr RNA, analisis filogenetik, lan analisis ekspresi gen.

Sajarah

Istilah bioinformatics wiwit diwedharaké ing tengah éra 1980-an kanggo ngacu panrapan komputer ing biologi. Éwadéné mangkono, panrapan bidang-bidang ing bioinformatika (kaya panggawéan basis data lan pangembangan algoritma kanggo analisis sekuens biologis) wis dilakokaké wiwit taun 1960-an.

Kamajuan teknik biologi molekular kanggo ndungkap sekuens biologis saka protein (wiwit awal 1950-an) lan asam nukleat (wiwit 1960-an) miwiti mekaring basis data lan teknik analisis sekuens biologis. Basis data sekuens protein wiwit dikembangaké taun 1960-an ing Amérika Sarékat, sauntara basis data sekuens DNA dikembangaké akir 1970-an ing Amérika Sarékat lan Jerman (ing European Molecular Biology Laboratory, Laboratorium Biologi Molekular Éropah). Panemon teknik sekuensing DNA sing luwih cepet ing tengah taun 1970-an dadi landhesan dumadiné ledakan cacahé sekuens DNA sing kasil didungkapaké ing taun 1980-an lan 1990-an, dadi salah sawijining pambuka dalan kanggo proyèk-proyèk pandungkapan genom, ningkataké kabutuhan marang panglolaan lan analisis sekuens, lan pungkasané njalari lairé bioinformatika.

Mekaré internèt uga ndhukung mekaré bioinformatika. Basis data bioinformatika sing gumandhéng liwat internèt nggampangaké èlmuwan nglumpukaké asil sekuensing nuju basis data kasebut uga antuk sekuens biologis minangka bahan analisis. Saliyané iku, panyebaran program-program aplikasi bioinformatika liwat internèt nggampangaké èlmuwan ngakses program-program kasebut lan banjur nggampangaké pangembangané.

Panrapan utama bioinformatika

Basis data sekuens biologis

Selaras kaliyan jinis informasi biologis sing disimpen, basis data sekuens biologis bisa arupa basis data primer kanggo nyimpen sekuens primer asam nukleat utawa protein, basis data sekunder kanggo nyimpen motif sekuens protein, lan basis data struktur kanggo nyimpen data struktur protein utawa asam nukleat.

Basis data utama kanggo sekuens asam nukleat saiki yaiku GenBank (Amérika Sarékat), EMBL (Éropah), lan DDBJMasalah transklusi: {{En}} mung bisa kaanggo ing mandhala aran Barkas. Anggonen {{lang-en}} utawa {{en icon}} baé. (DNA Data Bank of Japan, Jepang). Katelu basis data kasebut kerja bebarengan lan ijol-ijolan data saben dina kanggo njaga kawiyaran cakupan saben basis data. Sumber utama data sekuens asam nukleat yaiku submisi langsung saka periset individual, proyèk sekuensing genom, lan pandaftaran paten. Isi saliyané sekuens asam nukleat, entri ing basis data sekuens asam nukleat umumé ngandhut informasi ngenani jinis asam nukleat (DNA utawa RNA), jeneng organisme sumber asam nukleat kasebut, lan pustaka sing ana kaitané karo sekuens asam nukleat kasebut.

Sauntara iku, conto sapérangan basis data wigati sing nyimpen sekuens primer protein yaiku PIR (Protein Information Resource, Amérika Sarékat), Swiss-Prot (Éropah), lan TrEMBL (Éropah). Katelu basis data kasebut wis digabungaké ing UniProt (sing dana utamané saka Amérika Sarékat). Entri ing UniProt ngandhut informasi ngenani sekuens protein, jeneng organisme sumber protein, pustaka sing ana kaitané, lan komentar sing umumé isiné panjlasan ngenani fungsi protein kasebut.

BLAST (Basic Local Alignment Search Tool) arupa perkakas bioinformatika sing gumandhéng raket karo panggunaan basis data sekuens biologis. Panlusuran BLAST (BLAST search) ing basis data sekuens mungelaké èlmuwan kanggo nggolèki sekuens asam nukleat uga protein sing mèmper karo sekuens tinentu sing diduwèni. Bab iki migunani umpamané kanggo nemokaké gen sajenis ing sapérangan organisme utawa kanggo mriksa kaabsahan asil sekuensing uga kanggo mriksa fungsi gen asil sekuensing. Algoritma sing ndhasari kerja BLAST yaiku panyejajaran sekuens.

PDB (Protein Data Bank, Bank Data Protein) yaiku basis data tunggal sing nyimpen modhèl struktural telung dimensi protein lan asam nukleat asil panemton eksperimental (kanthi kristalografi sinar-X, spektroskopi NMR lan mikroskopi elektron). PDB nyimpen data struktur minangka koordinat telung dimensi sing nggambaraké posisi atom-atom ing njero protein utawa asam nukleat.

Panyejajaran sekuens

Panyejajaran sekuens (sequence alignment) yaiku prosès panyusunan/pangaturan loro utawa luwih sekuens saéngga pepadhan sekuens-sekuens kasebut katon nyata. Asil saka prosès kasebut uga disebut minangka sequence alignment utawa alignment waé. Larik sekuens ing sawijining alignment diwènèhi sisipan (umumé kanthi tandha "–") saéngga kolom-kolomé ngamot karakter sing identik utawa padha ing antarané sekuens-sekuens kasebut. Ing ngisor iki conto alignment DNA saka rong sekuens cendhak DNA sing béda, "ccatcaac" lan "caatgggcaac" (tandha "|" nedahaké kacocokan utawa match ing antarané loro sekuens iku).

 ccat---caac
 | ||   ||||
 caatgggcaac

Sequence alignment arupa metode dhasar ing analisis sekuens. Metode iki digunaaké kanggo nyinaoni évolusi sekuens-sekuens saka leluhur sing padha (common ancestor). Ora cocoké (mismatch) ing alignment diasosiasikaké kanthi prosès mutasi, éwadéné kasenjangan (gap, tandha "–") diasosiasikaké kanthi prosès insersi utawa delesi. Sequence alignment mènèhi hipotesis marang prosès évolusi sing dumadi ing sekuens-sekuens kasebut. Umpamané, loro sekuens ing conto alignment ing ndhuwur bisa dadi évolusi saka sekuens sing padha "ccatgggcaac". Ing kaitané karo bab iki, alignment uga bisa nedahaké posisi-posisi sing dipertahankan (conserved) sakwéné évolusi ing sekuens-sekuens protein, sing nedahaké yèn posisi-posisi kasebut bisa dadi wigati kanggo struktur utawa fungsi protein kasebut.

Saliyané iku, sequence alignment uga dipigunaaké kanggo nggolèki sekuens sing mèmper utawa padha ing basis data sekuens. BLAST yaiku sawijining metode alignment sing asring dipigunaaké ing panlusuran basis data sekuens. BLAST migunaaké algoritma heuristik ing panyusunan alignment.

Sapérangan metode alignment liya sing ndhisiki BLAST yaiku metode "Needleman-Wunsch" lan "Smith-Waterman". Metode Needleman-Wunsch digunaaké kanggo nyusun alignment global ing antarané loro utawa luwih sekuens, yaiku alignment kanggo sadawané sekuens kasebut. Metode Smith-Waterman ngasilaké alignment lokal, yaiku alignment kanggo bagéan-bagéan njero sekuens. Kaloro metode kasebut nerapaké pamrograman dinamik (dynamic programming) lan mung efektif kanggo alignment rong sekuens (pairwise alignment)

Clustal yaiku program bioinformatika kanggo alignment multipel (multiple alignment), yaiku alignment sapérangan sekuens sisan. Loro varian utama Clustal yaiku ClustalW lan ClustalX.

Metode liya sing bisa ditrepaké kanggo alignment sekuens yaiku metode sing gegandhéngan karo Hidden Markov Model ("Modhél Markov Kadhelikaké", HMM). HMM iku modhèl statistika sing mula bukané dipigunaaké ing èlmu komputer kanggo ngenali wicaraning Manungsa (speech recognition). Saliyané dipigunaaké kanggo alignment, HMM uga dipigunaaké ing metode-metode analisis sekuens liyané, kaya prediksi dhaérah pawènèh kode protein ing genom lan prédhiksi struktur sékundhèr protein.

Prédhiksi struktur protein

Model protein hemaglutinin saka virus influensa

Sacara kimia/fisika, wangun struktur protein didungkap kanthi kristalografi sinar-X utawa kanthi spektroskopi NMR, nanging rong metode iki banget ngentèkaké wektu lan rélatif larang. Sauntara iku, metode sekuensing protein rélatif luwih gampang ndungkap sekuens asam amino protein. Prédhiksi struktur protein ngupaya ngramalaké struktur telung dimensi protein adhedhasar sekuens asam aminoné (kanthi tembung liya, ngramalaké struktur tersier lan struktur sékundhèr adhedhasar struktur primer protein). Sacara umum, metode prédhiksi struktur protein sing ana saiki bisa dikategoriaké dadi rong klompok, yaiku metode pamodhèlan protein komparatif lan metode pamodhèlan de novo.

Pamodhèlan protein komparatif (comparative protein modelling) ngramalaké struktur sawijining protein adhedhasar struktur protein liya sing wis dimangertèni. Salah siji panrapan metode iki yaiku pamodhèlan homologi (homology modelling), yaiku prédhiksi struktur tersier protein adhedhasar pepadhan struktur primer protein. Pamodhèlan homologi didhasaraké ing teori yèn rong protein sing homolog nduwèni struktur sing mèmper banget siji lan sijiné. Ing metode iki, struktur sawijining protein (disebut protein target) ditemtokaké adhedhasar struktur protein liya (protein templat) sing wis dingertèni lan nduwèni kamèmperan sekuens karo protein target kasebut. Saliyané iku, panrapan liya pamodhèlan komparatif yaiku protein threading sing didhasaraké ing kamèmperan struktur tanpa kamèmperan sekuens primèr. Latar wingking protein threading yaiku struktur protein luwih dikonservasi tinimbang sekuens protein sakwéné évolusi; dhaérah-dhaérah sing wigati kanggo fungsi protein dipertahankan strukturé. Ing pandekatan iki, struktur sing paling kompatibel kanggo sawijining sekuens asam amino dipilih saka kabèh jinis struktur telung dimensi protein sing ana. Metode-metode sing kagolong ing protein threading ngupaya nemtokaké tingkat kompatibilitas kasebut.

Ing pandekatan de novo utawa ab initio, struktur protein ditemtokaké saka sekuens primèré tanpa mbandhingaké karo struktur protein liya. Ana akèh kamungelan ing pandekatan iki, umpamané kanthi nirokaké prosès panglipetan (folding) protein saka sekuens primèré dadi struktur tersieré (umpamané kanthi simulasi dinamika molekular), utawa kanthi optimisasi global fungsi energi protein. Prosedur-prosedur iki luwih mbutuhaké prosès komputasi sing intens, saéngga saiki mung dipigunaaké nalika nemtokaké struktur protein-protein cilik. Sapérangan usaha wis dilakokaké kanggo ngatasi kakurangan sumber daya komputasi kasebut, umpamané kanthi superkomputer (umpamané superkomputer Blue Gene [1] saka IBM) utawa komputasi kadistribusi (distributed computing, umpamané proyèk Folding@home) uga komputasi grid.

Analisis ekspresi gen

Analisis klastering ekspresi gen ing kanker payudara

Ekspresi gen bisa ditemtokaké kanthi ngukur kadar mRNA kanthi manéka warna teknik (umpamané kanthi microarray utawa uga Serial Analysis of Gene Expression ["Analisis Serial Ekspresi Gen", SAGE]). Teknik-teknik kasebut umumé diterapaké ing analisis ekspresi gen skala gedhé sing ngukur ekspresi akèh gen (malah uga genom) lan ngasilaké data skala gedhé. Metode-metode panggolèkan data (data mining) ditrepaké ing data kasebut supaya antuk pola-pola informatif. Minangka conto, metode-metode komparasi dipigunaaké kanggo mbandhingaké ekspresi ing antarané gen-gen, sauntara metode-metode klastering (clustering) dipigunaaké kanggo martisi data kasebut andhedhasar pepadhan ekspresi gen.

Bioinformatika ing Indonésia

Saiki mata ajaran bioinformatika uga mata ajaran kanthi muatan bioinformatika wis diwulangaké ing sapérangan perguruan tinggi ing Indonésia. Sekolah Èlmu lan Teknologi Hayati ITB nawakaké mata kuliah "Pengantar Bioinformatika" kanggo program Sarjana lan mata kuliah "Bioinformatika" kanggo program Pascasarjana. Fakultas Teknobiologi Universitas Atma Jaya, Jakarta nawakaké mata kuliah "Pengantar Bioinformatika". Mata kuliah "Bioinformatika" diwulangaké ing Program Pascasarjana Kimia Fakultas MIPA Universitas Indonesia (UI), Jakarta. Mata kuliah "Proteomik lan Bioinformatika" kalebu ing kurikulum program S3 bioteknologi Universitas Gadjah Mada (UGM), Yogyakarta. Materi bioinformatika kalebu ing njeron silabus sapérangan mata kuliah kanggo program sarjana uga pascasarjana biokimia,biologi, lan bioteknologi ing Institut Pertanian Bogor (IPB). Saliyané iku, riset-riset sing ngarah ing bioinformatika uga wis dileksanakaké déning mahasiswa program S1 Èlmu Komputer uga program pascasarjana biologi sarta bioteknologi IPB.

Riset bioinformatika protein dileksanakaké minangka bagéan saka aktivitas riset rékayasa protein ing Laboratorium Rekayasa Protein, Pusat Panlitèn Bioteknologi Lembaga Èlmu Pangetauan Indonésia (LIPI), Cibinong, Bogor. Lembaga Biologi Molekul Eijkman, Jakarta, sacara khusus nduwé laboratorium bioinformatika minangka fasilitas panunjang kagiyatan riseté. Saliyané iku, basis data sekuens DNA mikroorganisme asli Indonésia gèk dikembangaké ing UI.

Pirsanana uga

Réferénsi lan wacan terusan

  • Masalah transklusi: {{En}} mung bisa kaanggo ing mandhala aran Barkas. Anggonen {{lang-en}} utawa {{en icon}} baé. Attwood, T.K., dan D.J. Parry-Smith. 1999. Introduction to Bioinformatics. Harlow: Pearson Education. ISBN 0-582-32788-1
  • Masalah transklusi: {{En}} mung bisa kaanggo ing mandhala aran Barkas. Anggonen {{lang-en}} utawa {{en icon}} baé. Krane, D.E., dan M.L. Raymer. 2003. Fundamental Concepts of Bioinformatics. San Francisco: Benjamin Cummings. ISBN 0-8053-4633-3
  • Masalah transklusi: {{En}} mung bisa kaanggo ing mandhala aran Barkas. Anggonen {{lang-en}} utawa {{en icon}} baé. Mount, D.W. 2001. Bioinformatics: Sequence and Genome Analysis. Cold Spring Harbor: Cold Spring Harbor Laboratory Press. ISBN 0-87969-608-7

Pranala njaba

Cithakan:Link FA