Maju-maju Nankatsu...!

Maju-maju Nankatsu...!
_Tsubasa Kecil_

_Tsubasa Besar_

Senin, 18 April 2011

Bioinformatika : Perkembangan Ilmu Terkait dan Penerapannya


a.   Sejarah Bioinformatika
Bioteknologi secara umum telah dikenal sejak ribuan tahun yang lalu. Penggunaan mikrobia untuk fermentasi dalam pembuatan minuman beralkohol misalnya telah dilakukan sejak 30 abad sebelum masehi. Namun Sejarah Bioteknologi modern dimulai ketika ditemukan kembali kemampuan bakteri Streptococcus pneumoniae yang telah kehilangan virulensinya yaitu dengan mencampurkannya dengan bakteri yang virulen, Avery dkk (1944) telah membuktikan bahwa pada tingkat organogenesis yang paling rendah pun terjadi transaksi genetik (Brown 1991). Selanjutnya diketahui konstruksi plasmid, penyisipan gen antar organisme yang menghasilkan DNA rekombinan. Adanya bakteri tanah Agrobacterium tumafaciens yang dapat mentransfer gen secara alami dan akhirnya didapat mekanisme transfer gen antar tanaman maka muncullah tanaman transgenik (Maniatis dkk, 1982) Tanaman transgenik, yaitu tanaman yang sudah disusupi oleh DNA asing sebagai pembawa sifat yang diinginkan.
Istilah bioinformatics mulai dikemukakan pada pertengahan era 1980-an untuk mengacu pada penerapan komputer dalam biologi. Namun demikian, penerapan bidang-bidang dalam bioinformatika (seperti pembuatan basis data dan pengembangan algoritma untuk analisis sekuens biologis) sudah dilakukan sejak tahun 1960-an.
Kemajuan teknik biologi molekular dalam mengungkap sekuens biologis dari protein (sejak awal 1950-an) dan asam nukleat (sejak 1960-an) mengawali perkembangan basis data dan teknik analisis sekuens biologis. Basis data sekuens protein mulai dikembangkan pada tahun 1960-an di Amerika Serikat, sementara basis data sekuens DNA dikembangkan pada akhir 1970-an di Amerika Serikat dan Jerman (pada European Molecular Biology Laboratory, Laboratorium Biologi Molekular Eropa). Penemuan teknik sekuensing DNA yang lebih cepat pada pertengahan 1970-an menjadi landasan terjadinya ledakan jumlah sekuens DNA yang berhasil diungkapkan pada 1980-an dan 1990-an, menjadi salah satu pembuka jalan bagi proyek-proyek pengungkapan genom, meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya bioinformatika.
Perkembangan Internet juga mendukung berkembangnya bioinformatika. Basis data bioinformatika yang terhubung melalui Internet memudahkan ilmuwan mengumpulkan hasil sekuensing ke dalam basis data tersebut maupun memperoleh sekuens biologis sebagai bahan analisis. Selain itu, penyebaran program-program aplikasi bioinformatika melalui Internet memudahkan ilmuwan mengakses program-program tersebut dan kemudian memudahkan pengembangannya.

b.  Definisi Bioinformatika


·        Bioinformatika, sesuai dengan asal katanya yaitu “bio” dan “informatika”, adalah gabungan antara ilmu biologi dan ilmu teknik informasi (TI). Pada umumnya, Bioinformatika didefenisikan sebagai aplikasi dari alat komputasi dan analisa untuk menangkap dan menginterpretasikan data-data biologi. Ilmu ini merupakan ilmu baru yang yang merangkup berbagai disiplin ilmu termasuk ilmu komputer, matematika dan fisika, biologi, dan ilmu kedokteran, dimana kesemuanya saling menunjang dan saling bermanfaat satu sama lainnya.

·        Bioinformatika adalah (ilmu yang mempelajari) penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologis. Bidang ini mencakup penerapan metode-metode matematika, statistika, dan informatika untuk memecahkan masalah-masalah biologis, terutama dengan menggunakan sekuens DNA dan asam amino serta informasi yang berkaitan dengannya. Contoh topik utama bidang ini meliputi basis data untuk mengelola informasi biologis, penyejajaran sekuens (sequence alignment), prediksi struktur untuk meramalkan bentuk struktur protein maupun struktur sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.

·        Bioinformatika merupakan kajian yang memadukan disiplin biologi molekul,
matematika dan teknik informasi (TI). Ilmu ini didefinisikan sebagai aplikasi dari alat komputasi dan analisa untuk menangkap dan menginterpretasikan data-data biologi molekul. Biologi molekul sendiri juga merupakan bidang interdisipliner, mempelajari
kehidupan dalam level molekul.

·        Bioteknologi secara sempit didefinisikan sebagai penerapan prinsip-prinsip dasar biologi, biokimia, serta rekayasa untuk mengubah dan mendapatkan nilai tambah dari suatu organisme atau agensia biologis. Sedangkan dalam arti luas bioteknologi dapat didefinisikan sebagai teknologi untuk mendayagunakan organisme hidup atau bagian dari organisme untuk menghasilkan atau memodifikasi produk-produk tertentu, serta untuk perbaikan dan pemuliaan mikroorganisme, tanaman, atau hewan. bagian dari organisme melalui pemanfaatan.

·        Bioinformatika adalah bidang yang menggunakan komputer untuk menyimpan dan menganalisis informasi biologi molekuler. Menggunakan informasi ini dalam format digital, bioinformatika kemudian dapat memecahkan masalah molekuler biologi , memprediksi struktur, dan bahkan simulasi makromolekul.

c.  Kegunaan Bioinformatika
a)      Bioteknologi Dalam Bidang Klinis
Bioinformatika dalam bidang klinis sering disebut sebagai informatika klinis(clinical informatics). Aplikasi dari informatika klinis ini berbentuk manajemen data-dataklinis dari pasien melalui Electrical Medical Record (EMR) yang dikembangkan olehClement J. McDonald dari Indiana University School of Medicine pada tahun 1972.McDonald pertama kali mengaplikasikan EMR pada 33 orang pasien penyakit gula(diabetes). Sekarang EMR ini telah diaplikasikan pada berbagai penyakit. Data yang disimpan meliputi data analisa diagnosa laboratorium, hasil konsultasi dan saran, fotorontgen, ukuran detak jantung, dan lain lain. Dengan data ini dokter akan bisa bertugas menunjang seluruh proses kehidupan, antara lain sebagai katalis reaksi biokimia dalam tubuh (disebut enzim), berperan serta dalam sistem pertahanan tubuh melawan virus, parasit dan lain-lain (disebut antibodi), menyusun struktur tubuh dari ujung kaki(otot terbentuk dari protein actin, myosin, dan sebagainya) sampai ujung rambut (rambut tersusun dari protein keratin), dan lain-lain. Arus informasi, DNA -> RNA -> Protein,inilah yang disebut sentral dogma dalam biologi molekul.
Sekuen DNA satu organisme, yaitu pada sejenis virus yang memiliki kurang lebih 5.000 nukleotida/molekul DNA atau sekitar 11 gen, berhasil dibaca secara menyeluruh pada tahun 1977. Sekuen seluruh DNA manusia terdiri dari 3 milyar nukleotida yang menyusun 100.000 gen dapat dipetakan dalam waktu 3 tahun. Saat ini terdapat milyaran data nukleotida yang tersimpan dalam database DNA, GenBank di AS yang didirikan tahun 1982. Di Indonesia, ada Lembaga Biologi Molekul Eijkman yang terletak diJakarta. Di sini kita bisa membaca sekuen sekitar 500 nukleotida hanya dengan membayar $15. Trend yang sama juga nampak pada database lain seperti database sekuen asam amino penyusun protein, database struktur 3D protein, dan sebagainya. Inovasi teknologi DNA chip yang dipelopori oleh perusahaan bioteknologi AS, Affymetrix diSilicon Valley telah mendorong munculnya database baru mengenai RNA.
Desakan kebutuhan untuk mengumpulkan, menyimpan dan menganalisa data-databiologis dari database DNA, RNA maupun protein inilah yang semakin memacuperkembangan kajian Bioinformatika.

b)     Untuk Identifikasi Agent Penyakit Baru
Bioinformatika juga menyediakan tool yang sangat penting untuk identifikasi agent penyakit yang belum dikenal penyebabnya. Banyak sekali penyakit baru yang muncul dalam dekade ini, dan diantaranya yang masih hangat adalah SARS (Severe Acute Respiratory Syndrome).
Pada awalnya, penyakit ini diperkirakan disebabkan oleh virus influenza karenagejalanya mirip dengan gejala pengidap influenza. Akan tetapi ternyata dugaan ini salahkarena virus influenza tidak terisolasi dari pasien. Perkirakan lain penyakit ini disebabkanoleh bakteriCand ida karena bakteri ini terisolasi dari beberapa pasien. Tapi perkiraan inijuga salah. Akhirnya ditemukan bahwa dari sebagian besar pasien SARS terisolasi virus Corona jika dilihat dari morfologinya. Sekuen genom virus ini kemudian dibaca dan dari hasil analisa dikonfirmasikan bahwa penyebab SARS adalah virusCo rona yang telah berubah (mutasi) dari virusCorona yang ada selama ini.
Dalam rentetan proses ini, Bioinformatika memegang peranan penting. Pertamapada proses pembacaan genom virus Corona. Karena didatabase seperti GenBank, EMBL (European Molecular Biology Laboratory), dan DDBJ (DNA Data Bank of Japan)sudah tersedia data sekuen beberapa virus Corona, yang bisa digunakan untuk mendisainprimer yang digunakan untuk amplifikasi DNA virus SARS ini. Software untukmendisain primer juga tersedia, baik yang gratis maupun yang komersial. Contoh yanggratis adalah Webprimer yang disediakan oleh Stanford Genomic Resources, GeneWalker yang disediakan oleh Cybergene AB, dan lain sebagainya. Untuk yang komersial ada Primer Disainer yang dikembangkan olehScientific & Education Software, dan software-software untuk analisa DNA lainnya seperti Sequencher (Gene Codes Corp.), SeqMan II (DNA STAR Inc.),Genetyx(GENETYX Corp.),DNASIS (HITACHI Software), dan lain lain. Menentukan obat yang sesuai dengan kondisi pasien tertentu dan lebih jauh lagi, dengandibacanya genom manusia, akan memungkinkan untuk mengetahui penyakit genetikseseorang, sehingga penanganan terhadap pasien menjadi lebih akurat.

c)      Untuk Mendiagnosa Penyakit Baru
Untuk menangani penyakit baru diperlukan diagnosa yang akurat sehingga dapat dibedakan dengan penyakit lain. Diagnosa yang akurat ini sangat diperlukan untuk pemberian obat dan perawatan yang tepat bagi pasien.
Ada beberapa cara untuk mendiagnosa suatu penyakit, antara lain: isolasi agent penyebab penyakit tersebut dan analisa morfologinya, deteksi antibodi yang dihasilkan dari infeksi dengan teknik enzyme-linked immunosorbent assay (ELISA), dan deteksi gendari agent pembawa penyakit tersebut dengan Polymerase Chain Reaction (PCR).
Teknik yang banyak dan lazim dipakai saat ini adalah teknik PCR. Teknik ini sederhana, praktis dan cepat. Yang penting dalam teknik PCR adalah disain primer untuk amplifikasi DNA, yang memerlukan data sekuen dari genom agent yang bersangkutan dan software seperti yang telah diuraikan di atas. Disinilah Bioinformatika memainkan peranannya. Untuk agent yang mempunyai genom RNA, harus dilakukan reverse transcription (proses sintesa DNA dari RNA) terlebih dahulu dengan menggunakan enzim reverse transcriptase. Setelah DNA diperoleh baru dilakukan PCR. Reverse transcription dan PCR ini bisa dilakukan sekaligus dan biasanya dinamakan RT-PCR.  Teknik PCR ini bersifat kualitatif, oleh sebab itu sejak beberapa tahun yang lalu dikembangkan teknik lain, yaitu Real Time PCR yang bersifat kuantitatif. Dari hasil Real Time PCR ini bisa ditentukan kuantitas suatu agent di dalam tubuh seseorang, sehingga bisa dievaluasi tingkat emergensinya. Pada Real Time PCR ini selain primer diperlukan probe yang harus didisain sesuai dengan sekuen agent yang bersangkutan. Di sini juga  diperlukan software atau program Bioinformatika

d)     Bagaimana Penemuan Obat-obatan
Cara untuk menemukan obat biasanya dilakukan dengan menemukan zat/senyawayang dapat menekan perkembangbiakan suatu agent penyebab penyakit. Karena perkembangbiakan agent tersebut dipengaruhi oleh banyak faktor, maka faktor-fakto rinilah yang dijadikan target. Diantaranya adalah enzim-enzim yang diperlukan untuk perkembangbiakan suatu agent. Mula-mula yang harus dilakukan adalah analisa struktur dan fungsi enzim-enzim tersebut. Kemudian mencari atau mensintesa zat/senyawa yangdapat menekan fungsi dari enzim-enzim tersebut.
Analisa struktur dan fungsi enzim ini dilakukan dengan cara mengganti asam amino tertentu dan menguji efeknya. Analisa penggantian asam amino ini dahulu dilakukan secara random sehingga memerlukan waktu yang lama. Setelah Bioinformatika berkembang, data-data protein yang sudah dianalisa bebas diakses oleh siapapun, baik data sekuen asam aminonya seperti yang ada di SWISS-PROT maupun struktur 3D-nya yang tersedia di Protein DataBank (PDB). Dengan database yang tersedia ini, enzim yangbaru ditemukan dapat dibandingkan sekuen asam amino-nya, sehingga bisa diperkirakanasam amino yang berperan untuk aktivitas (active site) dan kestabilan enzim tersebut.
Setelah asam amino yang berperan sebagai active site dan kestabilan enzim tersebut ditemukan, kemudian dicari atau disintesa senyawa yang dapat berinteraksi dengan asam amino tersebut. Dengan data yang ada di PDB, maka dapat dilihat struktur3D suatu enzim termasuk active site-nya, sehingga bisa diperkirakan bentuk senyawayang akan berinteraksi dengan active site tersebut. Dengan demikian, kita cukup mensintesa senyawa yang diperkirakan akan berinteraksi, sehingga obat terhadap suatu penyakit akan jauh lebih cepat ditemukan. Cara ini dinamakan “docking” dan telah banyak digunakan oleh perusahaan farmasi untuk penemuan obat baru.
Meskipun dengan Bioinformatika ini dapat diperkirakan senyawa yang berinteraksi dan menekan fungsi suatu enzim, namun hasilnya harus dikonfirmasi dahulu melalui eksperimen di laboratorium. Akan tetapi dengan Bioinformatika, semua proses ini bisa dilakukan lebih cepat sehingga lebih efisien baik dari segi waktu maupun finansial.
Tahun 1997, Ian Wilmut dari Roslin Institute dan PPL Therapeutics Ltd,Edinburgh, Skotlandia, berhasil mengklon gen manusia yang menghasilkan faktor IX (faktor pembekuan darah), dan memasukkan ke kromosom biri-biri. Diharapkan biri-biri yang selnya mengandung gen manusia faktor IX akan menghasilkan susu yang mengandung faktor pembekuan darah. Jika berhasil diproduksi dalam jumlah banyakmaka faktor IX yang diisolasi dari susu harganya bisa lebih murah untuk membantu parapenderita hemofilia.

e)      Bioteknologi Dalam Bidang Pertanian
Bioteknologi telah diterapkan secara luas dalam bidang pertanian, antara lain yaitu:


  •         Pupuk Hayati (biofertiliser) yaitu suatu bahan yang berasal dari jasad hidup, khususnya mikrobia yang digunakan untuk meningkatkan kuantitas dan kualitas produksi tanaman.
  •       Kultur in vitro, yaitu pembiakan tanaman dengan menggunakan bagian tanaman yang ditumbuhkan pada media bernutrisi dalam kondisi aseptik.
  •      Kultur in vitro memungkinkan perbanyakan tanaman secara massal dalam waktu yang singkat.
  •      Teknologi DNA Rekombinaan, pengembangan tanaman transgenik, misalnya galur tanaman transgenik yang membawa gen cry dari Bacillus thuringiensis untuk pengendalian hama.

d.   Bidang Ilmu Yang Terkait
     Bioteknologi dapat diklasifikasikan menjadi bioteknologi konvensional dan bioteknologi modern. Bioteknologi modern ditandai dengan penggunaan teknik biologi molekuler sehingga rekayasa yang dilakukan dapat jauh lebih terarah sehingga hasil yang diperoleh dapat lebih atau sepenuhnya dikendalikan. Dalam biologi konvensional, agensia biologis yang digunakan masih “apa adanya” sehingga hasil yang diperoleh belum sepenuhnya dapat dikemdalikan.
      Bioteknologi sebagai ilmu multidisiplin dalam kajian dan penerapannya memiliki ruang lingkup yang luas. Banyak bidang ilmu yang terkait, di antaranya adalah :
1. Biologi (Mikrobiologi dan Biologi Sel Molekuler)
2. Biokimia (Kimia)
3. Genetika (Genetika Molekuler)
4. Rekayasa Genetik
5. Rekayasa Bioproses
6. Teknologi Enzim
7. Teknologi Pangan dan Fermentasi
8. Teknik Komputerisasi ( Teknik Bioinformatika)

Cabang Ilmu Bionformatika
Bioinformatika merupakan suatu bidang interdisipliner. Banyak cabang-cabang disiplin ilmu yang terkait dengan Bioinformatika sehingga banyak pilihan bagi yang ingin mendalami Bioinformatika. Beberapa bidang yang terkait dengan Bioinformatika antara lain:
1.      Biophysics
Biophysics adalah sebuah bidang interdisipliner yang mengaplikasikan teknik-teknik dari ilmu Fisika untuk memahami struktur dan fungsi biologi (British Biophysical Society).
2.      Computational Biology
Computational biology merupakan bagian dari Bioinformatika yang paling dekat dengan bidang Biologi umum klasik. Fokus dari computational biology adalah gerak evolusi, populasi, dan biologi teoritis daripada biomedis dalam molekul dan sel.
3.      Medical Informatics
Medical informatics adalah sebuah disiplin ilmu yang baru yang didefinisikan sebagai pembelajaran, penemuan dan implementasi dari struktur dan algoritma untuk meningkatkan komunikasi, pengertian dan manajemen informasi medis.
4.      Cheminformatics
Cheminformatics adalah kombinasi dari sintesis kimia, penyaringan biologis dan pendekatan data-mining yang digunakan untuk penemuan dan pengembangan obat (Cambridge Healthech Institute’s Sixth Annual Cheminformatics conference).
5.      Genomics
Genomics adalah bidang ilmu yang ada sebelum selesainya sekuen genom, kecuali dalam bentuk yang paling kasar. Genomics adalah setiap usaha untuk menganalisa atau membandingkan seluruh komplemen genetik dari satu spesies atau lebih.
6.      Mathematical Biology
Mathematical biology menangani masalah-masalah biologi, namun metode yang digunakan untuk menangani masalah tersebut tidak perlu secara numerik dan tidak perlu diimplementasikan dalam software maupun hardware.
7.      Proteomics
Proteomics berkaitan dengan studi kuantitatif dan kualitatif dari ekspresi gen di level dari protein-protein fungsional itu sendiri. Yaitu: “sebuah antarmuka antara biokimia protein dengan biologi molekul”.
8.       Pharmacogenomics
Pharmacogenomics adalah aplikasi dari pendekatan genomik dan teknologi pada identifikasi dari target-target obat.
9.      Pharmacogenetics
Pharmacogenetics 
adalah bagian dari pharmacogenomics yang menggunakan metode genomik atau Bioinformatika untuk mengidentifikasi hubungan-hubungan genomik.

e.  Penerapan Bioinformatika
Basisdata Sekuens Biologis
Sesuai dengan jenis informasi biologis yang disimpannya, basis data sekuens biologis dapat berupa basis data primer untuk menyimpan sekuens primer asam nukleat maupun protein, basis data sekunder untuk menyimpan motif sekuens protein, dan basis data struktur untuk menyimpan data struktur protein maupun asam nukleat.
Basis data utama untuk sekuens asam nukleat saat ini adalah GenBank (Amerika Serikat), EMBL (Eropa), dan DDBJ(Inggris) (DNA Data Bank of JapanJepang). Ketiga basis data tersebut bekerja sama dan bertukar data secara harian untuk menjaga keluasan cakupan masing-masing basis data. Sumber utama data sekuens asam nukleat adalah submisi langsung dari periset individual, proyek sekuensing genom, dan pendaftaran paten. Selain berisi sekuens asam nukleat, entri dalam basis data sekuens asam nukleat umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam nukleat tersebut, dan pustaka yang berkaitan dengan sekuens asam nukleat tersebut.
Sementara itu, contoh beberapa basis data penting yang menyimpan sekuens primer protein adalah PIR (Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), danTrEMBL (Eropa). Ketiga basis data tersebut telah digabungkan dalam UniProt (yang didanai terutama oleh Amerika Serikat). Entri dalam UniProt mengandung informasi tentang sekuens protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang umumnya berisi penjelasan mengenai fungsi protein tersebut.
BLAST (Basic Local Alignment Search Tool) merupakan perkakas bioinformatika yang berkaitan erat dengan penggunaan basis data sekuens biologis. Penelusuran BLAST (BLAST search) pada basis data sekuens memungkinkan ilmuwan untuk mencari sekuens asam nukleat maupun protein yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini berguna misalnya untuk menemukan gen sejenis pada beberapa organisme atau untuk memeriksa keabsahan hasil sekuensing maupun untuk memeriksa fungsi gen hasil sekuensing. Algoritmayang mendasari kerja BLAST adalah penyejajaran sekuens.
PDB (Protein Data Bank, Bank Data Protein) adalah basis data tunggal yang menyimpan model struktural tiga dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan kristalografi sinar-Xspektroskopi NMR dan mikroskopi elektron). PDB menyimpan data struktur sebagai koordinat tiga dimensi yang menggambarkan posisi atom-atom dalam protein ataupun asam nukleat.

Penyejajaran Sekuens 
            Penyejajaran sekuens (sequence alignment) adalah proses penyusunan/pengaturan dua atau lebih sekuens sehingga persamaan sekuens-sekuens tersebut tampak nyata. Hasil dari proses tersebut juga disebut sebagai sequence alignment atau alignment saja. Baris sekuens dalam suatu alignment diberi sisipan (umumnya dengan tanda "–") sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik atau sama di antara sekuens-sekuens tersebut. Berikut adalah contoh alignment DNA dari dua sekuens pendek DNA yang berbeda, "ccatcaac" dan "caatgggcaac" (tanda "|" menunjukkan kecocokan atau match di antara kedua sekuens).
ccat---caac
 | ||   ||||
 caatgggcaac
   Sequence alignment merupakan metode dasar dalam analisis sekuens. Metode ini digunakan untuk mempelajari evolusi sekuens-sekuens dari leluhur yang sama (common ancestor). Ketidakcocokan (mismatch) dalam alignment diasosiasikan dengan proses mutasi, sedangkan kesenjangan (gap, tanda "–") diasosiasikan dengan proses insersi atau delesi. Sequence alignment memberikan hipotesis atas proses evolusi yang terjadi dalam sekuens-sekuens tersebut. Misalnya, kedua sekuens dalam contoh alignment di atas bisa jadi berevolusi dari sekuens yang sama "ccatgggcaac". Dalam kaitannya dengan hal ini, alignment juga dapat menunjukkan posisi-posisi yang dipertahankan (conserved) selama evolusi dalam sekuens-sekuens protein, yang menunjukkan bahwa posisi-posisi tersebut bisa jadi penting bagi struktur atau fungsi protein tersebut.
Selain itu, sequence alignment juga digunakan untuk mencari sekuens yang mirip atau sama dalam basis data sekuens. BLAST adalah salah satu metode alignment yang sering digunakan dalam penelusuran basis data sekuens. BLAST menggunakan algoritma heuristik dalam penyusunan alignment.
Beberapa metode alignment lain yang merupakan pendahulu BLAST adalah metode "Needleman-Wunsch" dan "Smith-Waterman". Metode Needleman-Wunsch digunakan untuk menyusun alignment global di antara dua atau lebih sekuens, yaitu alignment atas keseluruhan panjang sekuens tersebut. Metode Smith-Waterman menghasilkan alignment lokal, yaitu alignment atas bagian-bagian dalam sekuens. Kedua metode tersebut menerapkan pemrograman dinamik (dynamic programming) dan hanya efektif untuk alignment dua sekuens (pairwise alignment) Clustal adalah program bioinformatika untuk alignment multipel (multiple alignment), yaitu alignment beberapa sekuens sekaligus. Dua varian utama Clustal adalah ClustalW danClustalX.
Metode lain yang dapat diterapkan untuk alignment sekuens adalah metode yang berhubungan dengan Hidden Markov Model ("Model Markov Tersembunyi", HMM). HMM merupakan model statistika yang mulanya digunakan dalam ilmu komputer untuk mengenali pembicaraan manusia (speech recognition). Selain digunakan untuk alignment, HMM juga digunakan dalam metode-metode analisis sekuens lainnya, seperti prediksi daerah pengkode protein dalam genom dan prediksi struktur sekunder protein.

Prediksi Struktur Protein


Model protein hemaglutinin dari virusinfluensa


Secara kimia/fisika, bentuk struktur protein diungkap dengan kristalografi sinar-X ataupun spektroskopi NMR, namun kedua metode tersebut sangat memakan waktu dan relatif mahal. Sementara itu, metode sekuensing protein relatif lebih mudah mengungkapkan sekuens asam amino protein. Prediksi struktur protein berusaha meramalkan struktur tiga dimensi protein berdasarkan sekuens asam aminonya (dengan kata lain, meramalkan struktur tersier dan struktur sekunder berdasarkan struktur primer protein). Secara umum, metode prediksi struktur protein yang ada saat ini dapat dikategorikan ke dalam dua kelompok, yaitu metode pemodelan protein komparatif dan metode pemodelan de novo.
Pemodelan protein komparatif (comparative protein modelling) meramalkan struktur suatu protein berdasarkan struktur protein lain yang sudah diketahui. Salah satu penerapan metode ini adalah pemodelan homologi (homology modelling), yaitu prediksi struktur tersier protein berdasarkan kesamaan struktur primer protein. Pemodelan homologi didasarkan pada teori bahwa dua protein yang homolog memiliki struktur yang sangat mirip satu sama lain. Pada metode ini, struktur suatu protein (disebut protein target) ditentukan berdasarkan struktur protein lain (protein templat) yang sudah diketahui dan memiliki kemiripan sekuens dengan protein target tersebut. Selain itu, penerapan lain pemodelan komparatif adalah protein threading yang didasarkan pada kemiripan struktur tanpa kemiripan sekuens primer. Latar belakang protein threading adalah bahwa struktur protein lebih dikonservasi daripada sekuens protein selama evolusi; daerah-daerah yang penting bagi fungsi protein dipertahankan strukturnya. Pada pendekatan ini, struktur yang paling kompatibel untuk suatu sekuens asam amino dipilih dari semua jenis struktur tiga dimensi protein yang ada. Metode-metode yang tergolong dalam protein threading berusaha menentukan tingkat kompatibilitas tersebut.
Dalam pendekatan de novo atau ab initio, struktur protein ditentukan dari sekuens primernya tanpa membandingkan dengan struktur protein lain. Terdapat banyak kemungkinan dalam pendekatan ini, misalnya dengan menirukan proses pelipatan (folding) protein dari sekuens primernya menjadi struktur tersiernya (misalnya dengan simulasi dinamika molekular), atau dengan optimisasi global fungsi energi protein. Prosedur-prosedur ini cenderung membutuhkan proses komputasi yang intens, sehingga saat ini hanya digunakan dalam menentukan struktur protein-protein kecil. Beberapa usaha telah dilakukan untuk mengatasi kekurangan sumber daya komputasi tersebut, misalnya dengansuperkomputer (misalnya superkomputer Blue Gene dari IBM) atau komputasi terdistribusi (distributed computing, misalnya proyekFolding@home) maupun komputasi grid.

Analisis Ekspresi Gen

Analisis Klastering Ekspresi Gen Pada Kanker Payudara



          Ekspresi gen dapat ditentukan dengan mengukur kadar mRNA dengan berbagai macam teknik (misalnya dengan microarray ataupun Serial Analysis of Gene Expression ["Analisis Serial Ekspresi Gen", SAGE]). Teknik-teknik tersebut umumnya diterapkan pada analisis ekspresi gen skala besar yang mengukur ekspresi banyak gen (bahkan genom) dan menghasilkan data skala besar. Metode-metode penggalian data (data mining) diterapkan pada data tersebut untuk memperoleh pola-pola informatif. Sebagai contoh, metode-metode komparasi digunakan untuk membandingkan ekspresi di antara gen-gen, sementara metode-metode klastering (clustering) digunakan untuk mempartisi data tersebut berdasarkan kesamaan ekspresi gen.

GenBank
GenBank basis data sekuens adalah akses terbuka , beranotasi koleksi semua yang tersedia secara umum nukleotida urutan dan mereka protein terjemahan. Database ini diproduksi dan dipelihara olehNational Center for Biotechnology Information (NCBI) sebagai bagian dari Internasional Nukleotida Sequence Database Kolaborasi (INSDC). The National Center for Biotechnology Information merupakan bagian dari National Institute of Health di Amerika Serikat . GenBank dan kolaborator yang menerima urutan diproduksi di laboratorium di seluruh dunia dari lebih dari 100.000 organisme yang berbeda.GenBank terus tumbuh pada tingkat eksponensial , dua kali lipat setiap 18 bulan. Release 155, diproduksi pada bulan Agustus 2006, berisi lebih dari 65 miliar basa nukleotida di lebih dari 61 juta urutan. GenBank dibangun oleh pengajuan langsung dari laboratorium individu, maupun dari kiriman curah dari pusat sequencing skala besar.

f.    Bioinformatika di Indonesia
Saat ini mata ajaran bioinformatika maupun mata ajaran dengan muatan bioinformatika sudah diajarkan di beberapa perguruan tinggi diIndonesia. Sekolah Ilmu dan Teknologi Hayati ITB menawarkan mata kuliah "Pengantar Bioinformatika" untuk program Sarjana dan mata kuliah "Bioinformatika" untuk program Pascasarjana. Fakultas Teknobiologi Universitas Atma Jaya, Jakarta menawarkan mata kuliah "Pengantar Bioinformatika". Mata kuliah "Bioinformatika" diajarkan pada Program Pascasarjana Kimia Fakultas MIPA Universitas Indonesia(UI), Jakarta. Mata kuliah "Proteomik dan Bioinformatika" termasuk dalam kurikulum program S3 bioteknologi Universitas Gadjah Mada (UGM),Yogyakarta. Materi bioinformatika termasuk di dalam silabus beberapa mata kuliah untuk program sarjana maupun pascasarjanabiokimia,biologi, dan bioteknologi pada Institut Pertanian Bogor (IPB). Selain itu, riset-riset yang mengarah pada bioinformatika juga telah dilaksanakan oleh mahasiswa program S1 Ilmu Komputer maupun program pascasarjana biologi serta bioteknologi IPB.
Riset bioinformatika protein dilaksanakan sebagai bagian dari aktivitas riset rekayasa protein pada Laboratorium Rekayasa Protein, Pusat Penelitian Bioteknologi Lembaga Ilmu Pengetahuan Indonesia (LIPI), Cibinong, Bogor. Lembaga Biologi Molekul Eijkman, Jakarta, secara khusus memiliki laboratorium bioinformatika sebagai fasilitas penunjang kegiatan risetnya. Selain itu, basis data sekuens DNAmikroorganisme asli Indonesia sedang dikembangkan di UI.

Kondisi Bioinformatika di Indonesia
Di Indonesia, Bioinformatika masih belum dikenal oleh masyarakat luas. Hal inidapat dimaklumi karena penggunaan komputer sebagai alat bantu belum merupakanbudaya. Bahkan di kalangan peneliti sendiri, barangkali hanya para peneliti biologimolekul yang sedikit banyak mengikuti perkembangannya karena keharusanmenggunakan perangkat-perangkat Bioinformatika untuk analisa data. Sementara dikalangan TI masih kurang mendapat perhatian.
Ketersediaan database dasar (DNA, protein) yang bersifat terbuka/gratismerupakan peluang besar untuk menggali informasi berharga daripadanya. Databasegenom manusia sudah disepakati akan bersifat terbuka untuk seluruh kalangan, sehinggadapat digali/diketahui kandidat-kandidat gen yang memiliki potensi kedokteran/farmasi.Dari sinilah Indonesia dapat ikut berperan mengembangkan Bioinformatika. Kerjasamaantara peneliti bioteknologi yang memahami makna biologis data tersebut dengan praktisiTI seperti programmer, dan sebagainya akan sangat berperan dalam kemajuanBioinformatika Indonesia nantinya.

g.  Kelebihan dan kekurangan bioteknologi modern
Kelebihan dan kekurangn Bioteknologi modern antara lain:
õ  perbaikan sifat genetik dapat dilakukan secara sangat terarah
õ  dapat mengatasi kendala ketidaksesuaian genetik
õ  dapat memeperpendek jangka waktu pengembangan galur tanaman baru
õ  relatif mahal dan memerlukan kecanggihan teknologi
õ  pengaruh jangka panjang belum diketahui

h.    Kesimpulan
Bioinformatika adalah teknologi pengumpulan, penyimpanan, analisis, interpretasi, penyebaran dan aplikasi dari data-data biologi molekul. Perangkat utama Bioinformatika adalah software dan didukung oleh kesediaan internet dan server WorldWide Web (WWW).
Dengan Bioinformatika, data-data yang dihasilkan dari proyek genom dapat disimpan dengan teratur dalam waktu yang singkat dengan tingkat akurasi yang tinggi serta sekaligus dianalisa dengan program-program yang dibuat untuk tujuan tertentu.Sebaliknya Bioinformatika juga mempercepat penyelesaian proyek genom karena Bioinformatika memberikan program-program yang diperlukan untuk proses pembacaangenom ini.
Dalam dunia kedokteran, keberhasilan proyek genom ini membuka kemungkinan luas untuk menangani berbagai penyakit genetik serta memprediksi resiko terkena penyakit genetik. Juga dapat digunakan untuk mengetahui respon tubuh terhadap obat sehingga efektivitas pengobatan bisa ditingkatkan.
Karena Bioinformatika merupakan suatu bidang interdisipliner, maka Bioinformatika juga tidak bisa berdiri sendiri dan harus didukung oleh disiplin ilmu lainyang mengakibatkan saling bantu dan saling menunjang sehingga bermanfaat untuk kepentingan manusia. Bidang yang terkait dengan Bioinformatika diantaranya adalah Biophysics, Computational Biology, Medical Informatics, Cheminformatics, Genomics, Mathematical Biology, Proteomics, Pharmacogenomics.
Meskipun merupakan kajian yang masih baru, Indonesia telah berperan aktif dalam mengembangkan Bioinformatika ini.Ada sejumlah pakar yang telah mengikuti perkembangan Bioinformatika ini, antara lain para peneliti dalam Lembaga BiologiMolekul Eijkman.

L.    Daftar Pustaka