Pendahuluan
Bioinformatika atau
Bioinformatics adalah ilmu yang mempelajari tentang penerapan teknik
komputasional untuk mengelola dan menganalisis informasi biologis. Bidang ini
mencakup ilmu matematika, statistik, dan komputer untuk memecahkan
masalah-masalah biologis, terutama dengan menggunakan sekuens DNA dan asam
amino serta informasi yang berkaitan dengannya. Secara esensial, bioinformatika
mempunyai tiga komponen :
- Penciptaan database yang memungkinkan penyimpanan dan manajemen pengaturan biologis yang besar.
- Penembangan algoritma dan statistik untuk menentukan hubungan diantara sejumlah data set yang besar.
- Penggunaan dari perkakas untuk analisa dan penafsiran dari berbagai jenis data biologis, mencakup DNA, RNA, dan urutan protein, profil ekspresi gen dan jalur biokimia.
Kemampuan untuk
memahami dan memanipulasi kode genetik DNA ini sangat didukung oleh teknologi
informasi melalui perkembangan hardware dan soffware. Baik pihak pabrikan
sofware dan harware maupun pihak ketiga dalam produksi perangkat lunak. Salah
satu contohnya dapat dilihat pada upaya Celera Genomics, perusahaan
bioteknologi Amerika Serikat yang melakukan pembacaan sekuen genom manusia yang
secara maksimal memanfaatkan teknologi informasi sehingga bisa melakukan
pekerjaannya dalam waktu yang singkat (hanya beberapa tahun).
Sejarah
Isitilah bioinformatika
pertama kali dikemukakan pada pertengahan tahun 1980-an untuk mengacu pada
penerapan komputer dalam biologi dan pada mulanya diartikan sebagai manajemen
dan analisis DNA, RNA dan data sekuensing protein. Namun demikian, penerapan
bidang-bidang dalam bioinformatika untuk analisis sekuensing telah dilakukan
sejak tahun 1960-an, tetapi hal ini mempunyai kepentingan yang sempit sampai
kemajuan dalam teknologi sekuensing yang mendorong ke arah suatu perkembangan
yang cepat dalam jumlah sekuens yang tersimpan di database seperti GenBank.
Saat ini, istilah
Bioinformatika telah meluas untuk menyertakan tipe data biologi yang berbeda,
sebagai contoh struktur protein, profil ekspresi gen dan interaksi protein.
Masing-masing dari tipe data tersebut memerlukan pengaturan database, algoritma
dan metode statistik sendiri-sendiri. Penemuan teknik
sekuensing DNA yang lebih cepat menjadi landasan terjadinya ledakan jumlah
sekuens DNA yang berhasil diungkapkan pada 1980-an dan 1990-an, menjadi salah
satu pembuka jalan bagi proyek-proyek pengungkapan genom, meningkatkan
kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan
lahirnya bioinformatika.
Sekuensing DNA satu
organisme, misalnya suatu virus memiliki kurang lebih 5.000 nukleotida atau
molekul DNA atau sekitar 11 gen, yang telah berhasil dibaca secara menyeluruh
pada tahun 1977. Kemudia Sekuen seluruh DNA manusia terdiri dari 3 milyar
nukleotida yang menyusun 100.000 gen dapat dipetakan dalam waktu 3 tahun,
walaupun semua ini belum terlalu lengkap. Saat ini terdapat milyaran data
nukleotida yang tersimpan dalam database DNA, GenBank di AS yang didirikan
tahun 1982.
Masa depan
bioinformatika adalah pengintegrasian data. Sebagai contoh, pengintegrasian
sumber data yang sangat bervariasi seperti data klinis dan data genomik akan
membantu kita dalam menentukan penggunaan gejala penyakit dalam memprediksi
mutasi genetik dan sebaliknya. Pengintegrasian data sistem informasi geografi
(SIG) seperti peta, sistem cuaca, dengan hasil kesehatan dan data genotipe,
akan membantu kita untuk memprediksi hasil sukses dari penelitian agrikultural.
Ruang lingkup masa depan penelitian bioinformatika adalah membandingkan secara
skala besar dari genomik. Sebagai contoh, pengembangan perkakas yang dapat
melaksanakan 10 jalur pembandingan genom akan mendorong majunya angka penemuan
pada bidang bionformatika. Selama ini, modeling dan visualisasi jejaring
(network) yang penuh dari sistem kompleks dapat digunakan untuk memprediksi
bagaimana sistem (atau sel) bereaksi terhadap obat sebagai contohnya. Tantangan
teknis yang melingkupi bioinformatika ditujukan pada komputer yang lebih cepat,
kemajuan teknologi dalam kapasitas ruang penyimpanan dan peningkatan bandwidth.
Akhirnya, pertanyaan kunci riset bagi masa depan bioinformatika adalah
bagaimana secara komputasi membandingkan pengamatan biologi kompleks, seperti
pola ekspresi gen dan jejaring protein. Bioinformatika adalah suatu sistem yang
mengubah pengamatan biologi kepada suatu model yang komputer akan dapat
memahaminya. Hal ini adalah tugas yang sangat menantang karena ilmu biologi
dapat menjadi sangat kompleks. Permasalahan bagaimana untuk mendigitalisasikan
data fenotif seperti perilaku, elektrokardiogram dan hasil kesehatan kepada
bentuk yang dapat terbaca komputer menawarkan tantangan yang menarik di masa
mendatang bagi para pakar bioinformatika.
PenerapanBiologis
Basis Data Sekuens
Biologis
Sesuai
dengan jenis informasi biologis yang disimpannya, basis data sekuens biologis
dapat berupa basis data primer untuk menyimpan sekuens primer asam nukleat
maupun protein, basis data sekunder untuk menyimpan motif sekuens protein, dan
basis data struktur untuk menyimpan data struktur protein maupun asam nukleat.
Basis data utama untuk
sekuens asam nukleat saat ini adalah GenBank (Amerika Serikat), EMBL (Eropa),
dan DDBJ(Inggris) (DNA Data Bank of Japan, Jepang). Ketiga basis data tersebut
bekerja sama dan bertukar data secara harian untuk menjaga keluasan cakupan
masing-masing basis data. Sumber utama data sekuens asam nukleat adalah submisi
langsung dari periset individual, proyek sekuensing genom, dan pendaftaran
paten. Selain berisi sekuens asam nukleat, entri dalam basis data sekuens asam
nukleat umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA),
nama organisme sumber asam nukleat tersebut, dan pustaka yang berkaitan dengan
sekuens asam nukleat tersebut.
Sementara itu, contoh
beberapa basis data penting yang menyimpan sekuens primer protein adalah PIR
(Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL
(Eropa). Ketiga basis data tersebut telah digabungkan dalam UniProt (yang
didanai terutama oleh Amerika Serikat). Entri dalam UniProt mengandung
informasi tentang sekuens protein, nama organisme sumber protein, pustaka yang
berkaitan, dan komentar yang umumnya berisi penjelasan mengenai fungsi protein
tersebut.
BLAST (Basic Local
Alignment Search Tool) merupakan perkakas bioinformatika yang berkaitan erat
dengan penggunaan basis data sekuens biologis. Penelusuran BLAST (BLAST search)
pada basis data sekuens memungkinkan ilmuwan untuk mencari sekuens asam nukleat
maupun protein yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini
berguna misalnya untuk menemukan gen sejenis pada beberapa organisme atau untuk
memeriksa keabsahan hasil sekuensing maupun untuk memeriksa fungsi gen hasil
sekuensing. Algoritma yang mendasari kerja BLAST adalah penyejajaran sekuens.
PDB (Protein Data Bank,
Bank Data Protein) adalah basis data tunggal yang menyimpan model struktural
tiga dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan
kristalografi sinar-X, spektroskopi NMR dan mikroskopi elektron). PDB menyimpan
data struktur sebagai koordinat tiga dimensi yang menggambarkan posisi
atom-atom dalam protein ataupun asam nukleat.
Analisis
Ekspresi Gen
Ekspresi gen dapat
ditentukan dengan mengukur kadar mRNA dengan berbagai macam teknik (misalnya
dengan microarray ataupun Serial Analysis of Gene Expression ["Analisis
Serial Ekspresi Gen", SAGE]). Teknik-teknik tersebut umumnya diterapkan
pada analisis ekspresi gen skala besar yang mengukur ekspresi banyak gen
(bahkan genom) dan menghasilkan data skala besar. Metode-metode penggalian data
(data mining) diterapkan pada data tersebut untuk memperoleh pola-pola
informatif. Sebagai contoh, metode-metode komparasi digunakan untuk
membandingkan ekspresi di antara gen-gen, sementara metode-metode klastering
(clustering) digunakan untuk mempartisi data tersebut berdasarkan kesamaan
ekspresi gen.
Sumber :
Sumber :
Tidak ada komentar:
Posting Komentar