1 / 50

Review Bioinformatik

Review Bioinformatik. 2 Desember 2009. Data & Website Bioinformatika. J.Craig Venter TIGR. Sel. Program /Tool. NCBI. Genome. Primer (Primer3) Alignment ( Clustal , Muscle) Filogenetik (PAUP,MEGA). EMBL. Transcrip - tome. DDBJ. Expasy. PDB. Proteome. UNIPROT.

cerise
Download Presentation

Review Bioinformatik

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Review Bioinformatik 2 Desember 2009

  2. Data & Website Bioinformatika J.Craig Venter TIGR Sel Program /Tool NCBI Genome Primer (Primer3) Alignment (Clustal, Muscle) Filogenetik (PAUP,MEGA) EMBL Transcrip- tome DDBJ Expasy PDB Proteome UNIPROT

  3. GENOME_TRANSCRIPTOME • INSDC (International Nucleotide Sequence Database Collaboration): • GenBank-NCBI (National Center Biotechnology Information-USA), • EMBL-EBI(European Molecular Biology Laboratory - Europe Bioinformatic Institute-Inggris) • DDBJ-CIB(DNA Data Bank of Japan - Center for Information Biology - Jepang).

  4. Entrez NIH NCBI EMBL GenBank • Submissions • Updates • Submissions • Updates EMBL DDBJ EBI CIB NIG • Submissions • Updates SRS getentry The International Sequence Database Collaboration

  5. Sequencing Result Analysis BLAST Phylogenetic Analysis DNA Isolation Polymerase Chain Reaction Cloning Sequencing Data Retrieval MSA Primer Design

  6. BLAST • Basic Local Alignment Search Tool • Tool paling populer untuk mengetahui homologi suatu sekuen • Tersedia di NCBI, EMBL dan DDBJ • Jika sekarang Anda sudah mendapat hasil sekuensing  konfirmasi apakah gen yang disekuensing adalah yang diinginkan

  7. Alamat BLAST pada NCBI : http://blast.ncbi.nlm.nih.gov/ Pilih BLAST “flavour” yang sesuai untuk query protein

  8. Blastp : protein Copy dan paste sekuen protein anda disini Pastikan pilihan databasenya adalah Non-redundant Lalu klik tombol BLAST untuk memulai analisis

  9. Hasil BLAST : Merah  bagus hitam  jelek Panjang grafik menunjukkan kecocokan sekuen kita, semakin panjang  semakin bagus Bit score : semakin besar  semakin bagus E-value semakinmendekati0  semakinbagus  semakin homolog

  10. Parameter hasil BLAST : Identity dan Gaps Hasil alignment menunjukkan seberapa cocok sekuen kita (Query) dengan database (Subject) Tanda + menunjukkan kesamaan sifat dari asam amino

  11. Pilih BLAST “flavour” untuk sekuen DNA

  12. Paste sekuen anda disini Ganti pilihan database menjadi non-redundant Klk tombol BLAST untuk memulai pencarian

  13. Klik disini untuk mendapatkan sekuen yang telah dipilih Klik disini untuk menandai sekuen yang akan dipilih Perhatikan hasil alignment dan parameter hasil BLAST

  14. Format FASTA ditandai dengan tanda > dan nama sekuen Sekuen protein atau DNA berada dibawah

  15. Multiple Sequence Alignment

  16. Aplikasi • Mencari kesamaan dan perbedaan dari beberapa sekuen • Mencari daerah lestari (Conserve region) yang bisa digunakan untuk mendesain primer untuk proses PCR • Mencari daerah fungsional dari suatu sekuen, melalui analisis komparatif • Mencari domain fungsional dari suatu sekuen • Mencari motif tertentu dari sekuen • Mencari kesamaan (homologi) struktur, pola hidrofobik dan hidrofilik yang bisa mengantarkan pada prediksi struktur sekuender dan tersier • Mencari hubungan kekerabatan/kesamaan (phylogenetic relationship) dari beberapa sekuen. Bisa dilakukan dengan membuat pohon kekerabatan berdasarkan penjajaran (alignment) yang telah dibuat.

  17. Hasil Multiple Alignment Residu hasil penjajaran • Perbedaan residu menunjukkan adanya subtitusi • Gap “-”  adanya insersi atau delesi residu • Residu yang muncul di setiap sekuen ditandai dengan tanda bintang “ * ” • Tanda “ : ”  berbeda residu, namun memiliki sifat fisikokimia (hydropathy) yang sama Posisi setiap residu Gap Subtitusi Sekuen Input Non Conserve Conserve

  18. Primer Design

  19. Syarat Primer • Panjang sekitar 17 hingga 30 nukleotida • Persen GC sekitar 50 % • Temperatur annealing antara primer forward dan Reverse diusahakan serupa (tidak jauh berbeda) • Diusahakan tidak mengandung basa berulang lebih dari tiga basa, terutama basa G (seperti GGGG) • Diusahakan primer tidak saling komplemen baik antara ujung-ujung dalam satu primer atau antara primer forward dan reverse. • Diusahakan tidak menempatkan lebih dari dua basa G atau C pada 5 basa terakhir • Hindari nilai ΔG Hairpin yang lebih rendah dari -0,5 Kcal / mol • Hindari nilai ΔG Dimer yang lebih rendah dari -4,0 Kcal / mol

  20. Design Primer PCR Standard Website : //frodo.wi.mit.edu Input DNA sequence

  21. copy/pasta DNA sequence Sequence Id, Target (guna simbol [ dan ] atau Excluded regions (gunakan simbol < dan >. Klik warna biru utk ket. Lebih detail

  22. Setting Kondisi Primer Rubah setting kondisi primer atau default setting Klik untuk mendapatkan penjelasan/manual

  23. Output design primer PCR 1 2 Urutan oligo DNA- Forward Urutan oligo DNA- reversed

  24. Design Primer PCR Standard (www.bioinformatics.nl/cgi-bin/primer3plus/primer3plus.cgi 1 copy/pasta DNA sequence copy/pasta DNA sequence 3 2 Rubah setting kondisi primer atau default setting Gunakan simbol [ dan ] untuk target

  25. Output design primer PCR Urutan oligo DNA- Forward Urutan oligo DNA- reversed

  26. 1 Klik Check dan BLAST 2 Klik primer Manager - Hasil ditunjukan point 2

  27. CHECK 1 2

  28. BLAST

  29. 1 2 Gunakan simbol { dan }untuk included

  30. Output design primer PCR ( PERHATIKAN HASIL YG DIPEROLEH DARI SEBELUMNYA

  31. Primer Degenerate (single protein – multiple protein/nucleotides) www.changbioscience.com/primo/index.html 1 Klik primo degenerate 2 Input data : copy/pasta single protein sequence or multiple protein/DNA (output clustal)

  32. Gunakan data hasil output file clustal : multiple protein (output clustal), tampilkan/save dalam bentuk/ text Hasil Multiple alignment DNA sequence

  33. Input data : copy/pasta protein sequence or multiple protein/DNA (output clustal) Output primer degenerate Pilih sesuai dengan input data Klik Go

  34. Primer Design • biotools.umassmed.edu/ Primer Selection tool

  35. General Parameter

  36. Primer size Panjang primer yang ingin didapatkan (umumnya sekitar 17 – 30 bp). Primer 3 memberi batasan untuk nilai min ≥ 1 bp dan nilai mak ≤ 36 bp. • Primer Tm Melting temperature dari primer (Celcius) • Max Tm Difference Perbedaan melting temp. yang diterima antara primer forward (left primer) dengan primer reverse (right primer). • Product Tm Melting temp. yang diinginkan dari hasil amplifikasi (amplicon). • Primer GC% Persen jumlah nukleotida G dan C yang terkandung dalam primer. Semakin tinggi %GC akan meningkatkan melting temp. • Max Self Complementary Nilai maksimum local alignment (penjajaran) yang dapat diterima antara sesama primer atau antara primer forward (left primer) dengan reverse (right primer). Parameter ini digunakan untuk memprediksi kemungkinan primer menempel dengan sesamanya atau dengan pasangannya. Penilaian mengacu pada peraturan berikut: basa yang saling komplemen diberi nilai 1 ; basa yang komplemen dengan N diberi nilai -0,25 ; sedangkan yang tidak komplemen diberi nilai -1 ; dan setiap penambahan gap diberi nilai -2 ( hanya 1 panjang gap yang diperbolehkan dalam setiap penambahannya). • Max 3’ Self Complementary Nilai maksimum global alignment (penjajaran) yang dapat diterima antara ujung 3’ sesama primer atau antara primer forward (left primer) dengan reverse (right primer). Parameter ini digunakan untuk memprediksi kemungkinan primer menempel dengan sesamanya atau dengan pasangannya pada ujung 3’ sehingga membentuk primer dimer. • Max Poly-X Nilai maksimum basa berulang yang masih diterima, contoh: nilai (4) untuk GGGG

  37. start (Start Position) Posisi awal mula primer. Posisi ini menunjukkan letak basa pertama pada ujung 5’ primer. • len (Oligo Length) Panjang primer yang merupakan jumlah seluruh nukleotida dari primer tersebut. • tm (Melting Temperature) Suhu melting primer. Suhu yang menjadi ukuran primer untuk melakukan proses annealing (penempelan) ketika amplifikasi PCR berlangsung. • gc% Persen GC pada primer yang menunjukkan jumlah GC yang terkandung pada primer • any (Self Complementarity) Nilai Self-Complementary dari Primer ( merupakan ukuran kemungkinan bagian primer untuk menempel dengan bagian primer lain dalam satu primer, sehingga membentuk struktur sekunder ). • 3' (Self Complementarity) Nilai 3' self-complementarity dari primer ( merupakan ukuran kemungkinan bagian 3’ dari satu primer untuk menempel dengan bagian 3’ dari primer itu sendiri , sehingga membentuk primer-dimer antara primer itu sendiri). • rep (Mispriming or Mishyb Library Similarity) Kemngkinan kesamaan sekuen primer dengan daerah lain pada template (diluar daerah yang diinginkan), sehingga memungkinkan terjadinya mispriming atau kesalahan penempelan. • seq (Primer Sequence, 5'3') Sekuen primer yang dipilih. Sekuen selalu ditulis dari ujung 5’ ke 3’. Sehingga primer reverse (Right primer) ditulis terbalik dengan rancangan pada sekuen template.

  38. Product size Ukuran daerah dari template yang akan teramplifikasi pada saat proses PCR • Target (start, len)* Daerah target yang diinginkan. Ditunjukkan dengan letak awal nukleotida dan panjangnya. Pada peta ditunjukkan dengan tanda bintang (*) • PAIR ANY COMPL Nilai Self-Complementary dari sepasang primer ( merupakan ukuran kemungkinan bagian primer forward (left primer) untuk menempel dengan bagian primer reverse (right primer). • PAIR 3’ COMPL Nilai 3' self-complementarity dari sepasang primer ( merupakan ukuran kemungkinan bagian 3’ dari primer forward untuk menempel dengan bagian 3’ dari primer reverse, sehingga membentuk primer-dimer antara dua primer tersebut). • >>>>>>>>>>>>>>>> Menunjukkan letak primer forward (Left primer) pada template • <<<<<<<<<<<<<<<< Menunjukkan letak primer reverse (Right primer) pada template

  39. FILOGENETIK

  40. What is Phylogeny? • Pengelompokan organisme berdaarkan kemiripan ciri-ciri morfologisnya • What is Phylogenetic? • Pengelompokan organisme berdasarkan kemiripan sekuen DNA atau protein ari organisme tersebut

  41. Filogenetik cenderung tidak bias karena informasi yang digunakan adalah sekuen DNA atau protein • Reason to do phylogenetic : • menentukan kekerabatan organisme, pada bateri dengan sekuen 16s rRNA • menentukan fungsi suatu gen • menetukan asal usul gen • melihat persebaran organisme (filogeografi)

  42. DNA vs Protein, the hard choice? • jika organisme/gen berkerabat dekat atau homologi > 70%  DNA • Jika organisme/gen berkerabat jauh atau homologi < 70%  Protein • Dari mana Anda tahu nilai homologinya? BLAST • Pilihan Anda akan berpengaruh pada hasil Multiple Sequence Alignment

  43. Kunci dari filogenetik yang baik  Multiple Sequence Alignment (MSA) yang baik. • Jika MSA Anda tidak cukup baik  pohon filogenetik tidak dapat dipertanggungjawabkan • Jika MSA Anda baik  pohon filogenetik dapat dipertanggungjawabkan.

  44. Metode rekonstruksi pohon filogenetik : • Distance based method : Mengukur perbedaan basa/asam amino antara dua sekuen. Semakin kecil perbedaan  berkerabat dekat. Contoh : Neighbor Joining (NJ) • Sequence based method : rekonstruksi filogenetik berdasarkan perbedaan yang ada padaosisis tertentu dari sekuen DNA/protein. Contoh : Maximum Parsimony, Maximum Likelihood & Bayesian • Semua metode dapat dipertanggungjawabkan

  45. Bagaimana membaca pohon filogenetik? • Clade adalah pengelompokan utama pada pohon filogenetik • Jarak antar Clade dilihat dengan membandingkan garis horizontal antar dua cabang dengan skala Pohon filogenetik dengan metode NJ

  46. Lebih lanjut tentang membaca pohon filogenetik ketika workshop, sorry 

  47. Bagaimana membaca pohon filogenetik ? • Spesies akan memiliki jarak genetik yang kecil • Genus bakteri dengan beberapa spesies dicirikan dengan jarak genetik yang cukup jauh Pohon filogenetik 16s rRNA dengan metode NJ

  48. Jarak antar genus dicirikan dengan jarak genetik yang jauh Pohon filogenetik 16s rRNA dengan metode NJ

  49. Bootstraping adalah pengujian terhadap kestabilan pengelompokan pada pohon filogenetik kita • Semakin tinggi nilai bootstraping semakin stabil pengelompokan dalam pohon filogenetik kita Bootstraping pohon filogenetik 16s rRNA

  50. Tugas • Protein • Modultambahan d Dikumpulkanselasa, 8 desember 2009

More Related