1 / 58

Sequence analysis

Sequence analysis. 資料格式 (Data format). 資料格式 ( Text ).

odelia
Download Presentation

Sequence analysis

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Sequence analysis

  2. 資料格式 (Data format)

  3. 資料格式 (Text) MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEGLVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHKQFASRKQLSDAILKEAEEKIKEELKAQGKPEKIWDNIIPGKMNSFIADNSQLDSKLTLMGQFYVMDDKKTVEQVIAEKEKEFGGKIKIVEFICFEVGEGLEKKTEDFAAEVAAQLTVSEINSETDFVAKNDQFIALTKDTTAHIQSNSLQSVEELHSSTINGVKFEEYLKSQIATIGENLVVRFATLKAGANGVVNGYIHTNGRVGVVIAAACDSAEVASKSRDLLRQICMH

  4. 資料格式 (FASTA) >SEQUENCE_1 MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEG LVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHK IPQFASRKQLSDAILKEAEEKIKEELKAQGKPEKIWDNIIPGKMNSFIADNSQLDSKLTL MGQFYVMDDKKTVEQVIAEKEKEFGGKIKIVEFICFEVGEGLEKKTEDFAAEVAAQL >SEQUENCE_2 SATVSEINSETDFVAKNDQFIALTKDTTAHIQSNSLQSVEELHSSTINGVKFEEYLKSQI ATIGENLVVRRFATLKAGANGVVNGYIHTNGRVGVVIAAACDSAEVASKSRDLLRQICMH

  5. 資料格式 (GenBank)

  6. 資料格式 (Swissport)

  7. 資料庫比對搜尋 Database Search

  8. 資料庫種類 文獻資料庫(Reference database) PubMed, Books, OMIN, SeqAnalRef 序列資料庫(Sequence Database) Nucleotide, protein 其他資料庫(Others) Signaling pathway, metabolic pathway……

  9. Reference database http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed

  10. Reference database http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Books

  11. Reference database http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM

  12. Reference database http://tw.expasy.org/seqanalref/

  13. Reference database http://scholar.google.com.tw/

  14. Sequence Databases • Nucleotide database • -DNA • -mRNA/cDNA • -Alternative spicing • -SNP • -UniGene • Protein Database • - Sequences • - Domain and family • - Structure • - Swiss-2D %3D Image • - ENZYME • - PDB

  15. International DNA data banks

  16. Data Bank http://www.ncbi.nlm.nih.gov/

  17. Data Bank http://www.ebi.ac.uk/Databases/

  18. Data Bank http://www.ddbj.nig.ac.jp/

  19. Genome Brower http://www.ncbi.nlm.nih.gov/mapview/

  20. Genome Brower http://genome.ucsc.edu/cgi-bin/hgGateway

  21. Genome Brower http://www.ensembl.org/

  22. Expression Sequence Tag

  23. mRNA/cDNA Database http://cdna.ims.u-tokyo.ac.jp/

  24. mRNA/cDNA Database http://www.ncbi.nlm.nih.gov/dbEST/index.html

  25. mRNA/cDNA Database http://www.ncbi.nlm.nih.gov/UniGene/

  26. Alternative splicing

  27. Alternative Splicing Annotation Project II http://bioinformatics.ucla.edu/ASAP2/

  28. BIPASS http://bip.umiacs.umd.edu:8080/

  29. Single Nucleotide Polymorphism (SNP)

  30. SNP database http://www.ncbi.nlm.nih.gov/SNP/

  31. SNP database http://www.binfo.ncku.edu.tw/snp/

  32. Protein database http://tw.expasy.org/sprot/

  33. http://tw.expasy.org/prosite/ 這是一個以蛋白質功能為分類基準的資料庫, 資料庫內的 資料包括了蛋白質的生化功能 、來源、活性區域、胺基酸序列的一致性模式 (consensus pattern)

  34. http://tw.expasy.org/ch2d/ 收集蛋白質在二維電泳膠片上特定位置的資料庫

  35. http://tw.expasy.org/enzyme/ ENZYME這個資料庫的資料有,酵素所催化的生化反應方程式、 酵素所需要的輔助因子(cofactor)、酵素在Boehringer Mannheim 所提供的生化新 陳代謝圖中的位置

  36. http://www.pdb.org/pdb/home/home.do

  37. OTHER-TYPE DATABASES • Signaling Pathway Database • Reference • ……….. • ………..

  38. GeneCards http://bioinformatics.weizmann.ac.il/cards/

  39. BIOCARTA http://www.biocarta.com/genes/allPathways.asp

  40. Kyoto Encyclopedia of Genes and Genomes (KEGG) http://www.genome.jp/kegg/

  41. Signaling Pathway Database http://www.grt.kyushu-u.ac.jp/spad/

  42. 2007 http://nar.oxfordjournals.org/cgi/content/full/35/suppl_1/D3/DC1

  43. Database search Text search (Key word) NCBI (Entrez; http://www.ncbi.nlm.nih.gov/sites/gquery) EBI (SRS; http://srs6.ebi.ac.uk/ ) 由於目前的Entrez 介面提供整個Entrez 資料庫的搜尋結果,所以使用者不需定義特定資料庫。在使用SRS 時就需注意定義特定資料庫,再進行搜尋。 Sequence search NCBI (BLAST; http://www.ncbi.nlm.nih.gov/blast/ ) EBI (Fasta; http://www.ebi.ac.uk/fasta33/index.html )

  44. 練習一 試以 Fibroblast growth factor 9 “ FGF9” 為keyword,練習由NCBI提供的Entrez或由EBI 提供的 SRS來搜尋文獻、核酸及蛋白質資料庫。

  45. 作業一 Tryptophan hydroxylase 2(TPH2)是大腦製造血清素的速率限制脢,請試著找出: 1. 人類TPH2 gene 位於那一條chromosome上?其physical map 的位置 約在多少Megabase(Mb)處? 2.找出一篇描述 TPH2 function有關的paper ,寫下作者、期刊名、卷號、頁數和出版年份。 3.利用NCBI上現有的電子書,找出那一本書上的那個章節有講述TPH2的相關資訊。 4.利用NCBI (Entrez 及 BLAST) 或 EBI (SRS 及 FASTA)的系統,找出人類 TPH2 mRNA or cDNA 序列並利用此序列進行蛋白質資料庫搜尋。顯示最好的50筆資料 。

  46. 序列分析比對 Sequence comparison

  47. 為什麼需要序列分析比對? 序列比對指將兩個或多個序列排列在一起,標明其相似之處。序列中可以插入間隔(通常用短橫線「-」表示)。對應的相同或相似的符號(在核酸中是A, T(或U), C, G,在蛋白質中是胺基酸殘基的單字母表示)排列在同一列上。 • 比較序列間相似程度 • 找出一些基因規則 • 找出親緣基因的同緣區域

  48. 為什麼需要序列分析比對? 序列比對指將兩個或多個序列排列在一起,標明其相似之處。序列中可以插入間隔(通常用短橫線「-」表示)。對應的相同或相似的符號(在核酸中是A, T(或U), C, G,在蛋白質中是胺基酸殘基的單字母表示)排列在同一列上。 • 比較序列間相似程度 • 找出一些基因規則 • 找出親緣基因的同緣區域

  49. 序列並列比對的種類 • Global vs. Local alignment

More Related