1 / 42

Analýza proteinových sekvencí

Analýza proteinových sekvencí. Osnova. Predikce fyzikálně-chemických vlastností Predikce membránových regionů Predikce motivů a domén Databáze motivů a domén Prohledávání databází motivů a domén. Predikce fyzikálně-chemických vlastností. ExPASy (Expert Protein Analysis System).

bin
Download Presentation

Analýza proteinových sekvencí

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Analýza proteinových sekvencí

  2. Osnova • Predikce fyzikálně-chemických vlastností • Predikce membránových regionů • Predikce motivů a domén • Databáze motivů a domén • Prohledávání databází motivů a domén Analýza proteinových sekvencí

  3. Predikce fyzikálně-chemických vlastností • ExPASy (Expert Protein Analysis System) Analýza proteinových sekvencí

  4. Predikce fyzikálně-chemických vlastností • ExPASy (Expert Protein Analysis System) • Molekulová hmotnost • Izoelektrický bod • Extinkční koeficient • Postranslační modifikace • Místa proteasové digesce • Poločas rozkladu • Nestabilita Analýza proteinových sekvencí

  5. Predikce fyzikálně-chemických vlastností • ExPASy (Expert Protein Analysis System) Analýza proteinových sekvencí

  6. Predikce membránových regionů • Hydrofóbní segmenty v membránových proteinech Analýza proteinových sekvencí

  7. Predikce membránových regionů • ProtScale • Predikce hydrofobicitního profilu ze sekvence Analýza proteinových sekvencí

  8. Predikce membránových regionů • TMHMM • Predikce pravděpodobnostní metodou Skrytých Markovových Modelů Analýza proteinových sekvencí

  9. Predikce membránových regionů • TOPCONS • Konsenzuální predikce topologie membránových proteinů Analýza proteinových sekvencí

  10. Predikce motivů a domén • Konzervované vzorcesekvencí jsou spojenéskonkrétní • proteinovou rodinou, biologickými vlastnostminebo funkcí Analýza proteinových sekvencí

  11. Predikce motivů a domén • Konzervované vzorcesekvencí jsou spojenéskonkrétní • proteinovou rodinou, biologickými vlastnostmi nebo funkcí • Klasifikace proteinových sekvencí • Identifikace strukturních a evolučních vztahů • Funkční anotace nových proteinů • Identifikace vazebných míst pro ligandy • Predikce postranslačních modifikací • Predikce sub-celulární lokalizace Analýza proteinových sekvencí

  12. Predikce motivů a domén Analýza proteinových sekvencí

  13. Predikce motivů a domén • Konzervované vzorce sekvencí jsou spojenés konkrétníproteinovou rodinou, biologickými vlastnostmi nebo funkcí • Motivy • Zpravidla krátké – 10-20 aminokyselinových zbytků • CGDAEEGDACCDGA Analýza proteinových sekvencí

  14. Predikce motivů a domén • Konzervované vzorce sekvencí jsou spojenés konkrétníproteinovou rodinou, biologickými vlastnostmi nebo funkcí • Motivy • Domény • Delší než motivy – 40-700 aminokyselinových zbytků • Nezávislé strukturní a funkční jednotky Analýza proteinových sekvencí

  15. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyv databázích ve forměkonsenzuální sekvence Analýza proteinových sekvencí

  16. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyv databázích ve forměkonsenzuální sekvence Analýza proteinových sekvencí

  17. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyv databázích ve forměkonsenzuální sekvence Analýza proteinových sekvencí

  18. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyv databázích ve forměkonsenzuální sekvence • Regulárnívýrazy Analýza proteinových sekvencí

  19. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyv databázích ve forměkonsenzuální sekvence • Regulárnívýrazy • E-X(2)-[FHM]-X(4)-{P}-L Analýza proteinových sekvencí

  20. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyv databázích ve forměkonsenzuální sekvence • Regulární výrazy • E-X(2)-[FHM]-X(4)-{P}-L • zbytek E je následován 2 libovolnými zbytky Analýza proteinových sekvencí

  21. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyv databázích ve forměkonsenzuální sekvence • Regulární výrazy • E-X(2)-[FHM]-X(4)-{P}-L • zbytek E je následován 2 libovolnými zbytky • následovanýmiF nebo H nebo M zbytky Analýza proteinových sekvencí

  22. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyv databázích ve forměkonsenzuální sekvence • Regulární výrazy • E-X(2)-[FHM]-X(4)-{P}-L • zbytek E je následován 2 libovolnými zbytky • následovanými F nebo H nebo M zbytky • následovanými 4 libovolnými zbytky Analýza proteinových sekvencí

  23. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyv databázích ve forměkonsenzuální sekvence • Regulární výrazy • E-X(2)-[FHM]-X(4)-{P}-L • zbytek E je následován 2 libovolnými zbytky • následovanými F nebo H nebo M zbytky • následovanými 4 libovolnými zbytky • následovanými jakýmkoliv zbytkem kromě P Analýza proteinových sekvencí

  24. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyv databázích ve forměkonsenzuální sekvence • Regulární výrazy • E-X(2)-[FHM]-X(4)-{P}-L • zbytek E je následován 2 libovolnými zbytky • následovanými F nebo H nebo M zbytky • následovanými 4 libovolnými zbytky • následovanými jakýmkoliv zbytkem kromě P • následovaným zbytkem L Analýza proteinových sekvencí

  25. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyvdatabázích ve forměkonsenzuální sekvence • Regulární výrazy Početpřesných hitů D-A-V-I-D 71 D-A-V-I-[DENQ]252 [DENQ]-A-V-I-[DENQ]925 [DENQ]-A-[VLI]-I-[DENQ] 2739 [DENQ]-[AQ]-[VLI]2-[DENQ]51506 Analýza proteinových sekvencí

  26. Predikce motivů a domén • Vytvářenyz multinásobného přiložení příbuzných sekvencí • Uloženyv databázích ve forměkonsenzuální sekvence • Regulární výrazy • Statistické modely(profily, bloky, Skryté Markovovy Modely) Analýza proteinových sekvencí

  27. Databáze motivů a domén • Manuální • Informativnídíky kvalitním anotacím • Nízký počet položek • Automatické • Méně informativní • Vysokýpočet položek Analýza proteinových sekvencí

  28. Databáze motivů a domén Analýza proteinových sekvencí

  29. Databáze motivů a domén • PROSITE • Motivy navrženy manuálně kvalifikovanými odborníky • Motivy často krátké pro zvýšení specifiy • Shody nutno interpretovat opatrně! Analýza proteinových sekvencí

  30. Databáze motivů a domén • PROSITE • Hity versushity s vysokým výskytem • Rozpoznání hitů = délka vzorce, informace o organismu, identifikace podobných vzorců, konzervovanost vzorce v přiložení Analýza proteinových sekvencí

  31. Databáze motivů a domén • BLOCKs • Bloky = segmenty multinásobného přiložení bez mezer • korespondujícís nejkonzervovanějšími regiony v proteinech Analýza proteinových sekvencí

  32. Databáze motivů a domén • BLOCKs • Bloky = segmenty multinásobného přiložení bez mezer • korespondujícís nejkonzervovanějšími regiony v proteinech Analýza proteinových sekvencí

  33. Databáze motivů a domén • Pfam • Přiložení doménvytvořené ze sekvencí databáze UniProtKB • Každá doména je reprezentována profilem Skrytých Markovových Modelů vytvořeným z mnohonásobného přiložení • Obsahuje dvě části: Pfam-A z manuálního přiložení a Pfam-B • z automatického přiložení Analýza proteinových sekvencí

  34. Databáze motivů a domén • Pfam Analýza proteinových sekvencí

  35. Databáze motivů a domén • ProDom • Databáze proteinovýchdomén automaticky vytvořenými ze sekvencí databáze UniProtKB • Navržena jako vyčerpávájicísbírka domén i bez znalosti funkce Analýza proteinových sekvencí

  36. Databáze motivů a domén • InterPro • Řeší problém redundance jednotlivých databází • Zahrnuje téměř všechnydostupné sekundárnídatabáze: PROSITE, Pfam,PRINTS, ProDom, SMART,… Analýza proteinových sekvencí

  37. Prohledávání databází motivů a domén • Simultánní prohledáníněkolikadatabází • InterProScan • CD Server • Motif-Scan Analýza proteinových sekvencí

  38. Prohledávání databází motivů a domén • Simultánní prohledání několika databází • InterProScan • CD Server • Motif-Scan • Vysoké skóre a vysoká shoda = spolehlivá interpretace • Závěry téměř vždy správné • Nízké skóre nebo částečná shoda = problematická interpretace • Závěry vyžadují další podpůrná data Analýza proteinových sekvencí

  39. Prohledávání databází motivů a domén • InterProScan • Srovnání prohledávané sekvence s InterPro databází • Hity a jejich umístění na sekvenci jsou vypsány přehledně Analýza proteinových sekvencí

  40. Prohledávání databází motivů a domén • CD Server • Hity jsou vypsány s E-hodnotou • prohledává menší počet databází než InterProScan Analýza proteinových sekvencí

  41. Prohledávání databází motivů a domén • Motif-Scan • Hityjsou vypsány s E-hodnotou a normalizovanýmskóre • Relevantní hity jsou označeny “!” Analýza proteinových sekvencí

  42. Reference • Claverie, J-M., & Notredame, C. (2006). Bioinformatics for Dummies (2nd ed.). Wiley Publishing, Hoboken, p. 436. • Xiong, J. (2006). Essential Bioinformatics, Cambridge University Press, New York, p. 352. • ExPASy: http://www.expasy.ch/ • ProtScale:http://www.expasy.org/cgi-bin/protscale.pl • TMHMM: http://www.cbs.dtu.dk/services/TMHMM-2.0/ • TOPCONS: http://topcons.net/ • PROSITE: http://www.expasy.org/prosite/ • BLOCKs: http://blocks.fhcrc.org • Pfam:http://pfam.sanger.ac.uk/ • ProDom: http://prodom.prabi.fr/prodom/current/html/home.php • InterPro: http://www.ebi.ac.uk/interpro/ • InterProScan: http://www.ebi.ac.uk/Tools/InterProScan/ • CD Search: http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi • Motif-Scan: http://myhits.isb-sib.ch/cgi-bin/motif_scan Analýza proteinových sekvencí

More Related