1 / 70

DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES

DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES. Modelado por homología. Dra. Cristina Marino Buslje Septiembre 2006. Preedición de la estructura de una proteína. Es una de las tareas mas significantes abordadas en la biología estructural computacional.

kamuzu
Download Presentation

DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES Modelado por homología Dra.CristinaMarino Buslje Septiembre 2006

  2. Preedición de la estructura de una proteína Es una de las tareas mas significantes abordadas en la biología estructural computacional. Tiene por objeto determinar la estructura tridimensional de proteínas a partir de su secuencia de aminoácidos. En términos mas formales, es la predicción de la estructura terciaria por su estructura primaria. Dada la utilidad del conocimiento de la estructura de proteínas en tareas tan valiosas como el diseño de drogas, este es un campo altamente activo de investigación. 1i9b.pdb

  3. Secuencia Estructura Plegamiento El plegamiento de proteínas es esencial Proteínadesplegada Proteínaplegada • Forma casi única • Precisamente ordenada • Estable • activa • Altamente móvil • inactiva • Asociaciones especificas • Reacciones especificas • La función depende de la forma

  4. 1tc2.pdb

  5. Dominio estructural Dentro de una proteína, un dominio estructural (dominio) es un elemento que se estabiliza por si mismo y generalmente se pliega independientemente del resto de la proteína. Muchos dominios no son únicos de las proteínas producto de un gen o una familia de genes, sino que aparecen en una gran variedad de proteínas. Los dominios son frecuentemente nombrados según la función biológica en la que intervienen en la proteína donde aparecen predominantemente, por ejemplo, el "calcium-binding domain” de la calmodulina LAS PROTEINAS ESTAN FORMADAS POR DOMINIOS

  6. 3583 proteínas contienen el dominio FN3

  7. Hay zonas de baja complejidad? Hay zonas trans membrana? secuencia secuencia PPPQNNSSSSTP Hay homologías parciales? secuencia secuencia Kinasa Cys rich SH2 Región hojas b Región a helices La predicción de estructura secundaria sugiere dominios? Asignación de dominios

  8. Jerarquía SCOPE. Ej: 1tc2 • Superfamily:PRTase-like • Lineage: • Root:scop • Class:Alpha and beta proteins (a/b)Mainly parallel beta sheets (beta-alpha-beta units) • Fold:PRTase-likecore: 3 layers, a/b/a; mixed beta-sheet of 6 strands, order 321456; strand 3 is antiparallel to the rest • Superfamily:PRTase-like • Families: • Phosphoribosyltransferases (PRTases) • Phosphoribosylpyrophosphatesynthetase

  9. Jerarquía CATH Ej: 1tc2 Clase Arquitectura (Fold) Topología (Superfamilia) Homologous superfamily Sequence family

  10. Ejemplo 1TC2 comparativo (tomado del PDB-Beta)

  11. Typos de Modelado • “Homology modelling” • “Fold recognition Modelling” • “Ab initio”

  12. “Comparative protein modelling (Homology Modelling)” Usa estructuras previamente resueltas como puntos de partida o moldes se basa en la razonable suposición de que dos proteínas homologas compartirán estructura similar

  13. De novo “Ab initio” protein modelling • Predecir la estructura de una proteína basándose solo en su secuencia. • Las predicciones “ab initio” recaen en la hipótesis termodinámica del plegamiento, que postula que las estructuras nativas de una secuencia proteica, corresponde a un mínimo global de energía libre. Actualmente hay tres problemas principales a los que debe enfrentarse este campo de investigación que son básicamente: • definir un sistema de “scoring” que diferencie estructuras nativas de las no nativas. • definir un campo de fuerzas para el cual la estructura con mínima energía libre global coincida con la estructura que conocemos como “nativa”. • El tiempo de computación necesario que requiere una cadena polipeptídica para recorrer todas las posibilidades conformacionales.

  14. Pasos para el modelado por homologia (“homology modelling”) • Busqueda de la proteína homologa (”molde” en general) • Alineamiento • Selección del modelo • Refinamiento del modelo • Validación del modelo

  15. El proceso de modelado por homología es cíclico Secuencia Alineamiento Validación del modelo Construcción del modelo Hasta no obtener mejoras

  16. Homologo PDB Homologo PDB Proceso de Modelado por homología Secuencia Datos experimentales Alineamiento múltiple de secuencias Búsqueda en bases de datos Asignación de dominios Predicción de estructura secundaria NO Reconocimiento de plegamiento Análisis de la familia de plegamiento SI Alineamiento de estructuras secundarias SI NO Modelado por homologia Predicción estructura terciaria Alineamiento de la secuencia a las estructuras Modelo 3D de la proteína Basado en Bob Rusell

  17. Cosas a tener en cuenta para evaluar una predicción de plegamiento (Fold recognition): • Correr mas de un programa de “Fold recognition” • En lo posible, correrlo sobre mas de un homologo. • Evaluar todas las salidas de un programa (no la primera) la solución puede estar entre las 10. • Función de la proteína de estructura desconocida. • Función de la proteína de estructura conocida. • La familia de plegamiento “FOLD FAMILY”. • Predicción de estructura secundaria.

  18. Datos experimentales • Tener todo dato experimental en mente a la hora de hacer un trabajo predictivo. • Comprobar si la predicción concuerda con los resultados experimentales. En caso negativo, habrá que re plantearse lo hecho.

  19. Datos experimentales pueden guiar el proceso de predicción ej: • Puentes disulfuro, restringen las posiciones de las cisteinas en el espacio. • Datos espectroscópicos. Dan información del contenido de estructura secundaria. • Mutagénesis dirigida, da información a cerca de que residuos intervienen en el centro activo o lugares de unión. • Conocimiento de lugares proteolíticos, modificaciones post-transduccionales, glucosilaciones, sugieren residuos accesibles. • Sitios antigénicos. • Etc.

  20. Validación de modelos CUAL es el correcto???

  21. Validación de modelos

  22. Validación de modelos Procheck

  23. Validación de modelos

  24. Validación de modelos Verify3D

  25. Validación de modelos Datos experimentales Procheck Verify3D Prosa II Errat WhatCheck ProQ …

  26. Modelado de Loops El modelado de Loops constituye un problema de “homology Modelling” dentro de la proteína. • Modelado “Knowledge based” (por homología) • Modelado “ab initio” (loop building)

  27. Clasificación de Loops http://sbi.imim.es/cgi-bin/archdb//loops.pl

  28. Clasificación de Loops Numero de clases Vs. Longitud del loop en ArchDB Fernández Fuentes, Narcís. Tesis doctoral UAB 2004

  29. Clasificación de Loops b-a 3.1.1 (2 cons GLY. 1 PH) b-b hairpin 5.1.1(1 cons GLY. 1 PH) Fernández Fuentes, Narcís. Tesis doctoral UAB 2004 a-b 4.1.1 (cons GLY PRO. 1 PH)

  30. Modelado de Loops

  31. Modelado de Loops

  32. Modelado de Loops • ej: Knowlege based http://manaslu.aecom.yu.edu/loopred/ http://www-cryst.bioc.cam.ac.uk/servers.html • ej: By satisfaction of spatial restrains http://alto.compbio.ucsf.edu/modloop/

  33. Errores mas frecuentes en modelos creados por “homology modelling” • Mala elección del “template” • Mal alineamiento entre el “template” y la proteína de estructura desconocida.

  34. Mala elección del “template” Mal asignación 1hht RNAdep-RNAPol. Bacteriophage phi-6 1c2p RNAdep-RNAPol. HCV

  35. Mala elección del “template” Mal asignación RHDV HCV PV Ribbon diagrams of RNA-dependent RNA polymerases shown from a similar vantage point

  36. Mala elección del “template” Molde no adecuado HCV Ramachandran Plot statistics Most favoured regions [A,B,L] 835 88.3%* Additional allowed regions [a,b,l,p] 102 10.8% Generously allowed regions [~a,~b,~l,~p] 5 0.5% Disallowed regions [XX] 4 0.4%* Non-glycine and non-proline residues 946 100.0% Glycine residues 58 Proline residues 54 Total number of residues 1062

  37. Mala elección del “template” HCV Ramachandran Plot statistics Most favoured regions [A,B,L] 909 91.5% Additional allowed regions [a,b,l,p] 84 8.5% Generously allowed regions [~a,~b,~l,~p] 0 0.0% Disallowed regions [XX] 0 0.0% Non-glycine and non-proline residues 993 100.0% End-residues (excl. Gly and Pro) 8 Glycine residues 62 Proline residues 56 Total number of residues 1119

  38. Alineamiento parcialmente erróneo 82-93

  39. Alineamiento parcialmente erróneo Superposición molde modelo

  40. Parcialmente mal alineamiento 1C2P unk

  41. Modelado de Loops

  42. Estudio Comparativo distintos softwares Para modelado por Homología 76% 52% 42% 39% 38% 24% 19% Akbar Nayeem. Et. Al. Protein Sci. 2006 15: 808-824

  43. Estado del arte: CASP http://predictioncenter.org/casp6/Casp6.html 6th Community Wide Experiment on the Critical Assessment of Techniques for Protein Structure Prediction Gaeta (Italy)      December 2004 Critical Assessment of Techniques for Protein Structure Prediction Asilomar Conference Center, Pacific Grove, CANovember 2006 (CASP7), 2006

  44. Estado del arte: CAPRI CAPRI: Critical Assessment of PRediction ofInteractions CAPRI community wide experiment on the comparative evaluation of protein-protein docking for structure prediction Hosted By EMBL/EBI-MSD Group

  45. Utilidad de un modelo EJEMPLODE ESTUDIOS ESTRUCTURALES

  46. M. A. Marti i Renom et. Al Current Protocols in Bioinformatics (2003) 5.1.1-5.1.3

  47. Construcción de estructuras supramoleculares IR

  48. Construcción de estructuras supramoleculares IR ILGFR 1999

  49. Identification of functional residues • Residues with backbone dihedral angles in strained conformation. • Clusters of charged residues. • Cavities or clefts in the protein structure. • Surface properties such as hydrophobicity, planarity, size or shape. • Energetics of the protein structure. • Surface mapping of phylogenetic information.

More Related