DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES

DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES Modelado por homología Dra.CristinaMarino Buslje Septiembre 2006

Preedición de la estructura de una proteína Es una de las tareas mas significantes abordadas en la biología estructural computacional. Tiene por objeto determinar la estructura tridimensional de proteínas a partir de su secuencia de aminoácidos. En términos mas formales, es la predicción de la estructura terciaria por su estructura primaria. Dada la utilidad del conocimiento de la estructura de proteínas en tareas tan valiosas como el diseño de drogas, este es un campo altamente activo de investigación. 1i9b.pdb

Secuencia Estructura Plegamiento El plegamiento de proteínas es esencial Proteínadesplegada Proteínaplegada • Forma casi única • Precisamente ordenada • Estable • activa • Altamente móvil • inactiva • Asociaciones especificas • Reacciones especificas • La función depende de la forma

1tc2.pdb

Dominio estructural Dentro de una proteína, un dominio estructural (dominio) es un elemento que se estabiliza por si mismo y generalmente se pliega independientemente del resto de la proteína. Muchos dominios no son únicos de las proteínas producto de un gen o una familia de genes, sino que aparecen en una gran variedad de proteínas. Los dominios son frecuentemente nombrados según la función biológica en la que intervienen en la proteína donde aparecen predominantemente, por ejemplo, el "calcium-binding domain” de la calmodulina LAS PROTEINAS ESTAN FORMADAS POR DOMINIOS

3583 proteínas contienen el dominio FN3

Hay zonas de baja complejidad? Hay zonas trans membrana? secuencia secuencia PPPQNNSSSSTP Hay homologías parciales? secuencia secuencia Kinasa Cys rich SH2 Región hojas b Región a helices La predicción de estructura secundaria sugiere dominios? Asignación de dominios

Jerarquía SCOPE. Ej: 1tc2 • Superfamily:PRTase-like • Lineage: • Root:scop • Class:Alpha and beta proteins (a/b)Mainly parallel beta sheets (beta-alpha-beta units) • Fold:PRTase-likecore: 3 layers, a/b/a; mixed beta-sheet of 6 strands, order 321456; strand 3 is antiparallel to the rest • Superfamily:PRTase-like • Families: • Phosphoribosyltransferases (PRTases) • Phosphoribosylpyrophosphatesynthetase

Jerarquía CATH Ej: 1tc2 Clase Arquitectura (Fold) Topología (Superfamilia) Homologous superfamily Sequence family

Ejemplo 1TC2 comparativo (tomado del PDB-Beta)

Typos de Modelado • “Homology modelling” • “Fold recognition Modelling” • “Ab initio”

“Comparative protein modelling (Homology Modelling)” Usa estructuras previamente resueltas como puntos de partida o moldes se basa en la razonable suposición de que dos proteínas homologas compartirán estructura similar

De novo “Ab initio” protein modelling • Predecir la estructura de una proteína basándose solo en su secuencia. • Las predicciones “ab initio” recaen en la hipótesis termodinámica del plegamiento, que postula que las estructuras nativas de una secuencia proteica, corresponde a un mínimo global de energía libre. Actualmente hay tres problemas principales a los que debe enfrentarse este campo de investigación que son básicamente: • definir un sistema de “scoring” que diferencie estructuras nativas de las no nativas. • definir un campo de fuerzas para el cual la estructura con mínima energía libre global coincida con la estructura que conocemos como “nativa”. • El tiempo de computación necesario que requiere una cadena polipeptídica para recorrer todas las posibilidades conformacionales.

Pasos para el modelado por homologia (“homology modelling”) • Busqueda de la proteína homologa (”molde” en general) • Alineamiento • Selección del modelo • Refinamiento del modelo • Validación del modelo

El proceso de modelado por homología es cíclico Secuencia Alineamiento Validación del modelo Construcción del modelo Hasta no obtener mejoras

Homologo PDB Homologo PDB Proceso de Modelado por homología Secuencia Datos experimentales Alineamiento múltiple de secuencias Búsqueda en bases de datos Asignación de dominios Predicción de estructura secundaria NO Reconocimiento de plegamiento Análisis de la familia de plegamiento SI Alineamiento de estructuras secundarias SI NO Modelado por homologia Predicción estructura terciaria Alineamiento de la secuencia a las estructuras Modelo 3D de la proteína Basado en Bob Rusell

Cosas a tener en cuenta para evaluar una predicción de plegamiento (Fold recognition): • Correr mas de un programa de “Fold recognition” • En lo posible, correrlo sobre mas de un homologo. • Evaluar todas las salidas de un programa (no la primera) la solución puede estar entre las 10. • Función de la proteína de estructura desconocida. • Función de la proteína de estructura conocida. • La familia de plegamiento “FOLD FAMILY”. • Predicción de estructura secundaria.

Datos experimentales • Tener todo dato experimental en mente a la hora de hacer un trabajo predictivo. • Comprobar si la predicción concuerda con los resultados experimentales. En caso negativo, habrá que re plantearse lo hecho.

Datos experimentales pueden guiar el proceso de predicción ej: • Puentes disulfuro, restringen las posiciones de las cisteinas en el espacio. • Datos espectroscópicos. Dan información del contenido de estructura secundaria. • Mutagénesis dirigida, da información a cerca de que residuos intervienen en el centro activo o lugares de unión. • Conocimiento de lugares proteolíticos, modificaciones post-transduccionales, glucosilaciones, sugieren residuos accesibles. • Sitios antigénicos. • Etc.

Validación de modelos CUAL es el correcto???

Validación de modelos

Validación de modelos Procheck

Validación de modelos

Validación de modelos Verify3D

Validación de modelos Datos experimentales Procheck Verify3D Prosa II Errat WhatCheck ProQ …

Modelado de Loops El modelado de Loops constituye un problema de “homology Modelling” dentro de la proteína. • Modelado “Knowledge based” (por homología) • Modelado “ab initio” (loop building)

Clasificación de Loops http://sbi.imim.es/cgi-bin/archdb//loops.pl

Clasificación de Loops Numero de clases Vs. Longitud del loop en ArchDB Fernández Fuentes, Narcís. Tesis doctoral UAB 2004

Clasificación de Loops b-a 3.1.1 (2 cons GLY. 1 PH) b-b hairpin 5.1.1(1 cons GLY. 1 PH) Fernández Fuentes, Narcís. Tesis doctoral UAB 2004 a-b 4.1.1 (cons GLY PRO. 1 PH)

Modelado de Loops

Modelado de Loops • ej: Knowlege based http://manaslu.aecom.yu.edu/loopred/ http://www-cryst.bioc.cam.ac.uk/servers.html • ej: By satisfaction of spatial restrains http://alto.compbio.ucsf.edu/modloop/

Errores mas frecuentes en modelos creados por “homology modelling” • Mala elección del “template” • Mal alineamiento entre el “template” y la proteína de estructura desconocida.

Mala elección del “template” Mal asignación 1hht RNAdep-RNAPol. Bacteriophage phi-6 1c2p RNAdep-RNAPol. HCV

Mala elección del “template” Mal asignación RHDV HCV PV Ribbon diagrams of RNA-dependent RNA polymerases shown from a similar vantage point

Mala elección del “template” Molde no adecuado HCV Ramachandran Plot statistics Most favoured regions [A,B,L] 835 88.3%* Additional allowed regions [a,b,l,p] 102 10.8% Generously allowed regions [~a,~b,~l,~p] 5 0.5% Disallowed regions [XX] 4 0.4%* Non-glycine and non-proline residues 946 100.0% Glycine residues 58 Proline residues 54 Total number of residues 1062

Mala elección del “template” HCV Ramachandran Plot statistics Most favoured regions [A,B,L] 909 91.5% Additional allowed regions [a,b,l,p] 84 8.5% Generously allowed regions [~a,~b,~l,~p] 0 0.0% Disallowed regions [XX] 0 0.0% Non-glycine and non-proline residues 993 100.0% End-residues (excl. Gly and Pro) 8 Glycine residues 62 Proline residues 56 Total number of residues 1119

Alineamiento parcialmente erróneo 82-93

Alineamiento parcialmente erróneo Superposición molde modelo

Parcialmente mal alineamiento 1C2P unk

Modelado de Loops

Estudio Comparativo distintos softwares Para modelado por Homología 76% 52% 42% 39% 38% 24% 19% Akbar Nayeem. Et. Al. Protein Sci. 2006 15: 808-824

Estado del arte: CASP http://predictioncenter.org/casp6/Casp6.html 6th Community Wide Experiment on the Critical Assessment of Techniques for Protein Structure Prediction Gaeta (Italy) December 2004 Critical Assessment of Techniques for Protein Structure Prediction Asilomar Conference Center, Pacific Grove, CANovember 2006 (CASP7), 2006

Estado del arte: CAPRI CAPRI: Critical Assessment of PRediction ofInteractions CAPRI community wide experiment on the comparative evaluation of protein-protein docking for structure prediction Hosted By EMBL/EBI-MSD Group

Utilidad de un modelo EJEMPLODE ESTUDIOS ESTRUCTURALES

M. A. Marti i Renom et. Al Current Protocols in Bioinformatics (2003) 5.1.1-5.1.3

Construcción de estructuras supramoleculares IR

Construcción de estructuras supramoleculares IR ILGFR 1999

Identification of functional residues • Residues with backbone dihedral angles in strained conformation. • Clusters of charged residues. • Cavities or clefts in the protein structure. • Surface properties such as hydrophobicity, planarity, size or shape. • Energetics of the protein structure. • Surface mapping of phylogenetic information.

DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES

DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES

Presentation Transcript

DETERMINACION DE LA RENTA NACIONAL

DETERMINACION DE COSTOS

ESTRUCTURA DE LA NOTICIA

Clase # 14. Modelado de la estructura de una proteína (II)

CONTROL DE APERTURA DE PUERTAS MEDIANTE UNA CONTRASEÑA

DETERMINACION DE LA NATURALEZA DE LA MATERIA

Modelización de sólidos mediante estructura octree

Estructura de una clase

Determinacion de la naturaleza ondulatorio de la materia

Determinacion de la naturaleza ondulatorio de la materia

ESTRUCTURA DE UNA PROPUESTA DIDÁCTICA.

DETERMINACION DE COSTOS

DETERMINACION DE FACTORES DE EQUILIBRIO

DETERMINACION DE COSTOS

Estructura de la Presentación

PREDICCIÓN DE LA ESTRUCTURA SECUNDARIA DE POLIPÉPTIDOS Y PROTEÍNAS MEDIANTE RMN

ELEMENTOS PARA UNA ESTRUCTURA DOCENTE DE LA FACULTAD

Ingeniería en Sistemas computacionales Estructura de datos

Es la representación gráfica de la estructura formal de una

DETERMINACION DE LA REFLEXION DE LA LUZ

LA ESTRUCTURA DE UNA ORACIÓN PERFECTA

Estructura de la