390 likes | 834 Views
Biología Computacional. Procesamiento Digital de Imágenes y recostrucción tridimensional de imágenes de ME. Modelaje Molecular de estructuras usando datos de cris- talografía por RX, RMN o por Difracción de Electrónes. Precisión: RX > RMN > DE (Dif. RX/RMN~0,75 - 1,5 A)
E N D
Biología Computacional • Procesamiento Digital de Imágenes y recostrucción tridimensional de imágenes de ME. • Modelaje Molecular de estructuras usando datos de cris- talografía por RX, RMN o por Difracción de Electrónes. Precisión: RX > RMN > DE (Dif. RX/RMN~0,75 - 1,5 A) • Mecánica Molecular para entender y predecir el compor- tamiento macroscópico de biomoléculas.Movimientos a nivel atómico o molecular para describir procesos en el tiempo • Ajuste de estructuras cristalográficas a mapas 3D obteni- dos por ME (Tinción Negativa o Congelado Hidratado) 1) Subjetivo (a la superficie) 2) Objetivo (a las densidades)
Structural Proteomics Proteoma: abarca todas las proteínas expresadas por el genoma. Proteómica: estudio del proteoma de un tipo celular o organismo completo Proteómica Estructural: determinación de la estructura 3-dimensional del proteoma Métodos experimentales para la caracterización estructural de complejos moleculares From words to literature in structural proteomics Andrej Sali, Robert Glaeser, Thomas Earnes& Wolfgang Baumeister NATURE,422:216-225, 13 march 2003
Filamentos gruesos teñidos negativamente Reconstrucción Tridimensional Estructura atómica del S1 Modelo molecular del filamento grueso
Herramientas Bioinformáticas • Bases de Datos • Proteinas • ácidos nucleicos • estructuras • Comparación de secuencias nucleotídicas • Alineamientos • Identificación de genes • Distancia genética • Arboles filogenéticos • Predicciónes: • Estructura Secundaria (hélices, plegamientos, lazos) • Interacciones de proteinas • Estructuras 3D (CASP/CAFASP) • Visualización Molecular • Modelaje Molecuar • Por Homologías • Dinámica Molecular • Ajuste o Docking
Bioinformática Bancos de Datos Biológicos • Es una colección organizada que almacena datos estructurales, funcionales y genéticos de proteínas y secuencias de genes. <National Center for Biotechnology Information ( http://www.ncbi.nlm.nih.gov )> Clasificación: • Bases de Datos de Acidos Nucléicos: • Genome Web (http://www.hgmp.mrc.ac.uk/GenomeWeb/); EMBL; GenBank • Bases de Datos de Proteinas: • Swiss-Prot (http://www.ebi.ac.uk/swissprot/); PIR; PROSITE; SBASE. • Bases de datos de Estructuras Macromoleculares (http://www.ebi.ac.uk/msd/) • Otras Bases de Datos: • Brookhaven Protein Data Bank (http://rcsb.rutgers.edu/); LiMB; OMIM; REBASE; etc. El Brookhaven Protein Databank contiene la estructura tridimensional de proteinas determinadas por cristalografía de rayos-X o análisis por NMR. El Banco también contiene estructuras tridimensionales de otras macromoléculas como DNA, RNA y varios complejos moleculares.
Comparación de Secuencias Homología: Evolutivamente, dos secuencias similares son homólogas si provienen de un ancestro común. Si provienen de ancestros no relacionadas se consideran homópasias. Alineamiento de Secuencias Nucleotídicas: Procedimiento mediante el cual se organizan dos o mas secuencias con la finalidad de medir el grado de homología entre ellas. Formatos: • Fasta, PIR, ClustalW, EMBL, Genebank, Swiss-Prot, etc. Programas: • Clustal, JalView, etc. Web Sites: • BLAST (http://www.ncbi.nlm.nih.gov/blast/bl2seq/bl2.html) • Embl-ebi clustal (http://www.ebi.ac.uk/clustalw/) El resultado de un alineamiento indica la cantidad de bases que se conservan y las que no son conservadas, ya sea por sustitusión (mutaciones) o por procesos de insersión o eliminación (indels) S1 G A T A C A S2 T A T T A C A S1 G A T A C A | | S2 T A T T A C A S1 G A T - A C A | | | | | S2 T A T T A C A
Predicciones • Estructura Secundaria (hélices, plegamientos, lazos) • JPRedhttp://www.compbio.dundee.ac.uk/%7Ewww-jpred/submit.html • Predictor Protein Serverhttp://www.embl-heidelberg.de/predictprotein/predictprotein.htmll • Interacciones intra-proteicas • Métodos basados en la estructura (Ajuste de estructuras) • Métodos basados en la secuencia (Mutaciones correlacionadas, Similaridad de árboles filogenéticos) • Métodos Híbridos • Estructuras 3D(CASP/CAFASPCritical Assessment Structure Prediction/CA Full Automated SP) • El objetivo de los experimentos CASP/CAFASP es evaluar el progreso en la predicción de estructuras 3D a partir de la secuencia proteica. • Estado actual: • La calidad del alineamiento no concuerda bien con la identidad de la secuencia • Se obtienen mejores resultados en regiones biologicamente importantes que con toda la proteina • El modelaje de los lazos sigue siendo un problema • Se esperan mejoras a medida que crezcan las bases de datos
Modelaje Molecular Es un término general que abarca un amplio rango de técnicas de visualización (molecular graphics) y química computacional, usadas para construir, mostrar, manipular, simular y analizar estructuras moleculares y calcular las propiedades de éstas Construcción-Ensamblaje de moléculas para ajustar los datos estructurales provenientes de: • Cristalografía de Rayos-X • Resonancia Magnética Nuclear (NMR) • Microscopía Electrónica (Crio-ME, Tomo. E., Cristal. E., Inmuno-ME) • Modelaje por Homologías • Flourescent Resonance Energy Transfer (FRET) • Cross-linking, Purificación por afinidad y Espectroscopía de masas • Dispersión de luz, Rayos-X & neutrones (scattering) Concentrándose en moléculas biológicas, especialmente proteínas, inicialmente generadas a mano, ahora utilizando métodos computacionales, interactivos u objetivos (BIOLOGIA COMPUTACIONAL) Modelaje Molecular = molecular graphics (Visualización) + Química Computacional
Modelaje Molecular • 1)Visualización Molecular (Molecular Graphics) • Visualización de moléculas cuya estructura ha sido determinada. • Presentación de la molécula en diversos estilos (líneas, tubos, cintas, etc.) • Movimientos interactivos • Visualizar las cadenas polipeptídicas, localización de subunidades e interfaces • Localizar dominios, sitios catalíticos o lugares de unión de ligandos • Apreciar Cambios Conformacionales • 2)Construcción y Ensamblaje de moléculas • Construyendo sobre lo conocido y prediciendo nuevas estructuras • Construcción de pequeñas moléculas a partir de fragmentos • Construcción de cadenas polipeptídicas (definir la estuctura secundaria) • Construcción de proteinas a partir de fragmentos • Construcción de grandes arreglos supramoleculares con simetría
Visualización Molecular • Programas para visualización: • Rasmol, Mage (Workstations) • Raswin, KineMage (PC) • Molscript • Raster3D • Weblab • Programas para visualización y análisis: • Mole • “O” • Swiss PDB Viewer • Insight
Visualización Molecular • Archivo PDB: • El resultado de una determinación estructural es un archivo pdb (Protein Data Base). • Formato PDB: (ver ejemplo) • Encabezado con información sobre la molécula, ej.: especie, condición de cristalización. • Referencias • Información sobre la sequencia • Formato en la parte principal: • ATOM atom number atom type residue residue number x y z coordinates • Nota: el tipo de átomo siempre comienza con el elemento • N es el átomo nitrógeno del péptido • C es el átomo carbono del péptido • O es el átomo oxygen del péptido • CA es el átomo de C alfa • CB es el átomo de C beta • Otros átomos en la mólecula • Ej. HN es hidrógeno unido al péptido N • Heteroatomos de ligandos no-protéicos.
Mecánica Quántica • Utiliza la mecánica Quántica para calcular la energía de los átomos (electrones y núcleo). • Se utiliza para: • Cálculo de Dinámica Molecular de pequeñas moléculas • Es complementaria a los cálculos de Mecánica Molecular Mecánica Molecular • Cálculo de la Energía Potencial (minimización de energía) y Dinámica Molecular • Utiliza la mecánica Newtoniana para calcular la energía potencial de los átomos, las fuerzas sobre ellos y los movimientos resultantes. • Se utiliza para: • Mejoramiento de los modelos • Optimiza la estructura en prueba eliminando distorsiones y choques estéricos encontrando la mejor • conformación. • Explora movimientos moleculares (ej: donde se pliega una proteina )
Energía Potencial Longitud de enlace (bond length) • Los enlaces de comportan como resortes con una longitud de equilibrio que depende del tipo de enlace. Aumento o disminución de la longitud de equilibrio requiere de una mayor energía Angulo de enlace (bond angle) • Se comportan como resortes con un ángulo de equilibrio Angulo de torsión (torsion angle) • La rotación puede ocurrir sobre un enlace A-B-C-D pero la energía dependedel ángulo de torsión generado por los ángulos CD & AB vistos desde BC. Interacciones de van der Waals • Las interacciones de atracción/repulsión entre átomos dependen fuerte-mente de la distancia, así que estan son despreciables por encima de 15 A. Interacciones Electrostaticas • Todos los átomos tienen carga parcial (C=O-C CP+; átomo de O CP-) • Dos átomos con la misma carga se repelen, con la misma carga se atraen • En muchos casos de moléculas con grupos neutrales, dos átomos adyacentes tienen cargas opuestas y se comportan como dipolos, en estos casos la energía potencial decae a 1/r3 • Decae menos rápidamente que para las interacciones de van der Waals interactions y puede ser despreciable a 30 A.
Energía Potencial La Energía Potencial es el resultado de la suma de todas las contribuciones: Cut off • El cálculo de las interacciones entre átomos no enlazados toma mucho tiempo de computación, así que es necesario limitar la distancias sobre las cuales se asume que las interacciones son despreciables. Grupos de Potenciales(potential atom types) Para reducir la complejidad de los cálculos los átomos son agrupados por tipos. • Todos los H en el metano son iguales a los H en el etano • El O en un grupo C=O es diferente del O en un grupo C-O-H. Pero los átomos de O en los alcoles son similares. (6) Los puentes de hidrógeno usualmente son calculados dentro de las interacciones electrostáticas pero ocasionalmente se añade un pequeño término extra
Minimización de la Energía • Cálculo de como deben moverse los átomos para minimizar el total de energía Potencial. • Al mínimo de energía, las fuerzas sobre cada átomo deben ser cero. • Optimización de la estructura para evitar deformaciones y choques estéricos. • Sin embargo, generalmente se encuentra el mínimo local mas que el global. Las barreras energéticas no pueden ser superadas, aun cuando pudiera encontrarse un menor estado energético. • La energía potencial depende de muchos parámetros, existen varios métodos para hacer el cálculo mas razonable: • Steepest descents • Conjugate gradients
Minimización de la Energía (métodos) “Line Search” “Steepest descents” “Conjugate gradients”
Dinámica Molecular • La minimización de la Energía Potencial alcanza unmínimo local, no necesariamente el mínimo global. • La Dinámica Molecular puede ser usada para simular los movimientos térmicos de una estructura en función del tiempo, usando las fuerzas que actúan sobre los átomos para producir ese movimiento (dándole energía térmica a una molécula se puede explorar los cambios conformacionales y sobrepasar las barreras energéticas). • Partiendo de la estructura de Mecánica Molecular, conociendo las fuerzas sobre los átomos y su masa, se puede calcular la aceleración (F=M*A) y las velocidades para obtener las nuevas posiciones de los átomos en períodos de tiempo my cortos (1 fsec=10-15 sec). • Este proceso se repite miles de veces generando trayectorias • La elevación de la temperatura están directamente relacionadas con mayores velocidades y con cambios conformacionales que permitan superar barreras energéticas y alcanzar comfiguraciones mas estables. • Usos: • a) Para explorar movimientos atómicos locales • b) Para sobrepasar barreras energéticas y encontrar mejores estructuras
Dinámica Molecular Efecto del Agua: • Las proteínas están rodeadas por agua. Las cadenas laterales sobre la superficie interactúan con el agua. De tal forma que modelar proteínas sin la presencia de agua no es realista. • Pero computacionalmente es muy intensivo y requiere de calcular un gran número de posisiones e interacciones. • En la práctica las proteinas se rodean de una muy fina capa de agua para hacer los cálculos. Molecular dynamics simulations of biomoleculas Martin Karplus & Andrew McCammon NATURE,9 (9):646-652 (788), september, 2002
Biocomputación en el ICGEB The server set of ICGEBnet has been expanded with a new server, “exon”, bringing more computing power for current and new bioinformatics services (e.g. DNAtools, Protein tools/SBASE);• version 7.0 of the SBASE protein domain library has been released (http://www.icgeb.trieste.it/sbase), equipped with a completely renewed and enriched suite of support programmes, written by Janos Murvai for the new server environment;• DNA sequence analysis servers (DNAtools at http: www.icgeb.trieste.it/dna/), predicting sequence dependent structural features such as bendability and static curvature, have been upgraded and moved onto the new web server by Kristian Vlahovicek.
Grupo de Biofísica Teórica, Universidad de Chicago, Urbana-Champaign. NIH Resource for Macromolecular Modeling and Bioinformatics (http://www.ks.uiuc.edu/) Dinámica Molecular y modelaje. VMD: Visual Molecular Dynamics (http://www.ks.uiuc.edu/Research/vmd/) NAMD: Scalable Molecular Dynamics (http://www.ks.uiuc.edu/Research/namd/)
Centro de Modelaje Molecular. Universidad de Pennsylvania: CM3D Software • http://www.cmm.upenn.edu/ Centro de Biología Estructural Bloomsbury. Univ. Londres: http://www.bcsb.lon.ac.uk/ Grupo de Cristalografía de Rayos-X: http://www.biochem.ucl.ac.uk/bsm/xtal/index.html Clasificación de la Estructura de Proteínas: http://www.biochem.ucl.ac.uk/bsm/cath_new/index.html Grupo de Biofísica Molecular: http://www.biochem.ucl.ac.uk/bsm/biophysics/ Grupo de Estructura y Modelaje: http://www.biochem.ucl.ac.uk/bsm/biocomp/index.html
Docking • Ajuste de estructuras cristalográficas a mapas 3D obtenidos por ME • Procesamiento Digital de Imágenes de Microscopía Electrónica • Reconstrucción tridimensional de Imágenes (Mapa 3D) • Visualización del mapas de densidad (contornos, secciones y superficie) • Generación de modelos y sus mapas de densidad • Filtraje pasa bajo para equiparar la resolución de los modelos a la reconstucción • Alineamiento y superposición de los modelos y la reconstrucción • Refinamiento iterativo de los modelos Ajuste de la estructura cristalográgica de la actina y la miosina al mapa 3D del complejo actomiosina ME Actomiosina: Rayment; Milligan & Whittaker Cristalo. Rx de G-actina: Kabsch Moledo F-actina: Homes, Lorenz Cristalo. Rx de S1: Rayment
Ajuste de Modelos a la Reconstucción • Una vez obtenida la reconstrucción o mapa tridimensional, queremos explicarlo en términos de la estructura atómica de la molécula • Podemos hacer el ajuste con la molécula rígida o permitiendo cierta flexibilidad
Ajuste de Modelos a la Reconstucción Mapas tridimensionales • Un mapa de densidad es una descripción de la densidad de proteinas en 3 dimensiones (una imagen 3d) • Puede ser una serie de (Z) archivos cada uno representando una sección (M x N) o un solo archivo que representa un volumen (M x N x Z) • Estos pueden ser mostrados como: • a) una serie de secciones • b) gráficos de contorno • c) vistas de superficie a c b
Ajuste de Modelos a la Reconstucción Estructura Cristalográfica • La molécula puede estar representada por tan solo los carbones alfa o por todos los átomos de cada residuo de la proteina (coordenadas atómicas) • Generalmente es un archivo con formato PDB • Estos pueden ser mostrados como: • a) líneas • b) vistas de superficie • c) bolas y bastones c a b
Ajuste de Modelos a la Reconstucción • Ajuste Manual • El ajuste se realiza interactivamente “a ojo”. • Se selecciona un nivel de contorno que incluya un volumen equivalente al de la molécula y se posiciona ésta dentro del contorno. • Ventajas: Simple, rápido y se usa como primera aproximación al problema • Desventaja: No usa los rasgos estructurales de mas alta densidad Ajuste Automático • Para el ajuste objetivo se debe parametrizar el modelo, osea describir el modelo entérminos numéricos (un número de variables finitas) • Usualmente las variables definen orientación, radio y cualquier flexibilidad interna (manteniendo fijas las distancias entre moléculas) • Los modelos generados se transforman en densidades y se busca el mejor ajuste entre el mapa y el (los) modelo(s).
Cálculo de los Mapas 3D de los Modelos • El modelo se genera colocando una molécula en cada posición correspondiente en la hélice (radio, rotación y ángulos). • Se calcula un mapa de densidad para cada modelo. • Alineación del modelo y de la reconstrucción (comparando proyecciones longitudinales y transversales). • Se comparan los volúmenes (densidades) del modelo alineado y la reconstrucción (calculando el coeficiente de correlación cruzada).
Refinamiento de los Modelos • Se busca obtener el modelo con el mejor puntaje • Solo dos métodos pueden ser usados para encontrar el mínimo (máximo) de una función con mas de una variable, si no se está disponible el gradiente: • (1) Método Powells • (2) Método Downhill Simplex • Un “simplex” es un poliedro en un espacio n-dimensional, una dimensión para cada parámetro que define el modelo. • Para dos dimensiones el “simplex” es un triángulo, para tres dimensiones es un tetraedro (n+1 vértices), etc.
Método Downhill Simplex • Se comienza haciendo un modelo por ajuste manual. • Se hacen n modelos permitiendo que cada parámetro cambie en pequeños incrementos ej.: radio cada 5 Å, ángulos cada 5°. • Se ordenan de mayor a menor los puntajes obtenidos para cada modelo.
Simulación de templado (Simulated annealing) • El método de downhill simplex solo encuentra el mínimo local, de tal forma que el mejor modelo puede no ser probado nunca. • La Simulación de Templado es el equivalente a proporcionar energía térmica al sistema para sobrepasar las barreras energéticas.
Mapas de superficie de la reconstrucción y del mejor modelo de los filamentos de miosina de Tarántula Reconstrucción Modelo
Modelaje Molecular • Demostración (Insight II): • Construcción de pequeñas moléculas (anillo pentabenzénico) • Diferentes tipos de visualización • Optimización (minimización de energía potencial) • Lectura de molécula en formato PDB • Superposisión de estructuras • Alineamiento • Docking