260 likes | 356 Views
Análise de Estruturas de Proteínas. Jeane Melo. Roteiro. Introdução Predição de Estrutura Secundária (Parte 1) Apresentação do problema Exemplos de abordagens Preditor NNPSS Comparação e Detecção de Padrões Estruturais (Parte 2) Apresentação do problema Exemplos de abordagens
E N D
Análise de Estruturas de Proteínas Jeane Melo
Roteiro • Introdução • Predição de Estrutura Secundária (Parte 1) • Apresentação do problema • Exemplos de abordagens • Preditor NNPSS • Comparação e Detecção de Padrões Estruturais (Parte 2) • Apresentação do problema • Exemplos de abordagens • Modelo desenvolvido
Introdução • Projeto genoma humano
Introdução • Proteínas • Metabolismo, suporte de filamentos, catálise bioquímica, regulação do volume celular e imunização
Introdução • Proteômica • Identificação de todas as proteínas expressas por um genoma • Determinação das funções patológicas e fisiológicas das proteínas
Swiss-Prot 290484 PDB 48235 Introdução Seqüências X Estruturas
Introdução • Análise seqüencial • Comparação de seqüências • Busca por ocorrências de padrões • Análise estrutural • Obtenção da estrutura a partir da seqüência • Comparação de estruturas conhecidas • Busca por motivos ou domínios estruturais
Introdução • Problema do dobramento de proteínas • Predição de Estrutura Secundária • Análise de estruturas conhecidas • Busca por motivos • Busca por subestrutura comum
Predição de Estrutura Secundária • Patrick J. Fleming, Haipeng Gong and George D. Rose (2006) Secondary structure determines protein topology. Protein Science 15:1828-1834.
Predição de Estrutura Secundária • Dada uma seqüência de aminoácidos, classificar cada resíduo em classes de elementos de estrutura secundária, por exemplo: • Hélices • Fitas • Coils • Abordagens estatísticas (50%-60%) • Abordagens envolvendo redes neurais têm se revelado mais eficazes (~80%).
Q3 = 64,3% • Janela de tamanho 13 • 40 nós na camada escondida Exemplos de abordagens • Qian, N. and Sejnowski, T. J. (1988). Predicting the secondary structure of globular proteins using neural network models. Journal Molecular Biology, 202:865-884.
Exemplos de abordagens • Georgios J. Pappas Jr. and Shankar Subramaniam.Analysis of the Effects of Multiple Sequence Alignments in Protein Secondary Structure Prediction. LNCS, 3594:128-140, 2005
Exemplos de Abordagens • PSIPRED • Perfis PSI-Blast • Predição em dois níveis • Desempenho Q3 • Entre 76,5% e 78,3% • Jones, D. T. (1999). Protein secondary structure prediction based on position-specific scoring matrices. Journal of Molecular Biology, 292:195-202.
Exemplos de Abordagens • Melhor Desempenho • 1032 proteínas dissimilares • Predição em dois níveis • Combinação de 800 predições • Desempenho alcançado • 77,2% • Utilizando o conjunto RS126 para teste • 80,6% • Petersen, T. N., Lundegaard, C., Nielsen, M., Bohr, H., Bohr, J., Brunak, S., Gippert, G. P., and Lund, O. (2000). Prediction of protein secondary structure at 80% accuracy. Proteins, 41:17-20.
Pontos Abordados • Resultados próximos porém não comparáveis • Esforço computacional • Algoritmo de treinamento • Regras de combinação • Dados de entrada
O Preditor NNPSS • NNPSS • Neural Network based Protein Secondary Structure Predictor • Arquitetura simplificada • Eficiência • Resultados comparáveis
Abordagem de Referência • Bancos de Dados • CB396, RS126 • Preditores avaliados • PHD [Rost and Sander, 1994] • DSC [King and Sternberg, 1996] • NNSSP [Salamov and Solovyev, 1995] • PREDATOR [Frishman and Argos, 1997] • CONSENSUS [Cuff and Barton, 1999] • Cuff, A. J. and Barton, J. G. (1999). Evaluation and improvement of multiple sequence methods for protein secondary structure prediction. Proteins: Structure, Function and Genetics, 34:508-519.
O Preditor NNPSS • Dados • Bancos • CB396, RS126 • Perfis • PSI_Blast, Freqüência, PSI_Blast com filtro • Banco de dados NR • Método de avaliação • Validação cruzada • Q3 • RPROP • Regras de combinação • Votação, Produto, Média, Máximo, Mínimo
Resultados • Guimarães, K. S., Melo, J. C. B., and Cavalcanti, G. D. C. (2003). Combining few neural nets for effective secondary structure prediction. In Proc. of the Third IEEE Symposium on Bioinformatics and Bioengineering, pages 415-420,Maryland, USA.
Extração de Características • Simplificar arquitetura • Seleção de resíduos significativos • Proteínas SSSD • Métodos • Análise de Componentes Principais (PCA) • Análise de Componentes Independentes (ICA) • Friedberg, I., Kaplan, T., and Margalit, H. Glimmers in the midnight zone: Characterization of aligned identical residues in sequence-dissimilar proteins sharing a common fold. In Proc. of the Eighth International Conference on Intelligent Systems for Molecular Biology, pages 162-170, 2000.
Análise Comparativa • Melo, J. C. B., Cavalcanti, G. D. C., and Guimarães, K. S. (2004). Protein secondary structure prediction: efficient neural network and feature extraction approaches. IEE Electronics Letters, 40(21):1358-1359.