Softwares de Análises Estatísticas em Biologia Sistêmica - PowerPoint PPT Presentation

jory
softwares de an lises estat sticas em biologia sist mica n.
Skip this Video
Loading SlideShow in 5 Seconds..
Softwares de Análises Estatísticas em Biologia Sistêmica PowerPoint Presentation
Download Presentation
Softwares de Análises Estatísticas em Biologia Sistêmica

play fullscreen
1 / 49
Download Presentation
Softwares de Análises Estatísticas em Biologia Sistêmica
93 Views
Download Presentation

Softwares de Análises Estatísticas em Biologia Sistêmica

- - - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

  1. V Conferência Sul em Modelagem Computacional Softwares de Análises Estatísticas em Biologia Sistêmica Prof. Dr. Éder Maiquel Simão Email: edersimao@gmail.com Rio Grande, Setembro de 2012

  2. Roteiro 1- Teoria 1.1 Introdução; 1.2 Informação Genética; 1.3 Formação do Câncer; 1.4 Expressão de Proteínas; 2- Prática 2.1 Normalização; 2.2 Atividade Relativa - Diversidade Relativa; 2.3 Mudança de Expressão; 2.4 Mapas Funcionais.

  3. 1.1 Introdução Biologia Sistêmica: Integração entre os fenômenos e as teorias que envolvem os sistemas biológicos. - Informação; - Abordagem sistêmica; O objetivo do mini curso será mostrar a funcionalidade de alguns softwares de análises estatísticas usados pela biologia sistêmica para investigar a expressão de vias e genes relacionados a doenças humanas. 1- Dados de expressão do GEO e genes da Ontologia Ontocancro; 2- Software R, com pacotes do Bioconductor; 3- Software ViaComplex; 4- Mapas Funcionais – Banco de Dados String.

  4. Um cromossomo é uma longa sequência de DNA, que contém vários genes, e outras sequências de nucleotídeos com funções específicas nas células dos seres vivos. 1.2 Informação Genética

  5. (String) Um conjunto de proteínas desempenha uma função específica. Ex: - Proteínas que dão cor aos olhos; - Envolvidas na morte celular; - Na proliferação celular...

  6. PROTEOMA GENOMA METABOLOMA interação prot-prot interação prot-gene 1.4 EXPRESSÃO DE PROTEÍNAS Citrate synthase Malate dehydrogenase Fumarase Succinate dehydrogenase INTERATOMA TRANSCRIPTOMA

  7. RNA-Seq MICROARRANJOS 2 2 Expressão de proteínas: Todos as células tem a mesma quantidade de genes e as células com funções diferentes produzem proteínas especializadas naquela função. COMO MEDIR A EXPRESSÃO DE PROTEÍNAS? 3 3

  8. Bancos de Dados http://www.ncbi.nlm.nih.gov/geo/

  9. Bancos de Dados Adrenocortical Carcinomas , Adenomas GSE10927 Glândulas suprarrenais: Estimulam a conversão de proteínas e gorduras em glicose, ao mesmo tempo que diminuem a captação de glicose pelas células, aumentando, assim, a utilização de gorduras. PASTA 1- ARQUIVOS .CEL (GSE10927)

  10. 2.1 Normalização Software R com pacotes do Bioconductor

  11. Gráfico de “bigodes”, indica a dispersão entre as amostras. A linha preta é a mediana, a caixa representa os elementos entre o 10 e o 30 quadrante. ARQUIVOS .CEL

  12. ABRINDO O ARQUIVO GSE10927_RMA.XLS MATRIZ NORMALIZADA - Cada elemento representa uma sonda de um gene; - Cada linha corresponde ao valor de expressão do mesmo gene; - Cada Coluna corresponde a uma amostra (microarranjo) de um determinado tecido.

  13. AGRUPAR OS TECIDOS 1- Criar 2 colunas em branco, separando as amostras; 2- Fazer a média entre as amostras; 3- Expandir o cálculo para todos os genes. 4- Criar nova planilha e colar as sondas com as médias;

  14. 5- Para gerar o arquivo de expressão usado no software ViaComplex devemos baixar o arquivo da plataforma referente a série que estamos analisando: 6- Deste arquivo 2 colunas são extraídas: - A primeira corresponde ao IDENTIFICADOR da SONDA; - A segunda corresponde ao SÍMBOLO APROVADO DO GENE. OBS: Passo já realizado.

  15. 7- Com a plataforma devemos formar as combinações de expressão a serem analisadas: ADENOMA x NORMAL e CÂNCER x NORMAL Observações Importantes: No arquivo TXT de expressão não pode aparecer o caractere “/” ou espaços em branco nas células de cálculo. # Devemos sempre cuidar o espaço existente no final do arquivo.

  16. ADENOMA x NORMAL e CÂNCER x NORMAL SALVAR CADA UM DESTES ARQUIVOS COMO: texto (separado por tabulação) PASTA 2 - Criar arquivos para o SOFTWARE VIACOMPLEX

  17. BANCOS DE DADOS DE VIAS E GENES: NCI PATHAWAY, REACTOME, BIOCARTA e ONTOLOGIA ONTOCANCRO http://ontocancro.inf.ufsm.br/ PASTA 3 - VIAS E GENES - ONTOLOGIA ONTOCANCRO

  18. 2.2 Atividade Relativa - Diversidade Relativa Atividade relativa Câncer Normal Diversidade Entropia de Shannon Diversidade relativa Frequênciadadiversidade do gene i

  19. 2.3 Mudança de Expressão No de vezesque a expressãovaria entre os genes de uma via (conjunto de genes com umadeterminadafunção) Câncer, adenoma Normal Para encontrar a mudança de expressão entre os genes de uma via: 1- Encontrar as vias de interesse: http://ontocancro.inf.ufsm.br/

  20. PASTA 5 - Fold Change

  21. Mudança de Expressão Software R com pacotes do Bioconductor Para efetuarmos os cálculos da mudança de expressão são necessários alguns arquivos importantes: 1- Vias de interesse; 2- Arquivo RData, salvo durante a Normalização dos dados; 3-Script.

  22. 2.4 Mapas funcionais Objetivo: Através da atividade relativa iremos analisar a expressão das amostras de tecidos pré cancerosos do cólon em uma rede de proteínas envolvida na manutenção do genoma. Para isso precisaremos construir uma rede de interação. http://ontocancro.inf.ufsm.br/

  23. Banco de Dados String Contém várias informações do genoma: Incluí mais de 5 milhões de proteínas de 1133 Organismos http://string-db.org/

  24. Arquivo Medusa Passo 6 - Software STRING

  25. Resultado

  26. Artigos publicados com os Softwares