Softwares de an lises estat sticas em biologia sist mica
This presentation is the property of its rightful owner.
Sponsored Links
1 / 49

Softwares de Análises Estatísticas em Biologia Sistêmica PowerPoint PPT Presentation


  • 67 Views
  • Uploaded on
  • Presentation posted in: General

V Conferência Sul em Modelagem Computacional. Softwares de Análises Estatísticas em Biologia Sistêmica. Prof. Dr. Éder Maiquel Simão Email: [email protected] Rio Grande, Setembro de 2012. Roteiro. 1- Teoria 1.1 Introdução; 1.2 Informação Genética; 1.3 Formação do Câncer;

Download Presentation

Softwares de Análises Estatísticas em Biologia Sistêmica

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Softwares de an lises estat sticas em biologia sist mica

V Conferência Sul em Modelagem Computacional

Softwares de Análises Estatísticas em Biologia Sistêmica

Prof. Dr. Éder Maiquel Simão

Email: [email protected]

Rio Grande, Setembro de 2012


Roteiro

Roteiro

1- Teoria

1.1 Introdução;

1.2 Informação Genética;

1.3 Formação do Câncer;

1.4 Expressão de Proteínas;

2- Prática

2.1 Normalização;

2.2 Atividade Relativa - Diversidade Relativa;

2.3 Mudança de Expressão;

2.4 Mapas Funcionais.


1 1 introdu o

1.1 Introdução

Biologia Sistêmica: Integração entre os fenômenos e as teorias que envolvem os sistemas biológicos.

- Informação;

- Abordagem sistêmica;

O objetivo do mini curso será mostrar a funcionalidade de alguns softwares de análises estatísticas usados pela biologia sistêmica para investigar a expressão de vias e genes relacionados a doenças humanas.

1- Dados de expressão do GEO e genes da Ontologia Ontocancro;

2- Software R, com pacotes do Bioconductor;

3- Software ViaComplex;

4- Mapas Funcionais – Banco de Dados String.


1 2 informa o gen tica

Um cromossomo é uma longa sequência de DNA, que contém vários genes, e outras sequências de nucleotídeos com funções específicas nas células dos seres vivos.

1.2 Informação Genética


String

(String)

Um conjunto de proteínas desempenha uma função específica.

Ex:

- Proteínas que dão cor aos olhos;

- Envolvidas na morte celular;

- Na proliferação celular...


1 4 express o de prote nas

PROTEOMA

GENOMA

METABOLOMA

interação

prot-prot

interação

prot-gene

1.4 EXPRESSÃO DE PROTEÍNAS

Citrate

synthase

Malate

dehydrogenase

Fumarase

Succinate

dehydrogenase

INTERATOMA

TRANSCRIPTOMA


Softwares de an lises estat sticas em biologia sist mica

RNA-Seq

MICROARRANJOS

2

2

Expressão de proteínas: Todos as células tem a mesma quantidade de genes e as células com funções diferentes produzem proteínas especializadas naquela função.

COMO MEDIR A EXPRESSÃO DE PROTEÍNAS?

3

3


Bancos de dados

Bancos de Dados

http://www.ncbi.nlm.nih.gov/geo/


Bancos de dados1

Bancos de Dados

Adrenocortical Carcinomas , Adenomas

GSE10927

Glândulas suprarrenais: Estimulam a conversão de proteínas e gorduras em glicose, ao mesmo tempo que diminuem a captação de glicose pelas células, aumentando, assim, a utilização de gorduras.

PASTA 1- ARQUIVOS .CEL (GSE10927)


Softwares de an lises estat sticas em biologia sist mica

2.1 Normalização

Software R com pacotes do Bioconductor


Softwares de an lises estat sticas em biologia sist mica

Gráfico de “bigodes”, indica a dispersão entre as amostras. A linha preta é a mediana, a caixa representa os elementos entre o 10 e o 30 quadrante.

ARQUIVOS .CEL


Softwares de an lises estat sticas em biologia sist mica

ABRINDO O ARQUIVO GSE10927_RMA.XLS

MATRIZ NORMALIZADA

- Cada elemento representa uma sonda de um gene;

- Cada linha corresponde ao valor de expressão do mesmo gene;

- Cada Coluna corresponde a uma amostra (microarranjo) de um determinado tecido.


Softwares de an lises estat sticas em biologia sist mica

AGRUPAR OS TECIDOS

1- Criar 2 colunas em branco, separando as amostras;

2- Fazer a média entre as amostras;

3- Expandir o cálculo para todos os genes.

4- Criar nova planilha e colar as sondas com as médias;


Softwares de an lises estat sticas em biologia sist mica

5- Para gerar o arquivo de expressão usado no software ViaComplex devemos baixar o arquivo da plataforma referente a série que estamos analisando:

6- Deste arquivo 2 colunas são extraídas:

- A primeira corresponde ao IDENTIFICADOR da SONDA;

- A segunda corresponde ao SÍMBOLO APROVADO DO GENE.

OBS: Passo já realizado.


Softwares de an lises estat sticas em biologia sist mica

7- Com a plataforma devemos formar as combinações de expressão a serem analisadas:

ADENOMA x NORMAL e CÂNCER x NORMAL

Observações Importantes: No arquivo TXT de expressão não pode aparecer o caractere “/” ou espaços em branco nas células de cálculo.

# Devemos sempre cuidar o espaço existente no final do arquivo.


Softwares de an lises estat sticas em biologia sist mica

ADENOMA x NORMAL e CÂNCER x NORMAL

SALVAR CADA UM DESTES ARQUIVOS COMO:

texto (separado por tabulação)

PASTA 2 - Criar arquivos para o SOFTWARE VIACOMPLEX


Softwares de an lises estat sticas em biologia sist mica

BANCOS DE DADOS DE VIAS E GENES:

NCI PATHAWAY, REACTOME, BIOCARTA e ONTOLOGIA ONTOCANCRO

http://ontocancro.inf.ufsm.br/

PASTA 3 - VIAS E GENES - ONTOLOGIA ONTOCANCRO


Softwares de an lises estat sticas em biologia sist mica

2.2 Atividade Relativa - Diversidade Relativa

Atividade relativa

Câncer Normal

Diversidade

Entropia de Shannon

Diversidade relativa

Frequênciadadiversidade do gene i


Softwares de an lises estat sticas em biologia sist mica

2.3 Mudança de Expressão

No de vezesque a expressãovaria entre os genes de uma via (conjunto de genes com umadeterminadafunção)

Câncer, adenoma

Normal

Para encontrar a mudança de expressão entre os genes de uma via:

1- Encontrar as vias de interesse:

http://ontocancro.inf.ufsm.br/


Softwares de an lises estat sticas em biologia sist mica

PASTA 5 - Fold Change


Softwares de an lises estat sticas em biologia sist mica

Mudança de Expressão

Software R com pacotes do Bioconductor

Para efetuarmos os cálculos da mudança de expressão são necessários alguns arquivos importantes:

1- Vias de interesse;

2- Arquivo RData, salvo durante a Normalização dos dados;

3-Script.


Softwares de an lises estat sticas em biologia sist mica

2.4 Mapas funcionais

Objetivo: Através da atividade relativa iremos analisar a expressão das amostras de tecidos pré cancerosos do cólon em uma rede de proteínas envolvida na manutenção do genoma.

Para isso precisaremos construir uma rede de interação.

http://ontocancro.inf.ufsm.br/


Softwares de an lises estat sticas em biologia sist mica

Banco de Dados String

Contém várias informações do genoma:

Incluí mais de 5 milhões de proteínas de 1133 Organismos

http://string-db.org/


Softwares de an lises estat sticas em biologia sist mica

Arquivo Medusa

Passo 6 - Software STRING


Softwares de an lises estat sticas em biologia sist mica

Resultado


Softwares de an lises estat sticas em biologia sist mica

Artigos publicados com os Softwares


  • Login