Softwares de an lises estat sticas em biologia sist mica
Download
1 / 49

Softwares de Análises Estatísticas em Biologia Sistêmica - PowerPoint PPT Presentation


  • 84 Views
  • Uploaded on

V Conferência Sul em Modelagem Computacional. Softwares de Análises Estatísticas em Biologia Sistêmica. Prof. Dr. Éder Maiquel Simão Email: [email protected] Rio Grande, Setembro de 2012. Roteiro. 1- Teoria 1.1 Introdução; 1.2 Informação Genética; 1.3 Formação do Câncer;

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Softwares de Análises Estatísticas em Biologia Sistêmica' - jory


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Softwares de an lises estat sticas em biologia sist mica

V Conferência Sul em Modelagem Computacional

Softwares de Análises Estatísticas em Biologia Sistêmica

Prof. Dr. Éder Maiquel Simão

Email: [email protected]

Rio Grande, Setembro de 2012


Roteiro

Roteiro

1- Teoria

1.1 Introdução;

1.2 Informação Genética;

1.3 Formação do Câncer;

1.4 Expressão de Proteínas;

2- Prática

2.1 Normalização;

2.2 Atividade Relativa - Diversidade Relativa;

2.3 Mudança de Expressão;

2.4 Mapas Funcionais.


1 1 introdu o

1.1 Introdução

Biologia Sistêmica: Integração entre os fenômenos e as teorias que envolvem os sistemas biológicos.

- Informação;

- Abordagem sistêmica;

O objetivo do mini curso será mostrar a funcionalidade de alguns softwares de análises estatísticas usados pela biologia sistêmica para investigar a expressão de vias e genes relacionados a doenças humanas.

1- Dados de expressão do GEO e genes da Ontologia Ontocancro;

2- Software R, com pacotes do Bioconductor;

3- Software ViaComplex;

4- Mapas Funcionais – Banco de Dados String.


1 2 informa o gen tica

Um cromossomo é uma longa sequência de DNA, que contém vários genes, e outras sequências de nucleotídeos com funções específicas nas células dos seres vivos.

1.2 Informação Genética


String

(String) vários genes, e outras sequências de nucleotídeos com funções específicas nas células dos seres vivos.

Um conjunto de proteínas desempenha uma função específica.

Ex:

- Proteínas que dão cor aos olhos;

- Envolvidas na morte celular;

- Na proliferação celular...


1 4 express o de prote nas

PROTEOMA vários genes, e outras sequências de nucleotídeos com funções específicas nas células dos seres vivos.

GENOMA

METABOLOMA

interação

prot-prot

interação

prot-gene

1.4 EXPRESSÃO DE PROTEÍNAS

Citrate

synthase

Malate

dehydrogenase

Fumarase

Succinate

dehydrogenase

INTERATOMA

TRANSCRIPTOMA


RNA-Seq vários genes, e outras sequências de nucleotídeos com funções específicas nas células dos seres vivos.

MICROARRANJOS

2

2

Expressão de proteínas: Todos as células tem a mesma quantidade de genes e as células com funções diferentes produzem proteínas especializadas naquela função.

COMO MEDIR A EXPRESSÃO DE PROTEÍNAS?

3

3


Bancos de dados

Bancos de Dados vários genes, e outras sequências de nucleotídeos com funções específicas nas células dos seres vivos.

http://www.ncbi.nlm.nih.gov/geo/


Bancos de dados1

Bancos de Dados vários genes, e outras sequências de nucleotídeos com funções específicas nas células dos seres vivos.

Adrenocortical Carcinomas , Adenomas

GSE10927

Glândulas suprarrenais: Estimulam a conversão de proteínas e gorduras em glicose, ao mesmo tempo que diminuem a captação de glicose pelas células, aumentando, assim, a utilização de gorduras.

PASTA 1- ARQUIVOS .CEL (GSE10927)


2.1 Normalização vários genes, e outras sequências de nucleotídeos com funções específicas nas células dos seres vivos.

Software R com pacotes do Bioconductor


Gráfico de “bigodes”, indica a dispersão entre as amostras. A linha preta é a mediana, a caixa representa os elementos entre o 10 e o 30 quadrante.

ARQUIVOS .CEL


ABRINDO O ARQUIVO GSE10927_RMA.XLS amostras. A linha preta é a mediana, a caixa representa os elementos entre o 1

MATRIZ NORMALIZADA

- Cada elemento representa uma sonda de um gene;

- Cada linha corresponde ao valor de expressão do mesmo gene;

- Cada Coluna corresponde a uma amostra (microarranjo) de um determinado tecido.


AGRUPAR OS TECIDOS amostras. A linha preta é a mediana, a caixa representa os elementos entre o 1

1- Criar 2 colunas em branco, separando as amostras;

2- Fazer a média entre as amostras;

3- Expandir o cálculo para todos os genes.

4- Criar nova planilha e colar as sondas com as médias;


5- Para gerar o arquivo de expressão usado no software ViaComplex devemos baixar o arquivo da plataforma referente a série que estamos analisando:

6- Deste arquivo 2 colunas são extraídas:

- A primeira corresponde ao IDENTIFICADOR da SONDA;

- A segunda corresponde ao SÍMBOLO APROVADO DO GENE.

OBS: Passo já realizado.


7- Com a plataforma devemos formar as combinações de expressão a serem analisadas:

ADENOMA x NORMAL e CÂNCER x NORMAL

Observações Importantes: No arquivo TXT de expressão não pode aparecer o caractere “/” ou espaços em branco nas células de cálculo.

# Devemos sempre cuidar o espaço existente no final do arquivo.


ADENOMA x NORMAL e CÂNCER x NORMAL expressão a serem analisadas:

SALVAR CADA UM DESTES ARQUIVOS COMO:

texto (separado por tabulação)

PASTA 2 - Criar arquivos para o SOFTWARE VIACOMPLEX


BANCOS DE DADOS DE VIAS E GENES: expressão a serem analisadas:

NCI PATHAWAY, REACTOME, BIOCARTA e ONTOLOGIA ONTOCANCRO

http://ontocancro.inf.ufsm.br/

PASTA 3 - VIAS E GENES - ONTOLOGIA ONTOCANCRO


2.2 Atividade Relativa - Diversidade Relativa expressão a serem analisadas:

Atividade relativa

Câncer Normal

Diversidade

Entropia de Shannon

Diversidade relativa

Frequênciadadiversidade do gene i


2.3 Mudança de Expressão expressão a serem analisadas:

No de vezesque a expressãovaria entre os genes de uma via (conjunto de genes com umadeterminadafunção)

Câncer, adenoma

Normal

Para encontrar a mudança de expressão entre os genes de uma via:

1- Encontrar as vias de interesse:

http://ontocancro.inf.ufsm.br/


PASTA 5 - Fold Change expressão a serem analisadas:


Mudança de Expressão expressão a serem analisadas:

Software R com pacotes do Bioconductor

Para efetuarmos os cálculos da mudança de expressão são necessários alguns arquivos importantes:

1- Vias de interesse;

2- Arquivo RData, salvo durante a Normalização dos dados;

3-Script.


2.4 Mapas funcionais expressão a serem analisadas:

Objetivo: Através da atividade relativa iremos analisar a expressão das amostras de tecidos pré cancerosos do cólon em uma rede de proteínas envolvida na manutenção do genoma.

Para isso precisaremos construir uma rede de interação.

http://ontocancro.inf.ufsm.br/


Banco de Dados String expressão a serem analisadas:

Contém várias informações do genoma:

Incluí mais de 5 milhões de proteínas de 1133 Organismos

http://string-db.org/


Arquivo Medusa expressão a serem analisadas:

Passo 6 - Software STRING


Resultado expressão a serem analisadas:


Artigos publicados com os Softwares expressão a serem analisadas:


ad