250 likes | 556 Views
. Proteomica. Genomica Strutturale. Farmaco-genomica. . . . . Il cosmo omico'. Trascritto-genomica. Genomica. Genoma: Insieme dei geni di un organismoGenomica: scienza che se ne occupaGenoma Umano: Sequenziato completamente nel 2003.Occorre localizzare: Elementi FunzionaliRegioni uti
E N D
7. Sequenziamento e analisi di genomi
8. Genoma Completo Cosa possiamo fare? Cosa dobbiamo fare? Riconoscimento dei geni
Predizioni dei siti funzionali
Annotazione funzionale dei prodotti genici
Studio dell’evoluzione del genoma
9. GENOMICA
10. Ricerca dei geni
11. Mappaggio di geni “noti” BLASTx: //www.ncbi.nlm.nih.gov/BLAST/
Molta informazione quando un genoma ‘vicino’ è stato studiato in precedenza.
Problemi: scelta di valori di soglia, mappaggio ‘fine’ delle posizioni d’inizio in altri casi. Soluzioni non esatte.
12. Utilizzo di ORFs lunghi Lunghezza minima funzionale di un ORF? (100 codoni?)
Quale MET indica l’inizio?
13. Le frequenze dei codoni differiscono dalle frequenze delle triplette non codificanti:
Composizione amminoacidica del potenziale prodotto;
Codon usage:frequenza d’utilizzo di codoni sinonimi in un gene o un genoma. L’importanza di questo parametro è dovuta all’osservazione che il codon usage è diverso in organismo diversi.
14. Potenziale codificante Una funzione che misure la probabilità che un frammento genomico sia codificante o no, basato sulla statistica del DNA.
15. Mappaggio esatto delle posizioni d’inizio dei geni. Procariotici: La MET iniziale è preceduta da un sito de legame per il ribosoma (chiamato scatola di Shine-Dalgarno)
Estensione dell’allineamento nucleotidico con regioni ortologhe appartenenti ad un genoma correlato evolutivamente.
16. Riconoscimento dei geni II: Eucarioti
Preceduto da un promotore e seguito da un sito di poliadenilazione (le sequenze caratteristiche poco definite)
Gli introni sono fiancheggiati dalle due
coppie AG e GT, ma non ci sono limiti
riguardo la distanza fra di loro.
L’introne può contenere un numero
qualunque di basi senza caratteristiche ovvie.
Negli esoni ci aspettiamo una frequenza di codoni compatibile con i codon usage dell’organismo al quale appartengono
Effetti di contesto: All’interno degli esoni, alcuni codoni tendono ad essere più spesso adiacenti ad altri; la frequenza di esanucleotidi è uno dei parametri per calcolare la probabilità che una sequenza sia codificante
17. Metodi Statistici
Matrici sito-specifiche: Valutano la probabilità che la frequenza delle basi di una sequenza sia compatibile con quella attesa per una certa regione ‘indipendentemente dalla base che la precede;
Reti neurali: Tutte le posizioni sono veramente importanti? Potremmo vedere quanta influenza ha ciascuna posizione nell’identificare le risposte corrette in una serie di esempi per i quali conosciamo la risposta .
Modelli Nascoti di Markov (HMM): Un sito di splicing è identificato da GA, quindi la probabilità che una A sia l’inizio di un introne dipende da quale base la precede.
18.
Modelli Nascoti di Markov (HMM): Può avere conto di tutti i parametri enunciati prima: Distribuzione dei codoni, dei nucleotidi, degli esanucleotidi, frequenza delle basi a monte e valle dei siti di splicing, siti di poliadenilazione, probabilità che un esone sia simile a una regione di proteina nota, ecc.
Ogni base avrà una probabilità diversa di far parte di uno degli elementi del gene e probabilità diverse di essere al confine tra un elemento e il successivo.
20. Trascrittomica: MicroArray Ogni cellula contiene la stessa informazione genica, ma non tutti i geni sono attivi o espressi allo stesso livello in tutte le cellule.