universita di milano bicocca laurea magistrale in bioinformatica n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA PowerPoint Presentation
Download Presentation
UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA

Loading in 2 Seconds...

play fullscreen
1 / 18

UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA - PowerPoint PPT Presentation


  • 158 Views
  • Uploaded on

UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA. Corso di BIOINFORMATICA: TECNICHE DI BASE Prof. Giancarlo Mauri Lezione 11 Distanza genomica. Introduzione.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA' - dillan


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
universita di milano bicocca laurea magistrale in bioinformatica

UNIVERSITA’ DI MILANO-BICOCCALAUREA MAGISTRALE IN BIOINFORMATICA

Corso di

BIOINFORMATICA: TECNICHE DI BASE

Prof. Giancarlo Mauri

Lezione 11

Distanza genomica

introduzione
Introduzione
  • Brassica Oleracea (cavolo) e Brassica Campestris (rapa): geni mitocondriali per il 99% identici, ma in ordine molto diverso
  • Nel cromosoma X dei mammiferi sono molto conservati i geni, ma non il loro ordine
  • Il confronto tra grandi porzioni di genomi può dare indicazioni sull’evoluzione
  • Si cercano quali operazioni possono trasformare un genoma in un altro, spostando parti di genoma
riarrangiamento genomico
Riarrangiamento genomico

Il riarrangiamento genomico è quel fenomeno per cui alcune parti del genoma vengono duplicate e collocate in posizioni lontane dalla loro origine

Operazioni possibili:

  • su un solo cromosoma
  • su due cromosomi
riarrangiamento genomico1
Riarrangiamento genomico

Operazioni su un solo cromosoma

  • Cancellazione
    • abc  ac
  • Inserimento
    • ac  abc
  • Duplicazione (tandem o no)
    • abc  abbc, abcd  abcbd, abcd  acbcd
  • Inversione
    • abcdefgh  abfedcgh
  • Trasposizione
    • abcd  acbd
  • Transversione
    • una delle sottosequenze trasposte viene invertita
riarrangiamento genomico2
Riarrangiamento genomico

Operazioni su due cromosomi

  • Traslocazione
    • scambio di “code”. Possibile solo se non si perde il centromero
  • Fusione
    • due cromosomi si fondono
  • Fissione
    • un cromosoma si divide in due
riarrangiamento genomico con inversioni
Riarrangiamento genomico con inversioni
  • Il problema studiato considera una sola tra le possibili operazioni: l’inversione
  • Dati due genomi si etichettano i geni che compongono il primo con numeri crescenti da 1 a n. Il secondo genoma sarà etichettato da una permutazione di {1,2,…,n}
  • Un’inversione equivale al rovesciamento di una sequenza di numeri
riarrangiamento genomico con inversioni1
Riarrangiamento genomico con inversioni

Esempio

Genoma1:1 2 3 4 5 6

Genoma2:4 3 2 1 5 6

Genoma2 è stato ottenuto da Genoma1 tramite l’inversione del segmento 1 2 3 4

dal cavolo alla rapa
Dal cavolo alla rapa

1 -5 4 -3 2

1 -5 4 -3 -2

1 -5 -4 -3 -2

1 2 3 4 5

dal verme all uomo
Dal verme all’uomo

12 31 34 28 26 17 29 4 9 36 18 35 19 1 16 14 32 33 22 15 11 27 5 20 13 30 23 10 6 3 24 21 8 25 2 7

20 5 27 11 15 22 33 32 14 16 1 19 35 18 36 9 4 29 17 26 28 34 31 12 13 30 23 10 6 3 24 21 8 25 2 7

1 16 14 32 33 22 15 11 27 5 20 19 35 18 36 9 4 29 17 26 28 34 31 12 13 30 23 10 6 3 24 21 8 25 2 7

1 16 15 22 33 32 14 11 27 5 20 19 35 18 36 9 4 29 17 26 28 34 31 12 13 30 23 10 6 3 24 21 8 25 2 7

1 16 15 36 18 35 19 20 5 27 11 14 32 33 22 9 4 29 17 26 28 34 31 12 13 30 23 10 6 3 24 21 8 25 2 7

1 16 15 14 11 27 5 20 19 35 18 36 32 33 22 9 4 29 17 26 28 34 31 12 13 30 23 10 6 3 24 21 8 25 2 7

1 16 15 14 31 34 28 26 17 29 4 9 22 33 32 36 18 35 19 20 5 27 11 12 13 30 23 10 6 3 24 21 8 25 2 7

1 26 28 34 31 14 15 16 17 29 4 9 22 33 32 36 18 35 19 20 5 27 11 12 13 30 23 10 6 3 24 21 8 25 2 7

1 26 28 18 36 32 33 22 9 4 29 17 16 15 14 31 34 35 19 20 5 27 11 12 13 30 23 10 6 3 24 21 8 25 2 7

1 26 28 29 4 9 22 33 32 36 18 17 16 15 14 31 34 35 19 20 5 27 11 12 13 30 23 10 6 3 24 21 8 25 2 7

1 26 28 29 30 13 12 11 27 5 20 19 35 34 31 14 15 16 17 18 36 32 33 22 9 4 23 10 6 3 24 21 8 25 2 7

1 26 11 12 13 30 29 28 27 5 20 19 35 34 31 14 15 16 17 18 36 32 33 22 9 4 23 10 6 3 24 21 8 25 2 7

1 26 27 28 29 30 13 12 11 5 20 19 35 34 31 14 15 16 17 18 36 32 33 22 9 4 23 10 6 3 24 21 8 25 2 7

1 26 27 28 29 30 31 34 35 19 20 5 11 12 13 14 15 16 17 18 36 32 33 22 9 4 23 10 6 3 24 21 8 25 2 7

1 26 27 28 29 30 31 34 35 19 20 9 22 33 32 36 18 17 16 15 14 13 12 11 5 4 23 10 6 3 24 21 8 25 2 7

1 26 27 28 29 30 31 22 9 20 19 35 34 33 32 36 18 17 16 15 14 13 12 11 5 4 23 10 6 3 24 21 8 25 2 7

1 26 27 28 29 30 31 32 33 34 35 19 20 9 22 36 18 17 16 15 14 13 12 11 5 4 23 10 6 3 24 21 8 25 2 7

1 26 27 28 29 30 31 32 33 34 35 36 22 9 20 19 18 17 16 15 14 13 12 11 5 4 23 10 6 3 24 21 8 25 2 7

1 26 27 28 29 30 31 32 33 34 35 36 22 9 24 3 6 10 23 4 5 11 12 13 14 15 16 17 18 19 20 21 8 25 2 7

1 26 27 28 29 30 31 32 33 34 35 36 22 9 8 21 20 19 18 17 16 15 14 13 12 11 5 4 23 10 6 3 24 25 2 7

1 26 27 28 29 30 31 32 33 34 35 36 8 9 22 21 20 19 18 17 16 15 14 13 12 11 5 4 23 10 6 3 24 25 2 7

1 26 27 28 29 30 31 32 33 34 35 36 8 9 22 21 20 19 18 17 16 15 14 13 12 11 5 4 3 6 10 23 24 25 2 7

1 26 27 28 29 30 31 32 33 34 35 36 8 9 22 21 20 19 18 17 16 15 14 13 12 11 5 4 3 2 25 24 23 10 6 7

1 2 3 4 5 11 12 13 14 15 16 17 18 19 20 21 22 9 8 36 35 34 33 32 31 30 29 28 27 26 25 24 23 10 6 7

1 2 3 4 5 11 12 13 14 15 16 17 18 19 20 21 22 9 8 7 6 10 23 24 25 26 27 28 29 30 31 32 33 34 35 36

1 2 3 4 5 6 7 8 9 22 21 20 19 18 17 16 15 14 13 12 11 10 23 24 25 26 27 28 29 30 31 32 33 34 35 36

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

distanza di inversione
Distanza di inversione

Distanza di inversione tra le sequenze S1 e S2: numero minimo di operazioni di inversione necessarie per trasformare S1 in S2

Esempio:

S1 1 2 3 4 5 6

1 4 3 2 5 6

1 4 6 5 2 3

S2 6 4 1 5 2 3

1 2 3 4 5 6

1 2 3 4 5 6

1 4 3 2 5 6

1 2 3 4 5 6

1 4 3 2 5 6

1 2 3 4 5 6

1 4 3 2 5 6

1 4 6 5 2 3

1 2 3 4 5 6

1 2 3 4 5 6

1 4 3 2 5 6

1 4 6 5 2 3

d(S1,S2 ) = 3

riarrangiamento genomico con inversioni2
Riarrangiamento genomico con inversioni

INPUT:

una permutazione p dell’insieme {1,2,…,n}

OUTPUT:

distanza tra p e la permutazione identica I

NB: la permutazione identica è

I=1,2,…,n

  • Il problema è NP-hard
  • Esiste però la possibilità di approssimarlo
riarrangiamento genomico con inversioni3
Riarrangiamento genomico con inversioni
  • Si definisca un breakpoint tra le posizioni i e i+1 di p se e solo se

|p(i) - p(i+1)| ≠ 1

dove p(i) e p(i+1) sono gli elementi di p alle posizioni i e i+1

  • La permutazione identica I non ha breakpoints, quindi il riarrangiamento secondo I corrisponde all’eliminazione dei breakpoints da p
  • In generale ogni inversione toglie al più due breakpoint
  • Ne segue che d()≥b()/2, dove d() è la distanza di p da I e b() è il numero di breakpoints in 
slide13

L’euristica

Definizione:

una striscia in  è un sottointervallo massimale di  senza breakpoints

  • decrescente se formata da numeri in ordine decrescente

Es: 7 9 6 5 4 3 8 1 2

  • crescente se formata da numeri in ordine crescente

Es: 7 9 6 5 4 3 8 1 2

NB: una striscia di lunghezza 1 è considerata decrescente

slide14

L’euristica

while ci sono breakpoints in do

begin

if c’è una striscia decrescente

then trovane una che riduca il numero di bp e invertila

(Lemma 1)

else trova e inverti una striscia crescente

(diventa decrescente; non aumenta i bp: Lemma 2)

Lemma 1- Se  contiene una striscia decrescente, allora

esiste una inversione che riduce il numero di bp di almeno uno

Lemma 2- ...

l algoritmo
L’algoritmo
  • Trovo la striscia decrescente con estremo più piccolo, K
  • Trovo K-1
  • Inverto tutta la sequenza tra K e K-1
    • ...... 7654........23.....--> ...... 765432..…
    • ........23........... 7654..... --> ........234567........
esempio
Esempio

45321987  123549867  123459867 

 123459876 123456789

riarrangiamento con permutazioni con segno
Riarrangiamento con permutazioni con segno
  • In questa versione del problema ogni numero è dotato di segno (+ oppure -)
  • Il segno cambia ogni volta che il numero è contenuto in un intervallo di inversione
riarrangiamento con permutazioni con segno1
Riarrangiamento con permutazioni con segno
  • Il problema a differenza della versione priva di segno non è NP-hard
  • Esistono algoritmi risolutivi esatti in tempo quadratico