Skryt markovove modely
This presentation is the property of its rightful owner.
Sponsored Links
1 / 30

Skryt é Markovove modely PowerPoint PPT Presentation


  • 71 Views
  • Uploaded on
  • Presentation posted in: General

Skryt é Markovove modely. Andrej Lúčny Katedra aplikovanej informatiky FMFI UK [email protected] http://www.fmph.uniba.sk/~lucny. Motiva čná úloha. G. A. G. T. T. G. A. G. G. G. A. A. A. A. A. G. C. G. M áme jedno vlákno DNA, čo je postupnosť báz A, C, G, T

Download Presentation

Skryt é Markovove modely

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Skryt markovove modely

Skryté Markovove modely

Andrej Lúčny

Katedra aplikovanej informatiky FMFI UK

[email protected]

http://www.fmph.uniba.sk/~lucny


Skryt markovove modely

Motivačná úloha

G

A

G

T

T

G

A

G

G

G

A

A

A

A

A

G

C

G

Máme jedno vlákno DNA, čo je postupnosť báz A, C, G, T

Potrebujeme určiť, ktoré časti vlákna sú exony (E), introny (I) a gény nekódujúca DNA (N)

G

A

G

T

T

G

A

G

G

G

A

A

A

A

A

G

C

G

N

N

N

N

N

N

I

I

I

I

I

E

E

E

E

E

E

N


Skryt markovove modely

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

Markovov model DNA:

Máme tri urny: E, I a N. V každej sú schované guličky A, C, G a T a na každej je ruleta, ktorej jamky sú podelené na úseky E, I a N


Skryt markovove modely

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

p(A) = 2/7

p(C) = 3/7

p(G) = 1/7

p(T) = 1/7

p(A) = 3/7

p(C) = 1/7

p(G) = 1/7

p(T) = 2/7

p(A) = 2/7

p(C) = 1/7

p(G) = 3/7

p(T) = 1/7


Skryt markovove modely

2/10

2/10

1/10

6/10

6/10

7/10

N

E

N

I

N

I

1/10

I

E

E

2/10

E

I

N

3/10

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A


Skryt markovove modely

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

G

Markovov proces:

  • Vytiahneme jednu guličku z urny (a vrátime ju späť)

  • Zatočíme ruletou na urne a podľa výsledku sa presunieme


Skryt markovove modely

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

A

N N

GA

. . . . .


Skryt markovove modely

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

G

N N N

G A G

. . . . .


Skryt markovove modely

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

T

N N N N

G A G T

. . . . .


Skryt markovove modely

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

T

N N N N N

G A G T T

. . . . .


Skryt markovove modely

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

G

N N N N N N

G A G T T G

. . . . .


Skryt markovove modely

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

A

N N N N N N I

G A G T T G A

. . . . .


Skryt markovove modely

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

A

N N N N N N I I I I I

G A G T T G A G G G A

. . . . .


Skryt markovove modely

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

C

N N N N N N I I I I I E E E E E E

G A G T T G A G G G A A A A A G C

. . . . .


Skryt markovove modely

Dostávame výsledok Markovovho procesu: čo sme kedy z ktorej urny vytiahli

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

G

N N N N N N I I I I I E E E E E E N

G A G T T G A G G G A A A A A G C G


Skryt markovove modely

Skrytý Markovov proces: vidíme iba čo vyťahujeme, ale nie z ktorej urny

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

N N N N N N I I I I I E E E E E E N

G A G T T G A G G G A A A A A G C G


Skryt markovove modely

Pre danú postupnosť ťahov máme teraz uhádnuť z akých urien boli vytiahnuté

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

N N N N N N I I I I I E E E E E E N

G A G T T G A G G G A A A A A G C G


Skryt markovove modely

Vieme pre nejakú hypotézu spočítať nakoľko je pravdepodobná ?

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

p( ) = ?

N I I I E E E I I I E E E N N I I N

hypotéza

G A G T T G A G G G A A A A A G C G


Skryt markovove modely

2/10

2/10

1/10

6/10

6/10

7/10

N

E

N

I

N

I

1/10

I

E

E

2/10

E

I

N

3/10

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

p(A) = 2/7

p(C) = 3/7

p(G) = 1/7

p(T) = 1/7

p(A) = 3/7

p(C) = 1/7

p(G) = 1/7

p(T) = 2/7

p(A) = 2/7

p(C) = 1/7

p(G) = 3/7

p(T) = 1/7

ľahko to z markovovho modelu spočítame ako súčin pravdepodobností jednotlivých ťahov a presunov

. . . . .

p( ) = 1.6768E-19

N I I I E E E I I I E E E N N I I N


Skryt markovove modely

2/10

2/10

1/10

6/10

6/10

7/10

N

E

N

I

N

I

1/10

I

E

E

2/10

E

I

N

3/10

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

p(A) = 2/7

p(C) = 3/7

p(G) = 1/7

p(T) = 1/7

p(A) = 3/7

p(C) = 1/7

p(G) = 1/7

p(T) = 2/7

p(A) = 2/7

p(C) = 1/7

p(G) = 3/7

p(T) = 1/7

keď zrátame pravdepodobnosť hypotézy rovnajúcej sa skutočnosti, je vyššia než u náhodne zvolenej hypotézy

. . . . .

p( ) = 8.7350E-16

N N N N N N I I I I I E E E E E E N


Skryt markovove modely

G A G T T G A G G G A A A A A G C G

. . . . .

p( ) = 1.6768E-19

N I I I E E E I I I E E E N N I I N

. . . . .

p( ) = 8.7350E-16

N N N N N N I I I I I E E E E E E N

. . . . .

Stačilo by teraz prebehnúť všetky možnosti a nájsť najpravdepodobnejšiu. Asi to nebola presne tá skutočná, ale bola by snáď aspoň dostatočne podobná, aby sme sa z toho niečo dozvedeli. Tých možností je ale šialene veľa. Našťastie celkom jednoduchý (Viterbiho) algoritmus vie najpravdepodobnejšiu možnosť priamo spočítať.


Skryt markovove modely

Viterbiho algoritmus

Zamerajme sa na samotnú hodnotu pravdepodobnosti najpravdepodobnejšej postupnosti urien.

Počítajme pravdepodobnosti čiastočných postupností tvorených prvými n členmi postupnosti urien, ktoré končia urnou E, I a N

Predstavme si, že ich vieme pre určité n. Ako ich získame pre n+1 ?

n = 9

n = 10

... A G G G A A A ...

E

E

G

pE

E

I

E

E

pE’ = pEG.max( pE.pEE, pI.pIE, pN.pNE )

N

E

E

I

G

pI

I

I

I

I

pI’ = pIG.max( pE.pEI, pI.pII, pN.pNI)

N

I

E

N

G

pN

N

I

N

N

pN’ = pNG.max( pE.pEN, pI.pIN, pN.pNN)

N

N


Skryt markovove modely

Viterbiho algoritmus

Zvyšok je aplikovanie indukcie.

n = 1

n = L

GA G ..... G C G

pE = pEG

E

E

pI = pIG

p = max( pE, pI, pN )

I

I

pN = pNG

N

N


Skryt markovove modely

Viterbiho algoritmus

Treba samozrejme vypočítať nielen pravdepodobnosť ale aj postupnosť.

Na to stačí ísť spätne vždy po tej vetve ktorá bola najpravdepodobnejšia

ak hľadaná postupnosť má na pozícii 10 E, potom na pozícií 9 má N

n = 9

n = 10

... A G G G A A A ...

E

E

G

E

I

E

E

pE’ = pEG.max( pE.pEE, pI.pIE, pN.pNE )

N

E

max

E

I

G

I

I

I

I

max

pI’ = pIG.max( pE.pEI, pI.pII, pN.pNI)

N

I

E

N

G

N

I

N

N

max

pN’ = pNG.max( pE.pEN, pI.pIN, pN.pNN)

N

N


Skryt markovove modely

Týmto spôsobom môžeme pre náš prípad odhadnúť, že postupnosť urien bola nasledovná:

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

N N N N I I I I NEE E E E E N N N

N N N N N N I I I I I E E E E E E N

G A G T T G A G G G A A A A A G C G


Skryt markovove modely

Nájdená postupnosť síce nemusí nezodpovedať skutočnosti, ale je najpravdepodobnejšou možnosťou

N

E

N

I

N

I

I

E

E

E

I

N

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

N N N N I I I I NEE E E E E N N N

N N N N N N I I I I I E E E E E E N

G A G T T G A G G G A A A A A G C G


Skryt markovove modely

2/10

2/10

1/10

6/10

6/10

7/10

N

E

N

I

N

I

1/10

I

E

E

2/10

E

I

N

3/10

C

T

G

C

A

C

T

T

T

C

C

G

A

A

A

G

G

G

A

A

A

p(A) = 2/7

p(C) = 3/7

p(G) = 1/7

p(T) = 1/7

p(A) = 3/7

p(C) = 1/7

p(G) = 1/7

p(T) = 2/7

p(A) = 2/7

p(C) = 1/7

p(G) = 3/7

p(T) = 1/7

Ale ako vôbec získame Markovov model ?

Nuž z malej vzorky dát a predpokladáme, že je to dobrý odhad

Napr. ručne určíme 1% DNA a zvyšok spočítame


Hmm ako bayesova sie

HMM ako Bayesova sieť

HMM je založený na zjednodušení, že viditeľná manifestácia ako i zmena skrytého stavu systému sú závislé iba na jeho aktuálnej hodnote (a nie napr. na predchádzajúcich hodnotách)

EINt-1

EINt

EINt+1

ACGTt-1

ACGTt

ACGTt+1


Hmm roz renia

HMM rozšírenia

  • závislosť od predchádzajúcich N hodnôt

  • automatické generovanie vnútorných stavov

  • spojité HMM


Skryt markovove modely

Ďakujem za pozornosť !

Skryté Markovove modely

Andrej Lúčny

KAI FMFI Bratislava

[email protected]

http://www.fmph.uniba.sk/~lucny


  • Login