360 likes | 506 Views
klastermeetod. optimummeetod. puude otsingud. põhjalik otsing ( exhaustive search ) - vaadeldakse kõiki võimalkke määratletud otsing ( specific tree search ) - potentsiaalselt õigeid branch-and-bound (Hendy & Penny 1982) - eelmisest pikemaid ignoreerides
E N D
klastermeetod optimummeetod
puude otsingud põhjalik otsing (exhaustive search) - vaadeldakse kõiki võimalkke määratletud otsing (specific tree search) - potentsiaalselt õigeid branch-and-bound (Hendy & Penny 1982) - eelmisest pikemaid ignoreerides heuristiline otsing (heuristic search) - ainult väikene hulk võimalikest kui m>20
1. branch-and-bound järjekord (Kumar 1993) a a a a igal puul rekonstrueeritakse MP sõlmed b b b b c c c c 1) leitakse maksimaalse pikkusega 3-tipuline puu (vaadeldes kõikvõimalikke triplette) saadud puu pikkus salvestatakse kui Lm 2) d d d neljas tipp d lisatakse selliselt, et tema kolmest võimalikust paigutusest (a,d), (b,d), (c,d) saadud minimaalse puu pikkus oleks maksimaalne kõigi teiste võimalike d-de hulgast; ja selle pikkus saab uueks Lm-iks
1. branch-and-bound:-> MP search (Kumar 1993) c a d b c b c a a a d b d b c d e e e c b c a a a b d d c d b Lu2<Lu1 b c c a a a d b d d b c e e e e e e c c b a a a Lu1 d d b d c b b c c a a a d b d d c b e e e b c a a d b c d e e e
2. heuristiline otsing (Kumar 1993) PHYLIP (“jumble”) PAUP* järkjärguline tippude lisamine a) andmemaatriksist tulenevalt (“as is”) b) juhuslikult (“random”) c) lühima puu pikkuse suunas (“closest”) puu harude vahetamine (branch swapping) MP puu
branch swapping a b c d d d a c a e e e c b b 1. lähimate naabrite vahetus (nearest neighbor interchange, NNI) - vaadeldakse kõiki võimalikke vahetusi lähimas topoloogilises naabruses (dT=2, 4..) 1 1 1 (2) - ja valitakse lühim (Lm)
branch swapping a c c c c d d d d T1 b b b b c a c a c d e a c b d d d a d e e e e e e a e e b b c b b T2 a T3 a a T4 2. alampuu pügamine ja taasühendamine (subtree pruning regrafting, SPR) puul 2m-3 serva
branch swapping a a d d a a c b c a e f d e d d c c e f f f f b c b b b e e 3. puu kaheks jagamine ja taasühendamine (tree subsection and reconnection, TBR)
branch swapping 4. star decomposition, SD NJ algoritm ML puu otsinguks (Saitou 1988; Adachi &Hasegawa 1996)
MEETODITE VÕRDLEMINE • Kiirus (NJ, UPGMA) • Kokkusobivus, consistency (MP probleem) • Statistiline kontrollitavus (bootstrap) • Tõenäosus õige puu leidmisele (simulatsioonid) • Võime harupikkusi õieti hinnata
MEETODITE VÕRDLEMINE * Milles kaks puud omavahel erinevad?
topoloogiline kaugus kahe puu vahel 5 4 6 6 3 3 5 4 1 1 7 7 d d a a b b c c e e 8 8 2 2 (1,2,3,4) (5,6,7,8) (1,2) (3,4,5,6,7,8) (1,2,3,5) (4,6,7,8) (1,2) (3,4,5,6,7,8) A B dT=2x2=4 Penny & Hendy (1985): kahe puu vaheline topoloogiline kaugus on kaks korda suurem harude arvust, mille katkestamisel saadud alamhulgad antud puude vahel erinevad. kehtib dihhotoomsete puude korral, polütoomsete korral, üldvalem: Rzhetsky, Nei 1992 kus q=võimalike sisemiste jagude arv; ja p=identsete jagude arv
MEETODITE VÕRDLEMINE • Milles kaks puud omavahel erinevad? • Millised on erinevatel meetoditel konstrueeritud puude pikkused?
890 bp mtDNA HC: 73 transitsiooni 5 transversiooni (Brown et al. 1982) kokku 281 varieeruvat, s.h. 90 informatiivset positsiooni kolm topoloogiat, millel totaalne puu pikkus L<149
juur juur juur kaalutud MP puu (R=6) MP puu G C H O O O G H H dT=2 dL=2 B B B G C C L=147 (356) L=145 (354) L=148 (357)
meetodite võrdlemine fülogonees eksperimentaalselt teada
meetodite võrdlemine simulatsioonid, erinevad kiirused, erinevad haru pikkused
meetodite võrdlemine simulatsioonid, erinevad kiirused, erinevad haru pikkused
meetodite võrdlemine simulatsioonid, informatsiooni hulk
meetodite võrdlemine simulatsioonid, informatsiooni hulk
õige puu rekonstrueerimine: meetodite erinevus ja võrreldavus
fit distants meetodid:
vaalad gamma-fibrinogeeni geen (8kb, Gatesby 1997); MP puu näide, vaalade evolutsioon klassikaliselt mäletsejad jõehobu sõralised sead kaamel teised imetajad
meetodite võrdlemine kongruentsus - erinevatest andmetest sama puu saamine kaks tegelikku puud, mustad sõõrid tähistavad kokkulangevaid sõlmi kahe juhuslikult saadud puu topoloogiline kaugus
meetodite võrdlemine kongruentsus - erinevatest andmetest sama puu saamine
meetodite võrdlemine kongruentsus - keelte ja geenide puu kokkulangevus
bootstrap’i probleemid bootstrap eeldab, et varieeruvad nukleotiidid on sõltumatud ja ühtlaselt jaotunud üle järjestuse majoriti-consensus bootstrap puu hästi toetatud harude (>50%) robustsus võib kahaneda nn. ujuharude ‘floating branches’ lisamisel ->tuleb kasutada teisi konsensusi
parameetriline bootstrap