Gene prediction
This presentation is the property of its rightful owner.
Sponsored Links
1 / 52

Gene Prediction PowerPoint PPT Presentation


  • 60 Views
  • Uploaded on
  • Presentation posted in: General

Gene Prediction. Marco Block Jonas Heise Nima Keshvari Michael Schreiber. Einführung. Wichtiges Gebiet der Bioinformatik Problematik ( exon alignment problem ) Biologische Herangehensweise Kombinatorischer Ansatz. exon assembly problem auf Pfadsuche in einem gerichteten

Download Presentation

Gene Prediction

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Gene prediction

Gene Prediction

Marco Block

Jonas Heise

Nima Keshvari

Michael Schreiber


Einf hrung

Einführung

  • Wichtiges Gebiet der Bioinformatik

  • Problematik (exon alignment problem)

  • Biologische Herangehensweise

  • Kombinatorischer Ansatz

  • exon assembly problem auf Pfadsuche in einem gerichteten

  • Graphen reduzieren (spliced alignment problem)

  • Optimierung :spliced alignment problem auf

  • network alignment problem (Kruskal) transformieren


Exon alignment problem

exon alignment problem


Exon alignment problem1

exon alignment problem


Exon alignment problem2

exon alignment problem


Exon alignment problem3

exon alignment problem


Exon alignment problem4

exon alignment problem


Exon alignment problem5

exon alignment problem


Exon alignment problem6

exon alignment problem


Exon alignment problem7

exon alignment problem


Grundlagen der biologie

Grundlagen der Biologie

Die Zelle ist von der Zellhülle oder –membran umgeben.

Im Zellleib oder Soma befindet sich der Zellkern.

Im Zellkern ist das Erbmaterial, die DNS.


Grundlagen der biologie1

Grundlagen der Biologie

Auf der DNS liegen die Gene.

Die Gene codieren für Proteine.


Grundlagen der biologie2

Grundlagen der Biologie

Die Gene sind unterteilt in Exons und Introns.


Grundlagen der biologie3

Grundlagen der Biologie

Die Exons werden bei der Translation (Produktion eines

Proteins aus mRNA) übersetzt, die Introns werden durch

Splicing entfernt.


Biologische herangehensweise

Biologische Herangehensweise

RT-PCR


Naiver ansatz

Naiver Ansatz

  • Suche alle möglichen Exon-Blöcke

  • Finde durch ausprobieren aller möglichen Kombinationen die bes


Kombinatorischer ansatz

Kombinatorischer Ansatz

  • Rekursives Verfahren

  • Gerichteter Lösungsgraph wird erstellt


Kombinatorischer ansatz1

Kombinatorischer Ansatz

1a/10

Begrifflichkeiten :

G

String mit g1...gn (genomic sequence)

B

Substring von G mit gi...gj

= {B1,B2,...,Bb}

(i)

= {k : last(k) < i}, Blöcke die strikt vor der

Position von i enden

= (B1,B2,...,Bb) mit B1<B2<...<Bb

*

String mit B1 * B2 * ... * Bb)

T

String mit t1...tm (target sequence)

s(G,T)

optimal alignment zwischen G und T


Kombinatorischer ansatz2

Kombinatorischer Ansatz

1b/10


Kombinatorischer ansatz3

Kombinatorischer Ansatz

2/10

Nun lässt sich das spliced alignment problem mit G,T und B

formulieren, als :

Suche nach der Stringkette , die unsere Funktion s(*, T),

unter allen möglichen Blockketten aus B, maximiert.


Kombinatorischer ansatz4

Kombinatorischer Ansatz

3/10

Wir erstellen einen Graphen, dessen Knoten die Blöcke

und dessen Kanten die potential transitions zwischen diesen

sind. Das Kantengewicht ergibt sich aus dem optimal alignment

zwischen den konkatenierten Blöcken.

Dieses Problem ist aber nicht mit dem kürzesten-Wege-Problem

verwandt, da die Gewichte der Knoten und Kanten in den

Graphen noch nicht definiert sind.


Kombinatorischer ansatz5

Kombinatorischer Ansatz

4/10


Kombinatorischer ansatz6

Kombinatorischer Ansatz

5/10


Kombinatorischer ansatz7

Kombinatorischer Ansatz

5/10


Kombinatorischer ansatz8

Kombinatorischer Ansatz

5/10


Kombinatorischer ansatz9

Kombinatorischer Ansatz

5/10


Kombinatorischer ansatz10

Kombinatorischer Ansatz

5/10


Kombinatorischer ansatz11

Kombinatorischer Ansatz

5/10


Kombinatorischer ansatz12

Kombinatorischer Ansatz

6/10

Aufruf :


Kombinatorischer ansatz13

Kombinatorischer Ansatz

7/10

Laufzeit :

O(mnc * mb²)

Wir können, das spliced alignment problem zu dem bereits von

Kruskal formulierten network alignment problem transformieren.

Dabei versuchen wir den Weg zu finden, der die grösste Ähnlichkeit

mit einer gegebenen target-Sequence besitzt.

Laufzeit :

O(mnc * mb)

Es werden nun weniger Kanten benötigt.


Kombinatorischer ansatz14

Kombinatorischer Ansatz

7/10

Graphskizze :


Kombinatorischer ansatz15

Kombinatorischer Ansatz

9/10


Kombinatorischer ansatz16

Kombinatorischer Ansatz

8/10


Kombinatorischer ansatz17

Kombinatorischer Ansatz

8/10


Vergleichsfunktion d

Vergleichsfunktion D

  • Zwei Aminosäuren As1 und As2 werden nach chemischer Ähnlichkeit verglichen

  • Eine Matrix liefert die Score für jedes As-paar

  • Bewertungsmatrix kann angepasst werden, keine Optimale Lösung bekannt


Beispielmatrix

Beispielmatrix

  • Scoringmatrix, nach Myers/Miller

  • Verwendet im Programm „ ALIEN“ ( berechnet multiple sequence Alignment )


Beispielmatrix1

Beispielmatrix

E : Glutamat, geladene As

F: Phenylalanin, aromatische unpolare As

-> negative Score (Penalty)


Beispielmatrix2

Beispielmatrix

K : Lysin, basische As

F: Arginin, ebenfalls basisch

-> positive Score


Kombinatorischer ansatz18

Kombinatorischer Ansatz

8/10


Option 2

Option 2

Biologisches Phänomen:

In der DNA kann es zu INsertion und DELetion von Basen kommen, es kann also ein besserer Match gefunden wenn statt zu Vergleichen diese Basen übersprungen werden. Dabei wird eine Penalty vergeben ( negatives Vorzeichen von Dindel !!!)


Beispiel zu indel

Beispiel zu InDel

LIEBE

LEBEN

mögliches Annealing: 1Match

LIEBE_

L_EBEN

besseres Annealing: 4 Matches, 2 InDel‘s


Kombinatorischer ansatz19

Kombinatorischer Ansatz

8/10


Kombinatorischer ansatz20

Kombinatorischer Ansatz

8/10


Kombinatorischer ansatz21

Kombinatorischer Ansatz

8/10


Kombinatorischer ansatz22

Kombinatorischer Ansatz

8/10


Kombinatorischer ansatz23

Kombinatorischer Ansatz

8/10


Vergleich beider verfahren

Vergleich beider Verfahren

RT-PCR

Nachteile :

Vorteile :

  • nachweisbar (genauer)

  • grosser Aufwand

Spliced Alignment

Nachteile :

Vorteile :

  • schnelleres Verfahren

  • je mehr Daten zur Verfügung,

  • desto optimaler

  • kurze Sequenzen probl.

  • ...


Weitere probleml sungsans tze

Weitere Problemlösungsansätze

  • Statistische Annäherung

  • Hidden Markov Modelle

  • Reverse Gene Finding


Kombinatorischer ansatz24

Kombinatorischer Ansatz

Zusatz

Beispiel :

genomic sequence :

It was brilliant thrilling morning and the slimy hellish lithe

doves gyrated and gambled nimbly in the waves.

famous line :

´t was brillig, and the slithy toves did gyre and gimble in the

wabe. (Lewis Carroll)


Kombinatorischer ansatz25

Kombinatorischer Ansatz

7/10

Ablauf des Algorithmus :


Option 1

Option 1

  • Rekursive Berechnung: S(i, j, k) ist Summe aus :

  • Score des vorherigen Schrittes

  • Ergebnis der Vergleichsfunktion D(As1, As2)


Option 3

Option 3

Am Anfang eines neuen Blocks wie Option 1, aber Bezug auf vorherigen Block.


  • Login