1 / 16

Bioinformatik

Bioinformatik. Was Wieso Warum. Esther Ratsch 10. Oktober 2003. Was ist Bioinformatik?. Anwendung von Methoden der Informatik auf biologische Probleme Speicherung großer Datenmengen Kombination großer Datenmengen auf der Suche nach neuem Wissen

justus
Download Presentation

Bioinformatik

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

  2. Was ist Bioinformatik? • Anwendung von Methoden der Informatik auf biologische Probleme • Speicherung großer Datenmengen • Kombination großer Datenmengen auf der Suche nach neuem Wissen • Unterstützt Laborbiologie an deren Grenzen • Planung von Experimenten

  3. Was ist Bioinformatik? • Verschiedene Arten der Bioinformatik, z.B.: • Sequenzanalyse • Modellierung von Proteinstrukturen • Simulation von Netzwerken • Erstellung von Datenbanken

  4. Genom und Gene gacaaggtga caggggacag gtgctctcat gcatggctga tgggaggatg aggtaaaatc 60 ttcagcaggc catttgacta tcaatattaa aaagccctaa aacacgcata cccaaatacg 120 caggaatttt acttcttgcc taaggaaata attgacgatg tggcgagaga tttaactcca 180 tggatgctta tcctagtact acttataata atgaaaatca gaaacaactc taagtatcta 240 atgagataga attagttaat aaatcatata aaatagttat atgaaatatt atacagacat 300 aaaaatgaag taaacctgta tttattgaca cagggagatg ctcagactaa aattgttaag 360 taccgaaagt agatggtaaa acaatattta aagttcttct tatcaatata taaaaatata 420 tattagtgtt tacatatagg atatcaaatt cttaaatgag gtattggtga gtggtgggat 480 tatgggcaat tattttcctt cctagtgttt atttatgtga agacaatgat aaaccttgaa 540 agaaaaaagt acccacaatc tcaccttgat gatgagtaat tttgatttat ttttattttt 600 gcatactcgt gttctcaaac ttttcatcag tgaaaattat attacttaaa ggatgaaaaa 660 tcatttccaa aagcctctaa aattctagag cctgattcac aaagagccac tcgaccaact 720 tcacacacag caagtcactg gcagggcaaa agcttggttc cccttctcag caggggacag 780 aatccctgga cacactggga agatattctg ggtgttgctg tcccttgtcc cttggccaag 840 aggtggtctg ggcatagaag acaagagtgg gccgggcgcg gtggctcacg cctgtaatcc 900 caacagtggg tggatcagga ggaggtcagg agtttgagac cagcctggcc aacatgttga 960 aaccccatct ctactaaaaa tacaaaatat tagccgggca tggtggcggg cgcctgtaat 1020 cccagctact tgggaggctg aggcaggaga attgcttgaa cccaggaggc agaggttgca 1080 gtgagccgag attgcaccac tgtactccac tccgccaaca gtgagagccc tgtctcaaaa 1140 aaaaaaaaaa aaaaagagtg ggtggcggga aggtggctga aggtaggagg gggaacctaa 1200 atgggacatg ggaggcatgg ttggcacgag ctcagcctga ccagggccca gagaggtaga 1260 ctgattcagt caaaagtcgt agtacttttc ctgctgagat tggtggccct tttgctgggc 1320 tttctcaagc aagaaatatc ctcttctgtt tcagaattat tctgaatcat taacccaagt 1380 cctcccaact gcactgatcc tgtcccagag aggccctggg ctgcatcacc taactgatca 1440 ctaaccacaa ccagttctgc tctctcctgg ttcctgaaat ccaggagcag atggtggtgg 1500 ggaggaggag tttggagaca gccctctacc agaagccaag aagaaagggg agtgaggagg 1560 gatagaggaa gttatcttgg tcctgcgccc acagtcccca gggtcctcct tcctgtgaag 1620 cccaacggtc tccagccaga tttcctgtcc ccttagcccc accaagaacc agaggctgcc 1680 cattgggtgg ctgttggatg caggttactg ttggagtggg ggatggccac ctgaggccaa 1740 ttgggtcatc tttactccag gtctcccttt catcctcctg tcttccctgg gggcactcta 1800 ttccctgcaa ttccttgggc taccagttcc tgacttttgt tcctttcaaa ggaaccctgg 1860 ataaacagtg taaccagaat ttcagagggg ttagttgtgt gtatcccctg gggacaagca 1920 ccggtatagg cacacaatgg tgagctgaga aatcttgggc tggtagtgct aaattcaaag 1980 gctgggacag gctgggccat ggctcatgcc tgtaatccca gcactttgga ggctgaggca 2040 gtggatcact tgaggtcagg agttcaagac cagcctggcc aacatggtga aaccctgtat 2100 ctactaaaaa tacaaaaatt agcttcttgc ctaaggaaaa atacaaaaat tacttcttgc 2160 ctaaggaaat aattgatgat gtggctagag gctagggcgt ggtggcgggc acctgtaatc 2220 ccagctactc gggaggctga ggcagaagaa tcgcttgaac cattgcacat cagcctgggc 2280 aacagagcaa gataaccgtc tcaaaaaaaa aaaaaaaaaa aaaaaggctg gggacaatgc 2340 tggccctcct tcctgcccct tcccc........ • Genom: Bauplan des Organismus • DNA: 4 Nukleotide (A,C,T und G) • Unterteilt in Gene, die für Proteine kodieren • Genomprojekte: • Viele Buchstaben • Wenig Sinn Teil der Sequenz des Gens für die leichte und schwere Kette der menschlichen Myeloperoxidase; EMBL AC X15377

  5. Vom Gen zum Protein • Transkription: DNA  RNA • Translation: RNA  Protein • Protein: aufgebaut aus Aminosäuren (20)

  6. MFKPVDFSETSPVPPDIDLAPTQSPHHVAPSQDSSYDLLS………….. ………. SMLKNKSFLLHGKDYPNNADNNDNEDIRAKTMNRSQSHV Sequenzanalyse • Wo sind Gene in dem Buchstaben- Haufen? • Ähnlichkeitssuchen zur Vorhersage der Verwandtschaftsbeziehungen eines Proteins und damit seiner Funktion gatccagctg taccattatg taatataata agacacggac gcac……...

  7. MFKPVDFSETSPVPPDIDLAPTQSPHHVAPSQDSSYDLLS………….. ………. SMLKNKSFLLHGKDYPNNADNNDNEDIRAKTMNRSQSHV gatccagctg taccattatg taatataata agacacggac gcac……... Proteine

  8. Struktur-Modellierung • 3-dimensionale Struktur bestimmt die Funktion • Experimentelle Struktur- aufklärung zeitaufwändig (damit teuer) und teilweise sehr schwer bis garnicht durchführbar. • Struktur ist durch Sequenz festgelegt und kann daher (näherungsweise) vorhergesagt werden. • Vorhersage basierend auf physikalischen Kräften oder Ähnlichkeitsanalysen.

  9. MFKPVDFSETSPVPPDIDLAPTQSPHHVAPSQDSSYDLLS………….. ………. SMLKNKSFLLHGKDYPNNADNNDNEDIRAKTMNRSQSHV gatccagctg taccattatg taatataata agacacggac gcac……... Reaktionen und Stoffwechselwege

  10. Enzyme • Enzyme sind Bio-Katalysatoren (Reaktionsbeschleuniger) • Sie binden die Reaktanden und vereinfachen damit deren Interaktion, d.h. die Reaktion zwischen ihnen • Klassifizierung: EC-Nummer, z.B 2.7.1.40: • 2 Transferases • 2.7 Transfering phosphorus containing group • 2.7.1 Phosphotransferases with an alcohol group as acceptor • 2.7.1.40 Pyruvate kinase Pyruvate kinase complex with bis mg-atp-na-oxalate; Pfam

  11. Biochemische Netzwerke

  12. Simulationen • Das Gesamtheitnetzwerk ist sehr komplex und kann nicht intuitiv erfaßt werden. • Einfluß einzelner Vorgänge auf das Gesamtergebnis vorhersagen • Testen von Modellen/Hypothesen • Mathematische Beschreibung der Prozesse nötig

  13. Beispiel einer Simulation Experimentell bestimmte (oben) und simulierte (unten) Calcium-Konzentration in Leberzellen.

  14. Datenbanken • Große Datenmengen • Speicherung so, daß Daten weiter nutzbar • Unterscheidung nach Inhalt (Proteinstrukturen, Reaktionen, Sequenzen) und Speicherformat (Tabelle, einfacher Text) • Unterstützen alle anderen Felder als Datenquelle und durch Speicherung der entstandenen Daten

  15. Ein Beispiel - Peroxidasen • Große Gruppe von Enzymen • Katalysieren viele verschiedene Reaktionen • Vorkommen in Pflanzen, Tieren, Pilzen und Bakterien • Abwehr von Krankheitserregern (bei Tieren und Pflanzen)

  16. Tagesablauf • Suche nach Daten zu Peroxidasen und ihren Reaktionen in verschiedenen Datenbanken • Nutzung ähnlicher Daten zur Simulation einer der katalysierten Reaktionen • Modellierung der Struktur der zugehörigen Peroxidase • Verbesserung der Simulation durch Daten, die bei der Modellierung des Proteins gewonnen werden

More Related