1 / 55

Rechnen mit Molekülen

Rechnen mit Molekülen. Rudolf FREUND. rudi@emcc.at. http://www.emcc.at/. Fakultät für Informatik Technische Universität Wien. Überblick. Molecular Computing. ► DNA Computing. ● Watson-Crick, Sticker Systems ● Splicing, Cutting/Recombination ● Test Tube Systems.

lindley
Download Presentation

Rechnen mit Molekülen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Rechnen mit Molekülen Rudolf FREUND rudi@emcc.at http://www.emcc.at/ Fakultät für Informatik Technische Universität Wien

  2. Überblick Molecular Computing ►DNA Computing ● Watson-Crick, Sticker Systems ● Splicing, Cutting/Recombination ● Test Tube Systems ►Membrane Computing ●P-Systeme - ein allgemeines Modell ●P-Systeme - ausgewählte Resultate ●P-Systeme - weitere Varianten/Modelle ●Ausblick

  3. NATURAL COMPUTING • Lerne von der Natur, um neue theoretische Modelle zu entwickeln (z.B. Computermodelle). • Verwende neue theoretische wissenschaftliche Erkenntnisse aus den Naturwissenschaften und ihren Anwendungsbereichen, um die (Vorgänge in der) Natur besser zu verstehen. • Quantum Computing • Molecular Computing

  4. Molecular Computing • ist eines der aktuellsten und sich am schnellsten • entwickelnden Gebiete der Informatik • vereint InformatikerInnen, BiologInnen, MedizinerInnen • eröffnet neue Möglichkeiten für alle Bereiche: • ► Computer helfen bei der • - Entschlüsselung des menschlischen Genoms, • - Simulation biologischer Prozesse, • - Darstellung und Aufbereitung medizinischer Daten; • ►InformatikerInnen lernen von der Natur; • die größte Herausforderung: • die gewonnenen theoretischen Erkenntnisse • wieder in die Praxis umzusetzen, um damit zu • einem besseren Verständnis biologischer • Prozesse beizutragen.

  5. Human Genome Project • begann Oktober 1990, war auf 15 Jahre geplant • bereits 2 Jahre früher (2003) beendet • Grund: rapider technologischer Fortschritt • Projektziele • - Identifizierung aller Gene in menschlicher DNA • (ca. 20000 - 25000), • - Bestimmung der etwa 3 Milliarden Basispaare, • - Speicherung dieser Informationen in Datenbanken, • - Verbesserung der Methoden für die Datenanalyse, • - Transferierung verwandter Technologien in den • privaten Sektor, • - Beachtung ethischer, juristischer, and sozialer Aspekte.

  6. Bioinformatik und Computationale Biologie • Medizinische Experten-/Diagnose-Systeme • Telemedizin • graphische Darstellung von NMR-Daten etc. • Simulation biologischer Prozesse • Drug Design • ...

  7. EMCC European Molecular Computing Consortium Präsident: Grzegorz ROZENBERG (Leiden) Österreichische Gruppe: Rudolf FREUND Franziska FREUND Marion OSWALD Franz WACHTLER

  8. Watson-Crick-Komplementarität Adenin(e) Cytosin(e) Guanin(e) Thymin(e) DNA DeoxyriboNucleic Acid DNS DeoxyriboNucleinSäure Doppelhelix 3´ … ATCG…5´ || || ||| ||| 5´ … TAGC…3´

  9. Sticker Systems Freund R., Păun Gh., Rozenberg G., Salomaa A., Bidirectional Sticker Systems, Pacific Symposium on Biocomputing '98, World Scientific, 1998. „Dominoes“

  10. Sticker Systems Freund R., Păun Gh., Rozenberg G., Salomaa A., Bidirectional Sticker Systems, Pacific Symposium on Biocomputing '98, World Scientific, 1998. Satz. Jede rekursiv aufzählbare Sprache L kann als Projektion einer von einem zweiseitigen Sticker-System erzeugten Sprache dargestellt werden.

  11. Sticker Systems - Universalität 3´ … ATCG…5´ || || ||| ||| 5´ … TAGC…3´ Watson-Crick-Komplementarität entsprichtDurchschnitt ! Durchschnitt zweier linearer Sprachen (lineare Grammatik mit Produktionen der Gestalt A → uBv, C → λ ), Projektion ergibt rekursiv aufzählbare Sprache.

  12. DNA Splicing 3´ … ATCC…5´ splicing 1 || ||| sticky ends 5´ … TAG G…3´ 3´ … T TCG…5´ || ||| sticky ends splicing 2 5´ … AAGC…3´ -------------------------------------------------------------------------------- 3´ … ATCG…5´ recombination 1 || || ||| ||| 5´ … TAGC…3´ 3´ … TTCC…5´ || || ||| ||| recombination 2 5´ … AAGG…3´

  13. DNA Computing - Splicing SPLICING RULE r = u1 # u2 $ u3 # u4 x = x1 u1 u2 x2 , y = y1 u3 u4 y2 , z = x1 u1 u4 y2 , w = y1 u3 u2 x2 SPLICING ( x , y )  r ( z , w ) T. Head: Formal language theory and DNA: An analysis of the generative capacity of specific recombinant behaviors.Bull. Math. Biology, 49 (1987), 737-759. E. Csuhaj-Varjú, R. Freund, L. Kari, Gh. Păun: DNA computing based on splicing: universality results. In: L. Hunter, T. Klein (Eds.): Pacific Symposium on Biocomputing '96, WSP (1996), 179-190. D. Pixton: Splicing in abstract families of languages. Theoretical Computer Science 234 (2000), 135-166.

  14. Splicing Splicing: r = u1 # u2 $ u3 # u4 , ( x , y )  r ( z , w ) z = x1u1u4y2 , w = y1u3u2x2 x = x1u1u2x2, y = y1u3u4 y2 , x1 u1 u2 x2 x y1 u3 u4 y2 y ------------------------------------------------------------------------------- z x1 u1 u4 y2 w y1 u3 u2 x2

  15. Cut and Recombine (CR) CUTTING RULE u1 # [m] $ [n] # u2 x = x1 u1 u2 x2 , y = x1 u1 [m] , z = [n] u2 y2 CUTTING x  r ( y , z ) RECOMBINATION RULE ( [m] , [n] ) x = x1 u1 u2 x2 , y = x1 u1 [m] , z = [n] u2 y2 RECOMBINATION ( y , z )  r x R. Freund, F. Wachtler: Universal systems with operations related to splicing. Computers and Art. Intelligence 15 (4).

  16. Cut and Paste (CP) CUTTING RULE u1 # [m] c [n] # u2 x = x1 u1 c u2 x2 , y = x1 u1 [m] , z = [n] u2 y2 CUTTING x  r ( y , z ) PASTING RULE ( [m] , c , [n] ) x = x1 u1 c u2 x2 , y = x1 u1 [m] , z = [n] u2 y2 PASTING ( y , z )  r x

  17. Splicing Systems / CR/CP Systems ohne zusätzliche Mechanismen können nur reguläre Sprachen erzeugt werden computationale Vollständigkeit (Universalität): - unendlich viele Regeln - Multimengen - periodische Regelmengen - Kontrollmechnismen (Kontrollgraphen,...) - Test Tube Systems - Membransysteme

  18. Test Tube Systems - Literatur L. M. Adleman: Molecular computation of solutions to combinatorial problems. Science, 226 (Nov. 1994), 1021-1024. (lab solution of small travelling salesman problem) E. Csuhaj-Varjú, L. Kari, and Gh. Păun: Test tube distributed systems based on splicing. Computers and Artificial Intelligence, Vol. 15 (2) (1996), 211-232. R. Freund, E. Csuhaj-Varjú, and F. Wachtler: Test tube systems with cutting/recombination operations. In: R.B. Altman, A.K. Dunker, L. Hunter, T. Klein (Eds.): Pacific Symposium on Biocomputing'97 (1997), 163-174.

  19. Test Tube Systems - Definition  = ( B , BT , n , A ,  , D , f ) • B Objekte • BT BTerminalobjekte • n Anzahl derTest Tubes • A = ( A1 , ... , An ) AiAxiomein Tube i •  = ( 1 , ... , n ) iOperationen in Tube i • D Output/Input-Relationender Gestalt • ( i , F , j ) ; F ist einFilterzwischen Tubes i und j • f  { 1 , ... , n }finaler Test Tube für Resultate

  20. Test Tube Systems - Schema Filter (i, F, j) Axiome i Axiome j Regeln i Regeln j Tube i Tube j

  21. TTS – Beginn eines Berechnungsschritts Die Berechnungen im System  gehen folgendermaßen vor sich: Am Beginn der Berechnung werden die Axiome entsprechend der durch A vorgegebenen Verteilung auf die n Test Tubes verteilt, d.h., Test Tube Ti beginnt mit Ai. Ist nun Li der Inhalt von Test Tube Ti am Beginn eines Ableitungsschrittes, dann operieren die Regeln von  auf Li und wir erhalten i*( Li).

  22. TTS – Reaktionen in den Test Tubes Filter (i, F, j) Axiome i Axiome j Regeln i Regeln j Tube i Tube j

  23. TTS – Filtern und Wiederverteilen Filter (i, F, j) Tube i Tube j

  24. TTS - Wiederverteilung Der nächste Teilschritt ist die Wiederverteilung der Elemente von i*(Li) über alle Test Tubes gemäß den entsprechenden Output/Input- Relationen aus D, d.h., ist ( i,F,j) in D, dann erhält der Test Tube Tj von i*(Li) nun i*(Li)  F, während der Rest von i*(Li), der nicht über andere Test Tubes verteilt werden kann, in Ti verbleibt.

  25. TTS – nächster Ableitungsschritt Filter (i, F, j) Axiome i Axiome j Regeln i Regeln j Tube i Tube j

  26. TTS – Resultat einer Berechnung Das Resultat der Berechnungen in  besteht aus allen Objekten aus BT im finalen Test Tube. Das Resultat der Berechnungen in  könnte auch aus allen Objekten aus Bim finalen Test Tube bestehen, d.h., in diesem Falle nehmen wir B = BT .

  27. When two tubes are enough WHEN TWO TUBES ARE ENOUGH

  28. TTS – Literatur Rudolf Freund, Franziska Freund: Test Tube Systems or How to Bake a DNA Cake. Acta Cybernetica, Vol. 12, Nr. 4, 445-459. Rudolf Freund, Franziska Freund: Test Tube Systems: When two tubes are enough. DLT '99 and in: G. Rozenberg, W. Thomas (Eds.): Developments in Language Theory, Foundations, Applications and Perspectives. WSP, Singapore (2000), 338-350.

  29. TTS – Universalität mit CR Satz. Jede rekursiv aufzählbare Sprache L kann von einem TTS mit CR-Regeln  = (MW*M , [e]W+[f] , 2, (A1, Ø ) , (C1  R1 , C2), {(1, F1, 2) , (2, F2, 1)}, {2}) mit nur zwei Tubes und Filtern, die jeweils eine endliche Vereinigung von Mengen der Gestalt mW+n mit Markierungen m,n sind, erzeugt werden. Beweis. Wir simulieren eine Grammatik G = (N,T,P,S) mit L(G) = L{d},wobei d jeweils im letzten Ableitungsschritt in G erzeugt wird. V = N  T {B} , W = V  {d}. Ein Wort w wird durch rotierte Versionen [x]w2Bw1[y] , w = w1w2 , repräsentiert. Terminalwörter sind von der Gestalt [e]w[f] , w  T+. Produktionen in P: p:   mit 1  |  | 2, 0  |  |  2 .

  30. TTS – Universalität mit CR (Beweis) M = {[e],[f],[e´],[f´], [x],[y],[x´],[y´]}  { [lp], [rp], [lp´] |pLab}  {[xc],[yc],[xc´],[yc´] |cLab} A1 = {[lp][y] |pLab, p:}  {[x]c[xc´], [yc´] [y] |cV}  {[x]BS[y]} C1 = {u#[rp] $ [lp´]#[y] | uV, pLab, p:, ||=2} {u#[rp] $ [lp´]#[y] | uV2  {B}, pLab, p:, ||=1} R1 = {([rp],[lp])|pLab}  {([xc´], [xc] ), ([yc], [yc´]) |cV} C2 = {u#[yc] $ [y´]#c[y], [x]#[x´]$ [xc]#u | u,c V} {[x]B#[e´] $ [e]#u, u#[f] $ [f´]#d[y] | uT} D = {(1, F1, 2), (2, F2, 1)} F1 = [x]W+[y] F2 =  cV [xc]W+[yc] 

  31. TTS – Universalität mit Splicing Satz. Jede rekursiv aufzählbare Sprache L kann von einem TTS mit Splicing-Regeln  = (W*,{E}W+{F}, 2, (A1,A2), (R1 R2), {(1,F1,2),(2,F2,1)}, {2}) mit nur zwei Tubes und Filtern, die jeweils eine endliche Vereinigung von Mengen der Gestalt {A}W+{B} mit A,B  W sind, erzeugt werden.

  32. (Wort-)Grammatiken Eine GrammatikGist ein Konstrukt(N,T,P,S), ∙ NNicht-Terminalsymbole; ∙ TTerminalsymbole, N ∩ T = { }; ∙ PProduktionen der Gestalt u → v, u V*, v V+, wobei V := NT; ∙ S N Startsymbol (oder S  V*Axiom). Ableitungsrelationfür u → vP definiert durch xuy u→v xvy für alle x,yV*, was in Summe die bekannte AbleitungsrelationGfür G ergibt. L(G) = { v  T* | S G* v } . Sprachfamilie L(ARB): beliebige Produktionen; Sprachfamilie L(CF): kontextfreieProduktionen der GestaltA → v mit AN und vV*.

  33. Matrixgrammatiken Eine MatrixgrammatikGM vom Typ Xist ein Konstrukt (N,T,P,M,w) wobeiG = (N,T,P,w) eine Grammatik vom Typ X und M eine endliche Menge endlicher Folgen von Produktionen aus P ist (ein Element von M heißt Matrix). Für eine Matrix m(i) = [mi,1,…,mi,n(i)]in M und v,uV* definieren wir v m(i)u genau dann wenn w0,w1,…,wn(i)V* sowie w0 = v, wn(i) = u, und für alle j, 1 ≤ j ≤ n(i), wj-1m(i,j) wjgemäßG. L(GM) = {v T* | wm(i,1) w1…m(i,k) wk, wk = v, wjV*, m(i,j) M für 1 ≤ j ≤ k ,k ≥ 1}. SprachfamilieL(X-MAT)

  34. Multimengen Eine Multimenge u <IN,V> ist eine Abbildung von V in IN, wobei IN die Menge der nicht-negativen ganzen Zahlen ist. Eine Multimenge u <IN,V> kann auch durch das entsprechende Wort aus V* angegeben werden, das jedes Symbol aus V genau so oft enthält wie u oder, auch noch anders formuliert, durch ein Wort aus V*, dessen Parikh-Vektor den Koeffizienten von u entspricht: Multimenge <(a1,n1),...,(ak,nk)> entspricht Parikh-Vektor (n1,...,nk) entspricht Wort a1n1...aknk. Wir betrachten auch Multimengen u <IN,V>, wobei IN = IN  { }.

  35. Multimengen-Grammatiken Eine Multimengen-GrammatikGist ein Konstrukt(N,T,P,S), ∙ NNicht-Terminalsymbole; ∙ TTerminalsymbole, N ∩ T = { }; ∙ PProduktionen der Gestalt u → v, u,v <IN,V>, u nicht die leere Multimenge; V := NT; ∙ S <IN,V>Axiom. Ableitungsrelation für u → vP definiert durch xu u→v xv für alle x<IN,V>, in Summe Gfür G. L(G) = { v  <IN,T> | S G* v } . Sprachfamilie Ps(ARB): beliebige Produktionen; Sprachfamilie Ps(CF):kontextfreieProduktionen der GestaltA → v mit AN und v<IN,V>. Ps ... Parikh sets

  36. Membransysteme eingeführt von Gheorghe PǍUN (1998) • gaben der theoretischen Informatik neue • Impulse, im Speziellen dem Gebiet der • formalen Sprachen; • abstrahieren Eigenschaften lebender Zellen; • erlauben die Konstruktion verschiedenster • Modelle universeller Computer, • eingeschränkte Modelle erlauben die • Charakterisierung bekannter Sprachfamilien.

  37. P-Systeme (Membranysteme) (eingeführt von Gheorghe PǍUN , 1998) Membranstruktur Multimengen von Objekten • Evolutions-/Kommunikations-Regeln angewendet • im maximal/minimal parallelen Modus • im sequentiellen/asynchronen Modus Auflösung / Erzeugung von Membranen Viele Varianten sind universell. Gheorghe Păun: Membrane Computing - An Introduction. Springer-Verlag, Berlin, 2002. The P Systems Web Page: http://ppage.psystems.eu/

  38. Membranstruktur [1[2[4 ]4 [5 ]5 ]2[3 ]3]1 elementare Membran Region 4 5 2 3 1 Hautmembran 0: Umgebung

  39. P-System - Definition Ein P-System vom Typ X ist ein Konstrukt • =( V,T,μ,wμ,Rμ, f), • - V/TSymbole/Terminalsymbole; • - μMembranstrukturvon ; üblicherweise werden die • Membranen mit 1,...,n bezeichnet; die äußerste • Membrane wird mit 1 markiert (Hautmembran); • wμ( = (w0,w1,...,wn))ordnet der Umgebung (w0) und • jeder Region innerhalb einer Membran i, 1 ≤ i ≤ n, eine • initiale Multimengeüber V zu (aus <IN,V>, üblicherweise • sind aber alle wi, i>0, nur aus <IN,V>); • Rμ ( = (R1,...,Rn) )ordnet jeder Membran i, 1 ≤ i ≤ n, • von μRegeln vom Typ X zu; • - f Output-Membran, 1 ≤ f ≤ n.

  40. P-System - Regeln EineRegelaus Riin einemP-Systemist von der Gestalt Pa,Qa[Pi,Qi|x[u→ v [ y. Dabei werden die Multimengen x in der Region außerhalb der Membran i und u innerhalb der Membran i durch die Multimengen v bzw. y ersetzt („rewriting“), vorausgesetzt, alle in den Mengen Pa und Pi enthaltenen Multisets kommen in der Region außerhalb bzw. innerhalb der Membran i vor und keiner der in den Mengen Qa und Qienthaltenen Multisets kommt in der Region außerhalb bzw. innerhalb der Membran i vor.

  41. maximal paralleler Ableitungsmodus ist eines der gebräuchlichsten Merkmale vieler Modelle von P-Systemen, die bisher eingeführt wurden. Eine universelle Uhr, welche die parallele Anwendung der Regeln steuert, erscheint unrealistisch, ist aber für viele interessante theoretische Resultatwichtig, speziell wenn es darum geht, Universalitätzu beweisen und (NP-) harte Probleme zu lösen. Im maximal parallelen Ableitungsmodus (max)wird eine Multimenge von Regeln derart ausgewählt, dass nach der Zuweisung entsprechender Objekte zu den (Kopien der) Regeln nicht genug Objekte mehr vorhanden sind, um noch die Anwendung einer zusätzlichen Regel zu erlauben.

  42. minimal paralleler Ableitungsmodus Im minimal parallelen Ableitungsmodus (min)wird eine Multimenge von Regeln derart ausgewählt, dass nach der Zuweisung entsprechender Objekte zu den Regeln nicht genug Objekte mehr vorhanden sind, um noch die Anwendung einer zusätzlichen Regel aus einer mit einer Membran assoziierten Regelmenge Ri, aus der noch keine Regel verwendet wurde, zu erlauben.

  43. Sequentieller und asynchroner Ableitungsmodus Im sequentiellen Ableitungsmodus(seq) wird in jedem Ableitungsschritt genau eine Regel angewendet. Im asynchronen Ableitungsmodus (asyn) wird in jedem Ableitungsschritt eine beliebige Anzahl von Regeln parallel angewendet. Biologische Prozesse in lebenden Organismen geschehen zwar parallel, aber nicht synchronisiert durch eine universelle Uhr. Viele Prozesse involvieren verschiedene Objekte gleichzeitig, aber die Prozesse selbst sind nicht synchronisiert.

  44. P-System - Ableitung Eine Ableitungim P system  geschieht folgendermaßen: Wir starten mit wi in der Umgebung und den Regionen innerhalb der Membranen. In jedem Ableitungsschritt werden die den Membranen zugeordneten Regelngemäß dem Ableitungsmodus non-deterministisch ausgewählt und (parallel) angewendet.

  45. P-System - Halten • Wir leiten im P system  so lange ab bis eine bestimmte • Haltebedingung erfüllt ist: • totales Halten (H): im gesamten System ist keine Regel • mehr anwendbar; • partielles Halten (h): aus einer Menge Ri ist keine Regel • mehr anwendbar; • adultes Halten (a): keine Konfigurationsänderung mehr; • Halten mit Endzustand (s).

  46. P-System – erzeugte Sprache Alle terminalen Multimengen aus <IN,T>, die am Ende einer Ableitung in Membran f erscheinen, tragen zu der von erzeugten Menge von Multimengen Ps()bei. Die Familie der von X-P-Systemen (mit Membranstruktur μ)im Ableitungsmodus m (seq, asyn, max, min)mit der Haltebedingung Y (H,h,a,s)erzeugten Mengen wird mit Ps((p,f)X-P,m,Y) bezeichnet. Sind alle Kontextbedingungen in einem X-P-System leer, dann bezeichnen wir die entsprechenden Mengenfamilien mit Ps(X-P,m,Y); sind nur erlaubte (“permitting contexts”) bzw. nur verbotene Kontextbedingungen vorhanden (“forbidding contexts”), d.h., alle Q-Mengen bzw. alle P-Mengen leer, dann bezeichnen wir die entsprechenden Mengenfamilien mit Ps(pX-P,m,Y) bzw. Ps(fX-P,m,Y).

  47. P-Systeme – minimal paralleler Ableitungsmodus und partielles Halten R. Freund, M. Oswald: P systems with partial halting. 2007. Satz. P-Systeme können in einer beliebigen Membranstruktur im sequentiellen, asynchronen und minimal parallelen Ableitungsmodus mit partiellem Halten nur Mengen von Multimengen erzeugen, die auch von kontextfreien Matrixgrammatiken erzeugten werden, d.h., Ps(X-P,{seq,asyn,min},h) = Ps(CF-MAT) = Ps(L(CF-MAT)).

  48. P-Systeme mit Kommunikationsregeln Kommunikationsregeln (communication rules) Antiport-Regeln der Gestalt (u,out;v,in) entsprechen Regeln v[u → u[ v. Symport-Regeln der Gestalt (u,out) bzw. (v,in)) entsprechen Regeln [u → u[bzw. v[ → [ v.

  49. P-Systeme mit Kommunikationsregeln Satz. P-Systeme mit Kommunikationsregeln (Antiport- und Symport-Regeln) können in einer beliebigen Membranstruktur im sequentiellen Ableitungsmodus nur Mengen von Multimengen erzeugen, die auch von Matrixgrammatiken erzeugt werden, d.h., Ps(AntiSym-P( [1 ]1 ),seq,{H,h}) = Ps(AntiSym-P,seq,{H,h}) =Ps(CF-MAT) = Ps(L(CF-MAT)). Satz. P-Systeme mit Antiport- und Symport-Regeln können in nur einer Membran im maximal parallelen Ableitungsmodus jede rekursiv aufzählbare Menge von Vektoren nicht-negativer ganzer Zahlen erzeugen, d.h., Ps(AntiSym-P( [1 ]1 ),max,{H,h}) = Ps(L(ARB)).

  50. P-Systeme für Wortsprachen R. Freund: P systems working in the sequential mode on Arrays and strings. DLT 2004, Dez. 2004, Auckland. Satz. Jede rekursiv aufzählbare Sprache L kann von einem P-System mit verbotenem Kontext und kontextfreien Produktionen in einer Membranstruktur von zwei Membranen im sequentiellen Ableitungsmodus erzeugt werden, d.h. (f = forbidden context), L(fCF-P( [1 [2 ]2 ]1,seq,H) ) = L(ARB).

More Related