1 / 45

SYSTEMS BIOLOGY IN DRUG DISCOVERY

SYSTEMS BIOLOGY IN DRUG DISCOVERY. ΒΙΒΛΙΟΓΡΑΦΙΚΟ ΘΕΜΑ ΣΤΟ ΜΑΘΗΜΑ ΕΜΒΙΟΜΗΧΑΝΙΚΗ-ΕΜΒΙΟΙΑΤΡΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΟΝΟΜΑ : ΚΑΡΑΓΙΑΝΝΟΠΟΥΛΟΣ ΦΑΕΘΟΝΤΑΣ. ΠΕΡΙΕΧΟΜΕΝΑ ΠΑΡΟΥΣΙΑΣΗΣ. ΕΙΣΑΓΩΓΗ ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΤΗ ΣΥΣΤΗΜΙΚΗ ΒΙΟΛΟΓΙΑ ΜΟΝΤΕΛΑ GAUSS-BAYES ΓΙΑ ΑΝΑΛΥΣΗ ΔΙΚΤΥΩΝ ΠΡΩΤΕΙΝΩΝ ΚΑΙ ΓΟΝΙΔΙΩΝ

july
Download Presentation

SYSTEMS BIOLOGY IN DRUG DISCOVERY

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. SYSTEMS BIOLOGY IN DRUG DISCOVERY ΒΙΒΛΙΟΓΡΑΦΙΚΟ ΘΕΜΑ ΣΤΟ ΜΑΘΗΜΑ ΕΜΒΙΟΜΗΧΑΝΙΚΗ-ΕΜΒΙΟΙΑΤΡΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΟΝΟΜΑ: ΚΑΡΑΓΙΑΝΝΟΠΟΥΛΟΣ ΦΑΕΘΟΝΤΑΣ

  2. ΠΕΡΙΕΧΟΜΕΝΑ ΠΑΡΟΥΣΙΑΣΗΣ ΕΙΣΑΓΩΓΗ ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΤΗ ΣΥΣΤΗΜΙΚΗ ΒΙΟΛΟΓΙΑ ΜΟΝΤΕΛΑ GAUSS-BAYES ΓΙΑ ΑΝΑΛΥΣΗ ΔΙΚΤΥΩΝ ΠΡΩΤΕΙΝΩΝ ΚΑΙ ΓΟΝΙΔΙΩΝ 4. ΣΥΜΠΕΡΑΣΜΑΤΑ

  3. ΕΙΣΑΓΩΓΗ • Με τον όρο συστημική βιολογία εννοούμε την αναπαράσταση του κυττάρου σαν ένα σύστημα (όπως πχ. τα φυσικά ή μηχανικά συστήματα). • Τα κύτταρα ως συστήματα που είναι διαθέτουν ορισμένους μηχανισμούς που τους εξασφαλίζουν τη λειτουργικότητα και την επιβίωση τους. • Όμως λόγω εξωγενών η και ενδογενών παραγόντων οι ρυθμιστικοί μηχανισμοί αυτοί απορρυθμίζονται και έτσι προκύπτουν οι ασθένειες.

  4. Η απορρύθμιση των κυτταρικών μηχανισμών συνίσταται σε τρείς τομείς: Α.Υποδοχή σημάτων Β.Διακυτταρικές απαντήσεις Γ.Επικοινωνία μεταξύ διαφορετικών κυτταρικών ομάδων • Η κατανόηση και μοντελοποίηση των ανωμαλιών αυτών μπορεί να οδηγήσει στην ανακάλυψη των κατάλληλων φαρμάκων για την αντιμετώπιση τους.

  5. ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΤΗ ΣΥΣΤΗΜΙΚΗ ΒΙΟΛΟΓΙΑ • Οι πρόσφατες πρόοδοι στις πειραματικές τεχνικές της μοριακής βιολογίας έχουν δημιουργήσει ένα μεγάλο εύρος δεδομένων. • Η ανάλυση των δεδομένων αυτών απαιτεί σύγχρονες υπολογιστικές τεχνικές και αλγορίθμους για την εξαγωγή συμπερασμάτων. • Έτσι μπορούμε να κατανοήσουμε τις χαρακτηριστικές ιδιότητες και μηχανισμούς των οργανισμών. • Μπορούμε να κατανοήσουμε μέσω πειραμάτων γιατί ορισμένες διαταραχές γενετικών και μοριακών μηχανισμών οδηγούν στις ασθένειες.

  6. μικροσυστοιχiεσγονιδiων (microarrays) • Ανάπτυξη τεχνολογίας Microarray τα τελευταία χρόνια μας δίνει τη δυνατότητα να απομονώσουμε γονίδια και να ελέγξουμε την έκφρασή τους.

  7. Στο φυσικό περιβάλλον οι οργανισμοί αντιδρούν στις διαταραχές του περιβάλλοντος μεταβάλλοντας την ποσότητα του γονιδιακού προιόντος που παράγει το κάθε γονίδιο. • Τις μεταβολές αυτές μπορούμε να τις παρατηρήσουμε με τα Microarrays ακολουθώντας πέντε βήματα • Σχεδιασμός πειράματος • Προεπεξεργασία δεδομένων • Εξαγωγή συμπερασμάτων • Ταξινόμηση • Αξιολόγηση συμπερασμάτων

  8. Διαδικασία ιδιαίτερα δύσκολη και περίπλοκη: • Γενετικό υλικό δε γίνεται διακριτό στις θέσεις των πλακιδίων • Φθορά γενετικού υλικού λόγω θορύβου • Ταξινόμηση των αποτελεσμάτων είναι ιδιαίτερα δύσκολη και απαιτεί τη χρήση προηγμένων αλγορίθμων • Επιστήμονες επιδιώκουν να αναπαραστήσουν τη χαμένη γενετική πληροφορία

  9. Microarrays πολύ σημαντική διαγνωστική μέθοδος καθώς μπορούμε να ελέγξουμε την αποτελεσματικότητα των φαρμάκων σε κύτταρα στα οποία έχει εγχυθεί το φάρμακο σε σύγκριση με κύτταρα που δεν έχει. • Επίσης ανοίγει νέες προοπτικές για την αποκρυπτογράφηση του μη κωδικοποιημένου DNA που λειτουργούν ως ρυθμιστικοί μηχανισμοί των κυττάρων

  10. ΑΝΑΓΩΓΗ ΤΩΝ ΕΡΓΑΣΤΗΡΙΑΚΩΝ ΔΕΔΟΜΕΝΩΝ ΣΕ ΓΟΝΙΔΙΑΚΗ ΚΛΙΜΑΚΑ • Τα περισσότερα δεδομένα εξάγονται με βάση εργαστηριακά πειράματα. Ωστόσο τα δεδομένα αυτά δεν είναι ακριβή καθώς δε γίνονται σε ζωντανούς οργανισμούς. • Προσπάθεια κατανόησης και εξάλειψης του λάθους

  11. ΜΕΘΟΔΟΙ ΣΥΛΛΟΓΗΣ ΔΕΔΟΜΕΝΩΝ • ΜΕΘΟΔΟΣ YEAST 2 HYBRID (Υ2Η) - Εξετάζουμε δύο γονίδια, το γονίδιο που ρυθμίζει την αντιγραφή (transcription gene ) και το γονίδιο το οποίο αντιγράφεται (reporter gene) • Το transcription gene αποτελείται από δύο τμήματα , το τμήμα που παράγει την πρωτείνη που προσκολλάται (binding domain) στην αλληλουχία ενεργοποίησης του reporter gene (UAS) και το τμήμα (activation domain) που παράγει την πρωτείνη που ενεργοποιεί την έκφραση του reporter gene. • Όταν τα δύο τμήματα αυτά ενωθούν τότε δίνεται εντολή στο reporter gene να εκφραστεί.

  12. Η ύπαρξη της πρωτεΐνης που παράγεται από το transcription gene υπονοεί την αλληλεπίδραση μεταξύ των πρωτεϊνών Bait-Prey (δόλωμα –κυνηγό )

  13. Άλλες μεθόδοι για την ανίχνευση των πρωτεινών είναι : • AP(Affinity purification) εντοπισμός της πρωτείνης από ένα μείγμα με βάση ένα συγκεκριμένο αντίσωμα. • TAP (Tandem affinity purification) παραλλαγή της μεθόδου AP αλλά με ανίχνευση της πρωτείνης σε δύο στάδια καθαρισμού από αντισώματα.

  14. ΛΑΘΗ ΣΕ ΠΕΙΡΑΜΑΤΙΚΑ ΔΕΔΟΜΕΝΑ • Τα δεδομένα που προκύπτουν περιέχουν λάθη τόσο θετικά (μεγαλύτερη συγκεντρωσηπρωτείνης) όσο και αρνητικά (μικρότερη συγκεντρωσηπρωτείνης) . • Η αλληλεπίδραση των πρωτεινώνin vitro περιέχει απροσδιοριστία και επηρεάζεται από παράγοντες που δεν υφίστανται in vivo. Χαρακτηριστικά: • Υδρόφιλα υπολείμματα στην επιφάνεια τους αυξάνουν την τάση τους να σχηματίσουν τυχαίες ενώσεις • Στην μέθοδο TAP ανιχνεύεται η παρουσία μιας πρωτεΐνης σε ένα μόνο πρωτεϊνικό σύμπλεγμα καθόσον χρησιμοποιούμε ένα συγκεκριμένο αντίσωμα • Επίσης υφίσταται αδυναμία υπολογισμού της περιεκτικότητας πρωτεϊνών που βρίσκονται σε μικρή κλίμακα στο διάλυμα άρα και αρνητικά λάθη

  15. Με τα υφιστάμενα υπολογιστικά μοντέλα μπορούμε να υπολογίσουμε τα λάθη που προκύπτουν. • Σε κάθε πείραμα κάνουμε μια παρατήρηση και έχουμε τρείς άγνωστες ποσότητες (αριθμός πραγματικών αλληλεπιδράσεων πρωτεινών, θετικά λάθη –αλληλεπιδράσεις που έγιναν αλλά δεν εντοπίστηκαν, αρνητικά λάθη-αλληλεπιδράσεις που δεν έγιναν αλλά εντοπίστηκαν). • Θεωρούμε ότι το σύνολο των λαθών σε κάθε πείραμα είναι ανεξάρτητη μεταβλητή. • Ελάχιστος απαιτούμενος αριθμός πειραμάτων 3 ώστε αριθμός παρατηρήσεων= αριθμός λαθών=7

  16. ΤΡΟΠΟΙ ΑΝΙΧΝΕΥΣΗΣ ΡΥΘΜΙΣΤΙΚΩΝ ΔΙΚΤΥΩΝ (REGULATORY NETWORKS) • REVEAL (REVerse Engineering Algorithm): Εντοπίζει τα γονίδια εκείνα τα οποία όταν εκφράζονται μεγιστοποιούν την ποσότητα της πρωτείνης που παράγει το γονίδιο που μας ενδιαφέρει. • Επαναλαμβάνουμε την ίδια διαδικασία για τα υπόλοιπα γονίδια και δημιουργούμε το ρυθμιστικό δίκτυο των γονιδίων.

  17. Η REVEAL ήταν η πρώτη υπολογιστική μέθοδος που χρησιμοποιήθηκε για δημιουργία δικτύων. • Ευρέως χρησιμοποιούμενη είναι η μέθοδος DBN (Dynamic Bayesian Network). • Μπορούμε να εκτιμήσουμε και την επιρροή γονιδίων που δεν είναι παρόντα (hidden factors)

  18. ΜΟΝΤΕΛΑ GAUSS-BAYES ΓΙΑ ΑΝΑΛΥΣΗ ΔΙΚΤΥΩΝ ΠΡΩΤΕΙΝΩΝ ΚΑΙ ΓΟΝΙΔΙΩΝ • Δίκτυα BAYES χωρίζονται σε δύο μεγάλες κατηγορίες στατικά δίκτυα BAYES (SBN) και δυναμικά δίκτυα BAYES (DBN). • Μελετάει τη συσχέτιση μεταξύ Χ1,Χ2…ΧΝ μεταβλητών. • Δημιουργούν ένα γράφημα G που αποτελείται από Ν κόμβους (μεταβλητές Χi) και ακμές με βέλη που ενώνουν τους κόμβους. • Κάθε κόμβος έχει το πατρικό σύνολο κόμβων για τους οποίους αποτελεί το παιδί. • Τα στατικά δίκτυα BAYES είναι DAG (directed acyclic graph) κανένας κόμβος δεν είναι πρόγονος η απόγονος του ιδίου.

  19. Στα δίκτυα Bayesη ύπαρξη μιας μεταβλητής (γονίδιο-πρωτείνη) εξαρτάται αποκλειστικά από την ύπαρξη και την ποσότητα των πατρικών κόμβων καθώς και από ένα σύνολο παραμέτρων q. Π.χ. για το ανωτέρω δίκτυο η συνολική πιθανότητα είναι:

  20. Ταδίκτυα DAG μπορεί να εισάγουν τον ίδιο σετ κατά συνθήκη ανεξαρτησιών. Έτσι από κάθε δίκτυο DAG προκύπτουν οι κλάσεις ισοδύναμων δικτύων DAG. • Για να περιγράψουμε τις κλάσεις αυτές χρησιμοποιούμε τα γραφήματα CPDAG (completed partially directed acyclic graphs). Περιέχουν κατευθυνόμενες (με βελάκι) και μη κατευθυνόμενες ακμές (χωρίς βελάκι) • Η κλάση περιέχει ορισμένα DAG με την αρχική κατεύθυνση όσο και ανεστραμμένα. • Για να είναι δύο δίκτυα DAG ισοδύναμα πρέπει να έχουν την ίδια v δομή και τον ίδιο σκελετό. Αυτό φαίνεται στο δεξί γράφημα του ανωτέρου σχήματος.

  21. Υπολογισμός της πιθανότητας που υπάρχει να παρουσιαστεί ένα δίκτυο δεδομένου ενός πίνακα D (NxM). N οι μεταβλητές και Μ οι φορές που εκτελούμε το πείραμα. • Ο πίνακας D σε κάποια θέση του Di,jπεριέχει τη θέση που έχει η κάθε μεταβλητήαπό την εκτέλεση του πειράματος και το συνόλο με τους πατρικούς κόμβους της μεταβλητής. Είναιγια τη πιθανότητα να έχουμε ένα γράφημα G:

  22. Όμως ο πληθάριθμος του συνόλου Ω όλων των δυνατών γραφημάτων που σχηματίζονται με τις δεδομένες μεταβλητές. Όμως το Ζ1 μεγαλώνει εκθετικά για n>6 και είναι δύσκολο να υπολογιστεί. • Αν έχουμε ομοιόμορφη κατανομή των γραφημάτων στο χώρο Ω τότε η πιθανότητα του κάθε γραφήματος είναι:

  23. ο πληθάριθμος των πατρικών κόμβων των γραφημάτων G, σταθερά εξαρτάται από κατανομή • Το υπολογίζεται κάνοντας παραμετροποίηση στο χώρο των γραφημάτων G ως προς την παράμετρο q. Έτσι έχουμε: • Όμως όπως αναφέραμε παραπάνω:

  24. To παραμετρικό διάνυσμα q αποτελείται από τα διανύσματα qi i=1:Ν. Επομένως έχουμε: • Όμως λόγω της υπόθεσης που έχουμε κάνει ότι κάθε παράμετρος εξαρτάται από το συγκεκριμένο κόμβο και ο κόμβος από το πατρικό του σύνολο έχουμε:

  25. Έτσι συνολικά έχουμε : • Και συνολικά η δεσμευμένη πιθανότητα εμφάνισης του γραφήματος G είναι: με

  26. Το Ζ που έχει χρησιμοποιηθεί παραπάνω στην εξίσωση είναι ένας παράγοντας κανονικοποίησης • Οι παράγοντες Ψ[] εξαρτώνται από το στοχαστικό μοντέλο το οποίο έχουμε χρησιμοποιήσει. • Συνήθως χρησιμοποιείται το γραμμικό μοντέλο Gauss με κανονική κατανομή Wilshart (BGe model) η πολυωνυμική κατανομή (Bde model) • Η ανωτέρω ανάλυση ισχύει για τα στατικά συστήματα ωστόσο στη φύση τα συστήματα είναι διαφορετικά, μεταβάλλονται με το χρονικό βήμα που έχουμε ορίσει εμείς

  27. BAYES GAUSSIAN ANALYSIS • Έστω ότι μας δίνεται ένας πίνακας D με τα δεδομένα που προκύπτουν από τις μεταβλητές του πειράματος Χ1,Χ2…ΧΝ : • Έτσι ώστε Di,jμας δείχνει τα αποτελέσματα (συγκέντρωση) που προκύπτει από την j φορά εκτέλεσης του πειράματος • Yπόθεσηπως τα αποτελέσματα που προκύπτουν από την εκτέλεση του πειράματος D,j (j=1,2….m) είναι ένα τυχαίο δείγμα από μια πολυμεταβλητήγκαουσιανή κατανομή Ν (μ,Σ)

  28. Γίνεται η υπόθεση πως το Σ (πίνακαςμε W=Σ-1) το οποίο επιλέγεται υπακούει σε μια κατανομή Wilshart • Έτσι η δεσμευμένη κατανομή του διανύσματος μ δεδομένου του W είναι Ν (μ0,(υ*W)-1) με υ>0 • W κατανομή Wilshartμε W(α,Τ0) • Για το έχουμε: • Όπου Σpπίνακας ΝxΝ,προτείνεται να λαμβάνεται Σp=ΙΝxΝ όπου ο πίνακας ΙΝxΝμοναδιαίος.

  29. Ορίζουμε: Όπου • Είναι το μέσο από τα m παρατηρούμενα διανύσματα και • Είναι ο εμπειρικός πίνακας συνδιακύμανσης που προκύπτει από τα υπολογιζόμενα διανύσματα m πολλαπλασιασμένο με m-1.

  30. Στα γκαουσιανά μοντέλα (BGe models) η δεσμευμένη πιθανότητα δίνεται όπως αναφέρθηκε ανωτέρω από την ακόλουθη σχέση: • Χι είναι η i μεταβλητή και πiείναι το σύνολο με τους πατρικούς κόμβους της μεταβλητής Χiστο γράφημα G. • και είναι οι υποπίνακες του πίνακα δεδομένων D που αποτελούνται μόνο από τις γραμμές που αντιστοιχούν στις μεταβλητές των υποσυνόλων S1 ={Xi,πi} και S2 ={πi}. • και αντιστοιχούν στα γραφήματα για τα υποσυνόλα των μεταβλητωνS1 ={Xi,πi} και S2 ={πi},

  31. Η δεσμευμένη πιθανότητα για ένα υποσύνολο δεδομένων , το οποίο αποτελείται από m εκτελέσεις του Ν διαστάσεως υποσυνόλου μπορεί να υπολογιστεί όταν το συνολικό γράφημα G δίνεται, από τον ακόλουθο τύπο: • Όπουείναι οι ορίζουσες των υποπινάκων και αποτελούνται μόνο από τις γραμμές και τις στήλες που αντιστοιχούν στις μεταβλητές του υποσυνόλου S. Η ποσότητα έχει αναφερθεί ανωτέρω πως υπολογίζεται και σχετικά με τις ποσότητες και έχουμε:

  32. Δύο ειδών δεδομένα με τα οποία γίνεται η αναπαράσταση των δικτύων , τα δεδομένα που προκύπτουν με παρεμβολή χρησιμοποιώντας κάποιους παράγοντες ανασταλτικούς η επιταχυντικούς και τα δεδομένα που λαμβάνουμε από απλή παρατήρηση (κυτανομετρία). • Οι τύποι που χρησιμοποιούνται είναι ελαφρώς διαφοροποιημένοι

  33. Αξιολόγηση των δεδομένων • Αξιολόγηση των δεδομένων συγκρίνοντας με τα τελικά αποτελέσματα με το δικτύο το οποίο έχουμε ήδη αναπαραστήσει. • Oρίζουμετον ακόλουθο συντελεστή : • Ο συντελεστής αυτός είναι ένας δυαδικός συντελεστής και παίρνει την τιμή 0 όταν η ακμή του τελικού διαγράμματος δεν υφίσταται στο γράφημα GT ενώ παίρνει την τιμή 1 όταν η ακμή αυτή υπάρχει στο γράφημα GT.

  34. Εν συνεχεία σχηματίζουμε το δείκτη ε(θ) με: ε(θ)={ ei,j │ το οποίο μας δείχνει όλες τις ακμές στο πιο πιθανό γράφημα που προκύπτει πως ξεπερνούν ένα συγκεκριμένο όριο θ. • Όμως αντί να επιλέξουμε μια συγκεκριμένη τιμή του θ παίρνουμε διάστημα του θ ολοκληρώνουμε και σχεδιάζουμε τη sensitivity με την inverse specificity σε δύο άξονες. Έτσι προκύπτει η καμπύλη ROC • Δίνονται από τους τύπους: sensitivity: inverse specificity:

  35. Oλοκληρώνονταςκαι παίρνοντας το εμβαδόν του όγκου που περικλείει προκύπτει η τιμή AUC που είναι ένα μέτρο της πιστότητας της αναπαράστασης του γραφήματος. • Ένα ακόμα πιο άμεσο και πιο κατανοητό κριτήριο είναι δίνεται από το λόγο αληθών θετικών συσχετίσεων προς λανθασμένων θετικών (TP/FP=5)

  36. Το μονοπάτι σημάτων RAF (RAF signaling pathway)

  37. Το σηματοδοτικό μονοπάτι RAF το οποίο φαίνεται στο ανωτέρω σχήμα περιγράφει τις διακυτταρικές συσχετίσεις ανάμεσα στα διαφορετικά μόρια που αλληλεπιδρούν για τη μετάδοση του σήματος. • Μελετήθηκαν τα επίπεδα έκφρασης 11 φωσφορούχων πρωτεινών και φωσφολιπιδίων σε 1200 άτομα με βάση την κυτομετρία (cytometry).

  38. Πέραν των στοιχείων που πήραμε με παρατήρηση μετρήθηκαν και τα επίπεδα των 11 μορίων μετά από 6 διαφορετικές διεγέρσεις που έγιναν από άλλα κύτταρα.

  39. Συμπεράσματα • Δίκτυα με παρεμβολή (έγχρωμα δίκτυα) εμφανίζουν καλύτερα ποσοστά ανακατασκευής του δικτύου σε σύγκριση με τα δίκτυα με απλή παρατήρηση (ασπρόμαυρα δίκτυα). • Ανακατασκευή δικτύων με μη κατευθυνόμενα άκρα δίνει καλύτερους συντελεστές AUC και TF/FP σε σύγκριση με τα δίκτυα με κατευθυνόμενα άκρα. • Δηλαδή από τα δεδομένα με παρεμβολή υπάρχει πολύ μεγαλύτερη πληροφορία σε σύγκριση με τα δεδομένα με απλή παρατήρηση. • Επίσης το να ανακατασκευάσουμε το δίκτυο με μη κατευθυνόμενα άκρα είναι πιο εύκολο σε σύγκριση με το να το ανακατασκευάσουμε με κατευθυνόμενα άκρα.

More Related