1 / 52

חיזוי מבנה חלבונים

חיזוי מבנה חלבונים. מה נראה היום. הצגת הבעיה דרכים ביולוגיות לפתרון הבעיה חיזוי מבנה שניוני חיזוי מבנה שלישוני. חשיבות הבעיה. ידיעת מבנה החלבון יכולה להועיל מאוד בהבנת הפונקציונליות שלו זיהוי סוג החלבון – קושר DNA , קושר מולקולות מסוימות וכו' הבנת דרך הפעולה של אנזימים ייצור תרופות

manju
Download Presentation

חיזוי מבנה חלבונים

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. חיזוי מבנה חלבונים

  2. מה נראה היום • הצגת הבעיה • דרכים ביולוגיות לפתרון הבעיה • חיזוי מבנה שניוני • חיזוי מבנה שלישוני

  3. חשיבות הבעיה • ידיעת מבנה החלבון יכולה להועיל מאוד בהבנת הפונקציונליות שלו • זיהוי סוג החלבון – קושר DNA, קושר מולקולות מסוימות וכו' • הבנת דרך הפעולה של אנזימים • ייצור תרופות • יצירת חלבונים ספציפיים למשל פקטורי שעתוק ספציפיים לרצף

  4. מה מחפשים? • מבנה ראשוני – זיהוי רצף חומצות האמינו בפוליפפטיד • מבנה שניוני – זיהוי מבנים מסוימים ברצף החלבון: α-helix, β-strand, loop • מבנה שלישוני – קיפול החלבון למבנה תלת מימדי • מבנה רביעוני – מבנה החלבון בקומפלקס

  5. איך עושים את זה? • החלבון יוצא מהריבוזום ומתקפל בצורה ספונטאנית למבנהו השלישוני • מספר אפשרויות הקיפולים הוא רציף ולכן אינסופי הנחות: • הקשרים בין האטומים בחלבון מכתיבים את מבנהו • החלבון מתקפל לצורה בה האנרגיה החופשית היא מינימלית

  6. סוגי הקשרים בקיפול חלבונים • קשרי מימן בשיירים ובשדרה, מתחרים על קשר עם המים • קשרים הידרופוביים בין שיירים הידרופוביים • קשרים אלקטרוסטטיים בין שיירים טעונים במטענים שונים (בליבת החלבון) ובין שיירים מיוננים למים (בשטח החיצון) • קשרי ון דר ואלס הן קשרי משיכה (בין אטומים לא טעונים) וקשרי דחייה (בין אטומים המוקפים בענני אלקטרונים)

  7. “most of the information about protein energetics contained in complex statistical potentials is simply hydrophobic clustering propensity . . . “(Thomas & Dill, 1996)

  8. פתירת מבנה חלבונים • NMR • Resolution: 2-5Å • Maximum protein size: ~50kDa • Protein in solution • Consumes 4-6 weeks • X-Ray Crystallography • Protein should be in crystal • Resolution: <2Å • Takes days to weeks • PDB holds 31,123 solved structures (31/5/2005) • 85% of are solved by x-ray • There are hundreds of thousands of known proteins

  9. CASP • Critical Assessment of Techniques for Protein Structure Prediction • ניסוי המתקיים כל שנתיים לבדיקת יכולת החיזוי • ב CASP6 (2004) השתתפו 266 קבוצות (מתוכן רק 65 השתמשו בשרת אוטומטי לגמרי) ונבחנו 64 חלבוני מטרה

  10. CASP הקטגוריות המנוסות בCASP: • Secondary structure prediction • Homology modeling • Protein threading • Contact prediction • De-novo structure prediction • Function prediction

  11. ההתקדמות במשך השנים

  12. CASP • מסקנות מניסויי CASP: • שרתים אוטומטיים טובים כמעט כמו כאלה עם התערבות אדם • שיטות שמשתמשות בהומולוגיה בלבד לא יתקדמו בתוצאות שלהן בעתיד • מידע על מבנה חלבונים עוזר במציאת הומולוגים רחוקים • אנו זקוקים לסימולציה טובה של אטומים ע"מ להתקדם ביכולות החיזוי • הבעיה העיקרית כיום היא חיזוי השיירים

  13. חיזוי מבנה שניוני • אחת הגישות בחיזוי מבנה החלבון היא לחזות קודם את המבנה השניוני וממנו לחזות את השלישוני • נראה שיטה שפיתח Jones המתבססת על ההנחה ששמירה אבולוציונית של מבנה חלבונים חזקה יותר מהשמירה על רצפם

  14. חיזוי מבנה שניוני Protein Secondary Structure Prediction Based on Position-specific Scoring Matrices Jones DT J Mol Biol (1999) 292, 195-202

  15. PSIPRED המאמר מציג שיטה בה משתמשים ברשת נוירונים שלמדה מבנים פתורים לחיזוי מבנה שניוני תוך שימוש במטריצת PSSM ההנחה היא שמבנה נשמר אבולוציונית טוביותר מרצף החלבון ולכן PSSM תתן ניבוי טוב

  16. PSIPRED שלבי השיטה: • בניית מטריצת שכיחויות שבה מוצג רצף החלבון מול כל ח"א האפשריות והשכיחוּת להחלפתן • מעבר על החלבון בחלון בגודל 15 וביצוע: • הכנסת המטריצה לרשת נוירונים שלמדה חלבונים פתורים לחיזוי המבנה של הח"א במיקום האמצעי בחלון • הכנסת התוצאות שהתקבלו עבור כל ח"א עוקבות לרשת נוירונים שניה לסינון התוצאות

  17. PSIPRED השלב הראשוני: • מאגר חלבונים יחודי למטרה זו נבנה כאשר אין בו כפילויות • רצף המטרה מורץ בPSI-BLAST מול מאגר זה • PSI-BLAST מוציא רשימה של חלבונים הומולוגים • מבצעים Multiple sequence alignment • כפלט של ההשוואה אנו מקבלים את השכיחות של כל ח"א להיות בכל מיקום ברצף • טבלא זו נקראת:PSSM: Position Specific Scoring Matrix

  18. PSIPRED >protein 1 AAVLGTNAAL >protein 2 AAVWTLAAL … >protein n VAVQGTNAAA MSA BLAST >template protein AAVLGTNAAL AAVLGTNAAL AAVW-TLAAL VAVQGTNAAA PSSM A A V L G T N A A L A 0.9 0.87 0.31 0.22 0.05 0.31 0.56 0.89 0.98 0.03 B 0.02 0.03 0.12 0.32 0.25 0.03 0.01 0.1 0.01 0.56 … Z 0.01 0.01 0.62 0.34 0.22 0.48 0.23 0.01 0.01 0.12

  19. רשתות נוירונים (בקצרה)

  20. רשתות נוירונים (המשך) • נוירון נתפס סכמטית כיחידה הסוכמת קלטים בינאריים בצורה משוקללת (גם משקלים שליליים) ומוציאה פלט בינארי http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html

  21. רשתות נוירונים (המשך) • לכן רשת נוירונים היא מספר נוירונים המחוברים זה לזה כאשר פלט של אחד מהווה קלט לאחר • ברשתות המלאכותיות שאנו נדבר עליהם ישנם 3 שכבות: קלט, פלט ושכבה נסתרת • כמו כן העברת הנתונים מתבצעת בכיוון אחד (feed-forward) http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html

  22. רשתות נוירונים (המשך) • למידה מבוקרת של רשת מתבצעת ע"י מענה לאחור (back propagation) • מזינים קלטים ידועים לרשת ומחשבים את השגיאה היחסית בעזרת פונקציה כלשהיא (למשל הפרש ריבועים) • הטעות היחסית של כל תא מוזנת לאחור והמשקלות מחושבים שוב

  23. PSIPRED אימון הרשת: • נבחרה רשימה גדולה של חלבונים פתורים בעלי מבנה שונה זה מזה • 10% מהרשימה נשמרים בתור סט מבחן • מעבירים את סט המבחן את כל התהליך ולבסוף משווים עם המבנה הידוע ומשיבים פידבק לרשת • עוצרים את האימון כאשר החיזוי של סט המבחן מתחיל לרדת באיכותו

  24. PSIPRED רשת הנוירונים הראשונה: • שכבת קלט בגודל 15*20=300 תאים כאשר לכל אחת מוכנס הווקטור מטבלת הPSSM • שכבה נסתרת בגודל 75 תאים • שכבת פלט בגודל 3 – תא עבור כל מבנהאפשרי (helix, strand, loop) ובכל אחד מקבלים את הסבירות למבנה זה

  25. PSIPRED • רשת נוירונים שניה משמשת לסינון התוצאות • יוצרת רצף דומיינים הגיוני מהתוצאות הקודמות • קלט-45 תאים: 3 תאים עבור כל חומצה אמינית ברצף • שכבה נסתרת של 60 תאים • פלט-3 תאים המסמנים את הסבירות לקבל כל דומיין • כאן נבחר את הדומיין עם הסבירות הגבוהה ביותר

  26. PSIPRED • מדד Q3: כאשר משווים את הפלט למבנה האמיתי סופרים בכמה אותיות שתי המילים (עם א"ב בגודל 3) זהות מתוך כלל האותיות HHHHSSLLLLSSSSSHHHHHLL HHHSSSSLLLLSSSSHHHHLLL Q3=18/22=82% • לPSIPRED ציון Q3 ממוצע של 76% בעוד לשיטות מקובלות אחרות יש ציונים נמוכים במעט

  27. תוצאות Rost R & Eyrich VA, EVA: large-scale analysis of secondary structure prediction

  28. חסרונות השיטה • כיוון שמשתמשים ברשת נוירונים עם שכבת קלט גדולה כ"כ לא ניתן ללמוד על התכונות הפיזיקליות שמביאות לקיפול מסוים

  29. מבנה שלישוני

  30. מהו מבנה שלישוני? בהנתן חלבון אנו רוצים למצוא עבור כל אטום בו את מיקומו במרחב התלת מימדי

  31. הבעיה החישובית נתון: חלבון באורך n ח"א ידועות, ידועים גם הקשרים האפשריים בין אטומים ורמת האנרגיה שלהם. פלט: מיקום כל אטום במרחב התלת-מימדי כאשר האנרגיה החופשית היא מינימלית.

  32. קשה גם אם נניח שהבעיה בדידה • מציאת הbackbone קשה מאוד כיוון שיש מספר רב של סידורים מרחביים לכל חומצה אמינית • מציאת המיקום של השיירים קשה גם באותה מידה • פתרון אפשרי: • שימוש בידע מוקדם

  33. חיזוי מבנה חלבונים דרכי החיזוי מתחלקות ל3 גישות: • חיזוי מבנה חלבונים בעליהומולוגים עם מבנה פתור • חיזוי מבנה חלבונים עם דמיון מבני לחלבון פתור • חיזוי מבנה ללא דמיון כלשהו למבנה פתור(ab initio prediction)

  34. חיזוי בעזרת הומולוגיה • בצורה הנאיבית אם יש לחלבון חלבון אחר שדומה לו מאוד המבנה שלהם זהה • לאחר שמצאנו את ההומולוג ניתן לכוונן את המבנה למבנה האמיתי

  35. חיזוי בעזרת דמיון מבני • לפעמים לא ניתן למצוא חלבון (פתור) עם דמיון רצפי משמעותי לחלבון המטרה • חלבונים עם דמיון מבני לחלבון המטרה קיימים ונמצאים במאגר • Threading- מציאת התאמה בין חלבון למבנה מוצע

  36. חיזוי בעזרת דמיון מבני GenTHREADER: An Efficient and Reliable Protein FoldRecognition Method forGenomicSequences Jones DT J Mol Biol (1999)

  37. GenTHREADER • השיטה מחשבת התאמה של חלבון למבנה של חלבון אחר • תחילה מחשבים פרמטרים שונים המשווים בין חלבון המטרה לחלבון התבנית אותו בוחנים • פרמטרים אלו מוזנים לרשת נוירונים ומידת ההתאמה שלהם מתקבלת • מידת ההתאמה בין חלבון המטרה למבנה של חלבון התבנית יוצאת כפלט

  38. GenTHREADER

  39. GenTHREADER הפרמטרים אותם GenTHREADER מחשבת: • התאמה רצפית בין החלבונים • הערכת אנרגיה לכל זוג חומצות במבנה • הערכת אנרגית קבירה (חוזק קשרים הידרופוביים) לכל שייר

  40. GenTHREADER ניקוד התאמת הרצף: • ע"מ להגדיר טוב יותר את פרופיל חלבון התבנית מוצאים לו חלבונים הומולוגים • עם רשימה זו מבצעים multiple sequence alignment • ישנם כמה שיטות לצורך זה, אין העדפה משמעותית של אחת ע"ג השניה • עם תוצאה זו אנו משווים את חלבון המטרה

  41. GenTHREADER חישוב אנרגיה לזוג ח"א: • את אנרגית הזוג ניתן להעריך בשיטות סטטיסטיות – איסוף מידע על מרחק פיזי בין ח"א שונות במרחקים שונים ברצף • כאן משתמשים במידע זה להעריך את הסבירות שזוג ח"א אכן נמצאות במרחק פיזי נתון • בעזרת שימוש במשוואת בולצמן מקבלים אנרגיה חופשית

  42. GenTHREADER פוטנציאל α-helix β-strand המרחק האטומי בין שתי ח"א אלאנין שהמרחק ביניהן ברצף הוא 3, לעומת האנרגיה הפוטנציאלית המרחק האטומי בין שתי ח"א ציסטאין שהמרחק ביניהן ברצף הוא 30 ומעלה, לעומת האנרגיה הפוטנציאלית מרחק (אנגסטרם) Disulphide bridge Jones DT (1992) Nature 358,87

  43. GenTHREADER • עבור כל ח"א נאספו נתונים עבור סבירות החומצה להיות בליבת החלבון או במעטפת • פוטנציאל הקבירה מחושב לכל שייר לפי סבירות השייר המסוים להיות בדרגת הקבירה המוצעת במבנה • פוטנציאל זה מנורמל ע"י הסבירות הכללית לרמת קבירה זו ומתורגם לאנרגיה ע"י משוואת בולצמן

  44. GenTHREADER הקלט של רשת הנוירונים: • סכום אנרגיות הזוג • סכום אנרגיות ממס • ציון התאמת רצף • אורך התאמת הרצף • אורך החלבון האחד • אורך החלבון השני ערכים אלו מנורמלים לסולם [0,1]

  45. GenTHREADER מבנה רשת הנוירונים: • שכבת הקלט: 6 תאים עבור הערכים שהצגנו • שכבה נסתרת של שישה תאים • שכבת הפלט: 2 תאים המציינים את הסבירות של החלבון להיות או לא להיות מתאים למבנה המוצע

  46. תוצאות • השרת הורץ על סט מבחן שהוצע ע"י Fischer et al. • הסט מכיל 68 צמדי חלבונים כאשר הדמיון המבני ביניהם גבוה והדמיון הרצפי נמוך • השרת הריץ אחד מכל זוג ודרג ב 73.5% מהמקרים את בן הזוג כבעל המבנה הדומה ביותר • יתרון נוסף של השיטה הוא היכולת לציין אם החיזוי טוב או לא, התאמות בודאות של 99% ומעלה נלקחו כתוצאות אמת

  47. שימוש בGenTHREADER • כיוון ש GenTHREADER עובד ללא התערבות אדם ניתן להריץ אותו על גנום שלם • Mycoplasma genitaliumנבחר להרצה בעל הגנום הבקטריאלי הקטן ביותר – 468 ORF

  48. שימוש בGenTHREADER

More Related