גנומיקה השוואתית
This presentation is the property of its rightful owner.
Sponsored Links
1 / 69

גנומיקה השוואתית PowerPoint PPT Presentation


  • 103 Views
  • Uploaded on
  • Presentation posted in: General

גנומיקה השוואתית. שחר מיידנבאום אמיר גולדברג. מנחה: מיכל ליניאל. 8.7.2008. פתיחה. מוטיבציה עקרונות וכלים Minimal Gene Set & Last Common Ancestor חיות מודל 12 fly project גילוי אקסונים חדשים באדם. למה מיפוי הגנום חשוב?. גילוי פונקציות חדשות תכנון micro-array איכות נתונים סטטיסטיים

Download Presentation

גנומיקה השוואתית

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


4450933

גנומיקה השוואתית

שחר מיידנבאום

אמיר גולדברג

מנחה: מיכל ליניאל

8.7.2008


4450933

פתיחה

  • מוטיבציה

  • עקרונות וכלים

  • Minimal Gene Set & Last Common Ancestor

  • חיות מודל

  • 12 fly project

  • גילוי אקסונים חדשים באדם


4450933

למה מיפוי הגנום חשוב?

  • גילוי פונקציות חדשות

  • תכנון micro-array

  • איכות נתונים סטטיסטיים

  • מציאת השפעות של תרופות

  • ועוד..


4450933

הבעיה

  • הדרך הניסיונית העיקרית לגילוי גנים היא איתור mRNA של אותו הגן.

    • לא ניתן להבחין בין RNA מקודד ל RNA שאינו מקודד לחלבון

    • לא ניתן לזהות אזורים רגולטוריים שכלל לא משועתקים

    • נותן מידע רק על רקמה מסויימת, שלב התפתחותי ומצב נוכחי של האורגניזם

  • כתוצאה – איכות הנתונים (להלן annotations) במאגרי המידע הגדולים איננה אחידה ברמתה


4450933

הפיתרון

  • אבולוציה!


4450933

קצת היסטוריה

  • In the beginning there was Evolution

  • 1992: The Institute for Genomic Research (TIGR) was founded with the goal of “jump-starting the genomics revolution”

  • May 1995: TIGR completed the first genome sequence of a free-living organism, a bacterium known as Haemophilus influenzae.

  • 1998: Celera was founded with the primary mission of completing the human genome sequence within three years

  • March 2000: Fruit fly sequence was published by Celera


4450933

קצת היסטוריה

  • June 2000: Celera announced the completion of its first draft of the human genome

  • April 2001: Celera completed the first assembly of the mouse genome

  • 2003: The Human Genome Project was completed

  • According to the Genome News Network, over 180 organisms have been sequenced since 1995


4450933

גנומים שפוענחו

Chimpanzee

Dog

Fruit Fly

Honeybee

Human

Mosquito

Mouse

Pufferfish

Rat

Red Jungle Fowl

Roundworm

Various Bacteria

Various Fungi

Various Microbes


4450933

איתור רצפים שמורים

  • אזורים מקודדים לחלבון

  • אזורים מקודדים ל – RNA (microRNA)

  • אזורים רגולטוריים

  • אלמנטים מבניים

  • ?


4450933

על מה לא נדבר

  • השוואת RNA ורצפים פפטידיים

  • השוואת מבנים שניוניים

  • מיקוד ההסתכלות ברמה הגלובלית


4450933

הכללת מידע ניסיוני לכדי מודל

  • UCSC Genome Browser - http://genome.ucsc.edu/


4450933

עקרונות ההשוואה הגנומית

קרבה אבולוציונית מכתיבה את רמת השימור

  • עקרונות מנחים:

    • ככל שמשהו רחוק יותר אבולוציונית הוא צפוי לצבור יותר שינויים

    • ככל שמשהו חשוב יותר, הוא ישתנה פחות

    • שינוי שתורם אדפטיבית לטובה צפוי להישמר בשל ברירה טבעית


4450933

עקרונות החלפה

  • כשיש לנו החלפה, הנטייה תהיה (ברמת החלבון):

    • יציבות התכונות

    • יציבות סטרית

    • השפעה של השכנים

  • נוכל למשקל סבירויות להחלפות שונות (מטריצות החלפה PAM, BLOSUM)

  • אובדן/רכישה יהיה בד"כ בכפולות של 3 (ברמת הנוקלאוטיד)


4450933

איך נשווה רצפים?

  • השוואה בין שני רצפים (allignment)

    • פרמטרים לבניית ציון:

      • Mismatch

      • Gaps (קנסות על פתיחה ועל הארכה)

    • השוואה גלובלית לעומת לוקאלית

    • השוואת חלבונים לעומת נוקלאוטידים


4450933

איך נשווה רצפים?

  • בקבוצת רצפים (MSA)

    • בניית פרופיל, בד"כ תוך השוואת זוגות

    • נחפש רצפים ותכונות שמורות לאורך כל הרצפים

  • תוכנות רלוונטיות

    • להשוואת זוג – Emboss, Lalign

    • להשוואת קבוצת רצפים – clustalW, PSI-BLAST, MUSCLE, T-Coffee.


4450933

הגדרות:

  • גנים הומולוגים: גנים שדומים זה לזה ברצף ובתפקיד

  • גנים אורתולוגים: גנים הומולוגים במינים שונים שמקורם מאב קדמון משותף

  • גנים פרלוגים: גנים הומולוגים באותו המין שמקורם מ – Gene Duplication


4450933

רקע לאורגניזם המינימלי

  • המיקרו-אורגניזמים הראשונים שפוענחו

  • הפרוייקט של ונטר (Mycoplasma laboratorium)

  • סדר גודל:

    • גנום אאוקריוטי רגיל 2,000-35,000 גנים

    • גנום פרוקריוטי רגיל 500-10,000 גנים.

      • אוטוטרופי מינימלי מוכר: A. Aeolicus <1,600 גנים

      • טפיל מינימלי מוכר: M. Genitalium 480 גנים

    • היעד של ונטר - 381 גנים

    • הכי מינימלי שהגיעו אליו בכוח – B. subtilis על מצע עשיר, 271 גנים

M. genitalium


4450933

$$$

Craig Venter

מה נעשה עם גנום מינימלי?

  • הבנה עמוקה יותר של תפקיד הגנים השונים ומקומם בתמונה הרחבה יותר של הגנום כולו.

  • תשתית לביצוע שינויים נקודתיים (לדעת במה לא לגעת...)

  • תשתית עתידית לייצור אורגניזמים חדשים ממש למטרות ייעודיות


4450933

אז איך נייצר אורגניזם מינימלי?

?

?


4450933

השיטה הניסויית

  • הרעיון הבסיסי - נתחיל להרוס גנים ונראה מה קורה

    • המוטציות של Itaya

    • מוטציות ממוקדות

  • יתרונות

    • יודעים בוודאות שזה נדרש

  • חסרונות

    • השענות על כפילויות מובנות (redundancy, pathways)

    • כלים לא מדוייקים (שמשתפרים)

    • מצבים שונים

    • השפעות לוואי


  • 4450933

    חיתוך גנים ורצפים

    • הרעיון הבסיסי - ביצוע חיתוך בין הגנומים של יצורים שונים כדי למצוא מה משותף לכולם.

    • התחשבות בשיקולים אבולוציוניים (הומולוגים, אורתולוגים)

    • הבעיה עיקרית – מוכרים לנו רק 60 גנים שנמצאים בכל האורגניזמים

    • גורמים:

      • מוטציות

      • קו-אורתולוגים

      • NOGD


    4450933

    חיתוך תכונות

    • מצד שני –

      • אמורפיות ההגדרה

      • סביבת חיים

        • בשגרה - תנאי סביבת חיים שונים, אוטוטרופיות

        • בחירום – התמודדות עם מצבי עקה שונים

      • יתכן שפעם היו מערכות אחרות לדברים (מערכת חליפית לדוגמא המרכזית)

      • יכולות נוספות – תנועה? אופי ממברנה?

    • מה אורגניזם מינימלי צריך?

      • שרשרת הדוגמה הראשית:

        • שעתוק

        • תרגום (וקיפול),

        • שכפול (ותיקון)

        • בקרות על הקודמים (פקטורים)

      • מטבוליזם

      • התרבות – כלים לחלוקת התא

      • תחזוק הממברנה, ושימור היחסים משני צידיה

      • וכל אחת צריכה קצת מסתורין...


    4450933

    חיתוך רצפים

    ניסויי

    COG’s

    לסיכום

    • השיטות השונות

      • ניסויי

      • חיתוך רצפים

      • פונקציונאלי

    • אינסוף אפשרויות...


    4450933

    האב הקדמון האחרון

    The Last Universal common ancestor (LUCA)

    אבא!


    4450933

    מוצא האדם מן ה-LUCA

    • LUCA (Last universal common ancestor) - ממבט על ההווה והעתיד למבט על העבר, ומיצורים תיאורתיים ליצורים מוחשיים

    • האם בהכרח היה קיים?

    • למה הוא מעניין אותנו?

      • היכרות עם ההתחלה המשותפת של כל היצורים שחיים היום ("דע מאין באת")

      • היכרות עם הדרך לשם

        • היכרות עם כלל העץ שבו זרמה

          האבולוציה

        • פרמטרים ומידע לבניית מודלים

          להתפתחות בעתיד

        • הבנה טובה יותר של מקורן של

          תכונות שונות שעשויה לאפשר

          לנו לשפר/לשנות אותם.


    4450933

    מושגי יסוד

    • עצים פילוגנטיים

      • Species tree

      • Gene tree

    • אירועי יסוד (elementary events)

      • אנכיים:

        • הופעת גן (emergence)

        • אובדן גן (loss)

      • אופקי:

        • העברת גן (HGT – horizontal gene transfer)


    Parsimony

    עקרון הפרסימוני (parsimony)

    תמיד נבנה את העץ שדורש הכי פחות אירועי יסוד ליצירתו

    • an archaeal gene that is lost in only one lineage.

    • an archaeal gene that was apparently transferred to a single bacterial lineage by horizontal gene-transfer (HGT). The purple boxes indicate the presence of the given gene in the respective lineage; white circles indicate the point of emergence of the given gene (COG); blue circles indicate lineage-specific gene loss; the arrow in b indicates HGT; pink hexagons indicate gene losses that would need have to have occurred to explain the phyletic pattern of COG1636 if HGT was substantially less frequent than gene loss


    4450933

    בעיות בעקרון הפרסימוני

    • בעיות:

      • לא בהכרח נכון – לא תמיד הדבר הכי יפה ומינימלי קורה

      • יכולים להיות כמה כאלו - נדרשת בחירה נכונה של התכונות שיש למיין לפיהן

      • אין התחשבות בנתונים אחרים (לדוג' נתונים ג"ג)

      • יתכן שהיה אובדן של מספר גדול של גנים קדומים

      • קביעת היחס בין אירועי היסוד השונים


    4450933

    היחס בין אירועי היסוד השונים

    • הנוסחה המקובל: S = I + gh

      • S הוא הציון המוענק לעץ (רוצים ציון מינימלי)

      • I הוא מספר אירועי אובדן והוספה אנכיים

      • h הוא כמות המעברים האופקיים

      • g הוא המשקל של מעברים כאלו

    • המשמעות של >g<1

    • המשמעות של g>>1


    4450933

    אז איך (אם בכלל) נראה LUCA?

    • השלכות הנוסחה

    • חי לפני 3.6-4.1 מיליארד שנים

    • כנראה ארכיאה

    • מורכב לעומת פשוט

      • המשמעות של פשוט בהקשר לאובדן מערכות קדומות


    4450933

    חיות מודל


    4450933

    איך נבחר חיית מודל?

    • בעיית היסוד

      • חיה קרובה מידי דומה מידי ולכן לא נוכל להבחין בהבדלים.

      • חיה רחוקה מידי שונה מידי ולא נוכל לבצע את ההשוואה.

    • המודל הקלאסי –

      • ללכת על משהו באמצע - לקחת חיה מאותה משפחה, אך עם מרחק אבולוציוני בינוני.

      • במקרה של אדם, הדוג' הקלאסית היתה השוואה לעכבר (יונק, אך עם פער אבולוציוני של כ-75 מיליון שנה)


    4450933

    הבעיות במודל הקלאסי

    • הבעיות:

      • עדיין יהיה דימיון רב מידי באזורים רבים שיפגע ביכולתנו ללמוד על איזורים אלו.

      • אנחנו מאבדים את היכולת ללמוד דברים על תכונות שנרכשו לאחר הפיצול בין שני האורגניזמים.

    • לכן נעבור לבחירה ייעודית של מודל


    4450933

    השוואה לחיה רחוקה

    הרעיון הבסיסי - מחפשים דברים שנשארו דומים, שכנראה בעלי משמעות חשובה במיוחד.

    • מתי נתמקד בחיה כזו?

      • מערכות בסיסיות (שעתוק, תרגום)

      • אזורים שכל שינוי בהם לטאלי (רצפים עובריים)

      • איתור אזורים שמורים במיוחד שלא מוכרים עדיין

    • בעיות:

      • הבדלים בפונקציות

        פיזיולוגיות

      • מספר תכונות גדול

        שנוספו מאוחר יותר

      • המרחק גורר מוטציות

        רבות וסיכוי רב יותר

        לשינוי בדברים מרכזיים


    4450933

    השוואה לחיה קרובה

    הרעיון המרכזי – כאן נתמקד גם בדימיון ושימור, אך באותה המידה ואף יותר בהבדלים.

    • Phylogenetic shadowing

    • מתי נתמקד בחיה כזו?

      • תכונות שהופיעו בשלב מאוחר יחסית (LPA)

      • נסיונות להבין הבדלים בין אורגניזמים קרובים

    • חסרונות

      • מרבית הרצף דומה.


    4450933

    בין אדם לקוף

    • הבדלים מוכרים ברמה הגנומית:

      • במערכת החיסונית

      • במערכת הרבייה

      • יכולת ליצור צלילים מורכבים

      • יציבות גנומית

      • גודל הלסת, ושרירים בה

      • כנראה שתומכים בגודל מוח מוגדל


    12 fly project

    המחקר – 12 Fly Project


    Why fly

    Why Fly?


    Why fly1

    Why Fly?

    • Diversity


    Why fly2

    Why Fly?

    D. Melanogaster


    Why fly3

    Why Fly?

    • Knowledge


    4450933

    הערה

    • מחקר דומה נעשה בשמרים (Kellis et al 2003)

    • דגש שונה בעבודה עם זבובים?


    Protein metrics

    מדדים חלבוניים (Protein Metrics)


    Protein metrics1

    מדדים חלבוניים (Protein Metrics)

    • CSF:


    Protein metrics2

    מדדים חלבוניים (Protein Metrics)

    • CSF:


    Protein metrics3

    מדדים חלבוניים (Protein Metrics)

    • RFC:


    Protein metrics4

    מדדים חלבוניים (Protein Metrics)

    • With Your Powers Combined…


    Protein metrics5

    מדדים חלבוניים (Protein Metrics)


    Flybase

    הרצה על FlyBase


    4450933

    חיפוש אחר אקסונים

    • HMM:


    4450933

    חיפוש אחר אקסונים


    4450933

    חיפוש אחר אקסונים

    • איפיון:

      • 923 אקסונים חדשים. מתוכם:

        • 562 הוכללו בתוך גנים קיימים

        • 192 הוכללו לקביעת 142 גנים חדשים.

        • 174 נדחו – קטנים (21 ח"א בממוצע) וחסרי בסיס ניסויי.

      • 184 אקסונים נבחנו ניסויית. מתוכם:

        • 120 (65%) התגלו בספריית cDNA


    4450933

    חיפוש אחר אקסונים

    • איפיון:

      • 50% / 37% הומולוגיה ביתוש ודבורה

      • 32% / 12% הומולוגיה בתולעת, שמר ובעלי חוליות


    4450933

    הערכת שגיאה


    4450933

    הערכת שגיאה

    • מה עם ה – 12% הנותרים?

      • אבולוציה מהירה (לדוג': מערכת החיסון)

      • חדשים בגנום

      • ממצאים שגויים


    4450933

    הערכת שגיאה

    • בחינה מקלה:

      • חלונות חופפים של 30 ח"א, בחיפוש אחר חתימת חלבונים.

      • חיפוש בגנומים הקרובים ביותר ל –

        D. melanogaster


    4450933

    הערכת שגיאה

    • הגנים הנדחים מזכירים אזורים לא מקודדים:

      • קצרים

      • אקסון בודד

      • לפחות חלקם מהווים microRNA.


    4450933

    עדכון המידע הקיים

    • קודון התחלה חלופי:


    4450933

    עדכון המידע הקיים

    • ORF חלופי


    4450933

    תופעות חריגות

    • Read-Through:


    4450933

    תופעות חריגות

    • Poly-cistronic RNA (אופרון?):


    4450933

    תופעות חריגות

    • Intentional Frameshift:


    4450933

    סיכום המחקר

    • מדדים חלבוניים נותנים אינדיקציה טובה לקיום או אי-קיום חלבון

    • גנומיקה השוואתית מאפשרת לשפר את איכות מאגרי המידע הקיימים

    • כלים חישוביים עשויים להצביע על תופעות ביולוגיות חריגות ולדחוף קדימה את המחקר הביולוגי


    4450933

    אקסונים חדשים באדם


    4450933

    אקסונים חדשים באדם


    4450933

    אקסונים חדשים באדם


    4450933

    סיכום

    • כלים חישוביים בפרספקטיבה על הגנום כולו יכולים לתת לנו הבנה מלאה על הקוד הגנטי

    • חשוב להחליט מה אנו רוצים למצוא, ובהתאם לכך לקבוע את כללי החיפוש (מה סוג הרצפים הרצויים? מה מידת השמירות הצפויה?)


    4450933

    ותודה ל:

    • מיכל על ההדרכה

    • מתן וסבינה על הכיבוד

    • לכם על ההקשבה


    4450933

    ביביליוגרפיה

    • Koonin (2003) Comparative Genomics, Minimal Gene-Sets and the Last Universal Common Ancestor. Nature Reviews 1: 127 - 136

    • Boffelli et al (2004) Comparative Genomics at the Vertebrate Extremes. Nature Reviews 5: 456 - 465

    • Lin et al (2007) Revisiting the protein-coding gene catalog of Drosophila melanogaster using 12 fly genomes. Genome Research 17: 1823 - 1836

    • Siepel et al (2007) Targeted Discovery of Novel Human Exons by Comparative Genomics. Genome Research 17: 1763 - 1773


  • Login