גנומיקה השוואתית
Download
1 / 69

גנומיקה השוואתית - PowerPoint PPT Presentation


  • 142 Views
  • Uploaded on
  • Presentation posted in: General

גנומיקה השוואתית. שחר מיידנבאום אמיר גולדברג. מנחה: מיכל ליניאל. 8.7.2008. פתיחה. מוטיבציה עקרונות וכלים Minimal Gene Set & Last Common Ancestor חיות מודל 12 fly project גילוי אקסונים חדשים באדם. למה מיפוי הגנום חשוב?. גילוי פונקציות חדשות תכנון micro-array איכות נתונים סטטיסטיים

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha

Download Presentation

גנומיקה השוואתית

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


4450933
גנומיקה השוואתית

שחר מיידנבאום

אמיר גולדברג

מנחה: מיכל ליניאל

8.7.2008


4450933
פתיחה

  • מוטיבציה

  • עקרונות וכלים

  • Minimal Gene Set & Last Common Ancestor

  • חיות מודל

  • 12 fly project

  • גילוי אקסונים חדשים באדם


4450933
למה מיפוי הגנום חשוב?

  • גילוי פונקציות חדשות

  • תכנון micro-array

  • איכות נתונים סטטיסטיים

  • מציאת השפעות של תרופות

  • ועוד..


4450933
הבעיה

  • הדרך הניסיונית העיקרית לגילוי גנים היא איתור mRNA של אותו הגן.

    • לא ניתן להבחין בין RNA מקודד ל RNA שאינו מקודד לחלבון

    • לא ניתן לזהות אזורים רגולטוריים שכלל לא משועתקים

    • נותן מידע רק על רקמה מסויימת, שלב התפתחותי ומצב נוכחי של האורגניזם

  • כתוצאה – איכות הנתונים (להלן annotations) במאגרי המידע הגדולים איננה אחידה ברמתה


4450933
הפיתרון

  • אבולוציה!


4450933
קצת היסטוריה

  • In the beginning there was Evolution

  • 1992: The Institute for Genomic Research (TIGR) was founded with the goal of “jump-starting the genomics revolution”

  • May 1995: TIGR completed the first genome sequence of a free-living organism, a bacterium known as Haemophilus influenzae.

  • 1998: Celera was founded with the primary mission of completing the human genome sequence within three years

  • March 2000: Fruit fly sequence was published by Celera


4450933
קצת היסטוריה

  • June 2000: Celera announced the completion of its first draft of the human genome

  • April 2001: Celera completed the first assembly of the mouse genome

  • 2003: The Human Genome Project was completed

  • According to the Genome News Network, over 180 organisms have been sequenced since 1995


4450933
גנומים שפוענחו

Chimpanzee

Dog

Fruit Fly

Honeybee

Human

Mosquito

Mouse

Pufferfish

Rat

Red Jungle Fowl

Roundworm

Various Bacteria

Various Fungi

Various Microbes


4450933
איתור רצפים שמורים

  • אזורים מקודדים לחלבון

  • אזורים מקודדים ל – RNA (microRNA)

  • אזורים רגולטוריים

  • אלמנטים מבניים

  • ?


4450933
על מה לא נדבר

  • השוואת RNA ורצפים פפטידיים

  • השוואת מבנים שניוניים

  • מיקוד ההסתכלות ברמה הגלובלית


4450933
הכללת מידע ניסיוני לכדי מודל

  • UCSC Genome Browser - http://genome.ucsc.edu/


4450933
עקרונות ההשוואה הגנומית

קרבה אבולוציונית מכתיבה את רמת השימור

  • עקרונות מנחים:

    • ככל שמשהו רחוק יותר אבולוציונית הוא צפוי לצבור יותר שינויים

    • ככל שמשהו חשוב יותר, הוא ישתנה פחות

    • שינוי שתורם אדפטיבית לטובה צפוי להישמר בשל ברירה טבעית


4450933
עקרונות החלפה

  • כשיש לנו החלפה, הנטייה תהיה (ברמת החלבון):

    • יציבות התכונות

    • יציבות סטרית

    • השפעה של השכנים

  • נוכל למשקל סבירויות להחלפות שונות (מטריצות החלפה PAM, BLOSUM)

  • אובדן/רכישה יהיה בד"כ בכפולות של 3 (ברמת הנוקלאוטיד)


4450933
איך נשווה רצפים?

  • השוואה בין שני רצפים (allignment)

    • פרמטרים לבניית ציון:

      • Mismatch

      • Gaps (קנסות על פתיחה ועל הארכה)

    • השוואה גלובלית לעומת לוקאלית

    • השוואת חלבונים לעומת נוקלאוטידים


4450933
איך נשווה רצפים?

  • בקבוצת רצפים (MSA)

    • בניית פרופיל, בד"כ תוך השוואת זוגות

    • נחפש רצפים ותכונות שמורות לאורך כל הרצפים

  • תוכנות רלוונטיות

    • להשוואת זוג – Emboss, Lalign

    • להשוואת קבוצת רצפים – clustalW, PSI-BLAST, MUSCLE, T-Coffee.


4450933
הגדרות:

  • גנים הומולוגים: גנים שדומים זה לזה ברצף ובתפקיד

  • גנים אורתולוגים: גנים הומולוגים במינים שונים שמקורם מאב קדמון משותף

  • גנים פרלוגים: גנים הומולוגים באותו המין שמקורם מ – Gene Duplication


4450933
רקע לאורגניזם המינימלי

  • המיקרו-אורגניזמים הראשונים שפוענחו

  • הפרוייקט של ונטר (Mycoplasma laboratorium)

  • סדר גודל:

    • גנום אאוקריוטי רגיל 2,000-35,000 גנים

    • גנום פרוקריוטי רגיל 500-10,000 גנים.

      • אוטוטרופי מינימלי מוכר: A. Aeolicus <1,600 גנים

      • טפיל מינימלי מוכר: M. Genitalium 480 גנים

    • היעד של ונטר - 381 גנים

    • הכי מינימלי שהגיעו אליו בכוח – B. subtilis על מצע עשיר, 271 גנים

M. genitalium


4450933

$$$

Craig Venter

מה נעשה עם גנום מינימלי?

  • הבנה עמוקה יותר של תפקיד הגנים השונים ומקומם בתמונה הרחבה יותר של הגנום כולו.

  • תשתית לביצוע שינויים נקודתיים (לדעת במה לא לגעת...)

  • תשתית עתידית לייצור אורגניזמים חדשים ממש למטרות ייעודיות


4450933
אז איך נייצר אורגניזם מינימלי?

?

?


4450933
השיטה הניסויית

  • הרעיון הבסיסי - נתחיל להרוס גנים ונראה מה קורה

    • המוטציות של Itaya

    • מוטציות ממוקדות

  • יתרונות

    • יודעים בוודאות שזה נדרש

  • חסרונות

    • השענות על כפילויות מובנות (redundancy, pathways)

    • כלים לא מדוייקים (שמשתפרים)

    • מצבים שונים

    • השפעות לוואי


  • 4450933
    חיתוך גנים ורצפים

    • הרעיון הבסיסי - ביצוע חיתוך בין הגנומים של יצורים שונים כדי למצוא מה משותף לכולם.

    • התחשבות בשיקולים אבולוציוניים (הומולוגים, אורתולוגים)

    • הבעיה עיקרית – מוכרים לנו רק 60 גנים שנמצאים בכל האורגניזמים

    • גורמים:

      • מוטציות

      • קו-אורתולוגים

      • NOGD


    4450933
    חיתוך תכונות

    • מצד שני –

      • אמורפיות ההגדרה

      • סביבת חיים

        • בשגרה - תנאי סביבת חיים שונים, אוטוטרופיות

        • בחירום – התמודדות עם מצבי עקה שונים

      • יתכן שפעם היו מערכות אחרות לדברים (מערכת חליפית לדוגמא המרכזית)

      • יכולות נוספות – תנועה? אופי ממברנה?

    • מה אורגניזם מינימלי צריך?

      • שרשרת הדוגמה הראשית:

        • שעתוק

        • תרגום (וקיפול),

        • שכפול (ותיקון)

        • בקרות על הקודמים (פקטורים)

      • מטבוליזם

      • התרבות – כלים לחלוקת התא

      • תחזוק הממברנה, ושימור היחסים משני צידיה

      • וכל אחת צריכה קצת מסתורין...


    4450933

    חיתוך רצפים

    ניסויי

    COG’s

    לסיכום

    • השיטות השונות

      • ניסויי

      • חיתוך רצפים

      • פונקציונאלי

    • אינסוף אפשרויות...


    4450933
    האב הקדמון האחרון

    The Last Universal common ancestor (LUCA)

    אבא!


    4450933
    מוצא האדם מן ה-LUCA

    • LUCA (Last universal common ancestor) - ממבט על ההווה והעתיד למבט על העבר, ומיצורים תיאורתיים ליצורים מוחשיים

    • האם בהכרח היה קיים?

    • למה הוא מעניין אותנו?

      • היכרות עם ההתחלה המשותפת של כל היצורים שחיים היום ("דע מאין באת")

      • היכרות עם הדרך לשם

        • היכרות עם כלל העץ שבו זרמה

          האבולוציה

        • פרמטרים ומידע לבניית מודלים

          להתפתחות בעתיד

        • הבנה טובה יותר של מקורן של

          תכונות שונות שעשויה לאפשר

          לנו לשפר/לשנות אותם.


    4450933
    מושגי יסוד

    • עצים פילוגנטיים

      • Species tree

      • Gene tree

    • אירועי יסוד (elementary events)

      • אנכיים:

        • הופעת גן (emergence)

        • אובדן גן (loss)

      • אופקי:

        • העברת גן (HGT – horizontal gene transfer)


    Parsimony
    עקרון הפרסימוני (parsimony)

    תמיד נבנה את העץ שדורש הכי פחות אירועי יסוד ליצירתו

    • an archaeal gene that is lost in only one lineage.

    • an archaeal gene that was apparently transferred to a single bacterial lineage by horizontal gene-transfer (HGT). The purple boxes indicate the presence of the given gene in the respective lineage; white circles indicate the point of emergence of the given gene (COG); blue circles indicate lineage-specific gene loss; the arrow in b indicates HGT; pink hexagons indicate gene losses that would need have to have occurred to explain the phyletic pattern of COG1636 if HGT was substantially less frequent than gene loss


    4450933
    בעיות בעקרון הפרסימוני

    • בעיות:

      • לא בהכרח נכון – לא תמיד הדבר הכי יפה ומינימלי קורה

      • יכולים להיות כמה כאלו - נדרשת בחירה נכונה של התכונות שיש למיין לפיהן

      • אין התחשבות בנתונים אחרים (לדוג' נתונים ג"ג)

      • יתכן שהיה אובדן של מספר גדול של גנים קדומים

      • קביעת היחס בין אירועי היסוד השונים


    4450933
    היחס בין אירועי היסוד השונים

    • הנוסחה המקובל: S = I + gh

      • S הוא הציון המוענק לעץ (רוצים ציון מינימלי)

      • I הוא מספר אירועי אובדן והוספה אנכיים

      • h הוא כמות המעברים האופקיים

      • g הוא המשקל של מעברים כאלו

    • המשמעות של >g<1

    • המשמעות של g>>1


    4450933
    אז איך (אם בכלל) נראה LUCA?

    • השלכות הנוסחה

    • חי לפני 3.6-4.1 מיליארד שנים

    • כנראה ארכיאה

    • מורכב לעומת פשוט

      • המשמעות של פשוט בהקשר לאובדן מערכות קדומות



    4450933
    איך נבחר חיית מודל?

    • בעיית היסוד

      • חיה קרובה מידי דומה מידי ולכן לא נוכל להבחין בהבדלים.

      • חיה רחוקה מידי שונה מידי ולא נוכל לבצע את ההשוואה.

    • המודל הקלאסי –

      • ללכת על משהו באמצע - לקחת חיה מאותה משפחה, אך עם מרחק אבולוציוני בינוני.

      • במקרה של אדם, הדוג' הקלאסית היתה השוואה לעכבר (יונק, אך עם פער אבולוציוני של כ-75 מיליון שנה)


    4450933
    הבעיות במודל הקלאסי

    • הבעיות:

      • עדיין יהיה דימיון רב מידי באזורים רבים שיפגע ביכולתנו ללמוד על איזורים אלו.

      • אנחנו מאבדים את היכולת ללמוד דברים על תכונות שנרכשו לאחר הפיצול בין שני האורגניזמים.

    • לכן נעבור לבחירה ייעודית של מודל


    4450933
    השוואה לחיה רחוקה

    הרעיון הבסיסי - מחפשים דברים שנשארו דומים, שכנראה בעלי משמעות חשובה במיוחד.

    • מתי נתמקד בחיה כזו?

      • מערכות בסיסיות (שעתוק, תרגום)

      • אזורים שכל שינוי בהם לטאלי (רצפים עובריים)

      • איתור אזורים שמורים במיוחד שלא מוכרים עדיין

    • בעיות:

      • הבדלים בפונקציות

        פיזיולוגיות

      • מספר תכונות גדול

        שנוספו מאוחר יותר

      • המרחק גורר מוטציות

        רבות וסיכוי רב יותר

        לשינוי בדברים מרכזיים


    4450933
    השוואה לחיה קרובה

    הרעיון המרכזי – כאן נתמקד גם בדימיון ושימור, אך באותה המידה ואף יותר בהבדלים.

    • Phylogenetic shadowing

    • מתי נתמקד בחיה כזו?

      • תכונות שהופיעו בשלב מאוחר יחסית (LPA)

      • נסיונות להבין הבדלים בין אורגניזמים קרובים

    • חסרונות

      • מרבית הרצף דומה.


    4450933
    בין אדם לקוף

    • הבדלים מוכרים ברמה הגנומית:

      • במערכת החיסונית

      • במערכת הרבייה

      • יכולת ליצור צלילים מורכבים

      • יציבות גנומית

      • גודל הלסת, ושרירים בה

      • כנראה שתומכים בגודל מוח מוגדל


    12 fly project
    המחקר – 12 Fly Project



    Why fly1
    Why Fly?

    • Diversity


    Why fly2
    Why Fly?

    D. Melanogaster


    Why fly3
    Why Fly?

    • Knowledge


    4450933
    הערה

    • מחקר דומה נעשה בשמרים (Kellis et al 2003)

    • דגש שונה בעבודה עם זבובים?



    Protein metrics1
    מדדים חלבוניים (Protein Metrics)

    • CSF:


    Protein metrics2
    מדדים חלבוניים (Protein Metrics)

    • CSF:


    Protein metrics3
    מדדים חלבוניים (Protein Metrics)

    • RFC:


    Protein metrics4
    מדדים חלבוניים (Protein Metrics)

    • With Your Powers Combined…






    4450933
    חיפוש אחר אקסונים

    • איפיון:

      • 923 אקסונים חדשים. מתוכם:

        • 562 הוכללו בתוך גנים קיימים

        • 192 הוכללו לקביעת 142 גנים חדשים.

        • 174 נדחו – קטנים (21 ח"א בממוצע) וחסרי בסיס ניסויי.

      • 184 אקסונים נבחנו ניסויית. מתוכם:

        • 120 (65%) התגלו בספריית cDNA


    4450933
    חיפוש אחר אקסונים

    • איפיון:

      • 50% / 37% הומולוגיה ביתוש ודבורה

      • 32% / 12% הומולוגיה בתולעת, שמר ובעלי חוליות



    4450933
    הערכת שגיאה

    • מה עם ה – 12% הנותרים?

      • אבולוציה מהירה (לדוג': מערכת החיסון)

      • חדשים בגנום

      • ממצאים שגויים


    4450933
    הערכת שגיאה

    • בחינה מקלה:

      • חלונות חופפים של 30 ח"א, בחיפוש אחר חתימת חלבונים.

      • חיפוש בגנומים הקרובים ביותר ל –

        D. melanogaster


    4450933
    הערכת שגיאה

    • הגנים הנדחים מזכירים אזורים לא מקודדים:

      • קצרים

      • אקסון בודד

      • לפחות חלקם מהווים microRNA.


    4450933
    עדכון המידע הקיים

    • קודון התחלה חלופי:




    4450933
    תופעות חריגות

    • Poly-cistronic RNA (אופרון?):


    4450933
    תופעות חריגות

    • Intentional Frameshift:


    4450933
    סיכום המחקר

    • מדדים חלבוניים נותנים אינדיקציה טובה לקיום או אי-קיום חלבון

    • גנומיקה השוואתית מאפשרת לשפר את איכות מאגרי המידע הקיימים

    • כלים חישוביים עשויים להצביע על תופעות ביולוגיות חריגות ולדחוף קדימה את המחקר הביולוגי





    4450933
    סיכום

    • כלים חישוביים בפרספקטיבה על הגנום כולו יכולים לתת לנו הבנה מלאה על הקוד הגנטי

    • חשוב להחליט מה אנו רוצים למצוא, ובהתאם לכך לקבוע את כללי החיפוש (מה סוג הרצפים הרצויים? מה מידת השמירות הצפויה?)


    4450933
    ותודה ל:

    • מיכל על ההדרכה

    • מתן וסבינה על הכיבוד

    • לכם על ההקשבה


    4450933
    ביביליוגרפיה

    • Koonin (2003) Comparative Genomics, Minimal Gene-Sets and the Last Universal Common Ancestor. Nature Reviews 1: 127 - 136

    • Boffelli et al (2004) Comparative Genomics at the Vertebrate Extremes. Nature Reviews 5: 456 - 465

    • Lin et al (2007) Revisiting the protein-coding gene catalog of Drosophila melanogaster using 12 fly genomes. Genome Research 17: 1823 - 1836

    • Siepel et al (2007) Targeted Discovery of Novel Human Exons by Comparative Genomics. Genome Research 17: 1763 - 1773


    ad
  • Login