1 / 21

התפלגות בינומית ומבחן הבינום

התפלגות בינומית ומבחן הבינום. תזכורת: הסיכוי של שחקן מסוים לקלוע לסל בזריקת עונשין הוא 0.7. מה הסיכוי שמתוך 5 זריקות עונשין הוא יקלע 3 פעמים בדיוק?. באופן כללי:

Download Presentation

התפלגות בינומית ומבחן הבינום

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. התפלגות בינומית ומבחן הבינום תזכורת: הסיכוי של שחקן מסוים לקלוע לסל בזריקת עונשין הוא 0.7. מה הסיכוי שמתוך 5 זריקות עונשין הוא יקלע 3 פעמים בדיוק? באופן כללי: במצב שבו ההסתברות להצלחה בניסיון מסוים היא p וההסתברות לכישלון היא q = 1-p. הסיכוי להצליח k פעמים מתוך n ניסיונות ב"ת שווה ל: אלה הם ניסיונות Bernoulli: ניסיונות ב"ת, כאשר לכל ניסיון 2 תוצאות אפשריות. Bernoulli (1645-1705)

  2. אם נחשב פונקצית הסתברות של k (מספר הצלחות מתוך n ניסיונות), נקבל התפלגות בינומית. לדוגמא: מספר הקליעות מתוך 5 זריקות עונשין.

  3. דוגמא: 4 ניסיונות כשבכל ניסיון 2 תוצאות אפשריות

  4. כל פונקצית הסתברות היא בעצם התפלגות דגימה, דהיינו התפלגות תיאורטית המבוססת על אינסוף חזרות. להתפלגות הבינומית 2 פרמטרים: n (מספר הניסיונות) ו-p (הסתברות להצלחה בכל ניסיון). נסמן את k כ-x דוגמא: מספר הקליעות מתוך 5 זריקות עונשים כשבכל זריקה הסיכוי לקליעה 0.7 אם נצייר את ההתפלגות שקיבלנו:

  5. יצרנו התפלגות דגימה תיאורטית מתוך אוכלוסייה בעלת פרמטרים נתונים (לדוגמא :5 זריקות, סיכוי להצלחה בכל זריקה 0.7) . כרגע אם יגיע שחקן הטוען שרמת משחקו היא כמו זו של השחקן שלעיל, אנו נוכל לבחון עד כמה ביצועיו תואמים לאלו של השחקן המקורי. נשמע מוכר? בדיקת השערות !! ניתן לחשב את אזורי הדחייה באופן מדויק: קצוות ההתפלגות הכוללים  (כפול 100) אחוז מהמקרים.

  6. הטלנו מטבע מסוים 10 פעמים והתקבלו 9 פעמים עץ. האם סביר להניח שהמטבע הוגן (p=1/2) ברמת בטחון של 95%? דוגמא: אין השערה מראש =0.05 הנחות: אי תלות בין ההטלות קביעת אזורי הדחייה: בכל זנב (השערה דו-צדדית) נחשב את השטח של הערכים הקיצוניים הכוללים פרופורציה של /2 מהמקרים. מאחר והערכים בדידים לא נוכל להגיע בדיוק ל- /2 לכן תמיד נחמיר ונמצא את הערכים שהפרופורציה שלהם לא עולה על /2. =הסיכוי להצלחה באוכלוסייה. ברב הספרים מסומן כ-p, גם אנחנו לפעמים נשתמש בסימון זה.

  7. אזור הדחייה:אנו מסכמים את ההסתברות המצטברת של הערכים עד לפני שעוברים את /2. =COMBIN(10,A1)*POWER(0.5,A1)*POWER(0.5,10-A1) זנב תחתון: p(x1)=0.0107</2 p(x2)=0.0547>/2 לכן אזור הדחייה בזנב התחתון x 1. כאשר =1/2 ההתפלגות סימטרית, לכן מספר האיברים באזור הדחייה התחתון שווה למספר האיברים באזור הדחייה העליון, לכן לא צריכים לחשב הסתברויות נוספות. p(x1)= p(x9) אזור אי הדחייה: 1<x<9 אזור הדחייה: x1 x9 9 נופל באזור הדחייה, מכאן שנוכל לדחות את H0 ולומר ברמת בטחון של 95% (לפחות) שהמטבע אינו הוגן.

  8. כאשר ההתפלגות אינה סימטרית (1/2), מספר האיברים באזור הדחייה העליון עלול להיות שונה ממספר האיברים שבאזור הדחייה התחתון. אם n קטן מדי, עלול להיות מקרה שבו אין איברים באזור הדחייה ("אם כזה מספר קטן של ניסיונות לא ניתן להגיע לשום מסקנה מדעית"). p(0)=0.03125>0.025 דוגמא: n=5,  =1/2 כפי שכבר למדנו אם יש השערה מראש, לפני איסוף הנתונים, ניתן לשער השערה חד-צדדית.

  9. חולים הסובלים מ-proactive amnesia לא מצליחים לאחסן זיכרונות חדשים. חוקר טוען שחולים אלו אכן זוכרים אך הם לא מודעים לכך. בניסוי שתכנן, בשלב א' חולה נחשף ל-50 צמדים של פריטים. בשלב ב' החולה נחשף ל-20 צמדים (שמחציתם חדשים ומחציתם לא) ונשאל האם כל צמד וצמד הופיע בשלב א'. החולה הצליח לזהות נכון 18 מתוך 20 הצמדים. האם ניתן לומר שהוא לא מנחש את תשובותיו ברמת בטחון של 95%? דוגמא: אזור הדחייה: =0.05 הנחות: אי תלות בין הצמדים אזור אי הדחייה: x<15 אזור הדחייה: x15 18 נופל באזור הדחייה, לכן ניתן לדחות את H0 ולומר ברמת בטחון של 95% שהחולה אינו מנחש.

  10. במקום לקבוע מראש את אזור/י הדחייה, ואז לבדוק אם מספר ה"הצלחות" שקיבלנו במדגם נופל באזור הדחייה או האי דחייה, עדיף לחשב את ערך ה-p של המדגם: מה ההסתברות לקבל ערך כמו של המדגם (כולל) או קיצוני יותר תחת H0. אם ערך ה-p קטן מ- בהשערה חד-צדדית או מ- /2 בהשערה דו-צדדית נוכל לדחות את H0. בדוגמא שלעיל: החולה הצליח לזהות נכון 18 מתוך 20 צמדים. לכן ניתן לדחות את H0 ... הערה: תמיד מחשבים את השטח של כל הערכים לכוון הזנב (כולל ערך המדגם)

  11. כאשר קיימת השערה חלופית (H1) נקודתית, נוכל לחשב את השטח של H1 הנופל באזור הדחייה, במילים אחרות את ההסתברות של האיברים הנמצאים באזור הדחייה תחת H1. עוצמה דוגמא: ידוע שרק 30% מהחולי הסובלים מסכיזופרניה מגיבים לתרופות אנטיפסיכוטיות טיפיקליות. חוקר מצא תרופה חדשה אשר לטענתו יעילה יותר. הוא בחן אותה על 7 חולים חדשים. א) מהן השערות המחקר ואזורי הדחייה עבור =0.05? אזור הדחייה: x5

  12. איזור הדחיה ב) אם מתברר שהתרופה החדשה אכן יעילה יותר, ועוזרת ל- 50% מהחולים, מה הסיכוי שהחוקר יחליט בצדק שהתרופה אכן יעילה? עלינו לחשב את p(x5) כאשר p=0.5. 1-=0.22656 עוצמה = 1-β

  13. ג) אם 4 מתוך 7 החולים הגיבו לתרופה, מה תהיה מסקנת החוקר ברמת בטחון של 95%? 4 נופל באזור אי הדחייה, לכן לא ניתן לדחות את H0. ברמת בטחון של 95% לא ניתן לומר שהתרופה החדשה יעילה יותר מהתרופות הטיפיקליות.

  14. קירוב נורמלי של הבינום ישנם מקרים בהם צורת ההתפלגות הבינומית מזכירה לנו את צורת ההתפלגות הנורמלית n=10, p =1/2 גם כאשר 1/2, אם n מספיק גדול חוסר הסימטריה שבין הזנבות יהיה זניח. n=20, p =0.3

  15. מה זה n מספיק גדול? זה פונקציה של p. ככל ש-p שונה יותר מ-1/2 כך דרוש n גדול יותר. כלל אצבע: אם n*p5 (כאשר p הוא הקטן מבין p ו-q) ניתן לבצע קירוב נורמלי של הבינום. זאת אומרת שקיימת עקומה נורמלית שאם "נלביש" אותה על ההתפלגות הבינומית, הפער שבין שתי ההתפלגויות יהיה זניח. מה יהיו הפרמטרים של העקומה הנורמלית? ניתן להוכיח ש: לדוגמא אם זורקים מטבע 10 פעמים, כמה פעמים אנו נצפה שייפול על עץ? 10*1/2=5 כמו כן ניתן להוכיח ש: זהו פיתוח של De Moivre-Laplace, המבוסס על:

  16. ההתפלגות הבינומית היא בדידה ואילו ההתפלגות הנורמלית רציפה, לכן בקירוב הנורמלי אנו נבצע תיקון לרציפות (שימוש בגבולות אמיתיים). דוגמא: n=10 p=0.5 למה שווה p(x7)? לפי הקירוב הנורמלי: p(x6.5) לפי הבינום המדויק: בזנב התחתון נוסיף 1/2. 1-NORMSDIST(0.95)=0.1712 או לחלופין עמודת C בטבלת z. p(x7)=0.1719

  17. ידוע כי בכלל האוכלוסייה ההסתברות להיות חולה בשפעת ביום נתון היא 0.4. המורה שושנה חוששת שמאחר ותלמידיה לא אוכלים מספיק ירקות, מערכת החיסונית שלהם פגיעה יותר ולכן סיכויים לחלות גבוה יותר. ביום מסוים, מתוך 15 תלמידים חלו 12. האם ניתן לומר ברמת בטחון של 95% שמספר החולים גבוהה במיוחד? דוגמא: n*p=15*0.4=6>5 לפי הבינום המדויק: לכן ניתן לבצע קירוב לנורמלי. p(x12)= =0.05 הנחות: אי תלות בין הילדים 1-NORMSDIST(2.9)=0.0019<0.05 לכן ברמת בטחון של 95% ניתן לדחות את H0... טעות נפוצה: לחלק את סטיית התקן של הת' הדגימה בשורש n. אין לעשות זאת!!

  18. מהי עוצמת המבחן שביצעת אם ידוע שבקרב ילדים שלא אוכלים מספיק ירקות הסיכוי לחלות בשפעת הוא 0.5? חישוב אזור הדחייה: אבל חייבים לעבור למסברים בדידים. אם מספר נופל ב"חלקו" באזור הדחייה ו"חלקו" באזור אי הדחייה הוא יהיה כולו באזור אי הדחייה. במקרה שלנו 9 נופל חלקו באזור אי הדחייה לכן הוא ישתייך לאזור אי הדחייה. אזור הדחייה: x10. עוצמת המבחן שווה להסתברות לקבל x10 תחת H1 . במקרה של הקירוב הנורמלי של הבינום: 1-=1-NORMSDIST(1.03)=0.15

  19. מבחן לבדיקת הבדל בין שתי פרופורציות עבור מדגמים גדולים כמו במבחן t, מה קורה כאשר אנו לא יודעים את  באוכלוסייה? במקביל למבחן t למדגמים בלתי תלויים, ניתן לדגום 2 מדגמים ולהשוות את פרופורציית ההצלחה ביניהם. למרות שאנו נעבוד עם סטטיסטיים במקום פרמטרים, עדיין נשתמש בהתפלגות z. מחשבים את: סטטיסטי המבחן יהיה:

  20. המורה שושנה חוששת שתלמידים תל-אביבים אשר לא אוכלים מספיק ירקות, פגיעים יותר לשפעת מאשר קיבוצניקים. היא דגמה מקרית 30 תל-אביבים ו-20 קיבוצניקים ובדקה ביום מסוים את מספר החולים בכל מדגם. האם ניתן לומר ברמת בטחון של 95% שמספר החולים גבוהה יותר בקרב ילדים תל-אביבים, אם היא מצאה 12 חולים בקרב ילדי ת"א ו-5 בקרב הקיבוצניקים? דוגמא =0.05 1-NORMSDIST(1.097)=0.136>0.05 z=1.097, p=0.136 לכן לא נוכל לדחות את H0 ברמת בטחון של 95%. עבור מדגמים גדולים התיקון לרציפות זניח

More Related