240 likes | 407 Views
Usikkerheter og sannsynligheter. Petter Mostad 2005.09.07. Repetisjon. To typer statistikk Deskriptiv statistikk Statistikk som verktøy for å håndtere usikker informasjon (”inferens-statistikk”) Eksempler på siste type statistikk: Hypotesetester Sannsynlighetsestimater
E N D
Usikkerheter og sannsynligheter Petter Mostad 2005.09.07
Repetisjon • To typer statistikk • Deskriptiv statistikk • Statistikk som verktøy for å håndtere usikker informasjon (”inferens-statistikk”) • Eksempler på siste type statistikk: • Hypotesetester • Sannsynlighetsestimater • Beslutninger under usikkerhet
Repetisjon • En sentral oppgave for statistikken er å skape reproduserbare forskningsresultater • Dessverre inneholder mange publikasjoner (et flertall?) resultater som ikke er reproduserbare. • Vi skal derfor studere sannsynlighetslære: Hvordan man kan anvende sannsynlighetsberegninger for å løse oppgaver som de over.
Utfallsrom • Samlingen av alle mulige utfall i situasjonen du ser på • Du deler opp utfallene bare så langt som er relevant for det spørsmålet du vil studere • På denne måten begynner du å bygge opp en forenklet modell for en liten del av virkeligheten
Eksempler • Terningkast: 6 mulige utfall • Kjønn og barnefødsler: 2 mulige utfall • En ny kreftbehandling: For hver pasient: virker eller virker ikke • Måling av blodtrykket til neste pasient: Et reellt tall (en kontinuerlig variabel) • Modellering av oljereservoarer: En komplett numerisk modell av reservoaret (mange tusen variable)
Sannsynlighet: definisjon via gjentatte forsøk • Hvis man gjentar samme forsøk veldig mange ganger, så vil hyppighetene av forskjellige utfall stabilisere seg ved visse andeler. Disse andelene kalles sannsynlighetene til utfallene.
Sannsynlighet: definisjon via kunnskapsmodell • Sannsynlighetene til utfallene i utfallsrommet angir de ”sjangsene” vår kunnskap anslår for at de ulike utfallene kommer til å skje, eller kommer til å bli observert. • Over tid vil utfall som har x% sannsynlighet ”slå til” x% av gangene.
Eksempler • Terningkast • Sannsynligheten for å bli tatt for sniking om man ikke betaler på trikken • Sannsynlighetnene for hva en ukjent person du stopper på gata skal stemme • Sannsynlighetene for hvordan et oljereservoar kan se ut
Sannsynlighetene er knyttet til kunnskapen om prosessen • Sannsynlighetene er avhengige av kunnskapen den enkelte personen har: • Sjangsen for gutt eller jente ved fødsel er 0.5 uten spesiell kunnskap; ultralyd gir mye mer sikker kunnskap • Sannsynligheter for hva en person skal stemme kan finnes i meningsmålinger; hvis du vet at personen er en kvinnelig bonde så endres sannsynlighetene. • Sannsynlighetene for hvordan et oljereservoar ser ut endrer seg om man får ny kunnskap, nye data.
Sannsynlighetsmodell • Et utfallsrom, sammen med en fordeling av sannsynligheter for alle utfallene. • Sannsynlighetene må summere seg til 1. • Det er denne typen sannsynlighetsmodeller vi må lære oss å regne med.
Begivenheter • Ordet begivenhet blir brukt om en samling av utfall. • Eksempler: • Å få 4 eller mer på terningen • At personen stemmer borgerlig • Sannsynligheten for å få C eller bedre på eksamen. • Sannsynligheten for en begivenhet er summen av sannsynlighetene for utfallene i begivenheten.
Mengdelære for begivenheter A • Grafiske illustrasjoner: Venn-diagrammer • Gitt begivenheter A og B: • Komplement tilsvarer ”ikke A”: • Snitt tilsvarer ”A og B”: • Union tilsvarer ”A eller B”: B
Eksempler • Hvis er begivenheten at hjemmelaget vinner 2-0, så er alle andre resultater • Hvis er begivenheten at hjemmelaget vinner, så er at de taper eller det blir uavgjort • Hvis er at barnet blir en gutt, og at barnet er friskt, så er at det er en frisk gutt • Hvis er regn i morgen, og er at tante Anne kommer ikke i morgen, så er at det blir regn eller at tante Anne ikke kommer.
Sannsynlighetsregning for begivenheter • Siden sannsynlighetene for alle mulige utfall summeres til 1, får vi • Dersom A og B er disjunkte, dvs at er umulig, så får vi • I allmenhet får vi
Eksempler • Hvis sannsynligheten for regn i morgen er 70%, hva er da sannsynligheten for oppholdsvær? • Hvis sannsynligheten for at laget spiller uavgjort er 20%, og at det vinner er 60%, hva er dat sannsynligheten for at det ikke taper? • Hvis Kristoffer sier han er født i februar, hva er sannsynligheten for at han ble født på en fredag eller på den 13?
Sannsynligheten for en begivenhet om det er samme sannsynlighet for alle utfall • Hvis alle utfall har samme sannsynlighet, kalles det en uniform sannsynlighetsmodell • Da kan sannsynligheten for en begivenhet beregnes som antallet utfall i begivenheten delt på det totale antall utfall • Kalles ”gunstige/mulige metoden” i boka
Eksempler • Hva er sannsynligheten for at tallet ”4” trekkes som første tallet i Lotto? • Hva er sannsynligheten for at det første tallet er mindre enn 10? • Hvis jeg samler inn en obligatorisk oppgave i denne klassen, hva er sannsynligheten for at den første oppgaven jeg retter er skrevet av en gutt? • Hvordan kan sannsynligheten for å få utdelt ”flush” i poker beregnes?
Betinget sannsynlighet • Hvis vi får ny informasjon som begrenser utfallsrommet, så beholdes de relative sannsynlighetene til utfallene som er igjen, men de skaleres slik at summen av sannsynlighetene i det nye utfallsrommet blir 1. • Eksempler: • Hvis du vet at terningen viser 4 eller mer, hva er sannsynligheten for at den viser 5?
Betinget sannsynlighet med symboler • Hvis A og B er begivenheter, så har vi • Anta sannsynligheten for sykdom X er 1%, og at den bare fins hos folk med gen Y. Anta 20% av befolkningen har gen Y. Hvis du har gen Y, hva er sannsynligheten for at du har X?
Uavhengige begivenheter • To begivenheter A og B sies å være uavhengige, dersom • Dette er det samme som at • Dermed er det også det samme som at
Eksempler • Hva er sannsynligheten for at alle i en tilfeldig gruppe på 10 mennesker er født på en fredag? • Hva er sannsynligheten for at ingen i gruppen er født på en fredag? • Hva er sannsynligheten for at minst en i gruppen er født på en fredag?
Eksempler fra genetikk • Alle personer har to alleler per locus • Nedarving av allel fra far er uavhengig av nedarving av allel fra mor • Recessive og dominante gener: • Genet for blå øyne er recessivt • Genet for Huntingtons sykdom er dominant • Mange gener er verken dominante eller recessive
Genetikk og sannsynligheter • Hvis mor er AB og far er BC, hva blir utfallsrommet for barnet? Hva blir sannsynlighetene? • Hvis mor og far både har Huntingtons sykdom, hva er sannsynligheten for at barna også får sykdommen? • Hvis mor og far har brune øyne, og storesøster har blå øyne, hva er sannsynligheten for at lillesøster også har blå øyne?
Flere eksempler • Anta 1% av en befolkning er bærere av sigdcelle-anemi. Anta to (friske) personer fra denne befolkningen får barn sammen. Hva er sannsynligheten for at de får et barn med sigdcelle-anemi?