1 / 31

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen. Repetition. Lov om total sandsynlighed Bayes’ sætning Stokastisk variabel – diskret: Endeligt antal værdier Sandsynlighedsfordeling: Tabel med ssh. for hvert x, P ( X = x ) .

jamese
Download Presentation

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

  2. Repetition • Lov om total sandsynlighed • Bayes’ sætning • Stokastisk variabel – diskret: Endeligt antal værdier • Sandsynlighedsfordeling: Tabel med ssh. for hvert x, P(X=x). • Kumulativ fordelings funktion • Middelværdi • Varians • Standard afvigelse

  3. Bernoulli fordelingen • Hvis et eksperiment består af et enkelt forsøg og forsøget enten kan være en succes eller en fiasko, så kaldes forsøget for et Bernoulli forsøg • X er en Bernoulli variabel med sandsynligheds-parameter p, hvis P(X=1)=p og P(X=0)=1-p. • Middelværdi og varians for en Bernoulli variabel: • E(X) = • E(X²) = • V(X) = • Hvis for eksempel p=0,7: • E(X)= V(X)=

  4. Lidt mere repetition… • Lad X1, X2,…, Xn være uafhængige Bernoulli variable, alle med samme sandsynligheds-parameter p. • S= X1+X2+…+Xn er summen af stok. var. • E(S) = E(X1+X2+…+Xn) = • V(S) = V(X1+X2+…+Xn) =

  5. Binomial fordeling • Binomial fordelingen er resultatet af et Binomialt eksperiment: • Det Binomiale eksperiment består af et fast antal (n) Bernoulli forsøg. • Så i hvert forsøg er der to mulige udfald, succes og fiasko. • P(”succes”)=p, dvs. sandsynligheden for success er den samme i hvert hvert forsøg. (Ligeledes for P(”fiasko”)=1-p=q) • Forsøgene er uafhængige

  6. Binomial fordeling - Eksempler • Eksempler: • Kast med en mønt n gange. S=(krone (succes), plat (fiasko)). Hvis fair mønt p=0,5. Sandsynligheden er konstant og forsøgene er uafhængige, da et møntkasts udfald ikke påvirker udfaldet af det næste kast • Træk et kort n gange. S=(”spar (succes)”, ”andet (fiasko)”). P(spar)=0,25 er konstant, hvis vi lægger kortet tilbage i bunken igen, ellers ikke. Uafhængige. Bemærk! Uden tilbagelægning vil P(nummer 2 spar, hvis nummer 1 er en spar)= 12/51 og dermed ikke konstant sandsynlighed

  7. Binomial eksempel • Kast en mønt 5 gange og lad X være antallet af krone. • Der er 25 = 32 mulige sekvenser af plat og krone i udfaldsrummet. Af disse er der 10 med 2 krone (X=2): KKPPP KPKPP KPPKP KPPPK PKKPP PKPKP PKPPK PPKKP PPKPK PPPKK Sandsynligheden for hvert af disse 10 udfald er p2q3= (1/2)2(1/2)3=(1/32), så sandsynligheden for 2 krone i 5 kast er: P(X = 2) = 10·(1/32) = (10/32) = 0.3125 Antal udfald med 2 krone Sandsynligheden for hvert af disse udfald

  8. Binomial-fordelingen generelt 1. Sandsynligheden for en given sekvens af x succes’er ud af n forsøg med sandsynlighed for succes p og sandsynlighed for fiasko q er lig med: pxq(n-x) 2. Antallet af forskellige sekvenser af n forsøg, der resulterer i x succes’er er lig med antallet af valg af x elementer ud af n elementer: n fakultet:

  9. Binomial-fordelingen Binomial sandsynligheds fordeling: hvor : p er sandsynligheden for succes i et enkelt forsøg, q = 1-p, n er antallet af forsøg, og x er antallet af succeser. Egenskab: Notation:

  10. Middelværdi, varians og standardafvigelse af en Binomial fordeling Antag X~B(n,p) Eksempel: K tæller antallet af kroner i 5 kast (n=5) med en fair mønt (p=0,5): Middelværdi Varians Standardafvigelse

  11. Kumulativ Binomial fordeling (Tabel 1, Appendiks C) Binomial kumulativ fordelingF(k) og sandsynligheds fordelingP(k) for K, antallet af krone i 5 kast med en fair mønt. Individuelle sandsynligheder fra kumulative sandsynligheder Eksempel: n=5 p=0.50

  12. Binomial sandsynligheder - eksempel 60% af SparNord aktierne ejes af mig ;-). En stikprøve på 15 aktier vælges. Hvad er sandsynligheden for at højst 3 af dem ejes af mig?

  13. Andre diskrete fordelinger • Binomial: • X=Antal succeser i n forsøg. P(”succes”)=p fast. • Negativ Binomial • X=Antal forsøg inden man har n succeser. • Hypergeometrisk • X=Antal gode blandt n valgte, når der totalt er N at vælge imellem, hvoraf S er gode. • Poisson • Typisk antal hændelser i et givet tidsrum, fx antal uheld.

  14. Diskret stokastisk variabel: Tæller hændelser Har et tællelig antal af mulige værdier Har diskrete hop mellem efterfølgende værdier Har målelige sandsynligheder for hver enkelt værdi Sandsynlighed er højde En kontinuert stokastisk variabel: Måler (højde, vægt, hastighed, løn) Har et uendelig antal af mulige værdier Går kontinuert fra værdi til værdi Har ingen målelig sandsynlighed til hver individuel værdi Sandsynlighed er areal For eksempel: Binomial n=3 p=.5 x P(x) 0 0.125 1 0.375 2 0.375 3 0.125 1.000 M i n u t e s t o C o m p l e t e T a s k B i n o m i a l : n = 3 p = . 5 0 . 3 0 . 4 0 . 3 0 . 2 ) x ) ( x P ( 0 . 2 P 0 . 1 0 . 1 0 . 0 0 . 0 1 2 3 4 5 6 0 1 2 3 M i n u t e s Diskrete og kontinuerte stokastiske For eksempel: Det skraverede område angiver sandsynligheden for mellem 2 og 3 minutter.

  15. M i n u t e s t o C o m p l e t e T a s k : F o u r t h s o f a M i n u t e M i n u t e s t o C o m p l e t e T a s k : B y H a l f - M i n u t e s 0 . 1 5 0 . 1 0 ) ) x x ( ( P P 0 . 0 5 0 . 0 0 0.0 . 1 . 0 1 . 5 2 . 0 2 . 5 3 . 0 3 . 5 4 . 0 4 . 5 5 . 0 5 . 5 6 . 0 6 . 5 0 1 2 3 4 5 6 7 M i n u t e s M i n u t e s ) z ( f 0 1 2 3 4 5 6 7 Minutes Kontinuert fordeling Kvart-Minut Intervaller Halv-Minut Intervaller Uendelig små intervaller Ottendedel-Minut Intervaller Tæthedsfunktion M i n u t e s t o C o m p l e t e T a s k : E i g h t h s o f a M i n u t e ) x ( P 0 1 2 3 4 5 6 7 M i n u t e s

  16. Kontinuerte stokastiske variable – tæthedsfunktion og fordelingsfunktion • Svarer til sandsynligheds fordeling for diskrete variable • For en tæthedsfunktionf(x) defineret på intervallet fra a til b gælder at: • f(x)≥0 for alle x mellem a og b • Det totale areal under kurven mellem a og b er 1. • Sandsynligheden for at x ligger i et giver interval (indehold i intervallet fra a til b) er arealet under kurven for dette interval. • Den kumulative fordelingsfunktionF(x) er givet som: • F(x)=P(X≤x) = ”arealet under f(x) mellem den mindste mulige værdi af x (typisk minus uendelig) og x”.

  17. Tæthedsfunktion og fordelingsfunktion F(x) 1 F(b) F(a) 0 a x b f(x) NB: P(X=x)=F(x)-F(x)=0 x a b 0

  18. Integrationsbonusslide! • Stok. Var: Diskret Kontinuert • Regel • Regel • Middelværdi: • E(X2) • Varians:

  19. Hele arealet under f(x) = 1/(b – a) * (b – a) = 1.00 Uniform fordeling uniform [a,b] tæthed: 1/(b – a) for a £ x£ b f(x)= 0 ellers E(X) = (a + b)/2; V(X) = (b – a)2/12 Uniform [a, b] fordeling f(x) 1/(b-a) Arealet under f(x) fra a1 til b1 = P(a1£X£ b1) = (b1 – a1)/(b – a) a a1 b1 b x

  20. Hele arealet under f(x) = 1/(5-0) * (5 – 0) = 1.00 Uniform fordeling uniform [0,5] tæthed: 1/5 for 0 £ x£ 5 f(x)= 0 ellers E(X) = (0 + 5)/2; V(X) = (5 – 0)2/12 Uniform [a, b] fordeling f(x) 1/5 Arealet under f(x) fra 1 til 3 = P(1£X£ 3) = (3 – 1)/(5 –0) = 2/5 = 0,4 0 1 3 5 x

  21. Eksponential-fordeling Eksponential-fordelingen Tæthedsfunktionen er givet ved: Middelværdi og standard-afvigelsen er begge lige 1/λ Den kumulative fordelings-funktion er givet ved: Eksponential fordeling : l = 2 2 ) x ( f 1 0 0 1 2 3 Tid Den eksponentiale fordeling bruges typisk som model for ”ventetiden” mellem to hændelser, fx. tiden mellem to maskinsammenbrud eller andre ”ulykker”.

  22. Normal-fordelingen • Normal fordelingen er en vigtig fordeling, blandt andet fordi mange andre fordelingen, kan approksimeres til den. • Desuden er mange teststørrelser normal-fordelte – kommer senere i kurset • Bland andre Carl F. Gauss (1777-1855) fandt frem til den, derfor kaldes den også den Gaussiske fordeling. Gauss Gaussfordeling Må ikke printes ;-)

  23. Normal fordelingen • Dens kendetegn er: • Klokkeformet og symmetrisk omkring dens middelværdi • Middelværdi=median=mode • Den er karakteriseret ved en middelværdi μ og varians σ²(eller standard afvigelse σ). • Notation: X~N(μ,σ²) betyder, at X følger en normal fordeling med middelværdiμ og varians σ² • Arealet under kurven indenfor zσaf middelværdien, er den samme for enhver normal fordeling, uanset middelværdi og standard afvigelse. • Er uanset parametre værdier, defineret for alle x (dvs x kan antage værdier fra minus uendelig til plus uendelig)

  24. Tæthedsfunktionen for normal-fordelingen Tæthedsfunktionen for normal-fordelingen: N o r m al-fordelingen :  = 0 ,  = 1 0 . 4 0 . 3 ) x 0 . 2 ( f 0 . 1 0 . 0 - 5 0 5 x

  25. Eksempler på normal-fordelinger μ= 0.0 μ= 1.0 μ= 2.0 Samme varians Samme middelværdi. σ= 2.0 σ= 0.5 σ= 1.0

  26. Standard afvigelsen σ når X~N(μ,σ2) • Cirka 68% af all observationer ligger indenfor en standard afvigelse fra middelværdien • Cirka 95% af alle observationer ligger indenfor to standard afvigelser fra middelværdien • Cirka 99.7% af alle observationer ligger indenfor 3 standard afvigelser fra middelværdien

  27. ≈68% σ ≈95% 2σ ≈99,7% 3σ Arealet under kurven indenfor kσ af middelværdien, er den samme for enhver normal fordeling, uanset middelværdi og standard afvigelse.

  28. Sum af uafhængige normal-fordelte stokastiske variable • Hvis X1, X2, …, Xn er uafhængige normal-fordelte stokastiske variable, så er deres sum S også normal-fordelt med • E(S) = E(X1) + E(X2) + … + E(Xn) • V(S) = V(X1) + V(X2) + … + V(Xn) • Bemærk: Det er varianserne der kan lægges sammen, ikke standard afvigelserne! • Eksempel: • S = X1 + X2 + X3. Så er E(S) = 10 + 20 + 30 = 60 og V(S) = 1 + 2 + 3 = 6. Standard afvigelsen af S er = 2.45.

  29. Linearkombinationer af uafhængige normal-fordelte stokastiske variable • Hvis X1, X2, …, Xneruafhængige normalfordelte stokastiske variable, så vil variablen Q defineret som Q = a1X1 + a2X2 + … + anXn + b også være normal fordelt, med: • E(Q) = a1E(X1) + a2E(X2) + … + anE(Xn) + b • V(Q) = a12 V(X1) + a22 V(X2) + … + an2 V(Xn) • Bemærk igen, at det er varianserne, der summeres og ikke standard afvigelserne.

  30. Eksempel 4.3: Lad X1 , X2 , X3og X4være uafhængige normal fordelte stokastiske variable med middelværdi og varians givet som i tabellen. Find middelværdien og variansen af Q = X1 - 2X2 + 3X2 - 4X4 + 5 Eksempel E(Q) = 12 – 2(-5) + 3(8) – 4(10) + 5 = 11 V(Q) = 4 + (-2)2(2) + 32(5) + (-4)2(1) = 73 SD(Q) =

More Related