Agenda

1 / 20

# Agenda - PowerPoint PPT Presentation

Agenda. Informationer Uformel evaluering Nu møder vi muren (sampling distribution) Opsamling fra sidst Normalfordelingen Dagens øvelser: Feedback på projekt 1 I gang med projekt 2. Status på ”Inferential Methods” Diskret sandsynlighedsfordel.: √

I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.

## Agenda

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.

- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Agenda
• Informationer
• Uformel evaluering
• Nu møder vi muren (sampling distribution)
• Opsamling fra sidst
• Normalfordelingen
• Dagens øvelser:
• Feedback på projekt 1
• I gang med projekt 2

Status på ”Inferential Methods”

• Diskret sandsynlighedsfordel.: √
• Kontinuert ssh. fordeling (normalfordelingen): I dag 1
• Sampling distribution: I dag 2
• Derefter: Konfidensintervaller (= estimation), stikprøvestørrelse og signifikanstest (=hypotesetest).
Opsamling: Diskrete sandsynlighedsfordelinger

μ= 0(0.23) + 1(0.38) + 2(0.22) + 3(0.13) + 4(0.03) + 5(0.01) = 1.38

The standard deviation of a probability distribution, σ, measures its spread.

• Excel har funktionen BINOMIAL.FORDELING
• Man indtaster
• Antal gunstige, f.eks. antal gange en mønt viser krone
• Det samlede antal forsøg (antal kast)
• Sandsynligheden for et gunstigt udfald, f.eks. 0,5
• 0 (for at få en punktsandsynlighed)
Kast med en mønt, P(X=x)=0,5; n=12
• Symmetri
• Position
• Spredning
Learning Objectives
• Normal Distribution
• Using Excel to find probabilities
• 68 – 95 – 99,7 Rule for normal distributions
• Z-Scores and the Standard Normal Distribution
• Using Excel to find probabilities for z-scores
For alle normalfordelinger gælder følgende

Normalfordelingen er symmetrisk (og klokkeformet). Ikke højre eller v. skæv.

Normalfordelingen beskrives fuldstændigt ved μ og σ.

μ angiver placeringen på x-aksen. Jo større μ, des længere til højre ligger fordelingen, jf. fordeling lilla vs rød.

σ angiver spredningen omkring μ. Jo større σ er, des større spredning. jf. blå fordeling vs. rød.

Excel finder ssh. for at Y er mindre end en given værdi, a, P(a<Y).

Arealet under kurven er 1.

Eksempel på brug af normalfordelingen

De besøgende på en hjemmeside bruger i gns. 300 sekunder på forsiden, før de klikker videre til en underside. Besøgstiden er normalfordelt med en standardafvigelse på 50 sekunder.

Hvad er sandsynligheden for at tilfældig besøgende højest bruger 265 sekunder på forsiden?

x = 265, μ = 300, σ = 50. Hvad er P(X<265)? Svaret er 0,24196....

Sandsynligheder i normalfordelingen

De besøgende på en hjemmeside bruger i gns. 300 sekunder på forsiden, før de klikker videre til en underside. Besøgstiden er normalfordelt med en standardafvigelse på 50 sekunder.

X er en random variabel som angiver tiden, før der klikkes videre til en underside.

Hvad er sandsynligheden for at en tilfældig besøgende højest bruger

240 sekunder på forsiden? P(X<240) = 0,1…

330 sekunder på forsiden? P(X<330) = ...

Hvad er sandsynligheden for at en tilfældig besøgende bruger mere end

240 sekunder på forsiden? P(X>240) = 1 - P(X<240) = 1 - 0,12 = 0,88

380 sekunder på forsiden? P(X>380) =

Hvad er sandsynligheden for at en tilfældig besøgende bruger mellem 300 og 330 sekunder på forsiden? P(300<X<330)

P(X<330) = 0,73

P(X<300) = 0,...

P(300<X<330) = 0,73 - ? = 0,2...

Den empiriske regel: 68 – 95 – 99,7% Rule
• 68% of the observations fall within 1 standard deviation of the mean
• 95% of the observations fall within 2 standard deviations of the mean
• 99.7% of the observations fall within 3 standard deviations of the mean
Normal Distribution
• Within what interval do almost all of the men’s heights fall? Women’s height?
Example: 68-95-99.7% Rule
• can be approximated by a normal distribution
• =65 inches; =3.5 inches
• 68-95-99.7 Rule for women’s heights
• 68% are between 61.5 and 68.5 inches
• [ µ = 65  3.5 ]
• 95% are between 58 and 72 inches
• [ µ 2 = 65  2(3.5) = 65  7 ]
• 99.7% are between 54.5 and 75.5 inches
• [ µ 3 = 65  3(3.5) = 65  10.5 ]
Standard normalfordelingen: z-score

En z-score angiver hvor mange (antal) standardafvigelser, X ligger fra μ

Eksempel: X angiver tiden før der klikkes videre til en underside. X er normalfordelt med μ = 300 og σ = 50.

Hvad er sandsynligheden for at en tilfældig besøgende bruger mindre end 240 sekunder på forsiden?

z = (x – μ) / σ = (240 – 300) / 50 = -60 / 50 = -1,2

P(z<-1,2) = 0,1151.

Hvad er sandsynligheden for at en tilfældig besøgende bruger mere end 380 sek. på forsiden?

z = (X – μ) / σ = (380 – 300) / 50 = 1,6

P(z>1,6) = 1 - P(z<1,6)

P(z<1,6) = 0,95.

P(z>1,6) = 1 - 0,95 = 0,05.

Opgaver

Tegn en standard normalfordeling og find ssh. for at z er ...

Mindre end -1.42

Større end 1.42

Mindre end 1.25

Mellem -1.42 and 1.25

P(X<x)
• Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek.
• Hvor stor en procentandel af brugerne har et tidsforbrug på under 100 sek.?
• P(X<100) =
• Tjek i Excel
• 15,9% af brugerne har et tidsforbrug under 100 sek
Finding Probabilities
• Draw a picture to show the desired probability under the standard normal curve
• State the problem in terms of the observed random variable X, i.e., P(X<x)
• Standardize X to restate the problem in terms of a standard normal variable Z
• Find the area under the standard normal curve using Excel
P(X>x)
• Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek.
• Hvor stor en procentandel har et tidsforbrug over 100 sek?
• P(X>100) = 1 – P(X<100)
• P(X>100)= 1- 0,1587=0,8413
• Tjek i Excel
• 84.1% af brugerne har et tidsforbrug på mere end 100 sek.
P(X>x)
• Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek.
• Hvor stor en procentandel har et tidsforbrug over 133 sek?
• P(X>133) = 1 – P(X<133)
• P(x>133)= 1-0,... = 0,2...
• ? af brugerne har et tidsforbrug over 133 sek.
P(a<X<b)
• Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek.
• Hvor stor en procentandel har et tidsforbrug mellem 100 og 133 sek?
• P(100<X<133) = P(X<133)-P(X<100)
• Tjek i Excel
• 58% af brugerne har et tidsforbrug mellem 100 og 133 sek.
Find en X værdi givet en sandsynlighed
• Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek.
• 10% af brugerne har et tidsforbrug, som er højere end hvad?
• P(X>x) = 0,10, find x.
• P(X>x)=1-P(X<x)
• Excel bruges til at finde z for P=1-0,1=0,9. Det giver z = 1,28
• Løs ligningen for at finde x:
• 10% af brugerne har et tidsforbrug over 145,6 sek.
• Check: P(X>145,6) = P(Z>1,28) = 0,10