Bayes
Download
1 / 21

Bayes - PowerPoint PPT Presentation


  • 127 Views
  • Uploaded on

Bayes. Voor psychologen. Recap Bayes’ Rule. Pierre Simon Laplace. Als een test .99 van de patienten detecteert die aan ziekte Z lijden (dit is erg hoog voor een medische test!) …,. en mijn testresultaat blijkt positief…. …hoe waarschijnlijk is het dan dat ik Z heb?.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Bayes' - sabin


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Bayes

Bayes

Voor psychologen


Recap Bayes’ Rule

Pierre Simon Laplace


Als een test .99 van de patienten detecteert die aan ziekte Z lijden

(dit is erg hoog voor een medische test!)…,

en mijn testresultaat blijkt positief…

…hoe waarschijnlijk is het dan dat ik Z heb?


Vraag1 1: hoe prevalent is Z? Stel: Z lijden 1 patient op de 1000

Vraag 2: Hoe veel false alarms? . Stel: 2 op de 100 gezonde mensen die worden getest.

(Heel goede test! Veel beter dan PSA- niveau voor prostaatkanker en mammogram voor borstkanker!!!)

Kans is .047


Lijkt .047 erg laag? Probeer een ruwe benadering:

Test een groep van 1000 mensen

Daarbij kun je redelijkerwijze 1 zieke verwachten

die hoogstwaarschijnlijk een positieve uitslag krijgt

Van de bijna 1000 gezonden zullen er ongeveer 20 ten onrechte een positieve uitslag krijgen.

Van de 21 positieven is er dus ongeveer 1 ziek, dat is dus een kans van ongeveer .048


Preciezer: benadering: 100000

100

99900

99 -+

1 --

1998…+

97902….-

.1%

1%

2%

99 ziek op 1998+ 99 = 2097 positieven:.04721


Zo’n redenering helpt voor intuitief begrip, maar is niet werkelijk valide: ook bij een steekproef van 10000 weet je niet zeker dat er precies 100 mensen ziek zijn!

Voor een formele behandeling van dit soort vragen moet men meer weten.

Vooral kansen en voorwaardelijke kansen

De kans op A: p(A)

De kans op A gegeven B: p(A|B)

Eerst een voorbeeld, dan een definitie.


De kans op A werkelijk valide: ook bij een steekproef van 10000 weet je niet zeker dat er precies 100 mensen ziek zijn! gegeven B: p(A|B)

een voorbeeld,

p(even) = 5/10 =1/2

  • 4 7

  • 10 3

  • 1 8 5

  • 9 2


De kans op A werkelijk valide: ook bij een steekproef van 10000 weet je niet zeker dat er precies 100 mensen ziek zijn! gegeven B: p(A|B)

een voorbeeld,

p(even) = 5/10 = 1/2

p(deel3) = 3/10

4 7

6 10 3

1 8 5

9 2


De kans op A werkelijk valide: ook bij een steekproef van 10000 weet je niet zeker dat er precies 100 mensen ziek zijn! gegeven B: p(A|B)

een voorbeeld,

p(even) = 5/10 = 1/2

p(deel3) = 3/10

p(even) = 5/10 = 1/2

p(deel3) = 3/10

p( even ^ deel3) = 1/10

4 7

6 10 3

1 8 5

92


De kans op A werkelijk valide: ook bij een steekproef van 10000 weet je niet zeker dat er precies 100 mensen ziek zijn! gegeven B: p(A|B)

een voorbeeld,

p(even) = 1/5 = ½

p(deel3) = 3/10

p(even ^ deel3) = 1/10

Kans op even gegeven deel3:

p(even|deel3) = 1/3

p(even^deel3) 1/10 =----------------------- = ------ p(deel3) 3/10

4 7

610 3

185

92


De kans op A werkelijk valide: ook bij een steekproef van 10000 weet je niet zeker dat er precies 100 mensen ziek zijn! gegeven B: p(A|B)

een voorbeeld,

p(even) = 1/5 = ½ p(deel3) = 3/10 p(even ^ deel3) = 1/10 p(even|deel3) = 1/3 =

p(even^deel3) 1/10 -------------------- = ------ p(deel3) 3/10

47

6 10 3

18 5

92

Kans op deel3 gegeven even:

p(deel3|even) =

p(even^deel3) 1/10 1

---------------------- = -------- = ---

p(even) 5/10 5


Een regel die verband legt tussen p(A|B) en p(B|A)is heel belangrijk voor psychologen!

Onderzoeker weet(?) p(gedrag|proces)

Maar wil weten p(proces|gedrag)

Diagnost weet p(testuitslag|stoornis)

Maar wil weten p(stoornis|testuitslag)

Statisticus weet p(steekproef|populatie)

Maar wil weten p(populatie|steekproef)

Waarnemer “weet” p(stimuli|wereld)

Maar “concludeert” p(wereld|stimuli)


p(A^B) belangrijk voor psychologen!

p(A|B) = ----------

p(B)

p(A^B) en p(B|A) = ------------ p(A)

p(B|A)•p(A) p(A|B)= -------------- p(B)

[basisvorm]

p(B|A)•p(A) = p(A^B)

p(B) = p(B^A) + p(B^¬A)

=p(B|A)•p(A)+p(B|¬A)•p(¬A)

p(B|A)•p(A) p(A|B)= ------------------------------------------ p(B|A)•p(A) + p(B|¬A)•p(¬A)

[standaardvorm]


p(B| belangrijk voor psychologen!A)p(A) p(A|B)= ------------------ p(B)

p(B|A)•p(A) p(A|B)= --------------- p(B)

[basisvorm]

p(B|A)•p(A) p(A|B)= ------------------------------------------- p(B|A)•p(A) + p(B|¬A)•p(¬A)

[standaardvorm]

Odds i.p.v. waarschijnlijkheid: Ω(A) = p(A)/p(¬A)

p(A|B) p(B|A) p(A) ------------- = ------------- • -------- p(¬A|B) p(B|¬A) p(¬A)

posterior odds = likelihood ratio • prior odds


De odds vorm is heel aardig om te laten zien wat er gebeurt als je nieuwe informatie krijgt:

p(A|B) p(B|A) p(A) ------------- = ------------- • -------- p(¬A|B) p(B|¬A) p(¬A)

De diagnostische “kwaliteit” van nieuwe informatie B

(likelihood ratio)

Je oorspronkelijke geloof in A (prior odds)

Je nieuwe geloof in A, nu je B weet (posterior odds)


Niet vergeten: als je nieuwe informatie krijgt:

p(B|A)•p(A) p(A|B)= -------------------- [basis] p(B)

p(B|A)•p(A) p(A|B)= ------------------------------------- p(B|A)•p(A) + p(B|¬A)•p(¬A)

p(B|Ai)•p(Ai) p(Ai|B) = ------------------ [gegeneraliseerde jp(B|Aj)•p(Aj) standaardvorm]

p(A|B) p(B|A) p(A) ------------- = --------- • ----------- [‘odds’]

p(¬A|B) p(B|¬A) p(¬A)


Opnieuw het ziektevoorbeeld: als je nieuwe informatie krijgt:

99% van zieken positief [p(Pos|Z)] 2% van gezonden positief [p(Pos|¬Z)] 0.1% zieken [p(Z)]

p(Pos|Z)•p(Z) p(Z|Pos)= ----------------------------------------- p(Pos|Z)•p(Z) + p(Pos|¬Z)•p(¬Z)

.99 • .001 .00099 = ------------------------ = ------------ = .047 .99 •.001 + .02 •.999 .020079


In de odds vorm: als je nieuwe informatie krijgt:

p(A|B) p(B|A) p(A) ------------- = ------------- • -------- p(¬A|B) p(B|¬A) p(¬A)

.001 ------ .999

(lage) prior odds

.99 ----- .02

(hoge) diagnostische waarde (49.5)

.0495

(nog steeds lage) posterior odds


Problemen: als je nieuwe informatie krijgt:

Wat is kans?

(verschillende antwoorden:

- (limiet van) relatieve frequentie

- maat voor sterkte van geloof

- mate waarin hypothese wordt ondersteund door evidentie)

Kun je zeggen dat een unieke gebeurtenis of de toestand op dit moment (de kans dat ik nu Z heb) een kans p heeft?


Graf van bayes
Graf van Bayes als je nieuwe informatie krijgt:


ad