help statistiek
Download
Skip this Video
Download Presentation
Help! Statistiek!

Loading in 2 Seconds...

play fullscreen
1 / 40

Help! Statistiek! - PowerPoint PPT Presentation


  • 463 Views
  • Uploaded on

Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Help! Statistiek!. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde woensdag in de maand, 12-13 uur 19 november : Robuuste statistiek 17 december : Resampling methoden

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Help! Statistiek!' - cirila


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
help statistiek
Doorlopende serie laagdrempelige lezingen,

voor iedereen vrij toegankelijk.

Help! Statistiek!

Doel: Informeren over statistiek in klinisch onderzoek.

Tijd: Derde woensdag in de maand, 12-13 uur

19 november : Robuuste statistiek

17 december : Resampling methoden

21 januari : Poisson regressie

Sprekers: Vaclav Fidler, Hans Burgerhof, Wendy Post

DG Epidemiologie

overzicht
Overzicht
  • Wat is robuuste statistiek
  • Introductie data (van dr. A.J. de Vries) met

gebruikelijke analyse

  • Beschrijvende statistiek
    • Locatie parameters
    • Spreidingsmaten
    • Outlier detectie
  • Nonparametrische toetsing
  • Bootstrap
robuuste statistiek
Robuuste statistiek?

Hans Burgerhof

wat is robuuste statistiek
Wat is robuuste statistiek

Methoden die robuust zijn tegen schendingen van modelveronderstellingen zoals normaliteit, covariantie structuren en lineaire verbanden.

Robuust zijn tegen:

weerstand bieden aan

minder gevoelig zijn voor

kunnen tegen een stootje

4

slide5
Data

Data van hartoperatie patiënten:

Heeft het reinigen van bloed effect, en zo ja, met welke methode?

RCT:

4 behandelingsarmen (methoden):

controle

cell saver

filter

cell saver+filter

In deze lezing

slechts 10% van alle patienten: 74 patienten

kreatinine level in bloed in eerste uur

Vraag: Is er een verschil tussen mannen en vrouwen?

5

slide6
Data

Is er een verschil tussen mannen en vrouwen m.b.t.

gemiddelde kreatinine level ?

Statistische toets

H0: µman = µvrouw

H1: µman ≠ µvrouw

Twee steekproeven t-test

6

slide7
Data

T-toets voor 2 onafhankelijke waarnemingen

Conclusie: geen verschil in kreatinine levels

7

slide8
Data

Hoe zit het met de aannames?

Onafhankelijke waarnemingen o.k.

Waarnemingen zijn normaal verdeeld niet o.k.

Beide groepen hebben zelfde variantie o.k.

In hoeverre geeft niet-normaliteit een ‘verkeerd’ resultaat?

Mogelijke oplossing:

Transformatie van gegevens: ln transformatie

8

slide10
Data

Ln transformatie

Conclusie: wel verschil tussen beide groepen

10

slide11
Data

Ln transformatie

11

locatie maten
Locatie maten

Locatie maat:

Waarde die het best de data beschrijft :

Welke waarde ligt het dichtst bij alle punten?

(dus in termen afstand)

Gemiddelde

Mediaan

γ% Trimmed mean

γ% Winsorized mean

locatie maten1
Locatie maten

Maat voor robuustheid:

Finite-sample break down point van een steekproefgrootheid:

In Nederlands: Eindige steekproef breekpunt

Kleinste deel van de waarnemingen die de steekproefgrootheid willekeurig groot of klein kan maken

locatie maten2
Locatie maten

Kleinste deel van de waarnemingen die de steekproefgrootheid willekeurig groot of klein kan maken

Gemiddelde 1/n

Mediaan 1/2

γ% Trimmed mean γ%

γ% Winsorized mean γ%

spreidingsmaten
Spreidingsmaten

Variantie en standaarddeviatie

- Median Absolute Deviance (MAD)

Interkwartielafstand (Interquartile Quartile

Range (IQR))

spreidingsmaten1
Spreidingsmaten

Median Absolute Deviance (MAD)

Bereken de mediaan van de waarnemingen, Med

Trek Med van alle waarnemingen af, en neem absolute waarden

Bereken de mediaan van deze absolute waarden

Uitkomst: MAD

Als waarnemingen normaal verdeeld zijn:

MADN = MAD/0.6745

Is een schatter voor de populatie standaarddeviatie

spreidingsmaten2
Spreidingsmaten

Interkwartiel afstand : IQR

Bereken eerste kwartiel Q1 (25 percentiel)

Bereken derde kwartiel Q3 (75 percentiel)

IQR = Q3 – Q1

Zegt iets over de middelste 50%

Onder normaliteit: IQR = 2*MAD

Gebruikt in boxplots

spreidingsmaten3
Spreidingsmaten

Boxplot : IQR

spreidingsmaten4
Spreidingsmaten

Finite sample break down?

- Variantie en standaarddeviatie 1/n

- Median Absolute Deviance (MAD) 1/2

- Interkwartielafstand (IQR) 1/4

outlier detectie
Outlier detectie

Gebaseerd op

Standaarddeviatie:

Verklaar waarneming outlier als:

|Xi - x |/ s > 2.24

MAD

Verklaar waarneming als outlier als

|Xi - med |/ MADN > 2.24

IQR

verklaar waarneming als outlier als

Xi < q1 - 1.5*IQR of als Xi > q3 + 1.5*IQR

slide21
Data

Is er een verschil tussen mannen en vrouwen m.b.t.

gemiddelde kreatinine level ?

Beantwoord dit voor alle waarnemingen zonder outliers

(gebaseerd op methode 2, via MAD en mediaan)

Er zijn in totaal 5 ouliers (van de 74).

H0: µman = µvrouw

H1: µman ≠ µvrouw

Twee steekproeven t-test

21

slide22
Data

Hoe ziet nu de verdeling eruit?

22

slide23
Data

Data inclusief outliers

Zonder outliers

23

slide24
Data

Twee steekproeven t-test

24

nonparametrische toetsen
Nonparametrische toetsen

Nonparametrische methoden worden ook wel verdelingsvrije methoden genoemd: Maken geen veronderstelling omtrent verdeling van de waarnemingen

Meeste nonparametrische toetsen zijn gebaseerd op de rangordes van de waarnemingen i.p.v. op de waarnemingen zelf

Nadeel: meer geschikt voor het toetsen van hypotheses dan voor schatten

mann whitney toets
Mann-Whitney toets

Voeg beide groepen samen

Rangnummer elke waarneming

Bepaal het gemiddelde rangnummer binnen elke groep

H0: De verdeling van kreatinine level is voor mannen en vrouwen gelijk

Onder H0:

Gemiddelde rangnummer van elke groep zal

ongeveer hetzelfde zijn

slide28
Data

Mann-Whitney toets

Conclusie: er is wel verschil tussen de groepen

28

betrouwbaarheidsintervallen bij deze toets in spss
Betrouwbaarheidsintervallen bij deze toets in SPSS?

H0: De verdeling van kreatinine level is voor mannen en vrouwen gelijk:

Kan men vertalen als:

De verschuiving/shift tussen beide verdelingen is 0

Zoek die verschuivingen die net niet een significant

resultaat opleveren bij de Mann-Whitney toets

mann whitney betrouwbaarheidsintervallen in spss
Mann-Whitney: betrouwbaarheidsintervallen in SPSS?

Zoek die verschuivingen die net niet een significant

resultaat opleveren

Tel bij één van de groepen een getal op, zeg x

en doe dan de Mann-Whitney toets

De x-en waarbij de Man-whitney toets net niet

significant worden zijn de onder- en bovengrens:

In onze data zijn dat -2 en -26

bootstrap methode
Bootstrap methode

Wikipedia:

Een bootstrap is een laarslus, een lus die

bovenaan een rijlaars is bevestigd en waaraan

men kan trekken om de laars aan te trekken.

Het is mogelijk iemand op te tillen door aan zijn

laarslussen te trekken.

Het is niet mogelijk jezelf op te tillen door aan je

eigen laarslussen te trekken.

bootstrap methode2
Bootstrap methode

We willen de kansverdeling weten van de populatie die ten grondslag ligt aan de waarnemingen

We hebben slechts de data

Als de data representatief zijn voor de populatie, dan kan

de kansverdeling benaderd worden door een groot

aantal trekkingen met teruglegging uit deze data

De frequentieverdeling van de gesimuleerde data

(steekproefgrootheid) is een schatter voor de theoretische

verdeling

bootstrap methode3
Bootstrap methode

Gegeven een steekproef van 300 waarnemingen,

representatief voor de populatie.

Trek met teruglegging 300 keer een waarneming uit deze steekproef; dit heet een bootstrap sample

Bereken de relevante steekproefgrootheid, bijvoorbeeld het gemiddelde gem1* over de 300 waarnemingen

Herhaal deze twee stappen een groot aantal keren (minstens 1000); men krijgt dan dus gem1*, … gem1000*

Maak een relatieve frequentieverdeling van deze 1000 waarden

Op basis van deze frequentieverdeling kan men dan uitspraken doen over de relevante steekproefgrootheid

bootstrap methode4
Bootstrap methode

Gegeven een steekproef van 300 waarnemingen,

representatief voor de populatie.

Veronderstel

populatie is standaard normaal verdeeld

Steekproefverdeling van het gemiddelde:

Normale verdeling met gemiddelde 0, en

standaarddeviatie 1/300 = 0.057

Neem 10.000 bootstrap samples

bootstrap methode5
Bootstrap methode

Bootstrap resultaten van deze gesimuleerde data

slide37
Data

T-toets voor 2 onafhankelijke waarnemingen

Bootstrap gemiddeld verschil: -14.65

Bootstrap schatting van betrouwbaarheidsinterval: -28.84 ; 0.91

37

slide38
Data

Samenvattend:

38

afsluitende opmerkingen
Afsluitende opmerkingen

Er zijn geavanceerdere methodes van bootstrappen die op een andere manier de verdeling schatten en daardoor andere resultaten zullen geven

Er bestaan ook robuuste regressiemethoden: methoden die gebaseerd zijn op robuuste maten

Beide onderwerpen zullen in de toekomst aan bod komen

afsluitende opmerkingen1
Afsluitende opmerkingen

Referenties:

Wilcox R.R.:

Applying contemporary statistical techniques (2003)

Fundamentals of Modern statistical methods (2001)

Davison A.C. abd Hinkley D.V.

Bootstrap methods and their application (1997)

Volgende Keer : 17 december

ad