statistik 11 11 04 n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Statistik: 11.11.04 PowerPoint Presentation
Download Presentation
Statistik: 11.11.04

Loading in 2 Seconds...

play fullscreen
1 / 21

Statistik: 11.11.04 - PowerPoint PPT Presentation


  • 92 Views
  • Uploaded on

Statistik: 11.11.04. Konfidenzintervall und Testen für den Mittelwert und Anteile. Schließende Statistik. oder Statistische Inferenz: Rückschluss aus den Ergebnissen einer Zufallsstichprobe auf die Grundgesamtheit oder ihre Parameter ( m , p , etc.)

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Statistik: 11.11.04' - xander-whitaker


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
statistik 11 11 04

Statistik: 11.11.04

Konfidenzintervall und Testen für den Mittelwert und Anteile

schlie ende statistik
Schließende Statistik

oder Statistische Inferenz: Rückschluss aus den Ergebnissen einer Zufallsstichprobe auf die Grundgesamtheit oder ihre Parameter (m, p, etc.)

  • Das Schätzen von Parametern: für den unbekann-ten Wert eines Parameters (m, p, etc.) ist zu bestimmen
    • ein numerischer Wert (Punktschätzer) oder
    • ein Intervall, in dem der unbekannte Wert mit vorgegebener Wahrscheinlichkeit enthalten ist (Konfidenzintervall)
  • Entscheidung zwischen Behauptungen (Hypothesen)

PI Statistik, WS 2004/05 (8)

beispiel a abf llmenge
Beispiel A: Abfüllmenge
  • Der unbekannte Mittelwert μder Füllmenge soll geschätzt werden
  • Stichprobe (n = 25): = 126.7, s = 0.5.
    • Punktschätzer für μ ist
    • Konfidenzintervall für μ: ±c.
    • Testen von H0: μ = 126.4 gegen H1: μ > 126.4

PI Statistik, WS 2004/05 (8)

beispiel b anteil der berufst tigen unter studierenden
Beispiel B: Anteil der Berufstätigen unter Studierenden
  • Anteilθist unbekannt
  • Stichprobe (n = 200) gibt Anteil von p = 32%
    • Punktschätzer fürθist p = 0.32
    • Konfidenzintervall p ± c
    • Testen die Nullhypothese H0:θ= 0.20 gegen H1: µ >0.20

PI Statistik, WS 2004/05 (8)

stichprobenverteilungen
Stichprobenverteilungen
  • Wahrscheinlichkeitsverteilungen von und p sind Basis von statistischen Entscheidungsverfahren
  • Zentraler Grenzwertsatz

PI Statistik, WS 2004/05 (8)

stichprobenmittelwert
Stichprobenmittelwert
  • Grundgesamtheit: X mit (beliebiger) Verteilung,  und .
  • Stichprobenmittelwert :
    • Mittelwert von ist 
    • Standardabweichung (Standardfehler, standard error) von ist

StdAbw( ) = /n

    • Für nicht zu kleines n: ist näherungsweise normalverteilt

PI Statistik, WS 2004/05 (8)

konfidenzintervall f r
Konfidenzintervall für μ
  • Konfidenzintervall zur Konfidenzzahlγ
  • Mit γ = 0.95

c = 2/n

genauer: c = 1.96 /n

  • 99.7%-iges KI:±3 /n
  • 90%-iges KI:±1.645/n

PI Statistik, WS 2004/05 (8)

beispiel a abf llmenge1
Beispiel A: Abfüllmenge
  • Stichprobe (n = 25): = 126.7, s = 0.5.
  • Punktschätzer für μ ist = 126.7
  • 95%-iges Konfidenzintervall für μ:
  • Einsetzen gibt
  • oder: 126.5 ≤ m ≤ 126.9

PI Statistik, WS 2004/05 (8)

konfidenzintervall wahl von c
Konfidenzintervall: Wahl von c
  • Näherungsweise gilt
  • Wahl von c0 so, dass

oder

  • Aus

folgt

und das 0.975-Perzentil c0 = 1.96

PI Statistik, WS 2004/05 (8)

100 g iges konfidenzintervall f r
100g%iges Konfidenzintervall für μ

Symmetrisches Intervall um so, dass 100g% aller so konstruierten Intervalle das wahre m enthalten

Wahl von z für

gegebenes g :

PI Statistik, WS 2004/05 (8)

wahl des stichprobenumfanges
Wahl des Stichprobenumfanges
  • Halbe Länge c des Konfidenzintervalls hängt ab von n, g und s
  • Bei Vorgabe von c und g kann n berechnet werden:

n =(z(1+g)/2σ/c)2

PI Statistik, WS 2004/05 (8)

unbekanntes s
Unbekanntes s
  • Verwendung der t -Verteilung statt der standardisierten Normalverteilung
  • Student‘sche t -Verteilung:
    • hat einen Parameter (n-1), die „Zahl der Freiheitsgrade“
    • tabelliert, in EXCEL: Funktionen TVERT, TINV
    • symmetrisch, glockenförmig
    • für wachsendes n der Normalverteilung immer ähnlicher

PI Statistik, WS 2004/05 (8)

slide13

t -Verteilung: Perzentile

p-Quantile der t -Verteilung für wachsende Zahl

der Freiheitsgrade und der Normalverteilung

PI Statistik, WS 2004/05 (8)

test f r
Test für μ

Verfahren

  • Lege die Nullhypothese H0 (μ = μ0) und die Alternative H1 fest
  • Wähle den maximal tolerierten p-Wert (probability value), d.i. die Wahrscheinlichkeit, den Fehler 1. Art zu begehen (das Signifikanzniveau, auch mit  bezeichnet); z.B. 0.05
  • Ziehe die Stichprobe, berechne
  • Berechne den p-Wert
  • Verwerfe H0, wenn der p -Wert kleiner als  ist

PI Statistik, WS 2004/05 (8)

beispiel a abf llmenge2
Beispiel A: Abfüllmenge
  • Nullhypothese H0:μ= 125g
  • Alternative H1:μ> 125g
  • Die Entscheidung soll für a = 0.05 getroffen werden
  • Stichprobe (n = 9): = 126.0, s = 1.5
  • Wir verwerfen H0!

PI Statistik, WS 2004/05 (8)

testen von hypothesen
Testen von Hypothesen
  • Methode, auf Basis einer Zufallsstichprobe eine Entscheidung zwischen zwei Behauptungen (Vermutungen) zu treffen
  • Nullhypothese H0: ist jene Vermutung, über die entschieden werden soll (z.B. m = 125)
  • Alternativhypothese: eine konkurrierende Vermutung
  • p -Wert: Wahrscheinlichkeit, den erhaltenen oder einen noch extremeren Wert für die Teststatistik zu erhalten, wenn H0 zutrifft; ein Maß für die Glaubwürdigkeit von H0
  • Fehlentscheidungen:
    • Fehler 1. Art (a-Fehler): richtige H0 wird nicht akzeptiert; der p -Wert ist die Wahrscheinlichkeit, diesen Fehler zu begehen
    • Fehler 2. Art: zutreffende Alternativhypothese wird nicht akzeptiert
  • Signifikanzniveau a: maximal tolerierter p -Wert

PI Statistik, WS 2004/05 (8)

wahl der alternativhypothese
Wahl der Alternativhypothese
  • Das, was ich „beweisen“ möchte
  • Beispiel: Abfüllmenge; H0: m=125g
    • Konsumentenschützer möchte erkennen, wenn m<125g;
    • er möchte ziemlich sicher sein, dass er recht hat, wenn er „m<125g“ behauptet
    • Test mit Signifikanzniveau a=0.05: er irrt höchstens in 5 von 100 Entscheidungen
    • Analog: Produzent möchte erkennen, wenn m>125g oder wenn m≠125g

PI Statistik, WS 2004/05 (8)

inferenz bei anteilen
Inferenz bei Anteilen
  • Schätzwert für Anteil aus Stichprobe (Umfang n): relative Häufigkeit pn
  • Stichprobenverteilung von pn (Zentraler Grenzwert-satz):
  • mit
  • Faustregel für „großes n'':

n q > 5, n (1-q) > 5

PI Statistik, WS 2004/05 (8)

100 g iges konfidenzintervall f r q
100g%iges Konfidenzintervall für q

Symmetrisches Intervall um pn so, dass 100g% aller so konstruierten Intervalle das wahre q enthalten

Wahl von z für

gegebenes g :

In sp ist q durch

pn zu ersetzen!

PI Statistik, WS 2004/05 (8)

beispiel b berufst tige
Beispiel B: Berufstätige
  • Anteil derBerufstätigen unter den Studierendenθist unbekannt
  • Stichprobe (n = 200) gibt Anteil von p200 = 32%
    • Punktschätzer fürθist p = 0.32
    • 95%-iges Konfidenzintervall für θ:

oder: 0.255 ≤ θ ≤ 0.385

Achtung! nθ ≈ 200 (0.32) = 64 > 5, n(1-θ) ≈ 200 (0.68) = 136 > 5

PI Statistik, WS 2004/05 (8)

beispiel b berufst tige1
Beispiel B: Berufstätige
  • Nullhypothese H0:θ= 30%
  • Alternative H1:μ> 30%
  • Die Entscheidung soll für a = 0.05 getroffen werden
  • Stichprobe (n = 200): p200 = 0.32
  • Wir verwerfen H0 nicht!

Beachten Sie!

PI Statistik, WS 2004/05 (8)