Statistiek voor dataverwerking
This presentation is the property of its rightful owner.
Sponsored Links
1 / 25

Statistiek voor Dataverwerking PowerPoint PPT Presentation


  • 131 Views
  • Uploaded on
  • Presentation posted in: General

Statistiek voor Dataverwerking. H. R. Zielman ICT , voorjaar 2004 boek: Weiss, N.A., Elementary Statistics. Agenda. Herhalen beschrijvende statistiek Kans Kansrekening Kansverdeling Binomiale verdeling Hypergeometrische verdeling Normale verdeling + benaderingen. Liggings schalen.

Download Presentation

Statistiek voor Dataverwerking

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Statistiek voor dataverwerking

Statistiek voor Dataverwerking

H. R. Zielman

ICT , voorjaar 2004

boek: Weiss, N.A., Elementary Statistics


Agenda

Agenda

  • Herhalen beschrijvende statistiek

  • Kans

  • Kansrekening

  • Kansverdeling

  • Binomiale verdeling

  • Hypergeometrische verdeling

  • Normale verdeling + benaderingen

ZIL/ICT Data verwerking (STAT)


Liggings schalen

Liggings schalen

ZIL/ICT Data verwerking (STAT)


Boxplot

Boxplot

  • Grafiek waarin karakteristieken van een verdeling weergegeven worden

  • Bepaal Q1,Q3, mediaan, xmin en xmaxen 1,5 * (Q3 - Q1)

  • Trek een box van Q1 tot Q3

  • Geef mediaan aan

  • trek lijnen van box tot berekende grens

  • geef eventuele uitbijters aan

ZIL/ICT Data verwerking (STAT)


Klassificeren

Klassificeren

  • Ordenen van n gegevens

  • Aantal klassen:

  • Klassen zijn b.v.k. even breed

ZIL/ICT Data verwerking (STAT)


Histogram

Histogram

  • Horizontale as (ratio-schaal) verdelen in intervallen

  • Kolom plaatsen boven elk interval

  • Oppervlak van kolom geeft frequentie aan!

  • Kolomhoogte: frequentie / kolombreedte

  • Assen: als andere figuren

ZIL/ICT Data verwerking (STAT)


Histogram 2

Histogram 2

  • Boekenprijzen (Hfl):

  • 25 45 35 25 30 70 20 45 65 30 40 4035 45 55 35 32 3728 45 49 39 40 6029 34 47 35 45 4935 45 34 28 34 5448 38 32 39 45 58

ZIL/ICT Data verwerking (STAT)


Histogram 3

Histogram 3

  • Aantal klassen: (42) = 7

  • hoogste - laagste = 70 - 20 = 50

  • klasse breedte ca. 50 / 7 ca. 7

ZIL/ICT Data verwerking (STAT)


Histogram 4

Histogram 4

  • klassefrequentiefreq/kb (eenh=5)17,5 - 27, 5 33/227,5 - 32,577/132,5 - 37,599/137,5 - 42,566/142,5 - 47,588/147,5 - 57,555/257,5 - 77,544/2

ZIL/ICT Data verwerking (STAT)


Kans definities

Kans - definities

  • Laplace: P(gebeurtenis) = gunstig/totaal

  • Experimenteel: P(gebeurtenis)= ng / nt

  • Axiomatisch

    • totale kansruimte: S, uitkomst deelvz A

    • i P(S) = 1

    • ii 0  P(A)  1 voor alle A

    • iii P (A  B  C …) = P(A) + P(B) + ….

ZIL/ICT Data verwerking (STAT)


Termen

Termen

  • Toevalsvariabele / kansvariabele / stochastische variabele / stochast :Numerieke waarde die aan elke uitkomst van een experiment wordt toegekend

  • Stochast is een functie die gedefinieerd is op de uitkomstenruimte v.e. kansexperiment

ZIL/ICT Data verwerking (STAT)


Voorbeelden

Voorbeelden

  • Discrete stochast:2 * werpen munt:{ KK, KM, MK, MM } -> { 0, 1, 2 }( P(1) = 0,5 , P(2) = 0,25 )

  • Continue stochast:Tijd tussen 2 * opwerpen:(P (0:00:02:05) = 0 )

    • (probleem: kans op precies deze waarde is heeeel klein)

ZIL/ICT Data verwerking (STAT)


Gebruik

Gebruik

  • Naam v. discrete stochast : k(Weiss: K of X)

  • uitkomst v. discrete stochast: k

  • naam v. continue stochast: x

  • uitkomst v. continue stochast: x

  • {0,1,2} vormen de uitkomsten verzameling

  • Bij elke uitkomst hoort kans  0,  = 1

ZIL/ICT Data verwerking (STAT)


Kans rekening

Kans rekening

  • Som regel:P ( A  B) = P(A) + P(B) - P ( AB)

  • Produkt regel:P ( A  B) = P(A) * P(B)

  • bij ONafhankelijke gebeurtenissen

ZIL/ICT Data verwerking (STAT)


Kans functie

Kans functie

  • : f(k) weergave v.d. kansen uit experiment

  • : f(k) = P(k = k) : de kans dat de stochast kde waarde k aanneemt

  • : f(k) >= 0

  • : kf(k) = 1

ZIL/ICT Data verwerking (STAT)


Kans verdeling

Kans verdeling

  • Complete beschrijving v.e. random variabele, dus een overzicht van alle mogelijke uitkomsten v.e. kansexperiment met de bijbehorende kans.

    • tabel

    • formule

    • grafiek

  • Zie de beide volgende sheets uit Weiss

ZIL/ICT Data verwerking (STAT)


Statistiek voor dataverwerking

Vb. Weiss Table 5.7: Probability distribution of the random variable X, the number of siblings of a randomly selected student

ZIL/ICT Data verwerking (STAT)


Statistiek voor dataverwerking

Vb. Weiss Figure 5.21: Probability histogram of the random variable X, the number of siblings of a randomly selected student

ZIL/ICT Data verwerking (STAT)


Ligging spreiding

Ligging & spreiding

  • Verwachtingswaarde E (k)  k k * f(k) = k k P(k = k)

    • k

  • VariantieVar (k)  k (k - E(k))2 * P(k = k)

    • 2k

    • k =  Var(k)

ZIL/ICT Data verwerking (STAT)


Binomiale verdeling

Binomiale verdeling

  • Twee mogelijke uitkomstensucces met kans p, falen met q = ( 1 - p)

  • Experiment wordt n keer herhaald

  • n P(k)=k =   pk qn-k k

  • E(k) = n*p, Var(k) = n * p * q

ZIL/ICT Data verwerking (STAT)


Statistiek voor dataverwerking

Vb Weiss Table 5.20: Probability distribution of the random variable X, the number of people out of three that are alive at age 65 (overlevingskans 20-jarigen tot 65 p = 0.8)

ZIL/ICT Data verwerking (STAT)


Statistiek voor dataverwerking

Vb Weiss Fig 5.25: Probability histogram for the random variable X, the number of people out of three that are alive at age 65

ZIL/ICT Data verwerking (STAT)


Statistiek voor dataverwerking

Figure 5.26: Probability histograms for binomial distributions with parameters n = 6 and (a) p = 0.25, (b) p =0.5, (c) p = 0.75

ZIL/ICT Data verwerking (STAT)


Andere discrete verdelingen

Andere discrete verdelingen

  • Hypergeometrische verdeling:n * trekken ZONDER teruglegging uit een populatie N waarvan M element MET een bepaald kenmerk zijn (bord->uitleg)

  • Poisson verdeling:aantal gebeurtenissen in een periode/gebied

    • aantal deeltjes gif (ppm) in vis

    • aantal server requests per minuut

ZIL/ICT Data verwerking (STAT)


Continue verdelingen

Continue verdelingen

  • Normale verdeling

  • Negatief exponentieel (wachttijden)beknopt op het bord

ZIL/ICT Data verwerking (STAT)


  • Login