Dopasowanie rozkładów
This presentation is the property of its rightful owner.
Sponsored Links
1 / 22

Dopasowanie rozkładów PowerPoint PPT Presentation


  • 129 Views
  • Uploaded on
  • Presentation posted in: General

Dopasowanie rozkładów. Dopasowanie rozkładów- ogólny cel. Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta ) 2 zmienne nie spełniają rozkładu normalnego -> testy nieparametryczne. Dopasowanie rozkładów- ogólny cel.

Download Presentation

Dopasowanie rozkładów

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Dopasowanie rozkładów


Dopasowanie rozkładów- ogólny cel

Porównanie średnich dwóch zmiennych

2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta)

2 zmienne nie spełniają rozkładu normalnego -> testy nieparametryczne


Dopasowanie rozkładów- ogólny cel

Cele prognostyczne

Często dla celów prognostycznych jest wskazane zrozumienie kształtu rozważanego rozkładu populacji.


Najczęściej używane rozkłady

  • Bernoulliego

  • Beta

  • Dwumianowy

  • Chi-kwadrat

  • Wykładniczy

  • F (Snedeckora)

  • Gamma

  • Geometryczny

  • Gompertza

  • Logistyczny

  • Logarytmiczno- normalny

  • Pareto

  • Poissona

  • Prostokątny

  • Rayleigha

  • t-studenta

  • Weibulla

  • NORMALNY


ROZKŁAD NORMALNY

Rozkład o charakterystycznym kształcie "krzywej dzwonowej", symetrycznej w stosunku do średniej.


ROZKŁAD NORMALNY

  • Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:

  • Występuje silna tendencja do przyjmowania wartości położonych blisko środka rozkładu;


ROZKŁAD NORMALNY

  • Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:

  • Dodatnie i ujemne odchylenia od środka rozkładu są jednakowo prawdopodobne;


ROZKŁAD NORMALNY

  • Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:

  • Liczność odchyleń gwałtownie spada wraz ze wzrostem ich wielkości.


ROZKŁAD NORMALNY

Podstawowy mechanizm tworzący rozkład normalny:nieskończoną liczbę niezależnych zdarzeń losowych które generują wartości danej zmiennej.

Przykład: istnieje prawdopodobnie prawie nieograniczona liczba czynników determinujących wzrost człowieka (olbrzymia liczba genów, sposób odżywiania, przebyte choroby itd.). Tak więc należy spodziewać się, że w populacji wzrost podlega rozkładowi normalnemu.


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

1. obliczenie skośności i kurtozy

2. analiza histogramu

3. analiza wykresów P-P

4. testy normalności


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

1. obliczenie skośności i kurtozy

Skośność mierzy odchylenie rozkładu od symetrii.

Jeśli wartość skośności jest wyraźnie różna od zera, wówczas dany rozkład jest asymetryczny.

Rozkład normalny jest symetryczny (skośność jest bliska 0)


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

1. obliczenie skośności i kurtozy

Kurtoza mierzy "spiczastość" rozkładu.

Jeśli wartość kurtozy jest wyraźnie<0, wówczas rozkład jest bardziej płaski, a jeśli jest wyraźnie >0 to rozkład jest bardziej spiczasty niż rozkład normalny.

Wartość kurtozy dla rozkładu normalnego wynosi 0!


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

2. Analiza histogramu


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

3. Analiza wykresów P-P

Wykres prawdopodobieństwo-prawdopodobieństwo

Dystrybuanta empiryczna kreślona jest względem dystrybuanty teoretycznej.

Jeśli teoretyczny rozkład dobrze przybliża rozkład obserwowany, wówczas punkty na wykresie powinny leżeć blisko przekątnej.


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

3. Analiza wykresów P-P


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

W celu zidentyfikowaniarozkładu zazwyczaj dopasowuje się rozkład empiryczny do rozkładu teoretycznego poprzez:

porównanie częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego

4. Testy normalności


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

częstości zaobserwowane w danych rzeczywistych

częstości oczekiwane rozkładu teoretycznego


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

Porównania częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego dokonuje się za pomocą testów statystycznych:

  • chi kwadrat

  • Kołmogorowa-Smirnowa

  • Lillieforsa

  • Shapiro-Wilka

4. Testy normalności


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

Test Kołmogorowa-Smirnowa: Wykorzystuje maksymalną wartość różnicy między dystrybuantą z próby, a założoną dystrybuantą teoretyczną.

p< 0.05 -> rozkład różni się istotnie od normalnego

p> 0.05 -> rozkład jest normalny

4. Testy normalności


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

Test chi-kwadrat:

Stopnie swobody: df = liczba kategorii - liczba parametrów - 1

liczba kategorii - liczba klas w tablicy liczności, w której liczności oczekiwane są wyższe niż 5,

liczba parametrów- liczba parametrów odpowiedniego rozkładu teoretycznego.

p< 0.05 -> rozkład różni się istotnie od normalnego

p> 0.05 -> rozkład jest normalny

4. Testy normalności


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

Test W Shapiro-Wilka: preferowany test normalności ze względu na jego dużą moc w porównaniu z innymi testami.

p< 0.05 -> rozkład różni się istotnie od normalnego

p> 0.05 -> rozkład jest normalny

4. Testy normalności


JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?

Test Lillieforsa: test oparty na badaniu maksymalnej różnicy pomiędzy dystrybuantą empiryczną (z próby) a dystrybuantą rozkładu normalnego o takiej samej średniej i wariancji jak oszacowana z próby

p< 0.05 -> rozkład różni się istotnie od normalnego

p> 0.05 -> rozkład jest normalny

4. Testy normalności


  • Login