Leri statistik teknikleri
Download
1 / 35

İleri İstatistik Teknikleri - PowerPoint PPT Presentation


  • 499 Views
  • Updated On :
  • Presentation posted in: General

İleri İstatistik Teknikleri. Üç tür yalan vardır: Yalan, Kuyruklu Yalan, İstatistik Benjamin Disraeli Dördüncü tür yalan İleri İstatistiktir, Emre Yeterince döndürürseniz veriye her türlü bulguyu itiraf ettirtebilirsiniz.... Anonim

Related searches for İleri İstatistik Teknikleri

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha

Download Presentation

İleri İstatistik Teknikleri

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


İleri İstatistik Teknikleri

Üç tür yalan vardır:

Yalan,

Kuyruklu Yalan,

İstatistik

Benjamin Disraeli

Dördüncü tür yalan İleri İstatistiktir, Emre

Yeterince döndürürseniz veriye her türlü bulguyu itiraf ettirtebilirsiniz.... Anonim

“Hayat fena halde futbola benzer: dört doğru pas yüzde 90 gol demektir” Bir filmden


İleri İstatistik Teknikleri

  • ? Neden “ileri” teknikler?

  • Amaç: Eldeki “veriyi” “bilgiye” dönüştürebilmek

    - Veri vs. Bilgi


İstatistiksel Yöntemler

  • Betimleyici (Descriptive) Yöntemler

    • Verili herhangi bir dağılımı bir ya da birden çok katsayıda anlatabilmek

      - Örn: şirkettekilerin yaş ortalaması

  • Açıklayıcı (Explanatory) Yöntemler

    • Bir veri setinde olası ilişkileri sergilemek

      - Örn: Şirkettekilerin ayakkabı numaralarıyla aldıkları maaş arasındaki ilişki


Betimleyici Yöntemler

  • Amaç: Eldeki dağılımı en iyi şekilde temsil etmek

  • Araçlar:

    • Ortalama:

    • Medyan:

    • Mod:


Betimleyici Yöntemler

  • Veeee....

  • Varyans/Standart Sapma:

  • Neden:


Dağılım:

6,6,6

Ortalama: 6

Medyan: 6

Mod: 6

Std. Sapma: 0

Dağılım:

0,6,12

Ortalama: 6

Medyan: 6

Mod: 6

Std: Sapma: 6

İki Dağılımın Hikayesi

Amaç: Görünenin Ötesine Bakabilmek


Açıklayıcı Analizler

  • Amaç: Verili bir sette olası ilişkileri keşfetmek ya da öngörülen hipotezleri test etmek


Görünen....


Görünenin Arkası....

GenelOrtalama: 51, Std. Sapma: 22

KadınlarOrtalama: 46, Std. Sapma: 23

ErkeklerOrtalama: 46, Std. Sapma: 21


Örnek: Internet Kullanımı


Ve Görünenin Arkası...

Erkekler

Kadınlar


Açıklayıcı Analizler

  • Amaç: İlk bakışta görül(e)meyen ilişkileri sergileyip ilişkisel açıklamalar getirmek

  • Y= f(x)

    ie: İnternet kullanımı= f(cinsiyet)

    ie: Yaşam biçimi= f(gelir)

    ie: Tüketim kalıpları= f(yaşam biçimi)


Örnek: Gelişmişlik ve Yaşam Kalitesi

  • BM verilerinden elde edilen bir tablo...

  • Araştırma sorusu: Gelişmişlik ve Yaşam Kalitesi arasındaki ilişki

  • İşlemleştirme:

    • Gelişmişlik: Kişi Başına Düşen GSMH

    • Yaşam Kalitesi: Çocuk ölümleri


Gruplanmış Veri


Scatterplot


Sorular

  • Grafiği ne kadar temsil ediyor?

  • Ne gibi çıkarımlar yapabiliyoruz?

  • “Forecasting” yapılabiliyor mu?

  • İlişkinin “boyutu” ve “yönü” ölçülebiliyor mu?

Ne Kadar Yeterli?


Amaç: Daha iyi analiz, daha iyi veri

  • Covariance (kovaryans)

  • Correlation Coefficient (korelasyon)


Sonuçlar

  • Covariance:

    2115,318

  • Correlation:

    -0,60165

    Çıkarılacak Sonuç Ne?


Amaç: Nedensel İlişkileri Göstermek

  • Y= f(x)

  • X, Y’nin belirleyicisi mi?

  • X, Y’yi ne kadar belirliyor?

  • X, Y’yi ne yönde belirliyor?


Regresyon Analizi

  • Y= f(x)

  • Y= a+bx

  • Regresyon Denklemi:


Scatterplot


Regresyon Katsayılarının Hesaplanması


Regresyon Analizi Sonuçları


Regresyon Analizinin Açılımları

  • Çoklu Regresyon

  • Kukla Değişkenli Regresyon (Dummy Variable)

  • Binomial/Multinomial Regression


Regresyon Analizinin “cız-kaka”ları

  • Arkasında çok ciddi üç varsayım vardır.

  • Regresyon analizi sadece “interval” ya da “ratio” ölçümleme düzeyinde yapılır

  • “Do not use any mathematical model without understanding it”


Kümeleme ve Birleştirme Analizleri

  • Bütün olgular birbiriyle ilişkilidir. Aradaki ilişkinin 0 olduğu yerde bile...

  • Birleştirme analizlerinin amacı olguların birbirleriyle olan ilişkilerinden yola çıkarak işimizi kolaylaştırmaktır

  • 1. Değişken sayısını azaltabilirler

  • 2. Vaka sayısını azaltabilirler

  • 3. Boyut sayısını azaltabilirler


Faktör Analizi: Değişken Sayısını Azaltmak

  • Analize tabi bütün değişkenler birbiriyle ilişkili.

  • Bu değişkenlerin bazıları birbirleriyle daha kuvvetli ilişki sahibi.

  • Kuvvetli ilişki sahibi değişkenleri birleştirerek aza indirmek mümkün.

  • Değişkenlerarası korelasyon matrisi kullanılarak “faktör”ler inşa ediliyor


Faktör Analizi


“Case” Sayısı Azaltmak: Clustering

  • Verili değişkenler bazında analize alınan “case”ler birbirlerine benzerler

  • Bu benzerlik bir ya da daha fazla boyutta olabilir

  • Benzerliklerden yola çıkarak “clusters” oluşturmak mümkün

  • Benzerlikler metric mesafelerle ölçülüyor


Cluster Analysis I


Cluster Analysis II


Cluster Analysis III


Boyut Sayısını Azaltmak: MDS

  • Analizde gözönünde tuttuğumuz her değişken bir “boyut” sayılabilir.

  • İki-üç boyuttan fazlasını “visualize” etmek kolay değil.

  • Değişkenler arasındaki uzaklıktan yola çıkılarak bu boyut sayısı azaltılabilir.

  • Değişkenler arasındaki uzaklıklar metric olarak ölçülebilir


MDS


Ve mutlu son....

  • “İstatistiksel araçlarınız ne kadar güçlü, ne kadar gelişmiş olursa olsun, unutmamanız gereken tek şey var:

  • Bu verileri okuma yazması olmayan demiryolu bekçileri topladı”

    Sir John Maynard Keynes


ad
  • Login