BAB 5
This presentation is the property of its rightful owner.
Sponsored Links
1 / 44

Analisis Bagi Data Berkategori PowerPoint PPT Presentation


  • 64 Views
  • Uploaded on
  • Presentation posted in: General

BAB 5. Analisis Bagi Data Berkategori. OBJEKTIF. Membezakan ujikaji multinomial dan binomial Mengira nilai jangkaan bagi jadual kontigensi Mengira statistik khi-kuasadua dan darjah kebebasannya yang sesuai.

Download Presentation

Analisis Bagi Data Berkategori

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Analisis bagi data berkategori

BAB 5

Analisis Bagi Data Berkategori


Analisis bagi data berkategori

OBJEKTIF

Membezakan ujikaji multinomial dan binomial

Mengira nilai jangkaan bagi jadual kontigensi

Mengira statistik khi-kuasadua dan darjah kebebasannya yang sesuai.

4.Mengenalpasti jenis ujian yang digunakan untuk menguji hipotesis iaitu ujian kebagusan penyesuaian, ujian ketaksandaran dan ujian homogen


Ujikaji multinomial

Ujikaji multinomial

  • Cara takrifan eksperimen multinomial sama cara kita menakrifkan eksperimen Binomial, kecuali eksperimen multinomial mempunyai lebih daripada dua kategori


Ujikaji multinomial1

Ujikaji Multinomial

  •  Bilangan percubaan adalah tetap

  •  Percubaan adalah tidak bersandar

  • Semua kesudahan bagi setiap percubaan

  • mestilah diklasifikasikan ke dalam hanya satu

  • daripada pelbagai kategori.

  •  Kebarangkalian untuk kategori yang berbeza

  • adalah tetap.

  • Contoh: Lontar sebiji dadu sebanyak 100 kali (6 kategori 100 cubaan )


Ujian kebagusan penyesuaian

Ujian Kebagusan Penyesuaian

  • Ujian ini hanya menguji satu pembolehubah populasi sahaja (univariate).

  • Tujuan ujian ini ialah untuk menguji sama ada taburan yang dicerap mengikut taburan tertentu (taburan jangkaan) atau sesuai dengan suatu set data.


Andaian

Andaian

  • Data dipilih secara rawak.

  • Data tertabur normal

  • Data sampel mengandungi jumlah kekerapan untuk setiap kategori

  • Nilai frekuensi yang dijangka (E) mestilah sekurang-kurangnya 5

    (E  5)


Ujian kebagusan penyesuaian1

Ujian Kebagusan Penyesuaian

Statistik Ujian

O Mewakili frekuensi tercerap

E Mewakili frekuensi jangkaan, E = np

k Mewakili bilangan kategori

n Mewakili jumlah bilangan cubaan

Di dalam ujian kebagusan penyesuaian

Dk = (k-1)

  • k = bilangan kategori

    Kawasan penolakan hanyalah di hujung

    kanan taburan khi-kuasadua


Prosedur menjalankan ujian kebagusan penyesuaian

Prosedur Menjalankan Ujian Kebagusan Penyesuaian

1.Tentukan hipotesis

H0 : Populasi mengikut taburan tertentu.

(Atau H0 : p1=p2=…=pk )

H1 : Populasi tidak mengikut taburan tertentu

(Atau H1 : sekurang-kurangnya terdapat satu kebarangkalian berbeza )

  • 2.Dapatkan frekuensi jangkaan Ej = npj bagi setiap kategori pembolehubah kajian, (pastikan memenuhi E  5 )

  • Di mana n = bilangan sampel dan

  • pj = kebarangkalian kategori menurut H0


Analisis bagi data berkategori

3.Tentukan aras keertian  dan tentukan kawasan kritikal di hujung kanan taburan

Nilai kritikal = dengan dk = k – 1

dan k = bilangan kategori pembolehubah kajian.

4.Dapatkan statistik ujian

5. Keputusan dan Kesimpulan


Contoh

Contoh :

  • Satu kajian telah dibuat berkaitan kemalangan di kilang W. Data yang diperolehi telah diringkaskan di dalam jadual di bawah. Uji dakwaan bahawa kemungkinan berlaku kemalangan setiap hari bekerja adalah sama


Penyelesaian

Penyelesaian

1.H0 : p1 = p2 = p3 = p4 = p5 = 1/5

H1 : sekurang-kurangnya satu kebarangkalian adalah tak sama dgn 1/5.

2.  Frekuansi jangkaan untuk setiap hari ialah E = 147 * (1/5) = 29.4 > 5

3. Tentukan  = 0.05 , darjah kebebasan=4

Nilai kritikal = 20.05,4 = 9.488


Analisis bagi data berkategori

4. Statistik ujian2 = [( Oj – Ej )2/Ej]

Pengiraan:

Hari O E (O-E)2/E

Isn 31 29.40.0871

Sel 42 29.4 5.4

Rabu 18 29.4 4.4204

Kha 25 29.4 0.6585

Jum 31 29.4 0.0871

2 = 10.6531

5. Keputusan dan Kesimpulan :

Tolak Ho kerana 10.6531 > 9.488. Berdasarkan sampel yg diambil, terdapat cukup bukti untuk membuat kesimpulan bahawa kadar kemalangan berlaku setiap hari adalah tidak sama utk  = 0.05


Kaedah nilai p

Kaedah Nilai-p

  • Rujuk jadual taburan 2 untuk mendapatkan nilap-p .Iaitu nilai-p untuk statistikujian 2 = 10.6531 dengan dk = 4 terletak antara 9.488 dan 11.143.

  • 9.488 < 10.6531 < 11.143

  • 0.025 < nilai-p < 0.05

  • Oleh kerana nilai-p < 0.05 , tolak H0

  • Buat kesimpulan seperti sebelum ini.


Contoh1

Contoh

  • Tahap pendidikan yang dimiliki oleh wanita daripada sebuah kawasan luar bandar dibahagikan kepada tiga kategori: mempunyai sijil SPM; diploma; ijazah. Seorang pakar demografi menganggar bahawa 28% daripada mereka mempunyai sijil SPM, 61% mempunyai diploma dan 11% mempunyai ijazah. Untuk membuktikan peratusan ini, sampel rawak n=100 wanita telah dipilih dari kawasan tersebut dan tahap pendidikan mereka dicatat. Bilangan wanita bagi setiap tahap pendidikan ditunjukkan di dalam jadual berikut. Guna   = .05. Uji untuk menentukan sama ada data sampel tidak bersetuju dengan peratusan yang dianggar oleh pakar demografi.


Analisis bagi data berkategori

Tahap pendidikan

Sijil SPM

Diploma

Ijazah

Jumlah

22

64

14

100


Penyelesaian1

Tahap pendidikan

Sijil SPM

Diploma

Ijazah

Total

Frekuensi dicerap

Frekuensi dijangka

22

(100)(.28)=(28)

64

(100)(61)=(61)

14

(100)(.11)=(11)

100

100

Penyelesaian

  • H0: Kebarangkalian bagi setiap kategori p1= .28, p2= .61, p3= .11

    H1: Sekurang-kurangnya dua daripada p1, p2, p3, berbeza daripada nilai yang dinyatakan di dalam hipotesis nol.

Kira frekuensi jangkaan


Statistik ujian

Statistik ujian

Nilai kritikal 20.05,2 = 5.991. Kita akan tolakH0 jika 2 > 5.991

Oleh kerana nilai statistik ujian 2 = 2.26 adalah kurang daripada 5.991, maka kita gagal tolak H0. Tidak terdapat cukup maklumat untuk menunjukkan data sampel tidak bersetuju dengan peratusan yang dianggar oleh pakar demografi.


Latihan

Latihan

Satu kajian telah dijalankan untuk menentukan sama ada kegemaran surirumah untuk berbelanja di pasaraya pada setiap hari adalah berbeza. Untuk tujuan ini 300 pelanggan pasaraya dipilih secara rawak dan ditanya hari kegemaran mereka dalam seminggu untuk berbelanja. Keputusannya adalah seperti berikut

Adakah data ini boleh mengesahkan bahwa kegemaran surirumah berbelanja adalah berbeza-beza mengikut hari. ( = 0.05)


Latihan1

Kategori

Jumlah

1

2

3

4

5

27

62

241

69

101

500

Latihan

Satu sampel rawak bersaiz, n = 500 diperuntukkan kepada k=5 kategori seperti di jadual. Andaikan kita mahu menguji hipotesis nul bahawa kebarangkalian bagi setiap kategori ialah p1 =.1, p2 =.1, p3 =.5, p4 =.1, dan p5 =.2.

Adakah data yang ada cukup untuk membuktikan bahawa hipotesis nol adalah salah?


Jadual kontigensi

Jadual kontigensi

  • Jadual Kontingensi atau jadual kekerapan dua – hala ialah jadual yang menunjukkan kekerapan yang menepati ciri kepada dua pembolehubah. Pembolehubah pertama digunakan untuk kategorikan baris dan pembolehubah kedua digunakan untuk kategorikan lajur .

  • Tujuan analisis jadual kontigensi adalah untuk menentukan sama ada kebersandaran wujud di antara dua pembolehubah kualitatif.


Analisis bagi data berkategori

Sepenuh masa

Separuh masa

Jumlah baris

Pelajar

Lelaki

393

248

641

Pelajar

Perempuan

411

368

779

Jumlah lajur

804

616

1420

Contoh Jadual Kontingensi


Ujian ketaksandaran

Ujian ketaksandaran

  • Tujuan ujian ini ialah untuk menguji sama ada wujud hubungan (bersandar) di antara dua pembolehubah (bivariate) bagi satu populasi

  • Contohnya kita hendak menguji sama ada sumber kepuasan kehidupan kaum lelaki bergantung kepada tahun kajian dilakukan

  • Pembolehubah ini perlu diklasifikasikan kepada beberapa kategori diskret dan saling menyisihkan (mutually exclusive).


Prosedur menjalankan ujian ketaksandaran

Prosedur Menjalankan Ujian Ketaksandaran

1.Tentukan hipotesis

H0 : pembolehubah I tidak bersandar kepada pembolehubah II

H1 : pembolehubah I bersandar kepada pembolehubah II

2.Dapatkan frekuansi jangkaan Eij bagi setiap kategori pembolehubah kajian, (pastikan memenuhi Eij 5 )


Analisis bagi data berkategori

3.Tentukan aras keertian  dan tentukan kawasan kritikal di hujung kanan taburan

Nilai kritikal = dengan dk = (B-1)(L-1) di mana B = bil. baris dlm. jadual kontigensi

L = bil. lajur dlm. jadual kontigensi

4.Dapatkan statistik ujian

Oij = kekerapan yg dicerap utk baris ke i , lajur ke j

Eij = kekerapan yg dijangka utk baris ke i , lajur ke j

5. Keputusan dan Kesimpulan


Contoh2

Pekerjaan

65

25

Keluarga

42

68

Lain – lain

13

17

Jumlah

120

110

Lelaki 1990

Lelaki 2001

Jumlah

90

110

30

230

Contoh :

Satu kajian pada tahun 1990 telah dijalankan terhadap 120 lelaki berkahwin dan berumur 30-45 thn mengenai sumber kepuasan hidup mereka. Kajian yg sama dijalankan pula terhadap 110 lelaki berkahwin pada tahun 2001. Maklumat yg diperolehi diringkaskan di dlm jadual kontigensi di bawah. Uji sama ada sumber kepuasan kehidupan lelaki telah berubah atau sebaliknya. (guna  = 0.05)

Sumber Kepuasan Hidup


Penyelesaian2

Pekerjaan

O11 = 65

E11= 46.96

Keluarga

O12 = 42

E12 = 57.39

Lain-lain

O13 = 13

E13=15.65

Jumlah

 120

Lelaki 1990

Lelaki 2001

O21 = 25

E21= 43.04

O22 = 68

E22 = 52.61

O23 = 17

E23=14.35

110

Jumlah

90

110

30

Jum = 230

Penyelesaian

1.   H0 : Sumber kepuasan hidup lelaki tidak bersandar kepada tahun kajian

H1 :Sumber kepuasan hidup lelaki bersandar kepada tahun kajian

2. Frekuensi jangkaan

Sumber Kepuasan Hidup


Analisis bagi data berkategori

3. Aras keertian  = 0.05

nilai kritikal20.05,2= 5.991

di mana dk = ( B – 1)(L – 1)

= ( 2 – 1) (3 – 1) = 2

4. Statistik ujian2 =  [ ( Oij – Eij )2 / Eij]


Analisis bagi data berkategori

Pengiraan:

O E (O-E)2/E

65 46.966.9302

42 57.394.1271

1315.650.4487

25 43.047.5614

68 52.614.5020

1714.350.4894

Jumlah : 24.0588

5. Kesimpulan :

Tolak Ho kerana 24.0588 > 5.991. Oleh itu, berdasarkan sampel yg diambil, terdapat cukup bukti untuk membuat kesimpulan bahawa taburan sumber kepuasan hidup lelaki bersandar kepada tahun kajian yang dibuat pada aras keertian 0.05. Dengan kata lain sumber kepuasan hidup lelaki telah berubah daripada tahun 1990 ke tahun 2001.


Analisis bagi data berkategori

Latihan

Seramai 164 orang siswazah telah ditemubual. Maklumat dikumpul berdasarkan kelas ijazah yang diperolehi dan kategori pekerjaannya. Jadual kontigensi diberikan seperti di bawah :

Uji sama ada wujud hubungan di antara kategori pekerjaan dengan kelas ijazahyang diperolehi pada aras keertian 5% .


Analisis bagi data berkategori

Tindakan yang perlu diambil jika E < 5

1) Gabung baris atau lajur yang bersesuaian

2) Buang baris atau lajur yang bersesuaian

3) Tambah saiz sampel


Analisis bagi data berkategori

Contoh

Berikut adalah data 487 pemilik harta bagi Negeri Z dan status perkahwinan mereka. Kaji sama ada nilai harta (RM ‘ 000) dan status perkahwinan adalah bersandar bagi pemilik harta di Negeri Z.

(Guna  = 0.05)


Analisis bagi data berkategori

Penyelesaian :

1) H0 : Nilai harta dan status perkahwinan pemilik harta adalah tidak bersandar

H1 : Nilai harta dan status perkahwinan pemilik harta adalah bersandar

2) Kekerapan jangkaan,

Contohnya untuk sel pemilik harta yang berkahwin dan mempunyai nilai harta 50 - < 200 (dalam ribu ringgit ),

E11 = (344 x 317) / 487 = 223.92


Analisis bagi data berkategori

Berkahwin

Bujang

Janda/

Duda

Jumlah baris

50 - < 200

O11= 227

E11=223.9

O12= 54

E12=53.0

O13= 63

E13=67.1

344

200 - < 500

O21= 60

E21=63.1

O22 = 15

E22=14.9

O23= 22

E23=18.9

97

500 –

< 1,000

O31= 20

E31=20.2

O32= 4

E32=4.8

O33= 7

E33=6.0

31

>1,000

O41= 10

E41=9.8

O42= 2

E42=2.3

O43= 3

E43=2.9

15

Jumlah lajur

317

75

95

Jum = 487


Analisis bagi data berkategori

Berkahwin

Bujang

Janda/

Duda

Jumlah baris

50 - < 200

O11= 227

E11=223.9

O12= 54

E12=53.0

O13= 63

E13=67.1

344

200 - <500

O21= 60

E21=63.1

O22 = 15

E22=14.9

O23= 22

E23=18.9

97

 500

O31= 30

E31=29.9

O32= 6

E32=7.1

O33= 10

E33=9.0

46

Jumlah lajur

317

75

95

Jum = 487

Didapati nilai E32, E42 dan E43 adalah kurang drpd 5

Langkah yang diambil ialah :

Gabungkan nilai harta 500 - < 1,000 dan > 1,000.


Analisis bagi data berkategori

3) Aras keertian = 0.05 dan darjah kebebasan ialah

dk = (B-1)(L-1) = (3-1)(3-1) = 4.

Oleh itu berdasarkan jadual 2 , nilai kritikal ialah 9.488. Ini bermakna H0 akan ditolak jika nilai statistik ujian yang dikira adalah lebih besar drpd 9.488.

4) Statistik Ujian :

= (227-223.9)2 / 223.9 + (54-53)2 / 53

+ (63-67.1)2 / 67.1 + (60-63.1)2 / 63.1

+(15-14.9)2 / 14.9 + (22-18.9)2 / 18.9

+ (30-29.9)2 / 29.9 + (6-7.1)2 / 7.1

+ (10-9.0)2 / 9.0

= 1.256


Analisis bagi data berkategori

5) Didapati 1.256 < 9.488 . Terima H0

Kesimpulan:

Oleh kerana statistik ujian jatuh dalam rantau penerimaan maka terdapat bukti yang cukup daripada sampel yang diambil untuk menerima H0 pada aras keertian 5%. Oleh itu, nilai harta dan status perkahwinan pemilik harta adalah tidak bersandar.


Analisis bagi data berkategori

Ujian Kehomogenan

  • Tujuan : untuk menguji kesecaman atau keserupaan taburan bagi dua atau lebih populasi yang berbeza.

  • Prosedur Ujian Kehomogenan adalah sama seperti Ujian Ketaksandaran kecuali bagi H0 dan H1 .

  • H0 : nisbah(perkadaran) elemen bagi ciri yg dikaji untuk dua atau lebih populasi yang berbeza adalah sama

    • ( H0 : p1 = p2 = …=pk )  k adalah bilangan populasi

H1 : nisbah(perkadaran) elemen bagi ciri yg dikaji untuk

dua atau lebih populasi yang berbeza adalah tidak sama

(H1 : sekurang-kurangnya 1 kadar populasi tidak sama)


Analisis bagi data berkategori

Ciri-ciri Ujian Kehomogenan yg berbeza drpd Ujian Ketaksandaran :

1) Jumlah salah satu faktor iaitu sama ada lajur atau baris di dalam jadual kontigensi telah ditetapkan terlebih dahulu.

2) Terdiri daripada dua atau lebih populasi yang berbeza.


Analisis bagi data berkategori

Contoh :

Perak

Johor

Jumlah baris

Ijazah

70

34

104

Diploma

80

40

120

SPM

100

76

176

Jumlah lajur

250

150

Jum = 400

Satu kajian telah dijalankan untuk mengetahui taburan pencapaian akademik penduduk di Perak dan di Johor. Oleh itu, seramai 250 penduduk Perak dan 150 penduduk Johor telah diambil sebagai sampel. Hasil kajian telah diringkaskan di dalam jadual kontigensi di bawah.

Uji pada  = 0.1 sama ada taburan pencapaian akademik bagi kedua-dua negeri adalah sama atau tidak.


Analisis bagi data berkategori

Penyelesaian :

  • H0:Perkadaran bagi pencapaian akademik penduduk untuk setiap tahap pendidikan adalah sama bagi Perak dan Johor.

H1:Perkadaran bagi pencapaian akademik penduduk

untuk setiap tahap pendidikan adalah tidak sama

bagi Perak dan Johor.

2) Kekerapan jangkaan :


Analisis bagi data berkategori

Perak

Johor

Jumlah baris

Ijazah

O11= 70

E11=65

O12= 34

E12=39

104

Diploma

O21= 80

E21=75

O22= 40

E22=45

120

SPM

O31= 100

E31=110

O32= 76

E32=66

176

Jumlah lajur

250

150

Jum = 400

Didapati semua nilai E > 5


Analisis bagi data berkategori

3) Aras keertian = 0.1 dan darjah kebebasan ialah

dk = (B-1)(L-1) = (3-1)(2-1) = 2.

Oleh itu berdasarkan jadual 2 , nilai kritikal ialah 4.605. Ini bermakna H0 akan ditolak jika nilai statistik ujian yang dikira adalah lebih besar drpd 4.605.

4) Statistik Ujian :

= (70-65)2 / 65 + (34-39)2 / 39

+ (80-75)2 / 75 + (40-45)2 / 45

+ (100-110)2 / 110 + (76-66)2 / 66

2 = 4.339


Analisis bagi data berkategori

5) Didapati 4.339 < 4.605 . Maka, Terima H0

Kesimpulan:

Oleh kerana statistik ujian jatuh dalam rantau penerimaan maka terdapat bukti yang cukup daripada sampel yang diambil untuk menerima H0 pada aras keertian 10%. Ini bererti taburan pencapaian akademik penduduk di Perak dan di Johor adalah sama.


Analisis bagi data berkategori

Latihan

Satu kajian dijalankan untuk membandingkan kadar kesilapan yang dilakukan oleh syarikat kecil, sederhana dan besar dalam akaun mereka. Didapati 50 drpd 950 akaun syarikat kecil, 55 drpd 945 syarikat sederhana dan 65 drpd 940 akaun syarikat besar yang diaudit mengandungi kesilapan. Adakah kadar kesilapan di antara ketiga-tiga jenis syarikat ini berbeza pada aras keertian 0.1 ?


  • Login