1 / 34

Κεφάλαιο 13- Δ

Κεφάλαιο 13- Δ. Πίνακας Συνάφειας & Έλεγχος χ 2. Ένα Κοινό Θέμα …. Ένας Τύπος Δεδομένων …. … Δύο τεχνικές. Δύο Τεχνικές ….

Download Presentation

Κεφάλαιο 13- Δ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Κεφάλαιο 13-Δ Πίνακας Συνάφειας & Έλεγχος χ2

  2. Ένα Κοινό Θέμα … Ένας Τύπος Δεδομένων … …Δύο τεχνικές

  3. Δύο Τεχνικές … Η πρώτηείναι ένας έλεγχος προσαρμοστικότηταςπου εφαρμόζεται σε έναπολυωνυμικό πείραμα,μία γενίκευση του δυωνυμικού πειράματος και χρησιμοποιείται για την περιγραφή ενός πληθυσμού δεδομένων. Η δεύτερηχρησιμοποιεί δεδομένα διευθετημένα σε ένανπίνακα συνάφειαςγια να προσδιορίσουμε εάν δύο ταξινομήσεις ενός πληθυσμού με ονομαστικά δεδομένα είναι στατιστικά ανεξάρτητες; Αυτός ό έλεγχος μπορεί επίσης να ερμηνευθεί ως μία σύγκριση δύο ή περισσοτέρων πληθυσμών. Και στις δύο περιπτώσεις, χρησιμοποιούμεχ2-κατανομή.

  4. Το Πολυωνυμικό Πείραμα … Σε αντιπαράθεση με το δυωνυμικό πείραμα το οποίο έχει δύο πιθανά ενδεχόμενα (π.χ. κορόνα ή γράμματα),έναπολυωνυμικό πείραμα: •Αποτελείται από έναν σταθερό αριθμό, n, δοκιμών. •Κάθε δοκιμή μπορεί να έχει ένα από ταkενδεχόμενα, καλούμενα ως κελιά. • Όλες οι πιθανότητεςpiείναι σταθερές. • Η συνήθης ιδιότητα των πιθανοτήτων ισχύει: p1 + p2 + … + pk = 1, και •Κάθε δοκιμή είναι ανεξάρτητη από τις υπόλοιπες δοκιμές.

  5. χ2 έλεγχος προσαρμοστικότητας… Ελέγχουμε εάν υπάρχει επαρκή μαρτυρία ώστε να απορρίψουμε ένακαθορισμένο σύνολοτιμών για τιςpi. Πιο αναλυτικά, η μηδενική υπόθεση είναι: H0: p1 = a1, p2 = a2, …, pk = ak (όπουa1, a2, …, akείναι οι τιμές που μας ενδιαφέρουν) Η ερευνητική υπόθεση είναι: H1: Τουλάχιστον ένα pi ≠ ai

  6. χ2 έλεγχος προσαρμοστικότητας… Ο έλεγχος πραγματοποιεί την σύγκριση μεταξύ των πραγματικών συχνοτήτων και των αναμενόμενων συχνοτήτων των The test builds on comparing actual frequency and the expected frequency of συμβάντων στα κελιά. Παράδειγμα 13.11… Συγκρίνουμε μερίδιο αγοράς πριν και μετά την διαφημιστική εκστρατεία για να δούμε αν υπάρχει διαφορά (δηλαδή εάν η διαφήμιση ήταν αποτελεσματική για την βελτίωση του μεριδίου αγοράς). H0: p1 = a1, p2 = a2, …, pk = ak Όπουaiείναι το μερίδιο αγοράςπριναπό την εκστρατεία. Εάν δεν υπήρχε αλλαγή, θα περιμέναμε τηνH0να μην απορριφθεί. Εάν υπάρχει μαρτυρία να απορρίψουμε τηνH0για την εύνοια της: H1: τουλάχιστον μίαpi ≠ ai, ποιο είναι ένα λογικό συμπέρασμα;

  7. ΑΝΑΓΝΩΡΙΣΤΕ Παράδειγμα 13.11… Μερίδια αγοράς πριν από διαφημιστική εκστρατεία … Εταιρία A – 45% Εταιρία B – 40% Λοιπές – 15 % 200 πελάτες καταμετρήθηκαν μετά την εκστρατεία. Τα αποτελέσματα: Εταιρία A – 102 πελάτες προτίμησαν το προϊόν. Εταιρία B – 82 πελάτες … Λοιπές – 16 πελάτες . Πριναπό την εκστρατεία, θα αναμέναμε 45% από τους 200 πελάτες (δηλαδή 90 πελάτες)να προτιμάν το προϊόν της εταιρίας Α.Μετάτην εκστρατεία,παρατηρούμε 102 καταναλωτές της. Σημαίνει αυτό ότι η εκστρατεία ήταν αποτελεσματική; (σε επίπεδο σημαντικότητας).

  8. Συχνότητα που Παρατηρούμε Αναμενόμενη Συχνότητα A A B B Παράδειγμα 13.11… Είναι αυτές οι αλλαγές στατιστικά σημαντικά;

  9. ΑΝΑΓΝΩΡΙΣΤΕ Παράδειγμα 13.11… Η μηδενική υπόθεση είναι: H0: pΕταιρίαΑ=.45, pΕταιρίαΒ=.40,pΛοιπές = .15 (δηλαδή τα μερίδια αγοράς πριν την εκστρατεία), και η εναλλακτική υπόθεση είναι: H1: Τουλάχιστον μίαpi ≠ ai Για να ολοκληρώσουμε την εκτέλεση του ελέγχου της υπόθεσης χρειαζόμαστε ένα στατιστικό τεστ και μία περιοχή απόρριψης …

  10. χ2 έλεγχος προσαρμοστικότητας… Το στατιστικό τεστ του χ2 ελέγχου προσαρμοστικότηταςδίνεται από: Σημειώστε:αυτό το στατιστικό είναιπροσεγγιστικά χ2 μεk–1 βαθμούς ελευθερίας εφόσον το δείγμα είναι αρκετά μεγάλα.Η περιοχή απόρριψης είναι: Αναμενόμενη Συχνότητα Συχνότητα που Παρατηρούμε

  11. ΥΠΟΛΟΓΙΣΤΕ Παράδειγμα 13.11… Για να υπολογίσουμε το στατιστικό τεστ, τοποθετούμε τα δεδομένα σε έναν πίνακα με τον παρακάτω τρόπο για ευκολότερους υπολογισμούς: Ελέγξτε ότι είναι όμοια

  12. ΕΡΜΗΝΕΥΣΤΕ Παράδειγμα 13.11… χ2 > χ2 = χ2 = 5.99147 Η περιοχή απόρριψης είναι: Αφού το στατιστικό τεστ είναι 8.18 το οποίο είναι μεγαλύτερο από την κριτική τιμή του χ2,απορρίπτουμε τηνH0την εύνοια της,H1, δηλαδή, «Υπάρχει επαρκή μαρτυρία να συμπεράνουμε ότι οι αναλογίεςέχουν αλλάξειαφότου η διαφημιστική εκστρατεία εφαρμόστηκε» α ,k- 1 .05,3-1

  13. Απαιτούμενες Υποθέσεις… Για να χρησιμοποιήσουμε αυτή την τεχνική, το μέγεθος του δείγματος πρέπει να είναιαρκετά μεγάλοέτσι ώστε η αναμενόμενη τιμή για κάθε κελί είναι 5 ή μεγαλύτερη (δηλαδή npi ≥ 5) Εάν η αναμενόμενη συχνότηταείναι μικρότερη από 5, συνδυάστε την με άλλα κελιά για να ικανοποιηθεί η υπόθεση.

  14. Αναγνώριση Παραγόντων … Παράγοντες που αναγνωρίζουν το τεστ του χ2 ελέγχου προσαρμοστικότητας: Περιγραφή του πληθυσμού →Ονομαστικά δεδομένα→2 ή >2 κατηγορίες Απαιτείται ei=(n)(pi)

  15. χ2 Έλεγχος για Πίνακα Συνάφειας Ο χ2 έλεγχος για έναν πίνακα συνάφειας χρησιμοποιείται: • για να καθορίσουμε αν υπάρχει μαρτυρία να συμπεράνουμε ότιδύο ονομαστικές μεταβλητές συσχετίζονται, και •για να συμπεράνουμε ότιδιαφορές υπάρχουνμεταξύ δύο η περισσοτέρων πληθυσμών με ονομαστικές μεταβλητές. Για να χρησιμοποιήσουμε αυτές τις τεχνικές, χρειαζόμαστε να ταξινομήσουμε τα δεδομένα σύμφωνα με δύο διαφορετικά κριτήρια.

  16. ΑΝΑΓΝΩΡΙΣΤΕ Παράδειγμα 13.12… Η ζήτηση των μαθημάτων επιλογής και των κατευθύνσεων σε ένα MBA πρόγραμμα ποικίλει αρκετά ανά έτος. Ηερευνητική υπόθεσηείναι ότι το ακαδημαϊκό υπόβαθρο των φοιτητών (δηλαδή τα προπτυχιακά τους πτυχία) επηρεάζει την επιλογή τους για την κατεύθυνση. Ένα τυχαίο δείγμα δεδομένων από φοιτητές του τελευταίου έτους του MBA συλλέγετε και περιληπτικά περιγράφεται με ένανπίνακα συνάφειας …

  17. Τα Δεδομένα Παράδειγμα 13.12…

  18. Παράδειγμα 13.12… Ξανά, ενδιαφερόμαστε να καθορίσουμε εάν ή όχι τοακαδημαϊκό υπόβαθροτων φοιτητών επηρεάζει την επιλογή τηςκατεύθυνσης στο ΜBA. Έτσι η ερευνητική μας υπόθεση είναι: H1: Οι δύο μεταβλητές είναι εξαρτημένες Η μηδενική υπόθεση τότε, είναι: H0: Οι δύο μεταβλητές είναι ανεξάρτητες.

  19. Παράδειγμα 13.12… Σε αυτή την περίπτωση, το στατιστικό τεστ είναι: (όπουkείναι ο αριθμός των κελιών σε έναν πίνακα συνάφειας, δηλαδή (γραμμές, r)(στήλες, c) Η περιοχή απόρριψηςείναι: Όπου ο αριθμός των βαθμών ελευθεριών είναι (r–1)(c–1)

  20. ΥΠΟΛΟΓΙΣΤΕ Παράδειγμα 13.12… Για να υπολογίσουμε το στατιστικό στοιχείο τουχ2ελέγχου, χρειάζεται ναυπολογίσουμετιςαναμενόμενες συχνότητεςγια όλα τα κελιά … Η αναμενόμενη συχνότητα ενός κελιού στην γραμμήiκαι την στήληjείναι: Σύνολο της i γραμμήςxΣύνολο της j στήλης eij = Μέγεθός του δείγματος

  21. Η Δομή του Πίνακα Συνάφειας …

  22. ΥΠΟΛΟΓΙΣΤΕ Παράδειγμα 13.12… Σύνολο της i γραμμήςxΣύνολο της j στήλης eij = Μέγεθός του δείγματος Υπολογισμός αναμενομένων συχνοτήτων… e23 = (31)(47)/152 = 9.59—σύγκριση αυτού με f23 = 7

  23. Παράδειγμα 13.12… Μπορούμε να συγκρίνουμε τις συχνότητες πουπαρατηρούνταιμε τιςαναμενόμενες … και υπολογίζουμε το στατιστικό τεστ:

  24. ΕΡΜΗΝΕΥΣΤΕ Παράδειγμα 13.12… Συγκρίνουμεχ2 = 14.70 με: Αφού το στατιστικό τεστ πέφτει σε περιοχή απόρριψης, απορρίπτουμε H0: Οι δύο μεταβλητές είναι ανεξάρτητες. για τη εύνοια της H1: Οι δύο μεταβλητές είναι εξαρτημένες. Δηλαδή, υπάρχει μαρτυρία για σχέση μεταξύ προπτυχιακού πτυχίου και κατεύθυνσης MBA. χ2= χ2 = χ2 = 12.5916 .05,6 α ,ν .05, (4-1)(3-1)

  25. Απαιτούμενη Υπόθεση – Κανόνας των Πέντε … Σε έναν πίνακα συνάφειας όπου ένα ή περισσότερα κελιά έχουναναμενόμενες τιμέςμικρότερες από 5, χρειάζεται να συνδυάσουμε γραμμές και στήλες για να ικανοποιήσουμε τον κανόνα των 5. Σημειώστε: όταν συνδυάζουμε γραμμές και στήλες αλλάζουν και οι βαθμοί ελευθερίας.

  26. Αναγνωρίζοντας Παράγοντες… Αναλύουμε την σχέση μεταξύ δύο μεταβλητών και συγκρίνουμε δύο ή περισσότερους πληθυσμό θα με ονομαστικά δεδομένα

  27. χ2 έλεγχος για Κανονικότητα χ2 έλεγχος για κανονικότητα στο Παράδειγμα 13.3 Αριθμός των Πακέτων 409 501 440 444 485 475 470 485 469 450 505 400 499 415 418 467 551 444 481 429 487 373 416 424 471 427 509 410 515 435 480 466 477 445 413 537 484 418 465 496 482 442 465 449 523 488 508 432 405 440

  28. χ2 έλεγχος για Κανονικότητα • χ2 έλεγχος για κανονικότητα στο Παράδειγμα 13.3 Για μέγεθος δείγματος ίσο με n=50, ο δειγματοληπτικός μέσος ήταν 460.38 με τυπικό σφάλμα 38.83. Μπορούμε να συμπεράνουμε από τα δεδομένα δοθέντος ότι το δείγμα επιλέχθηκε από μία κανονική κατανομή μεm = 460.38 και s = 38.8;Χρησιμοποιώντας 5% επίπεδο σημαντικότητας.

  29. Διαστήματα Έπειτα βρίσκουμε τις πιθανότητες από διαστήματα των οποίων το πλήθος είναι αυθαίρετο. Διάστημα 1: X ≤ 421.55 Διάστημα 2: 421.55 < X ≤ 460.38 Διάστημα 3: 460.38< X ≤ 499.21 Διάστημα 4: X > 499.21

  30. Υπολογίζουμε τις Πιθανότητες X –μ421.55 – 460.38 P ( X ≤ 421.55 ) = P ≤ σ 38.83 = P ( Z ≤ -1) = .1587

  31. .3413 .3413 .1587 .1587 421.55 χ2 έλεγχος για Κανονικότητα Λύση Πρώτα επιλέγουμε zτιμές που ορίζουνε ένα κελί (αναμενόμενη συχνότητα > 5 για κάθε κελί.) z1 = -1; P(z < -1) = p1 = .1587; e1 = np1 = 50(.1587) = 7.94 z2 = 0; P(-1 < z< 0) = p2= .3413; e2 = np2 = 50(.3413) = 17.07 z3 = 1; P(0 < z < 1) = p3= .3413; e3 = 17.07 P(z > 1) = p4= .1587; e4 = 7.94 Τα όρια των κελιών υπολογίζονται από τις αντίστοιχες τιμές τωνzτιμών κάτω από την Η0. Οι αναμενόμενες συχνότητες μπορούν τώρα να καθοριστούν για κάθε κελί. e2 = 17.07 e3 = 17.07 z1 =(x1 - 460.38)/38.83 = -1; x1 = 421.55 e4 = 7.94 e1 = 7.94 499.21 460.38

  32. χ2 έλεγχος για Κανονικότητα • Το στατιστικό τεστ (10 - 7.94)2 7.94 c2= (13 - 17.07)2 17.07 (19 - 17.07)2 17.07 (8 - 7.94)2 7.94 = 1.72 + + + f3 = 19 e3 = 17.07 e2 = 17.07 f2 = 13 f1 = 10 f4 = 8 e4 = 7.94 e1 = 7.94

  33. χ2 έλεγχος για Κανονικότητα • Το στατιστικό τεστ Συμπέρασμα: Υπάρχει ανεπαρκή μαρτυρία να συμπεράνουμε με 5% επίπεδο σημαντικότητας ότι τα δεδομένα δεν είναι κανονικά κατανεμημένα. (10 - 7.94)2 7.94 c2= (13 - 17.07)2 17.07 (19 - 17.07)2 17.07 (8 - 7.94)2 7.94 = 1.72 + + + • Η περιοχή απόρριψης

  34. χ2 έλεγχος για Κανονικότητα • Σημειώστε ότι η μηδενική υπόθεση είναι: • Η0: τα δεδομένα ακολουθούν κανονική κατανομή και η εναλλακτική υπόθεση είναι: • Η1: τα δεδομένα δεν ακολουθούν κανονική κατανομή

More Related