1 / 30

Η Ανάλυση Δεδομένων στις Κοινωνικές Επιστήμες

Η Ανάλυση Δεδομένων στις Κοινωνικές Επιστήμες. Γιάννης Παπαδημητρίου Τμήμα Εφαρμοσμένης Πληροφορικής Πανεπιστήμιο Μακεδονίας. Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα. Περιεχόμενο Εισήγησης.

Download Presentation

Η Ανάλυση Δεδομένων στις Κοινωνικές Επιστήμες

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Η Ανάλυση Δεδομένωνστις Κοινωνικές Επιστήμες Γιάννης Παπαδημητρίου Τμήμα Εφαρμοσμένης Πληροφορικής Πανεπιστήμιο Μακεδονίας Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  2. Περιεχόμενο Εισήγησης • Μέθοδοι της Ανάλυσης Δεδομένων: • Αρχές, Χαρακτηριστικά, Χρησιμότητα • Ποιοτικοποίηση Ποσοτικών Μεταβλητών • Ποσοτικοποίηση Ποιοτικών Μεταβλητών • Η Παραγοντική Ανάλυση των Αντιστοιχιώνκαι • Η Ανιούσα Ιεραρχική Ταξινόμηση 1 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  3. Η Ανάλυση Δεδομένων • Η Ανάλυση Δεδομένων (ΑΔ) είναι ένας σχετικά νέος κλάδος της Στατιστικής ενταγμένη μέσα στον ευρύτερο χώρο της Πολυμεταβλητής Στατιστικής Ανάλυσης και γνώρισε ραγδαία εξέλιξη, κυρίως στη Γαλλία μετά το 1970. Σήμερα η ΑΔ μελετάται, διδάσκεται και παρακολουθείται σ’ όλους σχεδόν τους επιστημονικούς κλάδους. • Η μεγάλη ανάγκη που υπάρχει σε πολλές επιστήμες για πλήρη επεξεργασία μεγάλου όγκου δεδομένων και η κατάληξη σε χρήσιμα συμπεράσματα, οδήγησε στην εξέλιξη και διάδοση των μεθόδων της ΑΔ. • Πίνακες δεδομένων μεγάλων διαστάσεων είναι διαθέσιμοι για άμεση στατιστική επεξεργασία. Τα δεδομένα των πινάκων αυτών είναι συνήθως ετερογενή και πολύ συχνά δεν ακολουθούν κάποια από τις γνωστές κατανομές πιθανοτήτων. 2 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  4. Μέθοδοι της Ανάλυσης Δεδομένων (1) • Οι πιο γνωστές και διαδεδομένες μέθοδοι της ΑΔ είναι: • Διερευνητική Ανάλυση Παραγόντων (Exploratory Factor Analysis) • Ανάλυση σε Κύριες Συνιστώσες (PrincipalComponentAnalysis) • Παραγοντική Ανάλυση των Αντιστοιχιών (Correspondence Analysis) • Ιεραρχική Ταξινόμηση ή Ανάλυση Συστάδων (Hierarchical Cluster Analysis) • Πολυδιάστατη Κλιμακοποίηση (Multidimensional Scaling) • Χρησιμοποιούνται όταν το ενδιαφέρον του ερευνητή είναι η ανάδειξη της κρυφής δομής ενός συνόλου δεδομένων, χωρίς τη διάκριση των μεταβλητών σε εξαρτημένες και ανεξάρτητες και χωρίς αυστηρές a priori υποθέσεις ή προϋποθέσεις. 3 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  5. Μέθοδοι της Ανάλυσης Δεδομένων (2) • Η ΑΔ έχει να προσφέρει αρκετά πλεονεκτήματα, τα οποία μπορούν να συμβάλλουν στην επιτυχημένη διεξαγωγή πολλών φάσεων της επιστημονικής έρευνας: • Ο μη παραμετρικός χαρακτήρας των μεθόδων, οι οποίες έχουν ελάχιστες τεχνικές προϋποθέσεις και δεν απαιτούν τα διαθέσιμα δεδομένα να χαρακτηρίζονται από συγκεκριμένες στατιστικές ιδιότητες. • Η δυνατότητα των μεθόδων να χειριστούν και ποιοτικά χαρακτηριστικά. • Η δυνατότητα ανάδειξης τόσο γραμμικών όσο και μη γραμμικών σχέσεων μεταξύ των μεταβλητών, ανάλογα με τα δεδομένα. • Τα παραγόμενα στατιστικά αποτελέσματα έχουν απτή φυσική ερμηνεία και είναι δυνατό να αναδείξουν φανερές ή όχι σχέσεις των ιδιοτήτων που περιγράφουν το υπό μελέτη φαινόμενο. 4 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  6. Στάδια Εφαρμογής των Μεθόδων • 1.Ομογενοποίηση των δεδομένων • (ποιοτικοποίηση των ποσοτικών δεδομένων) • 2.Κωδικοποίηση των δεδομένων (μετατροπή πινάκων δεδομένων σε κατάλληλους πίνακες με στοιχεία σε κοινή μονάδα μέτρησης) • 3.Ερμηνεία των Αριθμητικών και Γραφικών Αποτελεσμάτων (ποσοτικοποίηση των ποιοτικών δεδομένων) 5 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  7. Ομογενοποίηση των Δεδομένων (1) 6 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  8. Ομογενοποίηση των Δεδομένων (2) 7 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  9. Κωδικοποίηση των Δεδομένων • Έστω ο αρχικός πίνακας δεδομένων που περιγράφει το φαινόμενο των διακοπών 138 φοιτητών με 3 μεταβλητές, με την παρακάτω κωδικοποίηση: 8 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  10. Αρχικός Πίνακας Δεδομένων • Ο αρχικός πίνακας δεδομένων που περιγράφει το φαινόμενο των διακοπών 138 φοιτητών με 3 μεταβλητές. 9 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  11. Κατασκευή Λογικού Πίνακα 0-1 (1) 1. Δημιουργούμε μία στήλη – κλάση – ιδιότητα για κάθε μεταβλητή Μετ. Α 7 κλάσεις Μετ. Β 6 κλάσεις Μετ. Γ 2 κλάσεις 2. Μεταφορά κάθε γραμμής δεδομένων του αρχικού πίνακα στον πίνακα 0-1. Κάθε αριθμός γίνεται σχετική θέση στον 0-1. 1 2 1 10 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  12. Κατασκευή Λογικού Πίνακα 0-1 (2) 11 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  13. Κατασκευή Γενικευμένου Πίνακα Συμπτώσεων (Burt) 12 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  14. Απλός Πίνακας Συμπτώσεων Δύο Μεταβλητών «Είδος Διακοπών» ως προς «Επάγγελμα Πατέρα» Περιθώρια γραμμή Περιθώρια στήλη 13 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  15. Κωδικοποίηση Δεδομένων (συνοπτικά) Αρχικός Πίνακας Δεδομένων «αντικείμενα xμεταβλητές» Λογικός Πίνακας (0-1) Πίνακας Burt Απλός Πίνακας Συμπτώσεων 14 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  16. Η Παραγοντική Ανάλυση των Αντιστοιχιών • Η Παραγοντική Ανάλυση των Αντιστοιχιών (Correspondence Analysis, AnalyseFactorielledesCorespondances) θεωρείται ως μία περιγραφική μέθοδος για τη διερεύνηση της σχέσης μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών χωρίς αυστηρές a priori υποθέσεις ή προϋποθέσεις. • Πρωταρχικός σκοπός της μεθόδου είναι η ανάδειξη και οπτικοποίηση της ενδογενούς δομής των δεδομένων η οποία δεν είναι άμεσα αντιληπτή, αλλά βρίσκεται σε λανθάνουσα μορφή και μάλιστα χωρίς τη χρήση στατιστικών ελέγχων σημαντικότητας για την απόρριψη ή όχι υποθέσεων σχετικά με αυτά. • Η μέθοδος χρησιμοποιείται για την ανάλυση ποιοτικών δεδομένων, τα οποία μπορούν να οργανωθούν σε απλούς και σύνθετους πίνακες συνάφειας ή διπλής εισόδου. 15 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  17. Ο πρώτος παραγοντικός άξονας * Εφαρμογή της ΠΑΑ στον Πίνακα Burt 16 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  18. Ο δεύτερος παραγοντικός άξονας * Εφαρμογή της ΠΑΑ στον Πίνακα Burt 17 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  19. Το παραγοντικό επίπεδο 1x2 * Εφαρμογή της ΠΑΑ στον Πίνακα Burt 18 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  20. Το παραγοντικό επίπεδο 1x2 * Εφαρμογή της ΠΑΑ στον Απλό Πίνακα Συμπτώσεων 7x6 19 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  21. Πίνακας Ιδιοτιμών * Εφαρμογή της ΠΑΑ στον Πίνακα Burt 20 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  22. Συντεταγμένεςκαι δείκτες ερμηνείαςγραμμών/στηλών * Εφαρμογή της ΠΑΑ στον Πίνακα Burt Στατιστική Ανάλυση Δεδομένων 21 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  23. Η Ανιούσα Ιεραρχική Ταξινόμηση • Με την εφαρμογή της Αυτόματης ή Ανιούσας Ιεραρχικής Ταξινόμησης (ΑΙΤ) σ’ έναν πίνακα δεδομένων καταφέρνουμε να διαμελίσουμε τον πληθυσμό σ’ έναν αριθμό ομάδων, τάξεων ή κλάσεων που είναι ομοιογενείς ως προς τις μεταβλητές που επιλέχθηκαν να τον περιγράφουν. • Ο διαμελισμός ενός πληθυσμού με την Ταξινόμηση διασφαλίζει μια συνοπτική και δομημένη εικόνα του φαινομένου που περιγράφει ο πίνακας δεδομένων που αναλύεται. • Το αποτέλεσμα της ΑΙΤ είναι το δενδρόγραμμα ιεράρχησης. • Ως μετρική της απόστασης μεταξύ τωναντικειμένων χρησιμοποιείται η χ2 και ως κριτήριο συνένωσης των κλάσεων αυτό του Ward. • Η Ανιούσα Ιεραρχική Ταξινόμηση συμπληρώνει τα αποτελέσματα της Παραγοντικής Ανάλυσης των Αντιστοιχιών. 22 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  24. Το δενδρόγραμμα ιεράρχησης • Το δενδρόγραμμα δημιουργείται με τις διαδοχικές συνενώσεις, αρχικά των δύο πιο όμοιων αντικειμένων και στη συνέχεια των κλάσεων, μέχρι να φτάσουμε στον αρχικό κόμβο, δηλαδή το μέσο αντικείμενο του κόμβου – κλάσης που περιλαμβάνει το σύνολο των αρχικών αντικειμένων. 23 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  25. Το δενδρόγραμμα ιεράρχησης • Στόχος της μεθόδου είναι να δημιουργήσει όσο το δυνατό πιο εσωτερικά συμπαγείς ομάδες και ταυτόχρονα ανομοιογενείς μεταξύ τους ομάδες. 24 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  26. Περιγραφή των Κόμβων της Ταξινόμησης * Εφαρμογή στον Απλό Πίνακα Συμπτώσεων 7x6 25 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  27. Δείκτες ερμηνείας των αποτελεσμάτων * Εφαρμογή στον Απλό Πίνακα Συμπτώσεων 7x6 Συμβολή των ιδιοτήτων – μεταβλητών στο χαρακτηρισμό των κόμβων Συμβολή των ιδιοτήτων – μεταβλητών στη διάσπαση των κόμβων 26 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  28. Ενδεικτική Βιβλιογραφία (1) • Ξενόγλωσση • Blasius, J. & Greenacre, M.J. (2006). Multiple Correspondence Analysis and Related Methods, London: Chapman and Hall. • Clausen, S.-E. (1998). Applied Correspondence Analysis: An Introduction. Sage University Papers Series on Quantitative Applications in the Social Sciences, 07-121, Thousand Oakes, CA: Sage. • Gifi, A. (1996). Non-Linear Multivariate Analysis. Chichester: John Willey & Sons Ltd. • Greenacre, M.J. (1984). Theory and Applications of Correspondence Analysis. London: Academic Press. • Greenacre, M.J. (1993, 2007). Correspondence Analysis in Practice. London: Academic Press. • Le Roux. B. & Rouanet, H. (2004). Geometric Data Analysis: From Correspondence Analysis to Structured Data Analysis. Dordrecht: Kluwer Academic Publishers. 27 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  29. Ενδεικτική Βιβλιογραφία (2) • Ελληνόγλωσση • Αθανασιάδης, Η. (1995). Παραγοντική Ανάλυση Αντιστοιχιών και Ιεραρχική Ταξινόμηση. Εκδόσεις Νέων Τεχνολογιών, Αθήνα. • Δρόσος, Γ. (2006). Στατιστική & Ανάλυση Δεδομένων. Εκδόσεις Ανικούλα, Θεσσαλονίκη. • Καραπιστόλης, Δ. (1999). Ανάλυση Δεδομένων και Έρευνα Αγοράς. Εκδόσεις Ανικούλα, Θεσσαλονίκη. • Μαυρομάτης, Γ. (1999). Στατιστικά Μοντέλα και Μέθοδοι Ανάλυσης Δεδομένων. University Studio Press,Θεσσαλονίκη. • Μπεχράκης, Θ. (1999). Πολυδιάστατη Ανάλυση Δεδομένων: Μέθοδοι και Εφαρμογές. Εκδόσεις Νέα Σύνορα – Α.Α. Λιβάνης, Αθήνα. • Παπαδημητρίου, Γ. (2007). Η Ανάλυση Δεδομένων. Εκδόσεις τυπωθήτω. Αθήνα. 28 Σεμινάριο Συνεχιζόμενης Εκπαίδευσης στην Έρευνα και την Ανάλυση Δεδομένων με χρήση ΝΤ – 20-21/06/2009 - Ιωάννινα

  30. Ευχαριστώ για την προσοχή σας #fin

More Related