1 / 68

Korrelation

Korrelation. Gliederung Kovarianz Die Produkt-Moment-Korrelation Berechnung SPSS Voraussetzungen Mittelwerte von Korrelationen berechnen Unterschiede von Korrelationen testen Optimale Stichproben. Korrelation. Gliederung Korrelationen bei nicht intervallskalierten Variablen

genera
Download Presentation

Korrelation

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Korrelation 09_korrelation 1 Gliederung • Kovarianz • Die Produkt-Moment-Korrelation • Berechnung • SPSS • Voraussetzungen • Mittelwerte von Korrelationen berechnen • Unterschiede von Korrelationen testen • Optimale Stichproben

  2. Korrelation 09_korrelation 2 Gliederung • Korrelationen bei nicht intervallskalierten Variablen • Spearman‘s Rangkorrelation • Kendallsτ • Punktbiseriale Korrelation • Biseriale Korrelation • Biseriale Rangkorrelation • Punkttetrachorische Korrelation • Tetrachorische Korrelation • Polychorische Korrelation • Yules Y • ν-Koeffizient • Der Kontingenzkoeffizient CC • Cramérs Index

  3. Kovarianz und Korrelation 09_korrelation 3 Kovarianz und Korrelation sind Maße für den (linearen) Zusammenhang zwischen zwei Variablen. Eine positive Korrelation (bzw. Kovarianz) ist dann gegeben, wenn ein hoher Wert auf einer Variable häufig mit einen hohen Wert auf der anderen Variable einhergeht (z.B. Optimismus und Risikobereitschaft). Eine negative Korrelation (bzw. Kovarianz) ist dann gegeben, wenn ein hoher Wert auf einer Variable häufig mit einen niedrigen Wert auf der anderen Variable einhergeht (z.B. Optimismus und Ängstlichkeit).

  4. Kovarianz und Korrelation negativer Zusammenhang positiver Zusammenhang 09_korrelation 4 Grafisch kann man Zusammenhänge zwischen zwei Variablen in einem Scatterplot darstellen.

  5. Kovarianz 09_korrelation 5 Die Kovarianz (= „gemeinsame Varianz“) wird zur Herleitung der Korrelation benötigt. Die Kovarianz wird ähnlich wie die Varianz berechnet:

  6. Kovarianz 09_korrelation 6 Beispiel

  7. Kovarianz 09_korrelation 7 • Immer, wenn eine Person auf beidenVariablen über dem Durchschnitt oderauf beiden Variablen unter dem Durchschnitt liegt, vergrößert sich der Wert für die Kovarianz, sonst verkleinert er sich. • Interpretation: Die Kovarianz ist ein unstandardisiertes Maß • d.h. sie hängt von der Skalierung der beteiligten Variablen ab • Daher können Kovarianzen nicht direkt interpretiert oder verglichen werden. • Aus diesem Grund wird die Kovarianz standardisiert. • Die standardisierte Kovarianz ist der Korrelationskoeffizient.

  8. Produkt-Moment-Korrelation 09_korrelation 8 Der am häufigsten Verwendete Korrelationskoeffizient ist die Produkt-Moment-Korrelation (Pearson-Koeffizient) Berechnung: Die Korrelation entspricht der Kovarianz der z-transformierten Variablen

  9. Produkt-Moment-Korrelation 09_korrelation 9 Interpretation des Korrelationskoeffizienten • Der Korrelationskoeffizient (r) hat einen möglichen Wertebereich von +1 bis -1. • Es gilt: • r = 1  Perfekter positiver Zusammenhang • 1>r > 0  Positiver Zusammenhang • r ≈ 0  kein Zusammenhang • -1<r < 0  Negativer Zusammenhang • r =-1  Perfekter Negativer Zusammenhang

  10. Produkt-Moment-Korrelation 09_korrelation 10 • Korrelationen zeigen nur einen statistischen Zusammenhang dar. Sie dürfen nicht als Beweis für Kausalität verwendet werden. • Zusammenhänge können bedeuten, dass… • … sich „A“ auf „B“ auswirkt. • … sich „B“ auf „A“ auswirkt. • … „A“ und „B“ beide von einem dritten Merkmal „C“ beeinflusst werden • Beispiel: Es soll die Wirksamkeit von Nachhilfestunden untersucht werden. Dabei zeigt sich eine Korrelation von r = -.20 zwischen der Anzahl der genommenen Nachhilfestunden und der Schulleistung.

  11. Varianz von X Varianz von Y Gemeinsame Varianz Determinationskoeffizient 09_korrelation 11 Der Determinationskoeffizient (r²) ist die quadrierte Korrelation Er beschreibt den relativen Anteil der gemeinsamen Varianz von zwei Merkmalen. Der Determinationskoeffizient hat einen Wertebereichvon 0 bis 1.

  12. Produkt-Moment-Korrelation 09_korrelation 12 Beispiel

  13. Signifikanztest 09_korrelation 13 Statistische Signifikanz des Korrelationskoeffizienten • Auch bei Korrelationskoeffizienten muss ein Signifikanztest durchgeführt werden • Es werden dabei folgende Hypothesen geprüft • Ungerichtet: • H0: ρ = 0 (“rho” = Null) • H1: ρ ≠ 0 • Gerichtet: • H0: ρ ≤ 0 (bzw.: ρ ≥ 0) • H1: ρ > 0 (bzw.: ρ < 0)

  14. Signifikanztest 09_korrelation 14 Auch der Korrelationskoeffizient kann mit einem t-Test auf Signifikanz getestet werden. Dabei wird der empirische t-Wert wie folgt berechnet: Wie immer gilt: Wenn temp> tkrit wird die H0 verworfen tkrit wird unter Berücksichtigung der Freiheitsgrade, des Alpha-Niveaus und der Art der Testung aus der Tabelle abgelesen.

  15. Signifikanztest 09_korrelation 15 Für das Beispiel ergibt sich: • Der kritischer t-Wert bei df=3, α=.05 und 2-seitiger Testung beträgt:tkrit = 3.18. • Die H0 wird also verworfen. Es besteht demnach ein bedeutsamer Zusammenhang zwischen den beiden untersuchten Variablen.

  16. SPSS 09_korrelation 16 Datensatz: • Für eine Korrelation werdenimmer für jede Vp gültigeWerte für beide Variablen benötigt.

  17. SPSS 09_korrelation 17 Menu Befehl: • Analysieren • Korrelation • Bivariat

  18. SPSS 09_korrelation 18 Menu Befehl: • Beide Variablenauswählen • Pearson (für die Produkt-Moment-Korrelation) • Ein oder Zweiseitig? • OK

  19. SPSS 09_korrelation 19 SPSS Syntax: correlationoptwithrisiko. • Allgemein: correlationVAR1 withVAR2. • Oder: correlationVAR1,VAR2, VAR3, … .

  20. SPSS 09_korrelation 20 SPSS Ausgabe: • r = .93 • p < .05 • Also: signifikanter Zusammenhang

  21. SPSS 09_korrelation 21

  22. Voraussetzungen der Produkt-Moment Korellation Voraussetzungen der Produkt-Moment-Korrelation: • Intervallskalenniveau der Variablen • Normalverteilung der Variablen • Homoskedastizität: • Normalverteilung von y für alle Probanden, die den gleichen x-Wert haben. • Die Homoskedastizität ist in der Praxis kaum zu überprüfen!) • Zusätzliche Einschränkung: Es können nur lineare Zusammenhänge gezeigt werden! 09_korrelation 22

  23. Mittelwerte von Korrelationen • Korrelationen sind nicht intervallskaliert. Daher ist es nicht erlaubt, direkt einen Mittelwert zu bilden! • Vorgehen: • Berechnung von Fischers Z-Transformation für die einzelnen Korrelationen • Berechnung des (gewichteten) Mittelwertes der Z-Werte • Rücktransformation des arith-metischen Mittels (Tabelle in Leonhart, S. 466) 09_korrelation 23

  24. Mittelwerte von Korrelationen Beispiel: In zwei Untersuchungen wurde derZusammenhang zwischen der Studien-motivation und der Examensnote bestimmt. Fischers Z: Mittelwert: Rücktransformierung (nach Tabelle): 09_korrelation 24

  25. Unterschiede von Korrelationen • Fragestellung: Ist der Unterschied zwischen zwei Korrelationen statistisch bedeutsam? • Vorgehen: • Berechnung von Fischers Z-Transformation für beide Korrelationen. • Berechnung eines empirischen z-Werts • Bestimmung eines kritischen z-Wert (aus der Tabelle für die Standard-normalverteilung). • Wenn zemp > zkrit, liegt ein signifikanter Unterschied zwischen r1 und r2 vor. 09_korrelation 25

  26. Unterschiede von Korrelationen Beispiel: Es soll geprüft werden, ob sich diebeiden Korrelationen von Folie 24 signifikantunterscheiden. Berechnung: Interpretation: Die H0 kann nicht verworfen werden. Der Unterschied zwischen r1 und r2 ist nicht statistisch bedeutsam. 09_korrelation 26

  27. Optimale Stichprobenumfänge Wie beim t-Test gilt auch bei der Korrelation: Je kleiner ein Effekt (d.h. ein Zusammenhang), desto mehr Probanden werden benötigt, um ihn nachzuweisen! Die optimale Stichprobengröße kann mit G*Power bestimmt werden. Folgende Formel erlaubt eine Schätzung der optimalen Stichprobengröße:(Z: Fischers Z) 09_korrelation 27

  28. Optimale Stichprobenumfänge Fazit: Um eine Korrelation vonr = .30 mit einer Power von .90zeigen zur können, benötigt maneine Stichprobe von N=109. 09_korrelation 28

  29. Optimale Stichprobenumfänge Fazit: Um eine Korrelation vonr = .50 mit einer Power von .80(1-seitig) zeigen zur können, benötigt man eine Stichprobevon N=21. 09_korrelation 29

  30. Korrelationen ohne Intervallskalenniveau Wenn zur Überprüfung einer Zusammenhangshypothese keine intervallskalierten Daten zur Verfügung stehen, kann die Produkt-Moment-Korrelation nicht verwendet werden. Es gibt jedoch eine ganze Reihe weiterer Maße für die Korrelation, die in diesem Fall eingesetzt werden können. Dabei muss das Skalenniveau beider Variablen berück-sichtigt werden. Die folgende Tabelle gibt einen Überblick über den Einsatz der unterschiedlichen Koeffizienten. 09_korrelation 30

  31. Nach Leonhart (2004), S. 204

  32. Spearmans Rangkorrelation Spearmans Rangkorrelation wird eingesetzt, wenn… • … zwei Variablen (x, y) als ordinalskaliert sind. • … eine intervallskalierte und eine ordinalskalierte Variable vorliegen. • … intervallskalierte Variablen vorliegen aber die Normalverteilungsannahme verletzt ist. Vorsicht: • Wenn Rangplätze mehrfach besetzt sind („Rangbindung“), sollte Spearmans Rangkorrelation nicht verwendet werden. • In diesem Fall empfiehlt sich die Verwendung vonKendallsτ. 09_korrelation 32

  33. Spearmans Rangkorrelation • Alle Variablen werden vor der Berechnung in eine Rangreihe (Rang 1 bis N) transformiert. • Beispiel: • 3.40; 27.40; 7.80; 15.00; 27.10 •  1, 5, 2, 3, 4 • Berechnung: • Signifikanztest: 09_korrelation 33

  34. Spearmans Rangkorrelation Beispiel: Vergleich der Ergebnisse aus zwei Angsttests: 09_korrelation 34

  35. Spearmans Rangkorrelation Berechnung des Koeffizienten: Signifikanztest: Für df=6 und α=.05 bei einseitiger Testung ergibt sich: Die Korrelation ist statistisch signifikant! 09_korrelation 35

  36. Spearmans Rangkorrelation • Spearmans Rangkorrelation in SPSS • Gleicher Befehl wie für „Pearson“, aber „Spearman“ anwählen 09_korrelation 36

  37. Spearmans Rangkorrelation SPSS Ausgabe 09_korrelation 37

  38. Kendallsτ Kendallsτ („tau“) ist ebenfalls ein Koeffizient für ordinalskalierte Variablen. Kendallsτist unempfindlich gegenüber Ausreißern (es dürfen leere Ränge verwendet werden; die Bildung einer Rangreihe ist nicht notwendig!) Kendallsτwird verwendet, wenn Ränge mehrfach besetzt sind („Rangbindungen“). Hinweis: Kendallsτ fällt in der Regel kleiner aus als Spearmans Koeffizient. Daher sollte letzterer bevorzugt werden, wenn die Voraussetzungen erfüllt sind. 09_korrelation 38

  39. Kendallsτ Berechnung, wenn Rangbindungen vorliegen: • Mit… • P: Anzahl der Proversionen über alle Personen • I: Anzahl der Inversionen über alle Personen • N: Stichprobenumfang • k, m: Anzahl der Kategorien der Variablen X und Y • ti, wj: Anzahl der Probanden auf Rang i oder j 09_korrelation 39

  40. Kendallsτ • Proversionen: Anzahl der Vpn „rechts unterhalb“ eines Werts. • Inversionen: Anzahl der Vpn „links-unterhalb“ eines Werts. P=6 P=2 I=3 I=3 Über alle Vpn ergibt sich: P = 44 I = 7 09_korrelation 40

  41. Kendallsτ Signifikanzprüfung nach Tabelle (Leonhart, 2004, S. 465): Bei N = 12 ist ein Zusammenhang ab P – I > 26 statistisch bedeutsam. 09_korrelation 41

  42. Kendallsτ • Kendallsτ in SPSS: • Gleicher Befehl wie für „Pearson“, aber „Kendallsτ“ anwählen 09_korrelation 42

  43. Punktbiseriale Korrelation Verwendung der Punktbiserialen Korrelation • Es soll ein Zusammenhang zwischen einer intervallskalierten und einer natürlich dichotomen nominalskalierten Variable bestimmt werden. • Oder: Es soll ein Zusammenhang zwischen einer intervallskalierten Variable einerseits und einer (aus einer ursprünglich normalverteilten intervallskalierten Variable) künstlich dichotomisierten Variable bestimmt werden. • Die punktbiseriale Korrelation sollte nicht für latente Variablen verwendet werden! 09_korrelation 43

  44. Punktbiseriale Korrelation Berechnung der Punktbiserialen Korrelation 09_korrelation 44

  45. Punktbiseriale Korrelation Beispiel: Ängstlichkeit von Männern und Frauen Signifikanztest tkrit= 1.99  Der Zusammenhang ist statistisch bedeutsam! 09_korrelation 45

  46. Biseriale Korrelation Verwendung der Biserialen Korrelation: • Ein latentes, intervallskaliertes Konstrukt wird über eine dichotome, manifeste Variable erfasst. (z.B. „Haben Sie gute Statistikkenntnisse: ja/nein?“). • Eine intervallskalierten Variable wird künstlich dichotomisiert. (z.B. Alter größer oder kleiner 18 Jahre). 09_korrelation 46

  47. Biseriale Korrelation Berechnung der Biserialen Korrelation 09_korrelation 47

  48. Biseriale Korrelation Bestimmung von δ: • Bestimmung des Anteil der Probanden in Gruppe 1: • z.B. p(Gr.=1) = .40 • Bestimmung der Ordinate („y-Achse“) der Normalverteilung für p aus einer Tabelle zur Standardnormalverteilung. • z.B. Ordinate(p =.40) = 0.386 09_korrelation 48

  49. Biseriale Korrelation Beispiel: Nutzungsdauer des Internets (Minuten pro Tag) von Jugendlichen und Erwachsenen. 09_korrelation 49

  50. Biseriale Rangkorrelation Verwendung der BiserialenRangkorrelation: • Der Zusammenhang zwischen einer ordinalskalierten Variable und einer dichotomen Variable soll bestimmt werden. Berechnung: 09_korrelation 50

More Related