Korrelation
Download
1 / 68

Korrelation - PowerPoint PPT Presentation


  • 178 Views
  • Uploaded on

Korrelation. Gliederung Kovarianz Die Produkt-Moment-Korrelation Berechnung SPSS Voraussetzungen Mittelwerte von Korrelationen berechnen Unterschiede von Korrelationen testen Optimale Stichproben. Korrelation. Gliederung Korrelationen bei nicht intervallskalierten Variablen

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Korrelation' - genera


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Korrelation
Korrelation

09_korrelation 1

Gliederung

  • Kovarianz

  • Die Produkt-Moment-Korrelation

    • Berechnung

    • SPSS

    • Voraussetzungen

  • Mittelwerte von Korrelationen berechnen

  • Unterschiede von Korrelationen testen

  • Optimale Stichproben


Korrelation1
Korrelation

09_korrelation 2

Gliederung

  • Korrelationen bei nicht intervallskalierten Variablen

    • Spearman‘s Rangkorrelation

    • Kendallsτ

    • Punktbiseriale Korrelation

    • Biseriale Korrelation

    • Biseriale Rangkorrelation

    • Punkttetrachorische Korrelation

    • Tetrachorische Korrelation

    • Polychorische Korrelation

    • Yules Y

    • ν-Koeffizient

    • Der Kontingenzkoeffizient CC

    • Cramérs Index


Kovarianz und korrelation
Kovarianz und Korrelation

09_korrelation 3

Kovarianz und Korrelation sind Maße für den (linearen) Zusammenhang zwischen zwei Variablen.

Eine positive Korrelation (bzw. Kovarianz) ist dann gegeben, wenn ein hoher Wert auf einer Variable häufig mit einen hohen Wert auf der anderen Variable einhergeht (z.B. Optimismus und Risikobereitschaft).

Eine negative Korrelation (bzw. Kovarianz) ist dann gegeben, wenn ein hoher Wert auf einer Variable häufig mit einen niedrigen Wert auf der anderen Variable einhergeht (z.B. Optimismus und Ängstlichkeit).


Kovarianz und korrelation1
Kovarianz und Korrelation

negativer Zusammenhang

positiver Zusammenhang

09_korrelation 4

Grafisch kann man Zusammenhänge zwischen zwei Variablen in einem Scatterplot darstellen.


Kovarianz
Kovarianz

09_korrelation 5

Die Kovarianz (= „gemeinsame Varianz“) wird zur Herleitung der Korrelation benötigt.

Die Kovarianz wird ähnlich wie die Varianz berechnet:


Kovarianz1
Kovarianz

09_korrelation 6

Beispiel


Kovarianz2
Kovarianz

09_korrelation 7

  • Immer, wenn eine Person auf beidenVariablen über dem Durchschnitt oderauf beiden Variablen unter dem Durchschnitt liegt, vergrößert sich der Wert für die Kovarianz, sonst verkleinert er sich.

  • Interpretation: Die Kovarianz ist ein unstandardisiertes Maß

    • d.h. sie hängt von der Skalierung der beteiligten Variablen ab

    • Daher können Kovarianzen nicht direkt interpretiert oder verglichen werden.

  • Aus diesem Grund wird die Kovarianz standardisiert.

  • Die standardisierte Kovarianz ist der Korrelationskoeffizient.


Produkt moment korrelation
Produkt-Moment-Korrelation

09_korrelation 8

Der am häufigsten Verwendete Korrelationskoeffizient ist die Produkt-Moment-Korrelation (Pearson-Koeffizient)

Berechnung:

Die Korrelation entspricht der Kovarianz der z-transformierten Variablen


Produkt moment korrelation1
Produkt-Moment-Korrelation

09_korrelation 9

Interpretation des Korrelationskoeffizienten

  • Der Korrelationskoeffizient (r) hat einen möglichen Wertebereich von +1 bis -1.

  • Es gilt:

    • r = 1  Perfekter positiver Zusammenhang

    • 1>r > 0  Positiver Zusammenhang

    • r ≈ 0  kein Zusammenhang

    • -1<r < 0  Negativer Zusammenhang

    • r =-1  Perfekter Negativer Zusammenhang


Produkt moment korrelation2
Produkt-Moment-Korrelation

09_korrelation 10

  • Korrelationen zeigen nur einen statistischen Zusammenhang dar. Sie dürfen nicht als Beweis für Kausalität verwendet werden.

  • Zusammenhänge können bedeuten, dass…

    • … sich „A“ auf „B“ auswirkt.

    • … sich „B“ auf „A“ auswirkt.

    • … „A“ und „B“ beide von einem dritten Merkmal „C“ beeinflusst werden

  • Beispiel: Es soll die Wirksamkeit von Nachhilfestunden untersucht werden. Dabei zeigt sich eine Korrelation von r = -.20 zwischen der Anzahl der genommenen Nachhilfestunden und der Schulleistung.


Determinationskoeffizient

Varianz von X

Varianz von Y

Gemeinsame Varianz

Determinationskoeffizient

09_korrelation 11

Der Determinationskoeffizient (r²) ist die quadrierte Korrelation

Er beschreibt den relativen Anteil der gemeinsamen Varianz von zwei Merkmalen.

Der Determinationskoeffizient hat einen Wertebereichvon 0 bis 1.


Produkt moment korrelation3
Produkt-Moment-Korrelation

09_korrelation 12

Beispiel


Signifikanztest
Signifikanztest

09_korrelation 13

Statistische Signifikanz des Korrelationskoeffizienten

  • Auch bei Korrelationskoeffizienten muss ein Signifikanztest durchgeführt werden

  • Es werden dabei folgende Hypothesen geprüft

    • Ungerichtet:

      • H0: ρ = 0 (“rho” = Null)

      • H1: ρ ≠ 0

    • Gerichtet:

      • H0: ρ ≤ 0 (bzw.: ρ ≥ 0)

      • H1: ρ > 0 (bzw.: ρ < 0)


Signifikanztest1
Signifikanztest

09_korrelation 14

Auch der Korrelationskoeffizient kann mit einem t-Test auf Signifikanz getestet werden.

Dabei wird der empirische t-Wert wie folgt berechnet:

Wie immer gilt: Wenn temp> tkrit wird die H0 verworfen

tkrit wird unter Berücksichtigung der Freiheitsgrade, des Alpha-Niveaus und der Art der Testung aus der Tabelle abgelesen.


Signifikanztest2
Signifikanztest

09_korrelation 15

Für das Beispiel ergibt sich:

  • Der kritischer t-Wert bei df=3, α=.05 und 2-seitiger Testung beträgt:tkrit = 3.18.

  • Die H0 wird also verworfen. Es besteht demnach ein bedeutsamer Zusammenhang zwischen den beiden untersuchten Variablen.


SPSS

09_korrelation 16

Datensatz:

  • Für eine Korrelation werdenimmer für jede Vp gültigeWerte für beide Variablen benötigt.


SPSS

09_korrelation 17

Menu Befehl:

  • Analysieren

  • Korrelation

  • Bivariat


SPSS

09_korrelation 18

Menu Befehl:

  • Beide Variablenauswählen

  • Pearson (für die Produkt-Moment-Korrelation)

  • Ein oder Zweiseitig?

  • OK


SPSS

09_korrelation 19

SPSS Syntax:

correlationoptwithrisiko.

  • Allgemein: correlationVAR1 withVAR2.

  • Oder: correlationVAR1,VAR2, VAR3, … .


SPSS

09_korrelation 20

SPSS Ausgabe:

  • r = .93

  • p < .05

  • Also: signifikanter Zusammenhang


SPSS

09_korrelation 21


Voraussetzungen der produkt moment korellation
Voraussetzungen der Produkt-Moment Korellation

Voraussetzungen der Produkt-Moment-Korrelation:

  • Intervallskalenniveau der Variablen

  • Normalverteilung der Variablen

  • Homoskedastizität:

    • Normalverteilung von y für alle Probanden, die den gleichen x-Wert haben.

    • Die Homoskedastizität ist in der Praxis kaum zu überprüfen!)

  • Zusätzliche Einschränkung: Es können nur lineare Zusammenhänge gezeigt werden!

09_korrelation 22


Mittelwerte von korrelationen
Mittelwerte von Korrelationen

  • Korrelationen sind nicht intervallskaliert. Daher ist es nicht erlaubt, direkt einen Mittelwert zu bilden!

  • Vorgehen:

    • Berechnung von Fischers Z-Transformation für die einzelnen Korrelationen

    • Berechnung des (gewichteten) Mittelwertes der Z-Werte

    • Rücktransformation des arith-metischen Mittels (Tabelle in Leonhart, S. 466)

09_korrelation 23


Mittelwerte von korrelationen1
Mittelwerte von Korrelationen

Beispiel: In zwei Untersuchungen wurde derZusammenhang zwischen der Studien-motivation und der Examensnote bestimmt.

Fischers Z:

Mittelwert:

Rücktransformierung (nach Tabelle):

09_korrelation 24


Unterschiede von korrelationen
Unterschiede von Korrelationen

  • Fragestellung: Ist der Unterschied zwischen zwei Korrelationen statistisch bedeutsam?

  • Vorgehen:

    • Berechnung von Fischers Z-Transformation für beide Korrelationen.

    • Berechnung eines empirischen z-Werts

    • Bestimmung eines kritischen z-Wert (aus der Tabelle für die Standard-normalverteilung).

    • Wenn zemp > zkrit, liegt ein signifikanter Unterschied zwischen r1 und r2 vor.

09_korrelation 25


Unterschiede von korrelationen1
Unterschiede von Korrelationen

Beispiel: Es soll geprüft werden, ob sich diebeiden Korrelationen von Folie 24 signifikantunterscheiden.

Berechnung:

Interpretation: Die H0 kann nicht verworfen werden. Der Unterschied zwischen r1 und r2 ist nicht statistisch bedeutsam.

09_korrelation 26


Optimale stichprobenumf nge
Optimale Stichprobenumfänge

Wie beim t-Test gilt auch bei der Korrelation: Je kleiner ein Effekt (d.h. ein Zusammenhang), desto mehr Probanden werden benötigt, um ihn nachzuweisen!

Die optimale Stichprobengröße kann mit G*Power bestimmt werden.

Folgende Formel erlaubt eine Schätzung der optimalen Stichprobengröße:(Z: Fischers Z)

09_korrelation 27


Optimale stichprobenumf nge1
Optimale Stichprobenumfänge

Fazit: Um eine Korrelation vonr = .30 mit einer Power von .90zeigen zur können, benötigt maneine Stichprobe von N=109.

09_korrelation 28


Optimale stichprobenumf nge2
Optimale Stichprobenumfänge

Fazit: Um eine Korrelation vonr = .50 mit einer Power von .80(1-seitig) zeigen zur können, benötigt man eine Stichprobevon N=21.

09_korrelation 29


Korrelationen ohne intervallskalenniveau
Korrelationen ohne Intervallskalenniveau

Wenn zur Überprüfung einer Zusammenhangshypothese keine intervallskalierten Daten zur Verfügung stehen, kann die Produkt-Moment-Korrelation nicht verwendet werden.

Es gibt jedoch eine ganze Reihe weiterer Maße für die Korrelation, die in diesem Fall eingesetzt werden können.

Dabei muss das Skalenniveau beider Variablen berück-sichtigt werden.

Die folgende Tabelle gibt einen Überblick über den Einsatz der unterschiedlichen Koeffizienten.

09_korrelation 30



Spearmans rangkorrelation
Spearmans Rangkorrelation

Spearmans Rangkorrelation wird eingesetzt, wenn…

  • … zwei Variablen (x, y) als ordinalskaliert sind.

  • … eine intervallskalierte und eine ordinalskalierte Variable vorliegen.

  • … intervallskalierte Variablen vorliegen aber die Normalverteilungsannahme verletzt ist.

    Vorsicht:

    • Wenn Rangplätze mehrfach besetzt sind („Rangbindung“), sollte Spearmans Rangkorrelation nicht verwendet werden.

    • In diesem Fall empfiehlt sich die Verwendung vonKendallsτ.

09_korrelation 32


Spearmans rangkorrelation1
Spearmans Rangkorrelation

  • Alle Variablen werden vor der Berechnung in eine Rangreihe (Rang 1 bis N) transformiert.

  • Beispiel:

    • 3.40; 27.40; 7.80; 15.00; 27.10

    •  1, 5, 2, 3, 4

  • Berechnung:

  • Signifikanztest:

09_korrelation 33


Spearmans rangkorrelation2
Spearmans Rangkorrelation

Beispiel: Vergleich der Ergebnisse aus zwei Angsttests:

09_korrelation 34


Spearmans rangkorrelation3
Spearmans Rangkorrelation

Berechnung des Koeffizienten:

Signifikanztest:

Für df=6 und α=.05 bei einseitiger Testung ergibt sich:

Die Korrelation ist statistisch signifikant!

09_korrelation 35


Spearmans rangkorrelation4
Spearmans Rangkorrelation

  • Spearmans Rangkorrelation in SPSS

    • Gleicher Befehl wie für „Pearson“, aber „Spearman“ anwählen

09_korrelation 36


Spearmans rangkorrelation5
Spearmans Rangkorrelation

SPSS Ausgabe

09_korrelation 37


Kendalls
Kendallsτ

Kendallsτ („tau“) ist ebenfalls ein Koeffizient für ordinalskalierte Variablen.

Kendallsτist unempfindlich gegenüber Ausreißern (es dürfen leere Ränge verwendet werden; die Bildung einer Rangreihe ist nicht notwendig!)

Kendallsτwird verwendet, wenn Ränge mehrfach besetzt sind („Rangbindungen“).

Hinweis: Kendallsτ fällt in der Regel kleiner aus als Spearmans Koeffizient. Daher sollte letzterer bevorzugt werden, wenn die Voraussetzungen erfüllt sind.

09_korrelation 38


Kendalls1
Kendallsτ

Berechnung, wenn Rangbindungen vorliegen:

  • Mit…

    • P: Anzahl der Proversionen über alle Personen

    • I: Anzahl der Inversionen über alle Personen

    • N: Stichprobenumfang

    • k, m: Anzahl der Kategorien der Variablen X und Y

    • ti, wj: Anzahl der Probanden auf Rang i oder j

09_korrelation 39


Kendalls2
Kendallsτ

  • Proversionen: Anzahl der Vpn „rechts unterhalb“ eines Werts.

  • Inversionen: Anzahl der Vpn „links-unterhalb“ eines Werts.

P=6

P=2

I=3

I=3

Über alle Vpn ergibt sich:

P = 44

I = 7

09_korrelation 40


Kendalls3
Kendallsτ

Signifikanzprüfung nach Tabelle (Leonhart, 2004, S. 465):

Bei N = 12 ist ein Zusammenhang ab P – I > 26 statistisch bedeutsam.

09_korrelation 41


Kendalls4
Kendallsτ

  • Kendallsτ in SPSS:

    • Gleicher Befehl wie für „Pearson“, aber „Kendallsτ“ anwählen

09_korrelation 42


Punktbiseriale korrelation
Punktbiseriale Korrelation

Verwendung der Punktbiserialen Korrelation

  • Es soll ein Zusammenhang zwischen einer intervallskalierten und einer natürlich dichotomen nominalskalierten Variable bestimmt werden.

  • Oder: Es soll ein Zusammenhang zwischen einer intervallskalierten Variable einerseits und einer (aus einer ursprünglich normalverteilten intervallskalierten Variable) künstlich dichotomisierten Variable bestimmt werden.

  • Die punktbiseriale Korrelation sollte nicht für latente Variablen verwendet werden!

09_korrelation 43


Punktbiseriale korrelation1
Punktbiseriale Korrelation

Berechnung der Punktbiserialen Korrelation

09_korrelation 44


Punktbiseriale korrelation2
Punktbiseriale Korrelation

Beispiel: Ängstlichkeit von Männern und Frauen

Signifikanztest

tkrit= 1.99  Der Zusammenhang ist statistisch bedeutsam!

09_korrelation 45


Biseriale korrelation
Biseriale Korrelation

Verwendung der Biserialen Korrelation:

  • Ein latentes, intervallskaliertes Konstrukt wird über eine dichotome, manifeste Variable erfasst. (z.B. „Haben Sie gute Statistikkenntnisse: ja/nein?“).

  • Eine intervallskalierten Variable wird künstlich dichotomisiert. (z.B. Alter größer oder kleiner 18 Jahre).

09_korrelation 46


Biseriale korrelation1
Biseriale Korrelation

Berechnung der Biserialen Korrelation

09_korrelation 47


Biseriale korrelation2
Biseriale Korrelation

Bestimmung von δ:

  • Bestimmung des Anteil der Probanden in Gruppe 1:

    • z.B. p(Gr.=1) = .40

  • Bestimmung der Ordinate („y-Achse“) der Normalverteilung für p aus einer Tabelle zur Standardnormalverteilung.

    • z.B. Ordinate(p =.40) = 0.386

09_korrelation 48


Biseriale korrelation3
Biseriale Korrelation

Beispiel: Nutzungsdauer des Internets (Minuten pro Tag) von Jugendlichen und Erwachsenen.

09_korrelation 49


Biseriale rangkorrelation
Biseriale Rangkorrelation

Verwendung der BiserialenRangkorrelation:

  • Der Zusammenhang zwischen einer ordinalskalierten Variable und einer dichotomen Variable soll bestimmt werden.

    Berechnung:

09_korrelation 50


Biseriale rangkorrelation1
Biseriale Rangkorrelation

Korrektur bei Rangbindungen:

  • b: Anzahl der vorhandenen Rangplätze.

  • ti: Anzahl der Probanden auf Rangplatz i.

09_korrelation 51


Biseriale rangkorrelation2
Biseriale Rangkorrelation

R(x),R(y): Mittlerer Rangd: Differenz der mittleren Ränge

  • Beispiel: Es soll der Zusammenhang des Geschlechts mit einem vierstufigen Rating zum Optimismus bestimmt werden.

09_korrelation 52


Biseriale rangkorrelation3
Biseriale Rangkorrelation

Summe der quadrierten Rangdifferenzen

Korrekturkoeffizient:

09_korrelation 53


Biseriale rangkorrelation4
Biseriale Rangkorrelation

Berechnung der Korrelation:

09_korrelation 54


Punkttetrachorische korrelation
Punkttetrachorische Korrelation

Verwendung der Punkttetrachorischen Korrelation

  • Der Zusammenhang von 2 dichotomen Variablen soll bestimmt werden.

  • Alternativen:

    • Die punkttetrachorische Korrelation sollte nicht bei ungleichen Randsummen verwendet werden (Alternative: Yules Y).

    • Wenn eine intervallskalierte latente Variable zugrunde liegt, sollte der ν-Koeffizientverwendet werden.

    • Liegen zwei normalverteilte latente Variablen zugrunde, sollte die tetrachorische Korrelation verwendet werden.

    • Bei polytomen Variablen wird Cramérs Index verwendet.

09_korrelation 55


Punkttetrachorische korrelation1
Punkttetrachorische Korrelation

Berechnung der Punkttetrachorischen Korrelation

  • Beispiel: Zusammenhang von Geschlecht und Besitz eines Autos

09_korrelation 56


Tetrachorische korrelation
Tetrachorische Korrelation

Verwendung der Tetrachorischen Korrelation

  • Der Zusammenhang von zwei künstlich dichotomisierten Variablen, die auf intervallskalierten latenten Variablen beruhen, soll bestimmt werden.

    Berechnung (Näherungsformel):

09_korrelation 57


Polychorische korrelation
Polychorische Korrelation

Verwendung der Polychorischen Korrelation

  • Der Zusammenhang von zwei ordinalskalierten Merkmalen, denen latente intervallskalierte Merkmale zugrunde liegen soll berechnet werden.

    Die Berechnung wird hier nicht dargestellt, da sie relativ komplex ist (siehe Leonhart, 2004, S.221).

09_korrelation 58


Yules y
Yules Y

Verwendung von Yules Y

  • Der Zusammenhang von zwei natürlich dichotomen Variablen soll bestimmt werden.

  • Yules Y darf auch verwendet werden, wenn sich die Randsummen stark unterscheiden.

    Berechnung:

09_korrelation 59


Yules y1
Yules Y

Beispiel: Zusammenhang von Geschlecht und Besitz eines Autos

09_korrelation 60


Koeffizient
ν-Koeffizient

p.1: relative Häufigkeit der Stufe 1 des natürlich-dichotomen Merkmals

p.2: relative Häufigkeit der Stufe 2 des natürlich-dichotomen Merkmals

Verwendung des ν-Koeffizient

  • Der Zusammenhang von einem natürlich dichotomen und einer künstlich dichotomisierten Variable, der ein latentes Konstrukt zugrunde liegt, soll berechnet werden.

    Berechnung:

09_korrelation 61


Kontingenzkoeffizient cc
Kontingenzkoeffizient CC

Verwendung des Kontingenzkoeffizient CC

  • Der Zusammenhang zwischen zwei polytomen nominalskalierten Variablen soll berechnet werden.

  • CC sollte nicht bei ungleichen Randsummen verwendet werden.

  • Da CC nicht wie ein Korrelationskoeffizient skaliert ist (r<1), wird immer die Verwendung von Cramérs C empfohlen.

    Beispiel: Die Auftretenshäufigkeit psychiatrischer Diagnosen soll zwischen Verschiedenen EU-Staaten verglichen werden.

09_korrelation 62


Cram rs index
Cramérs Index

Verwendung von Cramérs Index

  • Der Zusammenhang zwischen zwei polytomen nominalskalierten Variablen soll berechnet werden.

    Beispiel:

  • Die Auftretenshäufigkeit psychiatrischer Diagnosen soll zwischen Verschiedenen EU-Staaten verglichen werden.

    Berechnung:

09_korrelation 63


Cram rs index1
Cramérs Index

Beobachtete Häufigkeiten

Erwartete Häufigkeiten

09_korrelation 64


Cram rs index2
Cramérs Index

09_korrelation 65


Zusammenfassung
Zusammenfassung

  • Kovarianz und Korrelation sind Maße für den (linearen) Zusammenhang zwischen zwei Variablen.

  • Positive bzw. negative Zusammenhänge erkennt man durch „ansteigende“ bzw. „abfallende“ Formen einer Punktewolke in einem Streudiagramm.

  • Die Kovarianz ist ein unstandardisiertes Maß; sie kann beliebige Werte annehmen.

  • Die Korrelation ist ein standardisiertes Maß; sie nimmt Werte zwischen -1 und +1 an.

  • Die Produkt-Moment-Korrelation kann mit einem t-Test auf Signifikanz überprüft werden.

09_korrelation 66


Zusammenfassung1
Zusammenfassung

Voraussetzungen für die Berechnung der Produkt-Moment-Korrelation sind (a) Intervallskalenniveau, (b) Normalverteilung und (c) Homoskedastizität.

Der Determinationskoeffizient gibt den Anteil der gemeinsamen Varianz an.

Mit Hilfe von Fischers Z-Transformation ist es möglich, Mittelwerte von Korrelationen zu berechnen und Unterschiede von Korrelationen auf Signifikanz zu prüfen.

Um schwache Zusammenhänge nachweisen zu können, sind sehr große Stichproben notwendig (G*Power).

09_korrelation 67


Zusammenfassung2
Zusammenfassung

Für nicht-intervallskalierte Variablen gibt es eine Reihe alternativer Korrelationskoeffizienten, die unterschiedliche Voraussetzungen haben.

Besonders wichtig sind dabei Spearmans Rangkorrelation und Kendallsτ

09_korrelation 68