Korrelation
This presentation is the property of its rightful owner.
Sponsored Links
1 / 68

Korrelation PowerPoint PPT Presentation


  • 80 Views
  • Uploaded on
  • Presentation posted in: General

Korrelation. Gliederung Kovarianz Die Produkt-Moment-Korrelation Berechnung SPSS Voraussetzungen Mittelwerte von Korrelationen berechnen Unterschiede von Korrelationen testen Optimale Stichproben. Korrelation. Gliederung Korrelationen bei nicht intervallskalierten Variablen

Download Presentation

Korrelation

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Korrelation

Korrelation

09_korrelation1

Gliederung

  • Kovarianz

  • Die Produkt-Moment-Korrelation

    • Berechnung

    • SPSS

    • Voraussetzungen

  • Mittelwerte von Korrelationen berechnen

  • Unterschiede von Korrelationen testen

  • Optimale Stichproben


Korrelation1

Korrelation

09_korrelation2

Gliederung

  • Korrelationen bei nicht intervallskalierten Variablen

    • Spearman‘s Rangkorrelation

    • Kendallsτ

    • Punktbiseriale Korrelation

    • Biseriale Korrelation

    • Biseriale Rangkorrelation

    • Punkttetrachorische Korrelation

    • Tetrachorische Korrelation

    • Polychorische Korrelation

    • Yules Y

    • ν-Koeffizient

    • Der Kontingenzkoeffizient CC

    • Cramérs Index


Kovarianz und korrelation

Kovarianz und Korrelation

09_korrelation3

Kovarianz und Korrelation sind Maße für den (linearen) Zusammenhang zwischen zwei Variablen.

Eine positive Korrelation (bzw. Kovarianz) ist dann gegeben, wenn ein hoher Wert auf einer Variable häufig mit einen hohen Wert auf der anderen Variable einhergeht (z.B. Optimismus und Risikobereitschaft).

Eine negative Korrelation (bzw. Kovarianz) ist dann gegeben, wenn ein hoher Wert auf einer Variable häufig mit einen niedrigen Wert auf der anderen Variable einhergeht (z.B. Optimismus und Ängstlichkeit).


Kovarianz und korrelation1

Kovarianz und Korrelation

negativer Zusammenhang

positiver Zusammenhang

09_korrelation4

Grafisch kann man Zusammenhänge zwischen zwei Variablen in einem Scatterplot darstellen.


Kovarianz

Kovarianz

09_korrelation5

Die Kovarianz (= „gemeinsame Varianz“) wird zur Herleitung der Korrelation benötigt.

Die Kovarianz wird ähnlich wie die Varianz berechnet:


Kovarianz1

Kovarianz

09_korrelation6

Beispiel


Kovarianz2

Kovarianz

09_korrelation7

  • Immer, wenn eine Person auf beidenVariablen über dem Durchschnitt oderauf beiden Variablen unter dem Durchschnitt liegt, vergrößert sich der Wert für die Kovarianz, sonst verkleinert er sich.

  • Interpretation: Die Kovarianz ist ein unstandardisiertes Maß

    • d.h. sie hängt von der Skalierung der beteiligten Variablen ab

    • Daher können Kovarianzen nicht direkt interpretiert oder verglichen werden.

  • Aus diesem Grund wird die Kovarianz standardisiert.

  • Die standardisierte Kovarianz ist der Korrelationskoeffizient.


Produkt moment korrelation

Produkt-Moment-Korrelation

09_korrelation8

Der am häufigsten Verwendete Korrelationskoeffizient ist die Produkt-Moment-Korrelation (Pearson-Koeffizient)

Berechnung:

Die Korrelation entspricht der Kovarianz der z-transformierten Variablen


Produkt moment korrelation1

Produkt-Moment-Korrelation

09_korrelation9

Interpretation des Korrelationskoeffizienten

  • Der Korrelationskoeffizient (r) hat einen möglichen Wertebereich von +1 bis -1.

  • Es gilt:

    • r = 1 Perfekter positiver Zusammenhang

    • 1>r > 0 Positiver Zusammenhang

    • r ≈ 0 kein Zusammenhang

    • -1<r < 0 Negativer Zusammenhang

    • r =-1 Perfekter Negativer Zusammenhang


Produkt moment korrelation2

Produkt-Moment-Korrelation

09_korrelation10

  • Korrelationen zeigen nur einen statistischen Zusammenhang dar. Sie dürfen nicht als Beweis für Kausalität verwendet werden.

  • Zusammenhänge können bedeuten, dass…

    • … sich „A“ auf „B“ auswirkt.

    • … sich „B“ auf „A“ auswirkt.

    • … „A“ und „B“ beide von einem dritten Merkmal „C“ beeinflusst werden

  • Beispiel: Es soll die Wirksamkeit von Nachhilfestunden untersucht werden. Dabei zeigt sich eine Korrelation von r = -.20 zwischen der Anzahl der genommenen Nachhilfestunden und der Schulleistung.


Determinationskoeffizient

Varianz von X

Varianz von Y

Gemeinsame Varianz

Determinationskoeffizient

09_korrelation11

Der Determinationskoeffizient (r²) ist die quadrierte Korrelation

Er beschreibt den relativen Anteil der gemeinsamen Varianz von zwei Merkmalen.

Der Determinationskoeffizient hat einen Wertebereichvon 0 bis 1.


Produkt moment korrelation3

Produkt-Moment-Korrelation

09_korrelation12

Beispiel


Signifikanztest

Signifikanztest

09_korrelation13

Statistische Signifikanz des Korrelationskoeffizienten

  • Auch bei Korrelationskoeffizienten muss ein Signifikanztest durchgeführt werden

  • Es werden dabei folgende Hypothesen geprüft

    • Ungerichtet:

      • H0: ρ = 0(“rho” = Null)

      • H1: ρ ≠ 0

    • Gerichtet:

      • H0: ρ ≤ 0 (bzw.: ρ ≥ 0)

      • H1: ρ > 0 (bzw.: ρ < 0)


Signifikanztest1

Signifikanztest

09_korrelation14

Auch der Korrelationskoeffizient kann mit einem t-Test auf Signifikanz getestet werden.

Dabei wird der empirische t-Wert wie folgt berechnet:

Wie immer gilt: Wenn temp> tkrit wird die H0 verworfen

tkrit wird unter Berücksichtigung der Freiheitsgrade, des Alpha-Niveaus und der Art der Testung aus der Tabelle abgelesen.


Signifikanztest2

Signifikanztest

09_korrelation15

Für das Beispiel ergibt sich:

  • Der kritischer t-Wert bei df=3, α=.05 und 2-seitiger Testung beträgt:tkrit = 3.18.

  • Die H0 wird also verworfen. Es besteht demnach ein bedeutsamer Zusammenhang zwischen den beiden untersuchten Variablen.


Korrelation

SPSS

09_korrelation16

Datensatz:

  • Für eine Korrelation werdenimmer für jede Vp gültigeWerte für beide Variablen benötigt.


Korrelation

SPSS

09_korrelation17

Menu Befehl:

  • Analysieren

  • Korrelation

  • Bivariat


Korrelation

SPSS

09_korrelation18

Menu Befehl:

  • Beide Variablenauswählen

  • Pearson (für die Produkt-Moment-Korrelation)

  • Ein oder Zweiseitig?

  • OK


Korrelation

SPSS

09_korrelation19

SPSS Syntax:

correlationoptwithrisiko.

  • Allgemein: correlationVAR1 withVAR2.

  • Oder: correlationVAR1,VAR2, VAR3, … .


Korrelation

SPSS

09_korrelation20

SPSS Ausgabe:

  • r = .93

  • p < .05

  • Also: signifikanter Zusammenhang


Korrelation

SPSS

09_korrelation21


Voraussetzungen der produkt moment korellation

Voraussetzungen der Produkt-Moment Korellation

Voraussetzungen der Produkt-Moment-Korrelation:

  • Intervallskalenniveau der Variablen

  • Normalverteilung der Variablen

  • Homoskedastizität:

    • Normalverteilung von y für alle Probanden, die den gleichen x-Wert haben.

    • Die Homoskedastizität ist in der Praxis kaum zu überprüfen!)

  • Zusätzliche Einschränkung: Es können nur lineare Zusammenhänge gezeigt werden!

09_korrelation22


Mittelwerte von korrelationen

Mittelwerte von Korrelationen

  • Korrelationen sind nicht intervallskaliert. Daher ist es nicht erlaubt, direkt einen Mittelwert zu bilden!

  • Vorgehen:

    • Berechnung von FischersZ-Transformation für dieeinzelnen Korrelationen

    • Berechnung des (gewichteten)Mittelwertes der Z-Werte

    • Rücktransformation des arith-metischen Mittels (Tabelle in Leonhart, S. 466)

09_korrelation23


Mittelwerte von korrelationen1

Mittelwerte von Korrelationen

Beispiel: In zwei Untersuchungen wurde derZusammenhang zwischen der Studien-motivation und der Examensnote bestimmt.

Fischers Z:

Mittelwert:

Rücktransformierung (nach Tabelle):

09_korrelation24


Unterschiede von korrelationen

Unterschiede von Korrelationen

  • Fragestellung: Ist der Unterschied zwischen zwei Korrelationen statistisch bedeutsam?

  • Vorgehen:

    • Berechnung von Fischers Z-Transformation für beide Korrelationen.

    • Berechnung eines empirischen z-Werts

    • Bestimmung eines kritischen z-Wert (aus der Tabelle für die Standard-normalverteilung).

    • Wenn zemp > zkrit, liegt ein signifikanter Unterschied zwischen r1 und r2 vor.

09_korrelation25


Unterschiede von korrelationen1

Unterschiede von Korrelationen

Beispiel: Es soll geprüft werden, ob sich diebeiden Korrelationen von Folie 24 signifikantunterscheiden.

Berechnung:

Interpretation: Die H0 kann nicht verworfen werden. Der Unterschied zwischen r1 und r2 ist nicht statistisch bedeutsam.

09_korrelation26


Optimale stichprobenumf nge

Optimale Stichprobenumfänge

Wie beim t-Test gilt auch bei der Korrelation: Je kleiner ein Effekt (d.h. ein Zusammenhang), desto mehr Probanden werden benötigt, um ihn nachzuweisen!

Die optimale Stichprobengröße kann mit G*Power bestimmt werden.

Folgende Formel erlaubt eine Schätzung der optimalen Stichprobengröße:(Z: Fischers Z)

09_korrelation27


Optimale stichprobenumf nge1

Optimale Stichprobenumfänge

Fazit: Um eine Korrelation vonr = .30 mit einer Power von .90zeigen zur können, benötigt maneine Stichprobe von N=109.

09_korrelation28


Optimale stichprobenumf nge2

Optimale Stichprobenumfänge

Fazit: Um eine Korrelation vonr = .50 mit einer Power von .80(1-seitig) zeigen zur können, benötigt man eine Stichprobevon N=21.

09_korrelation29


Korrelationen ohne intervallskalenniveau

Korrelationen ohne Intervallskalenniveau

Wenn zur Überprüfung einer Zusammenhangshypothese keine intervallskalierten Daten zur Verfügung stehen, kann die Produkt-Moment-Korrelation nicht verwendet werden.

Es gibt jedoch eine ganze Reihe weiterer Maße für die Korrelation, die in diesem Fall eingesetzt werden können.

Dabei muss das Skalenniveau beider Variablen berück-sichtigt werden.

Die folgende Tabelle gibt einen Überblick über den Einsatz der unterschiedlichen Koeffizienten.

09_korrelation30


Korrelation

Nach Leonhart (2004), S. 204


Spearmans rangkorrelation

Spearmans Rangkorrelation

Spearmans Rangkorrelation wird eingesetzt, wenn…

  • … zwei Variablen (x, y) als ordinalskaliert sind.

  • … eine intervallskalierte und eine ordinalskalierte Variable vorliegen.

  • … intervallskalierte Variablen vorliegen aber die Normalverteilungsannahme verletzt ist.

    Vorsicht:

    • Wenn Rangplätze mehrfach besetzt sind („Rangbindung“), sollte Spearmans Rangkorrelation nicht verwendet werden.

    • In diesem Fall empfiehlt sich die Verwendung vonKendallsτ.

09_korrelation32


Spearmans rangkorrelation1

Spearmans Rangkorrelation

  • Alle Variablen werden vor der Berechnung in eine Rangreihe (Rang 1 bis N) transformiert.

  • Beispiel:

    • 3.40; 27.40; 7.80; 15.00; 27.10

    •  1, 5, 2, 3, 4

  • Berechnung:

  • Signifikanztest:

09_korrelation33


Spearmans rangkorrelation2

Spearmans Rangkorrelation

Beispiel: Vergleich der Ergebnisse aus zwei Angsttests:

09_korrelation34


Spearmans rangkorrelation3

Spearmans Rangkorrelation

Berechnung des Koeffizienten:

Signifikanztest:

Für df=6 und α=.05 bei einseitiger Testung ergibt sich:

Die Korrelation ist statistisch signifikant!

09_korrelation35


Spearmans rangkorrelation4

Spearmans Rangkorrelation

  • Spearmans Rangkorrelation in SPSS

    • Gleicher Befehl wie für „Pearson“, aber „Spearman“ anwählen

09_korrelation36


Spearmans rangkorrelation5

Spearmans Rangkorrelation

SPSS Ausgabe

09_korrelation37


Kendalls

Kendallsτ

Kendallsτ („tau“) ist ebenfalls ein Koeffizient für ordinalskalierte Variablen.

Kendallsτist unempfindlich gegenüber Ausreißern (es dürfen leere Ränge verwendet werden; die Bildung einer Rangreihe ist nicht notwendig!)

Kendallsτwird verwendet, wenn Ränge mehrfach besetzt sind („Rangbindungen“).

Hinweis: Kendallsτ fällt in der Regel kleiner aus als Spearmans Koeffizient. Daher sollte letzterer bevorzugt werden, wenn die Voraussetzungen erfüllt sind.

09_korrelation38


Kendalls1

Kendallsτ

Berechnung, wenn Rangbindungen vorliegen:

  • Mit…

    • P: Anzahl der Proversionen über alle Personen

    • I: Anzahl der Inversionen über alle Personen

    • N: Stichprobenumfang

    • k, m: Anzahl der Kategorien der Variablen X und Y

    • ti, wj: Anzahl der Probanden auf Rang i oder j

09_korrelation39


Kendalls2

Kendallsτ

  • Proversionen: Anzahl der Vpn „rechts unterhalb“ eines Werts.

  • Inversionen: Anzahl der Vpn „links-unterhalb“ eines Werts.

P=6

P=2

I=3

I=3

Über alle Vpn ergibt sich:

P = 44

I = 7

09_korrelation40


Kendalls3

Kendallsτ

Signifikanzprüfung nach Tabelle (Leonhart, 2004, S. 465):

Bei N = 12 ist ein Zusammenhang ab P – I > 26 statistisch bedeutsam.

09_korrelation41


Kendalls4

Kendallsτ

  • Kendallsτ in SPSS:

    • Gleicher Befehl wie für „Pearson“, aber „Kendallsτ“ anwählen

09_korrelation42


Punktbiseriale korrelation

Punktbiseriale Korrelation

Verwendung der Punktbiserialen Korrelation

  • Es soll ein Zusammenhang zwischen einer intervallskalierten und einer natürlich dichotomen nominalskalierten Variable bestimmt werden.

  • Oder: Es soll ein Zusammenhang zwischen einer intervallskalierten Variable einerseits und einer (aus einer ursprünglich normalverteilten intervallskalierten Variable) künstlich dichotomisierten Variable bestimmt werden.

  • Die punktbiseriale Korrelation sollte nicht für latente Variablen verwendet werden!

09_korrelation43


Punktbiseriale korrelation1

Punktbiseriale Korrelation

Berechnung der Punktbiserialen Korrelation

09_korrelation44


Punktbiseriale korrelation2

Punktbiseriale Korrelation

Beispiel: Ängstlichkeit von Männern und Frauen

Signifikanztest

tkrit= 1.99  Der Zusammenhang ist statistisch bedeutsam!

09_korrelation45


Biseriale korrelation

Biseriale Korrelation

Verwendung der Biserialen Korrelation:

  • Ein latentes, intervallskaliertes Konstrukt wird über eine dichotome, manifeste Variable erfasst. (z.B. „Haben Sie gute Statistikkenntnisse: ja/nein?“).

  • Eine intervallskalierten Variable wird künstlich dichotomisiert. (z.B. Alter größer oder kleiner 18 Jahre).

09_korrelation46


Biseriale korrelation1

Biseriale Korrelation

Berechnung der Biserialen Korrelation

09_korrelation47


Biseriale korrelation2

Biseriale Korrelation

Bestimmung von δ:

  • Bestimmung des Anteil der Probanden in Gruppe 1:

    • z.B. p(Gr.=1) = .40

  • Bestimmung der Ordinate („y-Achse“) der Normalverteilung für p aus einer Tabelle zur Standardnormalverteilung.

    • z.B. Ordinate(p =.40) = 0.386

09_korrelation48


Biseriale korrelation3

Biseriale Korrelation

Beispiel: Nutzungsdauer des Internets (Minuten pro Tag) von Jugendlichen und Erwachsenen.

09_korrelation49


Biseriale rangkorrelation

Biseriale Rangkorrelation

Verwendung der BiserialenRangkorrelation:

  • Der Zusammenhang zwischen einer ordinalskalierten Variable und einer dichotomen Variable soll bestimmt werden.

    Berechnung:

09_korrelation50


Biseriale rangkorrelation1

Biseriale Rangkorrelation

Korrektur bei Rangbindungen:

  • b:Anzahl der vorhandenen Rangplätze.

  • ti:Anzahl der Probanden auf Rangplatz i.

09_korrelation51


Biseriale rangkorrelation2

Biseriale Rangkorrelation

R(x),R(y): Mittlerer Rangd:Differenz der mittleren Ränge

  • Beispiel: Es soll der Zusammenhang des Geschlechts mit einem vierstufigen Rating zum Optimismus bestimmt werden.

09_korrelation52


Biseriale rangkorrelation3

Biseriale Rangkorrelation

Summe der quadrierten Rangdifferenzen

Korrekturkoeffizient:

09_korrelation53


Biseriale rangkorrelation4

Biseriale Rangkorrelation

Berechnung der Korrelation:

09_korrelation54


Punkttetrachorische korrelation

Punkttetrachorische Korrelation

Verwendung der Punkttetrachorischen Korrelation

  • Der Zusammenhang von 2 dichotomen Variablen soll bestimmt werden.

  • Alternativen:

    • Die punkttetrachorische Korrelation sollte nicht bei ungleichen Randsummen verwendet werden (Alternative: Yules Y).

    • Wenn eine intervallskalierte latente Variable zugrunde liegt, sollte der ν-Koeffizientverwendet werden.

    • Liegen zwei normalverteilte latente Variablen zugrunde, sollte die tetrachorische Korrelation verwendet werden.

    • Bei polytomen Variablen wird Cramérs Index verwendet.

09_korrelation55


Punkttetrachorische korrelation1

Punkttetrachorische Korrelation

Berechnung der Punkttetrachorischen Korrelation

  • Beispiel: Zusammenhang von Geschlecht und Besitz eines Autos

09_korrelation56


Tetrachorische korrelation

Tetrachorische Korrelation

Verwendung der Tetrachorischen Korrelation

  • Der Zusammenhang von zwei künstlich dichotomisierten Variablen, die auf intervallskalierten latenten Variablen beruhen, soll bestimmt werden.

    Berechnung (Näherungsformel):

09_korrelation57


Polychorische korrelation

Polychorische Korrelation

Verwendung der Polychorischen Korrelation

  • Der Zusammenhang von zwei ordinalskalierten Merkmalen, denen latente intervallskalierte Merkmale zugrunde liegen soll berechnet werden.

    Die Berechnung wird hier nicht dargestellt, da sie relativ komplex ist (siehe Leonhart, 2004, S.221).

09_korrelation58


Yules y

Yules Y

Verwendung von Yules Y

  • Der Zusammenhang von zwei natürlich dichotomen Variablen soll bestimmt werden.

  • Yules Y darf auch verwendet werden, wenn sich die Randsummen stark unterscheiden.

    Berechnung:

09_korrelation59


Yules y1

Yules Y

Beispiel: Zusammenhang von Geschlecht und Besitz eines Autos

09_korrelation60


Koeffizient

ν-Koeffizient

p.1:relative Häufigkeit der Stufe 1 des natürlich-dichotomen Merkmals

p.2:relative Häufigkeit der Stufe 2 des natürlich-dichotomen Merkmals

Verwendung des ν-Koeffizient

  • Der Zusammenhang von einem natürlich dichotomen und einer künstlich dichotomisierten Variable, der ein latentes Konstrukt zugrunde liegt, soll berechnet werden.

    Berechnung:

09_korrelation61


Kontingenzkoeffizient cc

Kontingenzkoeffizient CC

Verwendung des Kontingenzkoeffizient CC

  • Der Zusammenhang zwischen zwei polytomen nominalskalierten Variablen soll berechnet werden.

  • CC sollte nicht bei ungleichen Randsummen verwendet werden.

  • Da CC nicht wie ein Korrelationskoeffizient skaliert ist (r<1), wird immer die Verwendung von Cramérs C empfohlen.

    Beispiel: Die Auftretenshäufigkeit psychiatrischer Diagnosen soll zwischen Verschiedenen EU-Staaten verglichen werden.

09_korrelation62


Cram rs index

Cramérs Index

Verwendung von Cramérs Index

  • Der Zusammenhang zwischen zwei polytomen nominalskalierten Variablen soll berechnet werden.

    Beispiel:

  • Die Auftretenshäufigkeit psychiatrischer Diagnosen soll zwischen Verschiedenen EU-Staaten verglichen werden.

    Berechnung:

09_korrelation63


Cram rs index1

Cramérs Index

Beobachtete Häufigkeiten

Erwartete Häufigkeiten

09_korrelation64


Cram rs index2

Cramérs Index

09_korrelation65


Zusammenfassung

Zusammenfassung

  • Kovarianz und Korrelation sind Maße für den (linearen) Zusammenhang zwischen zwei Variablen.

  • Positive bzw. negative Zusammenhänge erkennt man durch „ansteigende“ bzw. „abfallende“ Formen einer Punktewolke in einem Streudiagramm.

  • Die Kovarianz ist ein unstandardisiertes Maß; sie kann beliebige Werte annehmen.

  • Die Korrelation ist ein standardisiertes Maß; sie nimmt Werte zwischen -1 und +1 an.

  • Die Produkt-Moment-Korrelation kann mit einem t-Test auf Signifikanz überprüft werden.

09_korrelation66


Zusammenfassung1

Zusammenfassung

Voraussetzungen für die Berechnung der Produkt-Moment-Korrelation sind (a) Intervallskalenniveau, (b) Normalverteilung und (c) Homoskedastizität.

Der Determinationskoeffizient gibt den Anteil der gemeinsamen Varianz an.

Mit Hilfe von Fischers Z-Transformation ist es möglich, Mittelwerte von Korrelationen zu berechnen und Unterschiede von Korrelationen auf Signifikanz zu prüfen.

Um schwache Zusammenhänge nachweisen zu können, sind sehr große Stichproben notwendig (G*Power).

09_korrelation67


Zusammenfassung2

Zusammenfassung

Für nicht-intervallskalierte Variablen gibt es eine Reihe alternativer Korrelationskoeffizienten, die unterschiedliche Voraussetzungen haben.

Besonders wichtig sind dabei Spearmans Rangkorrelation und Kendallsτ

09_korrelation68


  • Login