120 likes | 302 Views
Korrelation Gamma Pearsons r Regression Kausalitet. Program. Eksempel: Korrelation. En stikprøve på 181 fans af HIMYM / StarWars / James Bond / TV Charlie … er indsamlet.
E N D
Korrelation Gamma Pearsons r Regression Kausalitet Program
Eksempel: Korrelation • En stikprøve på 181 fans af HIMYM / StarWars / James Bond / TV Charlie … er indsamlet. • Respondenterne er bl.a. blevet spurgt om deres alder og (på en skala fra 1-10) i hvilken grad de anser sig selv for fan af HIMYM / StarWars / James Bond / … /
Goodman – Kruskal Gamma • A non-parametric measure of correlation is Goodman Kruskal Gamma (G) which is based on the difference between concordant pairs (C) and discordant pairs (D). Gamma is computed as follows: • G = (C-D)/(C+D) • Thus, Gamma is the surplus of concordant pairs over discordant pairs, as a percentage of all pairs, ignoring ties. Gamma defines perfect association as weak monotonicity. Under statistical independence, Gamma will be 0, but it can be 0 at other times as well (whenever concordant minus discordant pairs are 0). • Gamma is a symmetric measure and computes the same coefficient value, regardless of which is the independent (column) variable. Its value ranges between +1 to –1. • Kilde: http://www.unesco.org/webworld/idams/advguide/Chapt4_2.htm
Eksempel på analyse af brugervenlighed ved spørgsmålet: ”Jeg fandt det, jeg ledte efter”. • En stikprøve på 20 udtages blandt landets kommuner. • Webmasteren spørges, hvor mange sider der er på kommunens website. • Data kobles til scoren på spørgsmålet ”Jeg fandt det, jeg ledte efter.” • Antal sider. Gns: 1.127. Std.afv.: 162. • Brugervenlighed. Gns: 2,7. Std.afv.: 0,7.
Korrelation • Korrelationen, som forkortes med bogstavet r, beskriver den linære association mellem x og y. • Korrelationen ‘r’ er et tal i intervallet mellem -1 og +1, begge tal inklusiv. • Jo større absolut værdi af r, des stærkere er den lineære association. • Korrelationen afhænger ikke af den enhed, der måles i.Kilde: http://www.sjsu.edu/faculty/gerstman/StatPrimer/correlation.pdf
RegressionsanalysePlot x og y mod hinanden og se om de danner en ret linje
Regressionsanalyse • Analysen fortæller os: • Brugervenlighed = 0,0034 x antal sider – 1,15. • Hældningen på linjen er 0,0034. Skæring med y-aksen er i -1,15 • Har en kommune 1.500 sider, er et kvalificeret gæt, at kommunen scorer: (0,0034 x 1.500) - 1,15 = 3,87 – 1,15 = 2,72 på BV-spørgsmålet. • Regressionsanalysen kan bruges til at forudsige værdien af y, når man kender værdien af x. • Forudsigelsen er i sagens natur ikke 100% præcis (y varierer). • Man bør tjekke for outliers, da de kan påvirke resultatet betydeligt
Model • En (statistisk) model er ikke eksakt beskrivelse af virkeligheden. • Modellen er ”kun” en approksimation, men … • Den er praktisk nyttig, hvis den estimerer relationen mellem x og y relativt godt. • Sort (og hvid) er virkeligheden. Rød er modellen (regressionsligningen)
Kausalitet: Årsag og virkning Betingelser for kausalitet Rækkefølge (X → Y, ikke X ← Y) Association mellem X og Y. Udtrykkes operationelt f.eks. ved regression eller en korrelationskoefficient, f.eks. r. Positive r værdier tyder på en positive association (sammenhæng) Negative r værdier tyder på en negative association r værdier tæt på +1 eller -1 tyder på en stærk lineær association r værdier tæt på 0 tyder på en svag association Udelukkelse af andre forklaringer X: Salg af is, Y: Drukne ulykker Hypotese: X → Y