statistik i l.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Statistik I PowerPoint Presentation
Download Presentation
Statistik I

Loading in 2 Seconds...

play fullscreen
1 / 49

Statistik I - PowerPoint PPT Presentation


  • 293 Views
  • Uploaded on

demnächst in Hörsaal 16 !!. Statistik I. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006 E-mail: ina.grau@uni-bielefeld.de Sprechstunde Di 16-17 in Raum T4-134 Telefon 106-4310. Einführung

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Statistik I' - happy


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide2
PD Dr. Ina Grau

Termin der Vorlesung Fr 12-14 in Hörsaal 16

erster Termin 21.10.2005

letzter Termin 10.2. 2006

E-mail: ina.grau@uni-bielefeld.de

Sprechstunde Di 16-17 in Raum T4-134

Telefon 106-4310

themen der vorlesung
Einführung

Vorgehen bei einer wissenschaftlichen Studie

Möglichkeiten der Datenerhebung

Grafische Darstellung von Variablen

Analyse einzelner Variablen (z.B. Mittelwert)

Zusammenhänge zwischen mehreren Variablen

SPSS

(Statistik II: Schlussfolgerungen aus einer Stichprobe auf die Population; Testverfahren)

Themen der Vorlesung
namen und e mail der tutoren
Cemil Sahinöz cemil@misawa.de

Kjell Hoffmann elkjell@gmx.net

Floris van Veen floris@veen-van.com

Sonja Schulz sonja1383@web.de

Namen und E-mail der Tutoren
termine und r ume der tutorien
Mo 10-12 in E01-108

Di 10-12 in T2-214

Mi 10-12 in L3-108

Mi 12-14 in C01-148

Do 10-12 in U2-147

teilweise im Cip-Pool U4-114

(auch in der ersten Sitzung)

Termine und Räume der Tutorien
dringend empfohlene literatur
Benninghaus, H. (2001): Einführung in die sozialwissenschaftliche Datenanalyse. 6. Aufl., München, Wien: Oldenbourg.

Gehring, U.W./ Weins, C. (2002): Grundkurs Statistik für Politologen. 3., überarbeitete Auflage. Opladen: Westdeutscher Verlag.

Dringend empfohlene Literatur
weiterf hrende literatur
Diekmann, A. (1995): Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. Hamburg: Rowohlt.

Schnell, R.; Hill, P.B.; Esser, E. (1993): Methoden der empirischen Sozialforschung. 4., überarb. Aufl., München, Wien: Oldenbourg.

Wright, D.B. (1997): Understanding statistics. An introduction for the social sciences. 1st edition. London et al.: Sage.

Kühnel, S.M./ Krebs, D. (2001): Statistik für die Sozialwissenschaften. Grundlagen, Methoden, Anwendungen. Reinbek: Rowohlt

Knoke, D. / Bohrnstedt, G.W. / Potter Mee, A. (2002): Statistics for social data analysis. 4th edition. Itasca, Ill: Peacock.

Bleymüller, J./ Gehlert, G./ Gülicher, H. (2002): Statistik für Wirtschaftswissenschaftler. 13. Aufl. München: Vahlen.

Fahrmeir, L./ Künstler, R./ Pigeot, I./ Tutz, G. (2003): Statistik: der Weg zur Datenanalyse. 4., verbesserte Auflage. Berlin et al.: Springer.

Bortz, J. (1999): Statistik für Sozialwissenschaftler. 5. Auflage Berlin/ Heidelberg: Springer.

Weiterführende Literatur
f r sie zu tun
in Tutoriumsliste eintragen

zum Tutorium Disketten mitbringen, wenn es im Cip-Pool stattfindet

Cip-Pool-Account im Internet beantragen

https://www.cipux.uni-bielefeld.de/antrag

und dann mit Vorlage der Immatrikulations-bescheinigung in Raum T4-142 freischalten lassen, Sprechst. Mo-Fr 11-12).

Für Sie zu tun:
slide13

Curriculum „Methoden der empirischen Sozialforschung“

Das Curriculum sieht im Grund- und Hauptstudium eine Folge von aufeinander aufbauenden Vorlesungen, Übungen und Seminaren vor. Über die Veranstaltungen und die notwendigen Leistungsnachweise informiert die folgende Überblickstabelle.

slide14

Studienphase

Semester

Veranstaltung

Leistungsnachweis

Grundstudium

1

  • Einführung in die Methoden der emp. Sozial-forschung (Do 18-20, H4)
  • Statistik I (Deskriptivstatistik) mit Tutorium

2

  • Statistik II (Inferenzstatistik) mit Tutorium

Klausur

3

  • Grundkurs "Methoden der emp. Sozialforschung"

4

  • Aufbaukurs "Methoden der emp. Sozialforschung"

Schein

Hauptstudium

5-8

  • Seminar im Wahlpflichtfach "Methoden"

Schein

Curriculum „Methoden der empirischen Sozialforschung“

slide15

Curriculum „Methoden der empirischen Sozialforschung“

Wahlpflichtfach „Methoden der empirischen Sozialforschung“

Im Hauptstudium ist mindestens eine der scheinfähigen Wahlpflichtveranstaltungen erfolgreich zu absolvieren. Ein Leistungsnachweis wird durch eine schriftliche Arbeit im Rahmen einer der regelmäßig angebotenen Wahlpflichtveranstaltungen erworben. Im Bereich der Quantitativen Methoden wird erwartet, dass in den scheinfähigen Wahlpflichtveranstaltungen entweder ein Leistungsnachweis für den Themenbereich "Datenerhebungsverfahren" oder den Themenbereich "Datenanalyse (Statistik)" erworben wird. Der jeweils andere Themenbereich ist dann Gegenstand der Diplom-Fachprüfung.

slide16

Was ist empirische Sozialforschung?

"Empirische Sozialforschung ist die systematische Erfassung und Deutung sozialer Erscheinungen. Empirisch bedeutet, dass theoretisch formulierte Annahmen an spezifischen Wirklichkeiten überprüft werden. Systematisch weist darauf hin, dass dies nach Regeln vor sich gehen muss. Theoretische Annahmen und die Beschaffenheit der zu untersuchenden Realität sowie die zur Verfügung stehenden Mittel bedingen den Forschungsablauf."

(Atteslander 1991: 16)

slide17

Was sind Methoden? (1)

"Unter Methoden der empirischen Sozialforschung versteht man die geregelte und nachvollziehbare Anwendung von Erfassungsinstrumenten wie Befragung, Beobachtung, Inhaltsanalyse. Je nach dem Grad der Kontrolle des Forschungsablaufs spricht man von Experimenten."

(Atteslander 1991: 16)

slide18

Was sind Methoden? (2)

"... sind erstens Mittel, um Realität zu erfassen - und damit auch zu schaffen, geleitet von Theorien, seien sie nun expliziert, bekannt oder nur 'background ignorance'. Zweitens, alle Methoden führen zu Aussagen, die auf bestimmten Stichproben von Objekten, von Räumen und von Zeiten beruhen. Immer wird die Wahrnehmung codiert, d.h. Erscheinungen werden Merkmale und ihre Ausprägungen zugeordnet. Die zentrale Frage ist, wie die vermuteten Regelmäßigkeiten, die unterstellte Struktur sozialer Prozesse, in der Sprache abgebildet und die Zusammenhänge als Gesetze formuliert werden."

(Friedrichs 1973: 189)

slide19

Auswahl des Forschungsproblems

Theoriebildung

Konzeptspezifikation Operationalisierung

Bestimmung der Untersuchungsform

Auswahl der Untersuchungseinheiten

Datenerhebung

Datenerfassung

Datenanalyse

Publikation

Quelle: Schnell et al. 1989, 110/Schnell et al. 1993, 118

Theoriegewinnung und Theorieprüfung (1)

slide20

Verallgemeinerungen

Hypothesen

Theoriegewinnung und Theorieprüfung (2)

Theorien

Beobachtungen

slide21

Stellenwert von Statistik im Forschungsprozeß (1)

  • 1. Heutzutage werden empirische Informationen zu allen möglichen
  • Sachverhalten erhoben, nicht jede Datenerhebung erlaubt jedoch inhaltlich valide Schlußfolgerungen.
  • Dieser Mangel kann auch nur begrenzt durch statistische (oder andere) Auswertungsverfahren ausgeglichen werden. Die Aussagekraft der erhobenen Daten hängt entscheidend von den verwendeten sozialwissenschaftlichen Theorien, Untersuchungsdesigns, Erhebungsinstrumenten und Auswahlverfahren ab.
  • 3. Es gibt keine "theoriefreie" empirische Beobachtung, auch wenn Theorien durch Konfrontation mit "neuen" empirischen Informationen "lernen".
slide22

Stellenwert von Statistik im Forschungsprozeß (2)

  • 4. Statistik ist eine wichtige wissenschaftliche Disziplin, aber die Relevanz einer Untersuchung hängt in erster Linie vom Inhalt und den verwendeten Methoden (s. Punkt 2) ab, nicht vom verwendeten statistischen Auswertungsverfahren. Gleichwohl helfen statistische Kenntnisse, empirische Untersuchungen so durchzuführen, daß gültige und zuverlässige Ergebnisse möglich sind.
  • In den Sozialwissenschaften gibt es neben statistischen auch andere Auswertungsmethoden für empirische Informationen.
  • Eines der Hauptziele von Statistik besteht darin, eine Vielzahl von Daten auf ihre wesentlichen Strukturen zu reduzieren. Die Annahmen über das, was als "wesentlich" betrachtet wird, werden in Form eines statistischen Modells zusammengefaßt. Dementsprechend sind die folgenden Ergebnisse modellabhängig (vgl. Stadtplanbeispiel). Ihre Verallgemeinerbarkeit steht und fällt daher mit der Angemessenheit des verwendeten Modells, die in jedem Anwendungsfall geprüft werden muß.
slide23

Stellenwert von Statistik im Forschungsprozeß (3)

  • 7. Bei der Auswertung und Interpretation empirischer Informationen dürfen drei Dinge nicht vergessen werden:
  • Theoretische Konstrukte, wie z.B. soziale Schicht oder Intelligenz, sind nicht direkt, sondern nur mittels bestimmter Indikatoren (z.B. Schichtindizes oder Intelligenztests) beobachtbar. Das verweist auf die Notwendigkeit der Entwicklung von validen Meßinstrumenten.
  • Erhebungsmethoden sind mit Meßfehlern verbunden. Daraus ergibt sich die Notwendigkeit der Entwicklung von zuverlässigen Meßinstrumenten bzw. der Verwendung geeigneter statistischer Methoden zur Kontrolle mangelnder Reliabilität.
  • Empirische Informationen bestehen in der Regel aus einer Auswahl von Objekten, Räumen und Zeiten. Daraus ergibt sich die Frage, ob und in welcher Weise die Auswertungsergebnisse über diese Auswahl hinaus verallgemeinert werden können.
slide24

Begriffsdefinition

"Eine notwendige Voraussetzung zur Beschreibung und Erklärung eines sozialen Zustandes oder eines sozialen Ereignisses ist seine begriffliche Präzisierung. Wissenschaften - gleich welcher Richtung - arbeiten nie mit konkreten Ereignissen an sich, sondern immer mit in Sprache gefasster Realität, mit Aussagen über die Realität. Wenn solche Aussagen nicht nur von einer einzigen oder einigen ausgewählten Personen verstanden werden, sondern allen Interessierten zugänglich sein sollen, dann ist es unumgänglich, dass der 'gemeinte Sinn' der verwendeten Begriffe von allen erfasst und geteilt werden kann: Man muss wissen, worüber geredet wird. Die am Kommunikationsprozess Beteiligten sollen den verwendeten Begriffen weitestgehend die gleichen Bedeutungen, die gleichen Vorstellungsinhalte zuschreiben."

(SN89: 38, SN93: 38, Herv. HJA)

slide25

Operationalisierung (1)

Theorien beschreiben Zusammenhänge zwischen theoretischen Begriffen. Theoretische Begriffe als Bestandteile von Theorien (oder 'Konstrukte ') sind nicht direkt beobachtbar.

Zur Überprüfung einer Theorie ist die Angabe von Korrespondenzregeln für theoretische Begriffe notwendig. Diese sog. Operationalisierung beinhaltet Angaben darüber, wie die theoretischen Konstrukte gemessen werden sollen.

slide26

Operationalisierung (2)

Dimensionale Analyse, Konzeptspezifikation

"Die meisten allgemeinen Konzepte sind viel zu unklar, als dass direkt Messanweisungen gegeben werden können. Aus diesem Grund beginnt die Operationalisierung eines theoretischen Begriffs meist mit der Klärung, welche theoretischen Aspekte eines bestimmten Gegenstandsbereichs ('Dimensionen') durch den theoretischen Begriff bezeichnet werden, bzw. welche Dimensionen das Konzept anspricht."

(SN89: 120, SN93: 130, Herv. im Original)

Operationalisierung

"Die 'Operationalisierung' eines theoretischen Begriffs besteht aus der Angabe einer Anweisung, wie Objekten mit Eigenschaften (Merkmalen), die der theoretische Begriff bezeichnet, beobachtbare Sachverhalte zugeordnet werden können."

(SN89: 122, SN93: 132, Herv. im Original)

grundbegriffe
Theorie: Aussage über Zusammenhang zwischen theoretischen Begriffen (hypothetischen Konstrukten), die zuvor definiert wurden

Operationalisierung: Messbarmachen der Begriffe, Umwandlung von theoretischen Begriffen in Variablen (Variablen, die für ein hypothetisches Konstrukt stehen, nennt man Indikatoren)

Hypothese: Aussage über Zusammenhang zwischen Variablen Forschung

Grundbegriffe
beispiel f r die genannten begriffe
Theorie: Frustration führt zu Aggression

Begriffsdefinition: Frustration ist eine Hinderung an der Erreichung eines Ziels, Aggression ist das absichtliche Austeilen schädigender Reize an eine Person.

Operationalisierung Frustration: Personen, die gerade eine Aufgabe lösen, werden kurz vor dem Ziel gestört. Aggression: Sie haben dann die Gelegenheit, einer anderen Person Elektroschocks zu verabreichen.

Hypothese: Personen, die soeben gestört wurden, teilen mehr Elektroschocks aus als Personen, die nicht gestört wurden.

Beispiel für die genannten Begriffe
slide29

Hypothesen (1)

  • Beispiele
  • Wenn der Entscheidungsspielraum (im Beruf) einer Person umfangreich ist, ist ihr Selbstwertgefühl hoch.
  • anders formuliert: Je größer der Entscheidungsspielraum einer Person ist, desto höher ist ihr Selbstwertgefühl.
  • Die zweite Formulierung berücksichtigt, dass beide Variablen viele Ausprägungen haben können.
slide30

Hypothesen (2)

Definition von „Hypothese“

"Noch unbewiesene Annahme als Hilfsmittel für

wissenschaftliche Erkenntnisse."

(Wahrig 1991: Deutsches Wörterbuch)

Eine Hypothese ist empirisch falsifizierbar.

Behauptungen, die die Formulierung „Wenn-dann“ enthalten, sind widerlegt, sobald ein Gegenbeispiel vorliegt. In den Sozialwissenschaften wird üblicherweise eine bestimmte Anzahl von Gegenbeispielen zugelassen, ohne dass die Hypothese als widerlegt gilt.

slide31

Hypothesen (3)

    • Eine Hypothese ist eine Aussage, keine Frage…
    • Die Aussage enthält mindestens zwei semantisch gehaltvolle Begriffe [...]
    • Die Begriffe sind durch den logischen Operator 'wenn-dann' verbunden. [...]
    • Die Aussage ist nicht tautologisch, d.h. ein Begriff deckt den anderen semantisch nicht ab. [...]
    • Die Aussage ist widerspruchsfrei, d.h. ein Begriff schließt den anderen semantisch nicht aus.
    • Die empirischen Geltungsbedingungen sind implizit oder explizit im einzelnen aufgezählt. [...]
    • Die Begriffe sind auf Wirklichkeitsphänomene hin operationalisierbar.
    • Die Aussage ist falsifizierbar."
  • (Atteslander 1991: 65f.) 0
h ufige formulierungen von hypothesen
Zusammenhangshypothesen

Schuhgröße und Körpergröße hängen positiv miteinander zusammen.

Unterschiedshypothesen

Frauen sind sprachlich begabter als Männer.

Beides ist häufig austauschbar: Das Geschlecht hängt mit der Sprachbegabung zusammen.

Häufige Formulierungen von Hypothesen
typen von hypothesen
Symmetrische Hypothesen: Schuhgröße und Körpergröße hängen zusammen (die wenn-dann-Beziehung kann in beide Richtungen formuliert werden)

Asymmetrische Hypothesen: Alter und Rückenbeschwerden hängen zusammen (die wenn-dann Beziehung ist nur in eine Richtung sinnvoll zu formulieren); eine Variable gilt als Ursache, die andere als Wirkung.

Typen von Hypothesen
typen von hypothesen34
Hypothesen können positiv oder negativ sein. Je ein Beispiel:

Je höher die Semesterzahl von Soziologiestudenten, desto größer ist das Wissen über soziologische Theorien.

Je länger ein Mitarbeiter in einer Firma beschäftigt ist, desto niedriger ist seine Motivation

Typen von Hypothesen
typen von variablen
Für asymmetrische Hypothesen gilt:

Die Variable, in der man die Ursache vermutet: unabhängige Variable

Die Variable, in der man die Wirkung vermutet: abhängige Variable

statistisch können kausale Zusammenhänge (Ursache – Wirkungs – Zusammenhänge) nicht bewiesen werden, sondern nur, dass überhaupt ein Zusammenhang besteht. Ein kausaler Beweis ist mit Experimenten möglich.

Typen von Variablen
experiment
Ein Experiment unterscheidet sich durch andere Arten empirischer Untersuchungen dadurch, dass die unabhängige Variable nicht gemessen, sondern vom Versuchsleiter hergestellt wird (wie im Beispiel Frustration: Störung oder keine Störung bei der Erledigung einer Aufgabe. Anderes Beispiel: Medikament oder Placebo)

Um die Wirkung von Störvariablen zu kontrollieren, müssen die Personen zufällig auf die Ausprägungen der UV aufgeteilt werden.

Experiment
slide37

Messen: schematische Darstellung

1

Hauptschule

Realschule

2

1

Hauptschule

Gymnasium

3

Numerisches Relativ

Empirisches Relativ

slide38

Messen und Messniveau (1)

"Unter 'Messen' wird allgemein die Zuordnung von Zahlen ('Messwerten') zu Objekten gemäß festgelegten Regeln verstanden. Die Mängel dieser Definition werden bereits dadurch deutlich, dass die Zuweisung von Schulnoten durch Würfeln eine definitionsgemäße Messung wäre. Eine brauchbare Definition muss für eine Messung fordern, dass die Messwerte zueinander Beziehungen aufweisen, die den Beziehungen der gemessenen Objekte entsprechen. So wird z.B. für eine sinnvolle Längenmessung gefordert, dass der 'größte' Messwert dem 'längsten' Objekt entspricht, der 'kleinste' Messwert dem 'kürzesten' Objekt. Eine Messung in diesem Sinne ist eine 'strukturtreue Abbildung': Die Beziehungen der Objekte ('kürzer' - 'länger') werden durch die Beziehungen der zugeordneten Zahlen ('kleiner' - 'größer') korrekt wiedergegeben."

(Schnell et al. 1993: 143, Herv. im Original)

slide39

Messen und Messniveau (2)

"Die Verwendung eines bestimmten Kriteriums, z.B. Länge, definiert eine bestimmte Beziehung ('Relation') der Objekte zueinander. Eine Menge von Objekten, über die eine Relation definiert wurde, bezeichnet man als 'empirisches Relativ', eine Menge von Zahlen, über die eine Relation definiert wurde, als 'numerisches Relativ'. [...] Das Problem der Messung besteht nun darin, eine Zuordnung der Zahlen zu den Objekten zu finden, so dass die Ordnung im numerischen Relativ der Ordnung im empirischen Relativ entspricht: Das Problem besteht in der Angabe einer Regel, die eine strukturtreue Abbildung ermöglicht."

(Schnell et al. 1993: 143f., Herv. im Original)

codieren
Bei einigen Variablen ergibt sich die Zuordnung von Zahlen zu Variablenausprägungen unproblematisch, z.B. Alter in Jahren – 20

Bei anderen Variablen muss man Entscheidungen treffen, z.B. beim Geschlecht Mann=1, Frau=2

Die codierten Werte werden dann in eine Datenmatrix eingegeben

Codieren
slide42

Niveau:

Eigenschaft:

Beispiel:

erlaubte Rechenoperationen

Nominal-skala

Name

Geschlecht

= 

Ordinal-skala

Rangfolge

Schulnoten

< >

Intervall-skala

mit gleichen Intervallabständen

Temperatur (Celsius)

+ -

Verhältnis-skala

mit absolutem Nullpunkt

Länge (Meter), Alter

* /

Skalenniveaus

Skalenniveaus

arten von variablen
Diskrete Variablen haben begrenzte Ausprägungen, z.B. Zahl der Kinder

Kontinuierliche Variablen: zwischen zwei Werten ist jeder Zwischenwert möglich, z.B. Alter, Größe

für die Statistik reicht folgende Unterscheidung:

Kategoriale Variablen: wenige Ausprägungen

Kontinuierliche Variablen: viele Ausprägungen

Arten von Variablen
slide44

Unterscheidung nach...

Bezeichnungen

Messniveau

nominal

ordinal

intervall-, verhältnisskaliert

nicht-metrisch

metrisch

Anzahl der Ausprägungen

diskret

kontinuierlich

Art der Datenanalyse

kategorial

kontinuierlich

Arten von Variablen

slide45

Nominal

Ordinal

Intervall

Verhältnis

Modus

ja

ja

ja

ja

Median

nein

Ja

ja

ja

Arithm. Mittel

nein

nein

ja

ja

Geom. Mittel

nein

nein

nein

ja

Mittelwerte und Streuungsmaße nach Messniveau (1)

Zentrale Tendenz (Mittelwerte)

slide46

Nominal

Ordinal

Intervall

Verhältnis

Spannweite

nein

(ja)

ja

ja

Quartilsabstand

nein

(ja)

ja

ja

Mittl. absolute Abweichung

nein

nein

ja

ja

VarianzStandardabweichung

nein

nein

ja

ja

Variationskoeffizient

nein

nein

nein

ja

Mittelwerte und Streuungsmaße nach Messniveau (2)

Streuung (Streuungsmaße)

skalierung
Häufig werden mehrere Variablen gemessen, die gemeinsam eine neue Variable ergeben:

Index: eine Variable (soziale Schicht) ergibt sich aus mehreren anderen Variablen (Einkommen, Bildung, Berufsprestige).

Die Berechnung der neuen aus den alten Variablen erfolgt nach definierten Rechenoperationen; im Beispiel ergibt sich das Problem unterschiedlicher Einheiten

Skalierung
skalierung48
Skala: die Summe oder der Mittelwert aus mehreren Items (Fragen), die dasselbe Konstrukt messen sollen. Die Einheiten sind bei allen Items gleich.

Es werden mehrere Items vorgelegt, um die Messgenauigkeit zu erhöhen. Wenn einige Items gegensinnig formuliert sind, müssen sie umgepolt werden, z.B.

Ich habe Angst. nein 1 2 3 4 5 ja

Ich bin ganz ruhig. nein 1 2 3 4 5 ja

recode It2 (1=5) (2=4) (3=3) (4=2) (5=1).

Skalierung
skalierung49
Der Skalenwert ergibt sich aus dem Mittelwert der einzelnen Items.

Die Mittelung hat gegenüber einer Summierung zwei Vorteile:

Das Minimum und das Maximum der Werte, die auftreten können, sind wie bei den Items, die Werte sind leichter interpretierbar.

Fehlende Werte werden ausgeglichen, da nur durch die Anzahl vorhandener Werte geteilt wird.

Skalierung