1 / 28

Anwendbarkeit von Benfords Gesetz Fälschungsforschung in den Sozialwissenschaften

Anwendbarkeit von Benfords Gesetz Fälschungsforschung in den Sozialwissenschaften. Johannes Bauer. Benfordverteilte Daten. Benfordverteilung. Benfordverteilung. Entstehungsfaktoren Multiplikationen – Richard Hammering (1970)‏ Verteilungen – Theodor Hill (1995)‏. Fälschungen aufdecken.

malini
Download Presentation

Anwendbarkeit von Benfords Gesetz Fälschungsforschung in den Sozialwissenschaften

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Anwendbarkeit von Benfords Gesetz Fälschungsforschung in den Sozialwissenschaften Johannes Bauer

  2. BenfordverteilteDaten

  3. Benfordverteilung

  4. Benfordverteilung • Entstehungsfaktoren • Multiplikationen– Richard Hammering (1970)‏ • Verteilungen– Theodor Hill (1995)‏

  5. Fälschungenaufdecken • Ansatz: • WelcheDatensind benfordverteilt? • AbweichungenalsIndizfürFälschungen

  6. Was ist Benfordverteilt Datenquelle: Kölner Zeitschrift für Soziologie und Sozialpsychologie Februar 1985 bis März 2007 (mit Unterstützung des Lehrstuhl Braun, LMU München)

  7. GleichverteilteZiffern • Normalverteilung • Mittelwert: 3 • Standardfehler: 2

  8. GleichverteilteZiffern • Normalverteilung • Mittelwert: 3 • Standardfehler: 2

  9. GleichverteilteZiffern • Normalverteilung • Mittelwert: 3 • Standardfehler: 2

  10. Untersuchung des Lehrstuhl Braun Zu fälschende Hypothese: “Je höher die Bildung einer Person, desto weniger Zigaretten raucht sie pro Tag” • 1. Ziffer: Ho abgelehnt • (χ ²=103.39,df = 8, • p = 0.000)‏ • 2. Ziffer: Ho abgelehnt • (χ ²=122.59,df = 9, • p = 0.000)‏

  11. Untersuchung: 3. und 4. Ziffer Ho abgelehnt Ho abgelehnt (χ² = 304.89, df=9, p= 0.000)‏ (χ ² = 622.20, df=9, p= 0.000)‏

  12. Untersuchung: Individualdaten Individuelle Abweichungen von Benfords Gesetz 1. Ziffer 2. Ziffer 3. Ziffer 4. Ziffer 47 Personen 40 41 35 42 absolut 0.851 0.872 0.744 0.893 prozentual

  13. Fälschungen entdecken • Ansatz: • Ab wann wird eine Fälschung erkannt? Vorgehensweise: 1. Empirische Verteilung gefälschter Regressionskoeffizienten 2. Ziehen von Zufallszahlen 3. Test der Zufallswerte auf Benfords Gesetz (H0) 4. Wiederholung für höhere Fallzahlen

  14. Erste gültige Ziffer Zweite gültige Ziffer Dritte gültige Ziffer Vierte gültige Ziffer Aggregatdaten Durchschnittliche Fallzahl um H0 mit einer Wahrscheinlich-keit von 95 % abzulehnen: 1. Ziffer: 989 Fälle 2. Ziffer: 766 Fälle 3. Ziffer: 351 Fälle 4. Ziffer: 138 Fälle

  15. Aggregatdaten Erste gültige Ziffer ~ 50 % gefälschte Daten Durchschnittliche Fallzahl um H0 mit einer Wahrscheinlich-keit von 95 % abzulehnen: 1. Ziffer: 4001 Fälle 2. Ziffer: 3308 Fälle 3. Ziffer: 1351 Fälle 4. Ziffer: 585 Fälle

  16. Aggregatdaten Erste gültige Ziffer ~ 10 % gefälschte Daten Durchschnittliche Fallzahl um H0 mit einer Wahrscheinlich-keit von 95 % abzulehnen: 1. Ziffer: 94439 Fälle 2. Ziffer: 78883 Fälle 3. Ziffer: 31266 Fälle 4. Ziffer: 12592 Fälle

  17. Aggregatdaten Erste Ziffer Zweite Ziffer Dritte Ziffer Vierte Ziffer

  18. Durchschnittliche Fallzahl um H0 mit einer Wahrscheinlich-keit von 95 % abzulehnen: 1. Ziffer: 136 Fälle 2. Ziffer: 102 Fälle 3. Ziffer: 100 Fälle 4. Ziffer: 69 Fälle Individualdaten Erste gültige Ziffer ~ 100 % gefälschte Daten

  19. Individualdaten Erste Ziffer Zweite Ziffer Dritte Ziffer Vierte Ziffer

  20. Kombination von Ziffern 6 2 1 1 3 4 1 1 4 0 1 6 2 0 3 3 5 5 0 9 2 6 4 9 8 0 8 7 3 0 9 2 3 2 4 5

  21. Kombination von Ziffern

  22. Zweiter Schritt: Gemeinsame Ziffern

  23. Zweiter Schritt: Gemeinsame Ziffern

  24. Zweiter Schritt: Gemeinsame Ziffern

  25. Zweiter Schritt: Vergleich

  26. Ergebniszusammenfassung • Fälschungserkennung mit Benfords Gesetz: • Untersuchung von Individualdaten • Untersuchung gemeinsamer Ziffern • Anwendung von Anpassungstests, welche stärker auf die • Stichprogengröße reagieren (hier χ²-Anpassungstest)‏ • Die Effektivität des Verfahrens ist stark abhängig von der • Vorgehensweise des Fälschers.

  27. Vorschläge • Fälschungserkennung mit Benfords Gesetz: • Erfassen möglichst vieler metrischer Kennwerte • Verwenden der Gleichverteilung • Fälschertypen bilden • Konzentration auf Abweichungen • Konzentration auf die Ziffernreihenfolge

  28. Literatur

More Related