200 likes | 293 Views
Explore the concept of margin of error in bibliometric statistics, analyzing the reliability and stability of data. Learn about common errors, stability measures, resampling techniques, and the challenges of interpreting statistical tests in bibliometrics.
E N D
Felmarginaler i bibliometrisk statistik Finns dom? Metrics seminariet 2013-04-11 Staffan Karlsson, KTH
Varför är man intresserad av osäkerheten i bibliometrisk statistik? • Hur ”säker” eller ”exakt” är statistiken för ett analysobjekt? • Skiljer sig olika analysobjekt åt? • Är en förändring över tid signifikant?
Vad är felmarginaler Från Wikipedia: The margin of error is a statistic expressing the amount of random sampling error in a survey's results. Dvs ”felet” beror på att statistik baserad på ett slumpässigt urval har en osäkerhet i hur väl urvalet representerar hela populationen i kombination med mätfel
Bibliometriska analyser baseras nästa alltid på totalundersökningar, dvs baseras på studieobjektets ALLA publikationer i en viss databas ... då finns inga fel i den bemärkelse termen felmarginal normalt syftar på. Om analysen görs om blir resultatet troligen exakt det samma.
Visst finns fel/osäkerheter i bibliometrisk statistik • Fel identifieringen av analysobjektens publikationer • Fel i databsen • ffa felaktiga detaljer i ref. listor fel i antalet citeringar till en artikel Marginellt i analyser av god kvalité Kan troligen vara betydande i vissa fall, men vi har inga metoder för att uppskatta storleken på dessa (?) • Resultatet är beroende av den databas som analysen baseras på
Ett alternativt perspektiv:Hur stabilt är ett bibliometriskt mått? Hur beroende är citeringsstatistiken för ett studieobjekt av några få högt citerade publikationer? • Colliander & Ahlgren 2011 • Waltman et al 2012
Stabilitet – hur mäts det? Resampling / permutation statistics: Ett stort antal nya uppsättningar data skapas genom upprepad slumpässig provtagning av de data man har. Från dessa nya utslumpade urval kan man uppskatta stabilitieten i statistiken.
Original obs. ...
Metodik Waltman et al • Bootstrapping (med återlägg) • Jackknife (utan återlägg – ta bort x observationer) Skapa ett stort antal (ofta tusentals) nya prov genom resampling och basera spridningsmått på dessa. Tex intervallet inom vilket 95% av alla nya medelvärden finns. Colliander & Ahlgren
Bootstrapping Med återlägg Original obs.
Jackknife utan återlägg Original obs. Norig Nsample Nsample < Norig
Exempel på Uppskattning av error margins/stabilitet för fältnormerad medelcitering Kronman & Karlsson, Nordiska bibliometrikonferensen 2008 (opubl) • Antagande: det finns en osäkerhet i årsmedel beroende på en slumpmässig variation mellan år i förekomsten av högt citerade publikationer • Årsmedelvärden 1984-2005 för • 24 svenska lärosäten och 153 länder med en volym om > 10 publ/år • Trender togs bort med en polynom regression • Konfidensintervall/felmarginaler beräknade baserat på residualerna från 3 • Eller med bootstrapping
Medelcitering, Länder och svenska lärosäten
Bootstrapp-uppskattningar Origninaldata: 15 års publ för 4 svenska lärosäten (150 000 publ)
Schabloner för stabilitetsinterval för fältnormerad medelcitering
95 % Stability intervalsof Mean Normalized Citation Score (MNCS)for 50 univeristies (Waltman et al 2012)
Sammanfattning • Det finns tvelöst felkällor i bibliometrisk (citerings) statistik • MEN dessa är svåra att kvantifiera • Felet är troligen oftast litet men ibland rätt stort... (tex ”svåra” namn i ref listor) • Stabiliteten i citeringsmått pga enstaka högt citerade publikationer kan relativt enkelt uppskattas • Stabilitets intervallet bör inte tolkas som ett ”mätfel”
Bör man använda [parametriska] statistiska tester på bibliometrisk statistik? • Problem • Ofta totalundersökningar som i princip inte är behäftade med några mätfel • Fördelningsmönstret är starkt skevt statistiska metoder som bygger på normalfördelningen är inte lämpliga • Ofta stora N lätt att hitta signifikanser även för små skillnader. svar Hypotestestande statistik - tveksamt! Konfidensinterval / Stabilitet OK Se Schneider 2012 för en kritisk diskussion om hypotestestning av bibliometriska material
Referenser • Colliander C & Ahlgren P. 2011. The effects and their stability of field normalization baseline on relative performance with respect to citation impact: A case study of 20 natural science departments. Journal of Informetrics 5: 101-113. • Waltman L. et al. 2012. The Leiden Ranking 2011/2012: Data Collection, Indicators, and Interpretation. Journal of the American Soc for Information Science and Technol. 63(12): 2419–2432 • Leydesdorff L & Bornmann L. 2012. Testing differences statistically with the Leiden ranking. Scientometrics 92:781–783 • Schneider JW 2012. Caveats for using statistical significance tests in research assessments. arXiv:1112.2516v1