280 likes | 375 Views
Learn about the German translation and validation of the STarT back screening tool, its methods, results, and implications for physiotherapy practice. Explore the importance of psychosocial factors and subgroup identification in managing back pain effectively. Discover the process of translation, cultural adaptation, and psychometric validation to ensure the tool's reliability and validity.
E N D
Einführung EvidenceBasedPhysiotherapyHeilbad St. Moritz 30.1.2014 • Bernhard Aebischer, MScPT, PT FH • Schmitten / www.physioaebischer.ch • PT-Schule Leukerbad 1984 – 88 • MSc PT 2010-13
Einführung EvidenceBasedPhysiotherapy Inhalt: • Präsentation Masterthesis: «STarT-G» • Einführung EBP • Diskussion
German translation, cross-cultural adaptation and validation of the STarT back screening tool (STarT-G) B.Aebischer, J. Hill, R.Hilfiker, S.Karstens
Einführung • Methoden • Resultate • Diskussion • Schlussfolgerung
Einführung • Hohe Prävalenz und Inzidenz Rückenschmerzen • 80% unspezifisch • 6 -17% chronisch • Evidenz für erfolgreiche Sekundärprävention Problematik=? Psychosoziale Faktoren + Untergruppenanalyse Identifikation der Untergruppen?
Einführung • Screeninginstrumente für stationäre Settings • Primärversorgung? STarT Back Screening Questionnaire • SubgroupTargetedTreatment • Hill et al. (2008) • Rasches und zuverlässiges Screening von modifizierbaren physischen und psychosozialen Risikofaktoren • + subgruppenspezifische Behandlungsrichtlinien
Einführung • Ziel = • Deutsche Übersetzung • Wie? Was beachten? Warum? • Kulturelle Anpassung • Weshalb? Wie? • Psychometrische Gültigkeit • „Misst er was er messen soll? Misst er es zuverlässig?“ • = kann ich den Resultaten genügend vertrauen? • = zeigt er ein akzeptables Bild der „Wahrheit“? • Vergleich mit anerkannten Fragebögen • Statistischen Methoden
Methoden 1.) Übersetzung und kulturelle Anpassung • Schweizer Hochdeutsch • Gängige Richtlinien Beaton et al. (2007) 2.) Psychometrische Validation • Interpretabilität • Interne Konsistenz • Konvergente und divergente Konstruktvalidität • Diskriminationsfähigkeit • Floor und Ceiling Effekte Terwee (2007)
Interpretabilität: Studienpopulation und wichtige Untergruppen, Probandenrekrutierung, Missing values, Mittelwerte und SD 2) Interne Konsistenz: Cronbachs Alpha der psychosozialen Subskala. Hypothese: gute IK. 3) Konstruktvalidität: a) Konvergent: rs Totalscore mit RFB Subscore mit psychosozialen RFB Risikogruppe mit RFB Hypothese: grosse Korrelation 0 keine Korrelation < 0,3 schwache Korrelation 0,3 – 0,5 moderate Korrelation > 0,5 grosse Korrelation 1 perfekte Korrelation Cohen (1988) .
b) Divergente Konstruktvalidität: Deskriptiver Vergleich der Proportionen (%) der STarT-Totalscore-Tertile mit „Fällen“ der RFB. Tertile: Low = Totalscore 0 – 2 Medium = 3 – 5 High = 6 – 9 „Fälle“ gemäss RFB Cutoff-Werten rsp. Medianwerten Hypothese: eindeutige Aufteilung von Fällen in Relation zu den Tertilen
4) Diskriminationsfähigkeit: AUC Testvariable = Totalscore / Subscore / Risikogruppe Zustandsvariable = Fall / kein Fall (f) einzelne RFB-Cutoffs rsp. «Composite Reference Standard» - Cutoff Hypothese: gute Diskriminationsfähigkeit 0.7 – <0.8 acceptable discrimination 0.8 – 0.9 excellent > 0.9 outstanding Hosmer&Lemeshow (2000) [Hill 2008] 5) Floor und Ceiling Effekt: maximal 15% Hypothese: keine Effekte
Resultate 1.) Übersetzung und kulturelle Anpassung: • Übersetzung • Pretest (n=25, CH und BRD): Item 5 (« Für eine Person in meinem Zustand ist es riskant, körperlich aktiv zu sein») • Helvetismen
Resultate 2.) Psychometrische Validation / Interpretabilität
Resultate Interpretabilität Vergleich positive Antworten («Trifft zu» / «Agree») STarT-G und STarT
Resultate • Interne Konsistenz: Cronbachs Alpha 0.53 • Floor and Ceiling: Totalscore 0 6.1% Totalscore 7 8.2% ≠ 8 oder 9
Resultate Konvergente Konstruktvalidität • 0 keine K., < 0.3 schwach, 0.3 – 0.5 moderat, > 0.5 gross, 1 perfekt Cohen (1988)
Resultate Diskriminationsfähigkeit STarT-G total score against RMDQ cases STarT-G risk group against composite reference standard cases 0.7 – <0.8 acceptable discrimination 0.8 – 0.9 excellent > 0.9 outstanding Hosmer&Lemeshow (2000) [Hill 2008]
Diskussion • Ziel der Übersetzung und Anpassung erreicht • Positiver Pretest. Item 5: siehe DK und GB • Keine Helvetismen • Stärke = striktes Befolgen der Guidelines, binationaler Pretest. • Deutliche Unterschiede Baseline-Werte: wegen PT? • Rolle für Statistik? : • ↓ Variabilität = ↓ Varianz = ↓ Kovarianz = ↓ Korr.-Koeff. • Interne Konsistenz 0.53 / kein Test-Retest • = ungenügende Reliabilität • Andere Population? • Übersetzung Item 5 und 7?
Genügende konvergente Konstruktvalidität • Befriedigende KI trotz kleiner sample size • Sehr gute divergente Konstruktvalidität bzgl. `no cases`, schlüssige Erklärung der `case`-Verteilung • Sehr gute AUC = Diskriminationsfähigkeit +++, vor allem für Risikogruppeneinteilung • Forschung: • Reliabilität • Umsetzung STarT-G
Schlussfolgerung • Übersetzung und Anpassung sehr gutes Resultat • Validität von STarT-G bestätigt durch zufriedenstellende psycho -metrische Messungen • Ungenügende Reliabilität • Unterschiede können logisch erklärt werden • Grosse AUC bestätigen die Diskriminationsfähigkeit von STarT-G