Cross-Cultural Validation of STarT-G for Evidence-Based Physiotherapy in St. Moritz

Einführung EvidenceBasedPhysiotherapyHeilbad St. Moritz 30.1.2014 • Bernhard Aebischer, MScPT, PT FH • Schmitten / www.physioaebischer.ch • PT-Schule Leukerbad 1984 – 88 • MSc PT 2010-13

Einführung EvidenceBasedPhysiotherapy Inhalt: • Präsentation Masterthesis: «STarT-G» • Einführung EBP • Diskussion

German translation, cross-cultural adaptation and validation of the STarT back screening tool (STarT-G) B.Aebischer, J. Hill, R.Hilfiker, S.Karstens

Einführung • Methoden • Resultate • Diskussion • Schlussfolgerung

Einführung • Hohe Prävalenz und Inzidenz Rückenschmerzen • 80% unspezifisch • 6 -17% chronisch • Evidenz für erfolgreiche Sekundärprävention Problematik=?  Psychosoziale Faktoren + Untergruppenanalyse Identifikation der Untergruppen?

Einführung • Screeninginstrumente für stationäre Settings • Primärversorgung?  STarT Back Screening Questionnaire • SubgroupTargetedTreatment • Hill et al. (2008) • Rasches und zuverlässiges Screening von modifizierbaren physischen und psychosozialen Risikofaktoren • + subgruppenspezifische Behandlungsrichtlinien

Einführung • Ziel = • Deutsche Übersetzung • Wie? Was beachten? Warum? • Kulturelle Anpassung • Weshalb? Wie? • Psychometrische Gültigkeit • „Misst er was er messen soll? Misst er es zuverlässig?“ • = kann ich den Resultaten genügend vertrauen? • = zeigt er ein akzeptables Bild der „Wahrheit“? •  Vergleich mit anerkannten Fragebögen • Statistischen Methoden

Methoden 1.) Übersetzung und kulturelle Anpassung • Schweizer Hochdeutsch • Gängige Richtlinien Beaton et al. (2007) 2.) Psychometrische Validation • Interpretabilität • Interne Konsistenz • Konvergente und divergente Konstruktvalidität • Diskriminationsfähigkeit • Floor und Ceiling Effekte Terwee (2007)

Beaton et al. (2007)

Interpretabilität: Studienpopulation und wichtige Untergruppen, Probandenrekrutierung, Missing values, Mittelwerte und SD 2) Interne Konsistenz: Cronbachs Alpha der psychosozialen Subskala. Hypothese: gute IK. 3) Konstruktvalidität: a) Konvergent: rs Totalscore mit RFB Subscore mit psychosozialen RFB Risikogruppe mit RFB Hypothese: grosse Korrelation 0 keine Korrelation < 0,3 schwache Korrelation 0,3 – 0,5 moderate Korrelation > 0,5 grosse Korrelation 1 perfekte Korrelation Cohen (1988) .

b) Divergente Konstruktvalidität: Deskriptiver Vergleich der Proportionen (%) der STarT-Totalscore-Tertile mit „Fällen“ der RFB. Tertile: Low = Totalscore 0 – 2 Medium = 3 – 5 High = 6 – 9 „Fälle“ gemäss RFB Cutoff-Werten rsp. Medianwerten Hypothese: eindeutige Aufteilung von Fällen in Relation zu den Tertilen

4) Diskriminationsfähigkeit: AUC Testvariable = Totalscore / Subscore / Risikogruppe Zustandsvariable = Fall / kein Fall (f) einzelne RFB-Cutoffs rsp. «Composite Reference Standard» - Cutoff Hypothese: gute Diskriminationsfähigkeit 0.7 – <0.8 acceptable discrimination 0.8 – 0.9 excellent > 0.9 outstanding Hosmer&Lemeshow (2000) [Hill 2008] 5) Floor und Ceiling Effekt: maximal 15% Hypothese: keine Effekte

Resultate 1.) Übersetzung und kulturelle Anpassung: • Übersetzung • Pretest (n=25, CH und BRD): Item 5 (« Für eine Person in meinem Zustand ist es riskant, körperlich aktiv zu sein») • Helvetismen

Resultate 2.) Psychometrische Validation / Interpretabilität

Resultate Interpretabilität Vergleich positive Antworten («Trifft zu» / «Agree») STarT-G und STarT

Resultate • Interne Konsistenz: Cronbachs Alpha 0.53 • Floor and Ceiling: Totalscore 0 6.1% Totalscore 7 8.2% ≠ 8 oder 9

Resultate Konvergente Konstruktvalidität • 0 keine K., < 0.3 schwach, 0.3 – 0.5 moderat, > 0.5 gross, 1 perfekt Cohen (1988)

Resultate Divergente Konstruktvalidität

Resultate Diskriminationsfähigkeit STarT-G total score against RMDQ cases STarT-G risk group against composite reference standard cases 0.7 – <0.8 acceptable discrimination 0.8 – 0.9 excellent > 0.9 outstanding Hosmer&Lemeshow (2000) [Hill 2008]

Diskussion • Ziel der Übersetzung und Anpassung erreicht • Positiver Pretest. Item 5: siehe DK und GB • Keine Helvetismen • Stärke = striktes Befolgen der Guidelines, binationaler Pretest. • Deutliche Unterschiede Baseline-Werte: wegen PT? •  Rolle für Statistik? : • ↓ Variabilität = ↓ Varianz = ↓ Kovarianz = ↓ Korr.-Koeff. • Interne Konsistenz 0.53 / kein Test-Retest • = ungenügende Reliabilität • Andere Population? • Übersetzung Item 5 und 7?

Genügende konvergente Konstruktvalidität • Befriedigende KI trotz kleiner sample size • Sehr gute divergente Konstruktvalidität bzgl. `no cases`, schlüssige Erklärung der `case`-Verteilung • Sehr gute AUC = Diskriminationsfähigkeit +++, vor allem für Risikogruppeneinteilung • Forschung: • Reliabilität • Umsetzung STarT-G

Schlussfolgerung • Übersetzung und Anpassung sehr gutes Resultat • Validität von STarT-G bestätigt durch zufriedenstellende psycho -metrische Messungen • Ungenügende Reliabilität • Unterschiede können logisch erklärt werden • Grosse AUC bestätigen die Diskriminationsfähigkeit von STarT-G

Cross-Cultural Validation of STarT-G for Evidence-Based Physiotherapy in St. Moritz