290 likes | 860 Views
Nested ケース・コントロールデザインにおける擬似尤度によるパラメータ推定. 口羽 文 1,2 吉村 健一 1,2,3 東京大学大学院医学系研究科疫学・予防保健学 1 国立がんセンターがん予防・検診研究センター情報研究部 2 日本臨床腫瘍研究グループ( JCOG )データセンター 3. : イベント. : 打ち切り. 疫学研究( 非介入研究 )のデザイン. コホート研究デザイン. ケース・コントロール研究デザイン. 研究ベース(コホート). ケース. コントロール. 時間. 研究開始. 研究開始. 疫学研究デザインの分類.
E N D
Nestedケース・コントロールデザインにおける擬似尤度によるパラメータ推定Nestedケース・コントロールデザインにおける擬似尤度によるパラメータ推定 口羽 文1,2 吉村 健一1,2,3 東京大学大学院医学系研究科疫学・予防保健学1 国立がんセンターがん予防・検診研究センター情報研究部2 日本臨床腫瘍研究グループ(JCOG)データセンター3
:イベント :打ち切り 疫学研究(非介入研究)のデザイン • コホート研究デザイン • ケース・コントロール研究デザイン 研究ベース(コホート) ケース コントロール 時間 研究開始 研究開始
ケース 発症時点でのリスク集団 :イベント :打ち切り 1:1-matchedコントロール Nested ケース・コントロール研究 ID 1 • 各リスク集団からサンプリング • Risk set sampling • Density sampling 2 3 4 5 6 7 8 9 10 時間
利点 • サンプリングにより曝露測定にかかるコストの削減 • Ex. 遺伝子多型(SNP)と疾患発症の関連を評価 • 全対象者の血液サンプルを収集した前向きコホート研究 • SNPタイピング(曝露の測定)は高コスト • ゲノムワイドのタイピング:約15万円/1人 • 1,000人測定すると 1億5000万円 • 10,000人 15億円 • Nestedケース・コントロール研究ではサンプリング集団のみの測定 • 100ケース:100コントロール測定しても 3,000万円 • Risk set サンプリングをしていることからハザード比を推定可能
ケース 発症時点でのリスク集団 時間 コホート研究におけるハザード比の推定 • 比例ハザードモデル • 各ケースの尤度への寄与 ハザード比(HR)
Nestedケース・コントロール研究におけるハザード比の推定Nestedケース・コントロール研究におけるハザード比の推定 • Thomas推定量 • イベント発症時点での1:mマッチングデザイン • 各ケースの尤度への寄与 • 時間依存性共変量へも容易に対応 • 情報の損失 • “マッチングされたコントロール”のみの情報を使用 • 曝露の分布に依存して大きく効率低下する可能性 • 曝露情報が一致するmatchedペアは情報なし
Samuelsenの提案 • コホート研究として考える • サンプリングされなかった対象者の共変量の欠測(missing covariate)の問題 • サンプリング確率の逆数による重み付き推定量 ID 1 2 3 共変量の欠測 4 5 6 7 8 9 10 時間
Samuelsen推定量 • 各ケースの尤度への寄与 • “サンプリング時点でのケース”以外のケースに対してもコントロールとして再利用 • 曝露情報が一致するmatchedペアの情報も利用 • Thomas推定量より効率が良くなる
各対象者のサンプリング確率 • ケースは強制的に全員がサンプリング • nested ケース・コントロール研究の対象者としてサンプリングされる確率
(1-1/9)(1-1/8) 1-1/9 (1-1/9)(1-1/8)(1-1/7) 各コントロールのサンプリング確率 ID 1 2 3 4 5 6 7 8 9 10 時間 T (1-1/9)(1-1/8)(1-1/7)(1-1/6) • カプラン・マイヤー推定量 • イベント:コントロールとしてサンプリングされること • 打ち切り:興味のあるイベント発症あるいは観察打ち切り • より複雑なサンプリングでもデザイン通りに対応可能
:イベント :打ち切り コントロール(サブコホート) :研究開始時点のリスク集団からのサンプル ケース・コホート研究 ID 1 • サンプリングされなかった対象の共変量の欠測(missingcovariate)の問題 • サブコホート(あるいはケース)にサンプリングされる確率で調整した擬似尤度に基づくハザード比の推定 2 3 共変量の欠測 4 5 6 7 8 9 10 時間
Samuelsenマクロの作成 • Thomas推定量 • SAS/STAT PHREGプロシジャ STRATAステートメント • Samuelsen推定量 • SASではプロシジャレベルで現在未提供 比例ハザード性を仮定した下 • Nested ケース・コントロール研究において Samuelsen推定量を得るためのマクロを作成 • Thomas推定量と効率の比較
SAS 9 によるSamuelsen推定 • 各対象者のサンプリング確率(pj)を推定 • DATAステップによりpjのカプラン・マイヤー推定量を算出 • SAS/STAT PHREGプロシジャのWEIGHTステートメントで1/pj を指定 • 重みを推定しているためCOVSオプションよりロバスト分散
プログラム %MACRO Samuelsen( data=_last_, time=, censor=, c_values=, match=, x= ) ; /* 解析データセット名 */ /* 生存時間を示す変数名 */ /* 打ち切りを示す変数名 */ /* “打ち切り”を表す値 */ /* matching人数を示す変数名 */ /* 曝露変数名 */
解析データセット:SURV • 仮想的な35人からなるコホートのデータSURVの一部 ・・・ %MACROSamuelsen(data=SURV,time=TIME,censor=CENSOR, c_values=0, match=MATCH, x=EXP);
-------------------------- Samuelsen estimator -------------------------- PHREG プロシジャ モデルの詳細 データセット WORK.SURV 従属変数 TIME 打ち切り変数 censor 打ち切り値の数 2 Weight Variable w タイデータの処理 EFRON Number of Observations Read 20 Number of Observations Used 20 収束状態 収束基準 (GCONV=1E-8) は満たされました。 モデルの適合度統計量 共変量 共変量 基準 なし あり -2 LOG L 14.265 13.135 AIC 14.265 15.135 SBC 14.265 15.437 SASアウトプット例
SASアウトプット例:続き グローバルな帰無仮説 H0: BETA=0 検定 カイ 2 乗 自由度 Pr > ChiSq 尤度比 1.1304 1 0.2877 Score (Model-Based) 1.0736 1 0.3001 Score (Sandwich) 2.3006 1 0.1293 Wald (Model-Based) 0.9336 1 0.3339 Wald (Sandwich) 2.2321 1 0.1352 最尤推定量の分析 パラメータ 標準 標準誤差 ハザード 95% ハザード比信頼 変数 自由度 推定 誤差 比 カイ 2 乗 Pr > ChiSq 比 限界 EXP 1 1.32501 0.88687 0.647 2.2321 0.1352 3.762 0.662 21.397
シミュレーションによる確認 • Samuelsen推定量とThomas推定量それぞれについて • 推定されたハザード比[HR=exp()]の平均 • 推定値の分散の平均 • ハザード比の平均95%信頼区間全幅 • 95%信頼区間の被覆確率 • 繰り返し数10,000回
シナリオ設定 • コホートサイズ n =1,000 • ケース:matchedコントロール=1:1 • 1つの曝露変数 • 2値(曝露あり or なし) • 曝露割合:0.3, 0.5 • 打ち切りとは独立 • 帰無仮説の下でのイベント期待発症割合:10% • ハザード比:1(帰無仮説), 2, 3
結果:曝露割合30% シミュレーション回数:10,000回 Samuelson推定量はThomas推定量よりも効率に優れる
相対効率(Samuelsen分散)/(Thomas分散) シミュレーション回数:10,000回 Samuelson推定量はThomas推定量よりも効率に優れる
まとめ • Samuelsen推定量を得るためのマクロを作成 • 今回検討した状況においてはThomas推定量より常に効率が良くなることを確認 • プログラムと本発表資料は一般公開予定 • 日本臨床腫瘍研究グループ(JCOG)公式HPhttp://www.jcog.jp/