nested n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Nested ケース・コントロールデザインにおける擬似尤度によるパラメータ推定 PowerPoint Presentation
Download Presentation
Nested ケース・コントロールデザインにおける擬似尤度によるパラメータ推定

Loading in 2 Seconds...

play fullscreen
1 / 24

Nested ケース・コントロールデザインにおける擬似尤度によるパラメータ推定 - PowerPoint PPT Presentation


  • 227 Views
  • Uploaded on

Nested ケース・コントロールデザインにおける擬似尤度によるパラメータ推定. 口羽 文 1,2  吉村 健一 1,2,3 東京大学大学院医学系研究科疫学・予防保健学 1 国立がんセンターがん予防・検診研究センター情報研究部 2 日本臨床腫瘍研究グループ( JCOG )データセンター 3. : イベント. : 打ち切り. 疫学研究( 非介入研究 )のデザイン. コホート研究デザイン. ケース・コントロール研究デザイン. 研究ベース(コホート). ケース. コントロール. 時間. 研究開始. 研究開始. 疫学研究デザインの分類.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Nested ケース・コントロールデザインにおける擬似尤度によるパラメータ推定' - hume


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
nested

Nestedケース・コントロールデザインにおける擬似尤度によるパラメータ推定Nestedケース・コントロールデザインにおける擬似尤度によるパラメータ推定

口羽 文1,2 吉村 健一1,2,3

東京大学大学院医学系研究科疫学・予防保健学1

国立がんセンターがん予防・検診研究センター情報研究部2

日本臨床腫瘍研究グループ(JCOG)データセンター3

slide2

:イベント

:打ち切り

疫学研究(非介入研究)のデザイン
  • コホート研究デザイン
  • ケース・コントロール研究デザイン

研究ベース(コホート)

ケース

コントロール

時間

研究開始

研究開始

nested1

ケース  発症時点でのリスク集団

:イベント

:打ち切り

1:1-matchedコントロール 

Nested ケース・コントロール研究

ID

1

  • 各リスク集団からサンプリング
    • Risk set sampling
    • Density sampling

2

3

4

5

6

7

8

9

10

時間

slide5
利点
  • サンプリングにより曝露測定にかかるコストの削減
    • Ex. 遺伝子多型(SNP)と疾患発症の関連を評価
      • 全対象者の血液サンプルを収集した前向きコホート研究
        • SNPタイピング(曝露の測定)は高コスト
          • ゲノムワイドのタイピング:約15万円/1人
          • 1,000人測定すると 1億5000万円
          • 10,000人       15億円
      • Nestedケース・コントロール研究ではサンプリング集団のみの測定
          • 100ケース:100コントロール測定しても 3,000万円
  • Risk set サンプリングをしていることからハザード比を推定可能
slide6

ケース  発症時点でのリスク集団

時間

コホート研究におけるハザード比の推定
  • 比例ハザードモデル
  • 各ケースの尤度への寄与

ハザード比(HR)

nested2
Nestedケース・コントロール研究におけるハザード比の推定Nestedケース・コントロール研究におけるハザード比の推定
  • Thomas推定量
    • イベント発症時点での1:mマッチングデザイン
    • 各ケースの尤度への寄与
    • 時間依存性共変量へも容易に対応
    • 情報の損失
      • “マッチングされたコントロール”のみの情報を使用
    • 曝露の分布に依存して大きく効率低下する可能性
      • 曝露情報が一致するmatchedペアは情報なし
samuelsen
Samuelsenの提案
  • コホート研究として考える
    • サンプリングされなかった対象者の共変量の欠測(missing covariate)の問題
  • サンプリング確率の逆数による重み付き推定量

ID

1

2

3

共変量の欠測

4

5

6

7

8

9

10

時間

samuelsen1
Samuelsen推定量
  • 各ケースの尤度への寄与
  • “サンプリング時点でのケース”以外のケースに対してもコントロールとして再利用
    • 曝露情報が一致するmatchedペアの情報も利用
    • Thomas推定量より効率が良くなる
slide10
各対象者のサンプリング確率
  • ケースは強制的に全員がサンプリング
  • nested ケース・コントロール研究の対象者としてサンプリングされる確率
slide11

(1-1/9)(1-1/8)

1-1/9

(1-1/9)(1-1/8)(1-1/7)

各コントロールのサンプリング確率

ID

1

2

3

4

5

6

7

8

9

10

時間 T

(1-1/9)(1-1/8)(1-1/7)(1-1/6)

  • カプラン・マイヤー推定量
    • イベント:コントロールとしてサンプリングされること
    • 打ち切り:興味のあるイベント発症あるいは観察打ち切り
  • より複雑なサンプリングでもデザイン通りに対応可能
slide13

:イベント

:打ち切り

コントロール(サブコホート) :研究開始時点のリスク集団からのサンプル

ケース・コホート研究

ID

1

  • サンプリングされなかった対象の共変量の欠測(missingcovariate)の問題
  • サブコホート(あるいはケース)にサンプリングされる確率で調整した擬似尤度に基づくハザード比の推定

2

3

共変量の欠測

4

5

6

7

8

9

10

時間

samuelsen2
Samuelsenマクロの作成
  • Thomas推定量
    • SAS/STAT PHREGプロシジャ STRATAステートメント
  • Samuelsen推定量
    • SASではプロシジャレベルで現在未提供

比例ハザード性を仮定した下

  • Nested ケース・コントロール研究において Samuelsen推定量を得るためのマクロを作成
  • Thomas推定量と効率の比較
sas 9 samuelsen
SAS 9 によるSamuelsen推定
  • 各対象者のサンプリング確率(pj)を推定
    • DATAステップによりpjのカプラン・マイヤー推定量を算出
  • SAS/STAT PHREGプロシジャのWEIGHTステートメントで1/pj を指定
    • 重みを推定しているためCOVSオプションよりロバスト分散
slide16
プログラム

%MACRO Samuelsen(

data=_last_,

time=,

censor=,

c_values=,

match=,

x=

) ;

/* 解析データセット名 */

/* 生存時間を示す変数名 */

/* 打ち切りを示す変数名 */

/* “打ち切り”を表す値 */

/* matching人数を示す変数名 */

/* 曝露変数名 */

slide17
解析データセット:SURV
  • 仮想的な35人からなるコホートのデータSURVの一部

・・・

%MACROSamuelsen(data=SURV,time=TIME,censor=CENSOR, c_values=0, match=MATCH, x=EXP);

slide18
-------------------------- Samuelsen estimator --------------------------

PHREG プロシジャ

モデルの詳細

データセット WORK.SURV

従属変数 TIME

打ち切り変数 censor

打ち切り値の数 2

Weight Variable w

タイデータの処理 EFRON

Number of Observations Read 20

Number of Observations Used 20

収束状態

収束基準 (GCONV=1E-8) は満たされました。

モデルの適合度統計量

共変量 共変量

基準 なし あり

-2 LOG L 14.265 13.135

AIC 14.265 15.135

SBC 14.265 15.437

SASアウトプット例
slide19
SASアウトプット例:続き

グローバルな帰無仮説 H0: BETA=0

検定 カイ 2 乗 自由度 Pr > ChiSq

尤度比 1.1304 1 0.2877

Score (Model-Based) 1.0736 1 0.3001

Score (Sandwich) 2.3006 1 0.1293

Wald (Model-Based) 0.9336 1 0.3339

Wald (Sandwich) 2.2321 1 0.1352

最尤推定量の分析

パラメータ 標準 標準誤差 ハザード 95% ハザード比信頼

変数 自由度 推定 誤差 比 カイ 2 乗 Pr > ChiSq 比 限界

EXP 1 1.32501 0.88687 0.647 2.2321 0.1352 3.762 0.662 21.397

slide20
シミュレーションによる確認
  • Samuelsen推定量とThomas推定量それぞれについて
    • 推定されたハザード比[HR=exp()]の平均
    • 推定値の分散の平均
    • ハザード比の平均95%信頼区間全幅
    • 95%信頼区間の被覆確率
  • 繰り返し数10,000回
slide21
シナリオ設定
  • コホートサイズ n =1,000
  • ケース:matchedコントロール=1:1
  • 1つの曝露変数
    • 2値(曝露あり or なし)
    • 曝露割合:0.3, 0.5
    • 打ち切りとは独立
  • 帰無仮説の下でのイベント期待発症割合:10%
  • ハザード比:1(帰無仮説), 2, 3
slide22
結果:曝露割合30%

シミュレーション回数:10,000回

Samuelson推定量はThomas推定量よりも効率に優れる

samuelsen thomas
相対効率(Samuelsen分散)/(Thomas分散)

シミュレーション回数:10,000回

Samuelson推定量はThomas推定量よりも効率に優れる

slide24
まとめ
  • Samuelsen推定量を得るためのマクロを作成
  • 今回検討した状況においてはThomas推定量より常に効率が良くなることを確認
  • プログラムと本発表資料は一般公開予定
    • 日本臨床腫瘍研究グループ(JCOG)公式HPhttp://www.jcog.jp/