Sem behavioral genetics
Download
1 / 60

SEM behavioral genetics - PowerPoint PPT Presentation


  • 71 Views
  • Uploaded on

SEM による行動遺伝学 (behavioral genetics) 解析の理論と実際. 前川研 PD 村山 航. 目次. 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1: Sex limitation model 発展モデル2:多変量遺伝分析モデル 発展モデル3: G X E interaction モデル. 目次. 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1: Sex limitation model 発展モデル2:多変量遺伝分析モデル

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'SEM behavioral genetics ' - sancha


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Sem behavioral genetics

SEM による行動遺伝学 (behavioral genetics) 解析の理論と実際

前川研 PD

村山 航


目次

  • 基本的な考え方(単変量遺伝分析)

  • 生物測定学モデルによる遺伝子相関の算出

  • 発展モデル1:Sex limitation model

  • 発展モデル2:多変量遺伝分析モデル

  • 発展モデル3:G X E interaction モデル


目次

  • 基本的な考え方(単変量遺伝分析)

  • 生物測定学モデルによる遺伝子相関の算出

  • 発展モデル1:Sex limitation model

  • 発展モデル2:多変量遺伝分析モデル

  • 発展モデル3:G X E interaction モデル


遺伝子

共有環境

家庭の雰囲気居住環境など

非共有環境

家庭外の交友関係など

ある特性の分散(個人差)を規定するもの

“A set” of genes相加型・非相加型(エンドウマメ)

外向性

表現型(phenotype)

環境

+測定 誤差


とりあえず相加型(additive)遺伝子に限定

遺伝子 (additive gene: A)

a

共有環境(common environment: C)

外向性

c

表現型(phenotype)

e

非共有環境(random environment: E)

データから代入

SEM による表現

* 潜在変数の分散は1に固定

解けない!(識別不定)

方程式1つ

パラメータ3つ (a,c,e)

Vp2 = a2 + c2 + e2


A

a

この値は biometrical model によって得られる(後述)。

c

表現型

C

0.5

e

E

1.0

A

a

c

表現型

C

e

E

兄弟からデータを取ってみる

Vp2 = a2 + c2 + e2

Cov = 0.5a2 + c2

まだ解けない!


Monozygotic twins

一卵性双生児だから遺伝子は同一(後述)

A

a

c

表現型

C

1.0

e

E

1.0

A

Vp2 = a2 + c2 + e2

a

Cov = a2 + c2

c

表現型

C

e

E

一卵性双生児 (Monozygotic twins)からデータを取ってみる

・ e は算出可能・ a と c が分離不能


Vp2 = a2 + c2 + e2

Covbros = 0.5a2 + c2

A

Covmz = a2 + c2

a

c

表現型

C

e

0.5/1.0

E

1.0

A

a

c

表現型

C

e

E

あわせてみる

方程式3つ → 解けた!

しかし…

兄弟と一卵性双生児だと全員に共通する「共有環境」の意味が不明確


Dizygotic twins

A

二卵性双生児は遺伝的には兄弟と同じ

a

c

表現型

C

e

1.0/0.5

E

Vp2 = a2 + c2 + e2

1.0

Covdz = 0.5a2 + c2

A

a

Covmz = a2 + c2

c

表現型

C

e

E

一卵性双生児と二卵性双生児 (dizygotic twins) からデータを取る

やはり方程式が解け,かつ「共有環境」も等質


まとめると

  • 一卵性双生児と二卵性双生児のデータを両方用いることで,ある表現型に対する,遺伝,共有環境,非共有環境の効果を分離することができる

  • 統計的には共分散構造分析の多母集団解析を用いて解を推定する

  • 実際的には,3つの効果を同時推定するモデル (ACE モデル)と,CE モデル,AE モデル,E モデルの適合度 (e.g., AIC)を比較し,最もよいモデルを選ぶ。

Note1: ACE モデルも飽和モデルではない(すべての表現型分散が等しいという仮定が入っているため)

Note2: 測定誤差は E に含まれる


行列による共分散構造

a2 + c2 + e2

a2 + c2 a2 + c2 + e2

ΣMZ =

a2 + c2 + e2

0.5a2 + c2 a2 + c2 + e2

ΣDZ =

MZ間 の相関が DZ 間の相関より高ければ遺伝の効果があることを示唆

ふたご間の相関を目で見るだけでも,遺伝の効果は推測できる


単変量遺伝分析の実際

  • 調査対象:首都圏に住む 13-18 歳のふたご 908 組

    • MZ男男:221 組

    • MZ女女:301 組

    • DZ男男:88組

    • DZ女女:99組

    • DZ男女:199組

  • 調査の詳細:首都圏ふたごプロジェクト (TOTCOP: http://www.totcop.jp/index.html)

分析に使用


ここで取り上げる項目例

  • 教科ごとの好き嫌いと成績(自己報告)

    • 数学:「数学ではよい成績を取っている」「数学が好きである」

    • 英語:上に同じ

    • 総合学習:上に同じ

  • 授業の予習・復習

    • 「学校の授業の予習・復習をする」

  • 数学の認知的な学習方略

    • 「数学の勉強をしていて,教科書,ノート,参考書などを読むとき『なぜ間違えたのか』『これから間違えないようにするにはどうしたらいいのか』などということについて考える」など



A 2 a 2 c 2 e 2
結果2:遺伝率の推定 (a2/[a2+c2+e2])

全体として遺伝の効果が強い


注意点

  • 「遺伝の効果」は個人差を説明する効果

    • 遺伝に既定されていても,個人差がなければ効果はでない (例:「指を5本にする遺伝子」)

  • できれば性別ごとに分けて分析するのがよい

    • 二卵性双生児のopposite sexペアは除去

  • モデルの前提を脅かす要因

    • 遺伝要因と環境要因の相関 (G-E correlation)

      • 人は自分の遺伝にあった環境を選ぶ・作るかも

      • いい遺伝の家族はいい環境にいるかも

        ⇒ 正の相関はAを overestimate させる


目次

  • 基本的な考え方(単変量遺伝分析)

  • 生物測定学モデルによる遺伝子相関の算出

  • 発展モデル1:Sex limitation model

  • 発展モデル2:多変量遺伝分析モデル

  • 発展モデル3:G X E interaction モデル


Dz 0 5
なぜDZの遺伝間相関は0.5なのか

  • なぜMZの遺伝間相関は1なのか。赤の他人は?

    ⇒ 生物測定学 (biometrical) モデルによる定式化

  • 以下の話の前提

    • ある遺伝子座1つの効果を考える

    • 遺伝子座には2つの対立遺伝子Aとaだけ関与

    • 遺伝の効果は相加的:A が1つ増えると表現型(たとえば身長)は d だけ大きくなる。

遺伝子型

AA Aa aa

表現型

d 0 -d


u + v = 1

1世代後の遺伝子頻度

A: u2 + ½ uv + ½ uv = u2 + uv = u (u+v) = u a: v2 + ½ uv + ½ uv = v2 + uv = v (u+v) = v

変化しない!

  • A の遺伝子頻度を u, a の遺伝子頻度を v とする

  • 交配がランダムだとすると,次の世代は


遺伝子型

AA Aa aa

頻度

u2 2uv v2

  • 前の表より,遺伝子型の頻度は,どの世代でも

  • 従って,表現型の(遺伝による)平均と分散は

表現型

d 0 -d

μ = u2 d + 2uv x 0 + v2 (-d) = (u+d)(u-v)d = (u-v)d

σ2 = u2[d – (u-v)d]2 +2uv[ 0 – (u-v)d]2 + v2[-d – (u-v)d]2 = … = 2uvd2


(X1i – μ) (X2i – μ) を 頻度で重み付けして足すと,MZ, DZ, unrelated それぞれの表現型の遺伝による共分散が分かる


  • 共分散の計算結果

    • Cov (MZ) = 2uvd2

    • Cov (DZ) = uvd2

    • Cov (unrelated) = 0

  • よって相関は,これを標準偏差(先述)で割って

    • MZ: 2uvd2/ 2uvd2 = 1

    • DZ: uvd2/ 2uvd2 = 0.5

    • Unrelated = 0/2uvd2 = 0

  • 遺伝子座が複数あったとしても計算結果は同じ(メンデルの独立の法則より)

モデルで仮定した値と一致!


Dominance d
非相加遺伝子 (dominance: D)

  • ある遺伝子の効果が別の遺伝子の効果によって変わってくること (e.g. エンドウマメの皺)

  • 非相加効果は,下図における h で表現可能

  • h を組み込んで,先ほどのモデルからDZの表現型の遺伝による相関を計算すると,0.25 となる

    • MZ は 1, unrelated は 0

aa Aa AA

h

-d

d


ADCE モデル

A

a

  • 非相加遺伝の効果も組み込んだモデル

  • 共通環境で養育された双子データだけだと識別不定

  • 解が不安定になりやすい

  • 以降では,ACE モデルだけを取り扱う

D

d

1.0/0.5

表現型

C

c

e

E

1.0/0.25

A

Vp2 = a2 + c2 + d2 + e2

a

D

d

Covdz = .5a2 + .25d2+ c2

1.0

表現型

Covmz = a2 + d2 + c2

C

c

e

E


注意点

  • DZ における遺伝の効果の相関が 0.5 (or 0.25) である背後には,「ランダム交配」の前提

    • エンドウマメはランダムだった

    • 人間なら,遺伝子が似ている人ほど結婚しやすいかも: Assortative mating (同類交配)

    • Assortative mating が存在:A のDZにおける相関は実際は 0.5 以上になり,それを 0.5 として分析してしまうことで,C の効果がoverestimate される。


目次

  • 基本的な考え方(単変量遺伝分析)

  • 生物測定学モデルによる遺伝子相関の算出

  • 発展モデル1:Sex limitation model

  • 発展モデル2:多変量遺伝分析モデル

  • 発展モデル3:G X E interaction モデル


General sex limitation model
General sex-limitation model

  • 行動遺伝学における 2 タイプの性差

    • 1:遺伝や環境の効果の大きさに性差があるか

    • 2:どちらの性別にも同じ遺伝子セット(もしくは共有環境)が影響を与えているのか

  • この両方を1つのモデルで検討

  • ポイント:これまで使わなかった opposite sex の DZ のデータを用いる


A

C

E

af

cf

ef

表現型(女)

男性に特殊な遺伝の効果を仮定

影響力に性差を仮定

(共有環境の効果でもいいが,どちらか1つにしないと識別できない)

MZ male, MZ female, DZ male, DZ female も同じようにモデル構築

⇒ 5群の多母集団分析

モデル

0.5

1.0

A

C

E

A

am

cm

em

a’m

表現型(男)

DZ opposite sex ペア


共分散構造

Vmale = am2 + cm2 + em2 + a’m2

Vfemale = af2 + cf2 + ef2

CovDZm-f = 0.5amaf + cmcf

CovDZmale = 0.5am2 + cm2 + 0.5a’m2

CovDZfemale = 0.5af2 + cf2

CovMZmale = am2 + cm2 + a’m2

CovMZfemale = af2 + cf2

異なる性別間では分散が違っていてもよい!

Opposite sex DZ の相関が,Same sex DZ の相関よりも弱ければ,特殊遺伝子があることを示唆


サブモデル

  • Common effects sex-limitation model

    • a’m の効果を 0 にしたもの

    • General sex-limitation model より自由度1減

  • Scalar effects sex-limitation model

    • Common effects sex-limitation model の制約をさらに強め,効果の性差はあるが,遺伝・環境の効果の割合は変わらないようにしたもの

    • Common effects sex-limitation model より自由度2減


同一

効果をスケーリング

* Scalar effects sex-limitation model

0.5

1.0

A

C

E

A

C

E

a

c

e

a

c

e

L(女)

L(男)

1

k

表現型(女)

表現型(男)


さらなる発展モデル

  • 性別を「環境」と考えると,環境によって遺伝や環境の効果が変わってくるモデルになる

    ⇒ 一種の G X E interaction モデル

  • ただし,環境が性別のように二値変数の場合にしか使えない

  • 連続量の場合の G X E interaction model に関しては後述


Sex limitation model

MZ DZ

双子間相関

男ペア 0.38 0.19

女ペア 0.47 0.41

男女ペア 0.17

Sex-limitation model の実際

  • 自己概念

    • 「数学の授業の内容を理解できる自身がある」

    • 「数学の授業の内容を身につけることができていると感じている」

← 遺伝?

← 共有環境?


モデル比較

男性は遺伝の効果が,女性は共有環境の効果が大きい


目次

  • 基本的な考え方(単変量遺伝分析)

  • 生物測定学モデルによる遺伝子相関の算出

  • 発展モデル1:Sex limitation model

  • 発展モデル2:多変量遺伝分析モデル

  • 発展モデル3:G X E interaction モデル


データから代入

a12 + c12 + e12

a12 + c12 + e12 a22 + c22 + e22

V(X1)

Cov(X1,X2) V(X2)

=

2変量の場合

X1 = a1A1 + c1C1 + e1E1

X2 = a2A2 + c2C2 + e2E2

V(X1) = a12 + c12 + e12

V(X2) = a22 + c22 + e22

Cov(X1, X2) = a1a2 Cor (A1,A2) + c1c2 Cor (C1,C2) + e1e2 Cor (E1,E2) = a12 + c12 + e12

潜在変数の分散を1にしてあるので,相関になる

A,C,E間の共分散は 0

置き換え

共分散も遺伝要因・環境要因に分割可能

方程式3つにパラメータ9つ ⇒ 解が求まらない!


パス図で書くと(遺伝相関モデル)

A1

a1

c1

X1

C1

e1

Cor(A1,A2)

E1

Cor(C1,C2)

A2

a2

c2

Cor(E1,E2)

X2

C2

e2

E2

* ふたご間ではなく,「1人」のパス図である点に注意!


ふたごを使ってみる

  • 「ふたご間」の分散と共分散が求まる

CovMZ(X1) = a12 + c12 + e12

CovMZ(X2) = a22 + c22 + e22

CovMZ(X1, X2) = a12 + c12 + e12

CovDZ(X1) = 0.5a12 + c12

CovDZ(X2) = 0.5a22 + c22

CovDZ(X1, X2) = 0.5a12 + c12

方程式はさきほどとあわせて合計9つ,パラメータは9つ ⇒ 解が求まる!


分散共分散構造を改めてきちんと書くと

双子1

双子2

x1 x2 x1 x2

a12 + c12 + e12

a12 + c12 + e12 a22 + c22 + e22

a12 + c12 a12 + c12 a12 + c12 + e12

a12 + c12 a22 + c22 a12 + c12 + e12 a22 + c22 + e22

x1

x2

x1

x2

双子1

Sym.MZ

双子2

a12 + c12 + e12

a12 + c12 + e12 a22 + c22 + e22

0.5a12 + c12 0.5a12 + c12 a12 + c12 + e12

0.5a12 + c12 0.5a22 + c22 a12 + c12 + e12 a22 + c22 + e22

x1

x2

x1

x2

双子1

Sym.DZ

双子2


行列による簡略化

a12 a12

a12 a22

c12 c12

c12 c22

e12 e12

e12 e22

= A

= C

= E

A + C + E

A + CA + C + E

MZ

A + C + E

0.5A + CA + C + E

DZ


パス図で書くと

1.0/0.5

ふたご1

ふたご2

A1

1.0

A1

a1

a1

c1

c1

X1

C1

C1

X1

e1

e1

Cor(A1,A2)

E1

E1

Cor(C1,C2)

A2

A2

a2

a2

1.0/0.5

c2

c2

X2

C2

C2

X2

Cor(E1,E2)

e2

e2

E2

E2

1.0


コレスキー分解

  • A, C, E行列が正定値でないといけないが(分散共分散行列なので),往々にしてそれが満たされない

  • したがって,下記のコレスキー分解で下三角行列の値を推定してから,A, C, Eの値を求める。このようにして求めた A, C, Eは必ず正定値

A = PP’, C = QQ’, E = RR’(P, Q, Rは下三角行列)

PP’ + QQ’ + RR

PP’ + QQ’PP’ + QQ’ + RR’

MZ

PP’ + QQ’ + RR’

0.5PP’ + QQ’PP’ + QQ’ + RR’

DZ


遺伝相関:Cor (A1, A2) = a12/a11a22

共有環境相関:Cor (C1, C2) = c12/c11c22

非共有環境相関:Cor (E1, E2) = e12/e11e12


さらなる発展モデル1以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

  • 独立経路 (independent pathway) モデル

    • より制約の強いモデル

    • 遺伝相関,環境相関のそれぞれに因子分析を実施したモデル

    • さらに個々の変数の独自因子も遺伝要因と環境要因に分割可能


モデル図以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

(双子の片側のみ)

A1

A

X1, X2, X3を単一の遺伝・環境因子で説明

C1

X1

E1

A2

C

X2

C2

E2

A3

X3

E

C3

E3


さらなる発展モデル2以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

  • 共通経路 (common pathway) モデル

    • 独立経路モデルより制約の強いモデル

    • 表現型を単一の因子が説明し,それが遺伝要因・環境要因に分割される

    • さらに個々の変数の独自因子も遺伝要因と環境要因に分割可能


独立経路モデルとの意味的な違いは難しい?以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

モデル図

(双子の片側のみ)

A1

C1

X1

E1

A

A2

f

C

X2

C2

E2

E

A3

X3

C3

E3


多変量遺伝分析の実際以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

  • 努力に対する信念,努力量,そして成績の関係

    • 努力に対する信念:「勉強をいっしょうけんめい努力すれば,学校でいい点数をとることができると思う」

    • 学校での勉強時間

    • 学校での総合的な成績(自己報告)

  • 単変量遺伝解析の結果

    • 努力に対する信念,学校での総合的な成績 ⇒ AE

    • 学校での勉強時間 ⇒ ACE

    • よって,C をコレスキー分解した下三角行列に制約を入れ,A や E だけに変数間の相関があるモデルを検討


表現型相関以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

信念 1

努力量 .11 1

成績 .15 .20 1

分散説明率

A C E

信念 33% - 67%

努力量 47% 22% 31%

成績 62% - 38%

遺伝相関

非共有環境相関

信念 1

努力量 .30 1

成績 .25 .31 1

信念 1

努力量 .01 1

成績 .16 .10 1

結果


目次以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

  • 基本的な考え方(単変量遺伝分析)

  • 生物測定学モデルによる遺伝子相関の算出

  • 発展モデル1:Sex limitation model

  • 発展モデル2:多変量遺伝分析モデル

  • 発展モデル3:G X E interaction モデル


G x e interaction
G x E interaction 以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)モデルとは

  • 遺伝と環境の効果は,ある状況下にいる人や,パーソナリティを持った人によって違うかもしれない

  • Sex limitation モデルはその例の1つ

  • 連続量の場合だとどうか?

  • 遺伝と環境の効果に影響を与える変数を調整変数 (moderator variable) と呼ぶ


M1: 以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)1人目の調整変数の値

M2: 2人目の調整変数の値

モデル図

a + t x M1

A

c + u x M1

表現型

C

1.0/0.5

E

e + v x M1

M1

1.0

M2

a + t x M2

A

c + u x M2

表現型

C

E

e + v x M2

※ 基本は単純な(潜在変数を含んだ)交互作用モデル


共分散構造以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

Vp12 = (a + s M1)2 + (c + t M1)2 + (e + uM1)2

Vp22 = (a + s M2)2 + (c + t M2)2 + (e + uM2)2

Covmz = (a + sM1)(a + sM2) + (c + tM1)(c + tM2)

Covdz = 0.5 (a + sM1)(a + sM2) + (c + tM1)(c + tM2)

Mx だとこれをこのままプログラムに代入すればよい → 1人1人について尤度を算出して最大化している?


注意点以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

  • モデル比較をしながら,不必要なパラメータは除去

  • 調整変数によって因子負荷が線形的に変化するモデルなので,分散成分は非線形に変化する

  • 結果を視覚化するソフトが http://statgen.iop.kcl.ac.uk/gxe/にある

  • ここでプロットされるのはあくまでも分散成分であり,「分散説明率」は新たにスケールしなおす必要がある:結果としてまったく違った見え方になる可能性あり

  • 両端部分は,サンプル数が少ないので,不安定であることを意識する必要性


G x e interaction1
G x E interaction 以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)モデルの実際

  • クラスサイズによって総合学習の成績における遺伝の分散成分は変わってくるのか?


パラメータ値以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

A - 0.0784

E 1.2688

T 0.0127

V -0.0151

このまま解釈するのは難しい


プロットすると一目瞭然以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

E

A

クラスサイズが大きいと遺伝の寄与が増える!


ただし調整変数の分布には注意以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

このようなクラスはほとんどない

E

A


参考文献など以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)

  • Web上で無料で手に入るテキスト

    • Neale, M. C. & Maes, H. H. M. (2002). Methodology for genetic studies of twins and families: http://ibgwww.colorado. edu/workshop2006/cdrom/HTML/book2004a.pdf

  • G x E interaction について

    • Purcell S (2002). Variance components models for gene-environment interaction in twin analysis. Twin Research, 5, 554-571.

  • 今回紹介しなかった direction of causation analysis の話

    • Heath, A. C, Kessler, R. C., Neale, M. C., Hewitt, J. K., Eaves, L. J., & Kendler, K. S. (1993). Testing hypotheses about direction of causation using cross-sectional family data. Behavior Genetics, 23, 29-50.


ad