100 likes | 211 Views
タンパク質立体構造予測. アミノ酸配列からの立体構造予測. 立体構造未知タンパク質のアミノ酸配列が、既に立体構造データベースに登録されているタンパク質のアミノ酸配列と相同性が高い場合、この既知タンパク質の立体構造をテンプレート(鋳型)として、立体構造を計算機的手法で予測することができる ホモロジーモデリング法 配列の相同性が約 30% 以上の時に、配列の保存領域で構造既知のタンパク質がどのような立体構造を取っているか(つまりテンプレート構造)を参照しながら、構造未知のタンパク質の立体構造を予測する手法 構造認識法
E N D
アミノ酸配列からの立体構造予測 • 立体構造未知タンパク質のアミノ酸配列が、既に立体構造データベースに登録されているタンパク質のアミノ酸配列と相同性が高い場合、この既知タンパク質の立体構造をテンプレート(鋳型)として、立体構造を計算機的手法で予測することができる • ホモロジーモデリング法 • 配列の相同性が約30%以上の時に、配列の保存領域で構造既知のタンパク質がどのような立体構造を取っているか(つまりテンプレート構造)を参照しながら、構造未知のタンパク質の立体構造を予測する手法 • 構造認識法 • ホモロジーモデリング法同様、既知の立体構造をテンプレートとして参照するが、立体構造空間における残期間ポテンシャルや物理化学的な環境を表現するプロファイルの適合度に着目してテンプレートタンパク質を選択する方法 • ab initio構造予測 • 経験的ポテンシャルを用いてエネルギー最小の状態を探索することで構造予測を行うような演繹的手法
ホモロジーモデリング法 • モデル構築の手順 • 配列比較法により予測対象配列と構造既知のタンパク質配列とのアラインメントを作成する • これによりタンパク質間でのアミノ酸残基の対応付けがなされる • 配列 / 立体構造比較からファミリーやスーパーファミリーで保存されている領域を見つけ、その部分の主鎖構造を予測構造として用いる • 非保存領域は挿入 / 欠失が頻発し、構造が変化している場合が多いので、しばしばループ専用の構造ライブラリなどにより提供される主鎖構造の中から適切なものを当てはめる • 主鎖構造依存の側鎖構造ライブラリなどを利用して側鎖を発生させる • 最後に、エネルギー極小化による構造の精密化を行う
構造認識法 • 構造認識 • 問題配列がとるであろう立体構造と非常によく似た構造を、PDBから検索すること • 構造認識法の研究開発に世界中の研究者が邁進する動機 • タンパク質の立体構造の基本構造(fold)の数に限りがあることが強く示唆されていること • 立体構造の方が配列よりも保守的で、進化圧に対して発散が少ない • 現在世界中で進行している構造ゲノムプロジェクトにより、foldのライブラリは完備されるあろう • 後は配列を基にして立体構造を検索できる方法があれば、構造認識という戦略は無敵となる
構造認識法の技法 • 配列プロファイル(PSSM) • サイトに依存した置換行列で、問題配列を種にホモロジー検索などを行ってマルチプルアラインメントを作成し導出 • 2次構造予測 • foldの類似は2次構造配置のおおよその一致を意味するので、2次構造予測結果とデータベース側の2次構造の一致を数値化して取り込む • 構造―配列適合性関数 • タンパク質の安定化を評価するエネルギー的なもの(利用されない場合もある) • 構造アラインメント • 立体構造既知のタンパク質があれば、構造アラインメントを利用してより厚いアラインメントを作成することが可能 • 構造アラインメントに基づいて作成した配列プロファイルを3D-PSSMとも呼ぶ • 多重方向サーチ • 以下の両者のサーチを実行して結果の和を利用すると制度が上がる • PSI-BLAST(立体構造既知のタンパク質からなる配列データベースに対して問題配列の配列プロファイルを作成し検索) • reverse-PSI-BLAST(立体構造既知タンパク質からなる配列データベースのタンパク質についてプロファイルを作成し問題配列との適合を評価) • スコアの規格化 • スコアは問題配列とデータベース中の配列とのアラインメントに与えられる • ホモロジー検索で利用する置換行列の和などの生スコアはアラインメントされた配列長に依存するので、補正し規格化スコアに直して出力する
ab initio 構造予測 • 予測対象配列(およびその相同配列)に対して、ある類似性を基準にして、立体構造データベースからフラグメントを抽出 • フラグメントの構造をもとに、主鎖と側鎖の重心に一相互作用点のみを考慮したような簡略化したモデルで初期構造を用意 • データベースから導出された経験的ポテンシャルを用いてシミュレーションを行い、構造をサンプルする • このとき、構造認識法を適用した場合、非常によい適合度を与える残基対に距離拘束を加える手法も発表されている • 発生した多数の構造に対して、データベースの観測から得られたタンパク質らしい構造の選択基準を用いてスクリーニングを行う • 側鎖原子を発生させ、原子同士の衝突を取り除くなど、モデルの精密化を行う • 予測候補の抽出には、エネルギーだけを基準とせず、クラスター解析による候補構造の抽出を行う手法が構造予測コンテストで好成績を収めている
GTOP(http://spock.genes.nig.ac.jp/~genome/whatgtop-j.html)GTOP(http://spock.genes.nig.ac.jp/~genome/whatgtop-j.html) • ゲノムにコードされている全タンパク質の配列データを解析した結果をまとめたデータベース • 国際遺伝研究所の大量遺伝子情報研究室で製作 • 配列相同性解析を主な手段として、立体構造の情報を積極的に利用していることが特徴 • 科学技術振興事業団、文部省科学研究費特定領域研究C「ゲノム」によって支援されている
GTOP解析方法 • 立体構造予測 • 対PDB<http://www.rcsb.org/pdb/index.html>の配列相同性検索 • Reverse PSI-BLASTを使用 • 機能予測(ファミリー分類) • SWISS-PROT<http://kr.expasy.org/sprot/>に対する配列相同性解析 • BLASTを使用 • その他の解析 • モチーフ解析(PROSITE<http://kr.expasy.org/prosite/>) • ファミリー分類(Pfam<http://www.sanger.ac.uk/Software/Pfam/>) • 膜貫通へリックス予測 (SOSUI<http://sosui.proteome.bio.tuat.ac.jp/sosuiframe0.html>) • コイルドコイル予測(Multicoil<http://theory.lcs.mit.edu/~elwolf/multicoil.html>) • 繰り返し配列解析(RepAlign)
3D-PSSM(http://www.sbg.bio.ic.ac.uk/~3dpssm/) • 英国Imperial Collage of Science,Technology and MedicineのSternbergの研究室で運営 • 構造認識サーバ • 自動的タンパク質の立体構造予測法コンテスト(CAFASP2)でも優秀な成績を修めた方法で、現在、最も信頼性がおけるものの最右翼 • 配列プロファイル、2次構造予測結果(PSIPRED)、構造関数、立体構造アラインメント、多重方向サーチを駆使し、E-valueを出力
メモ 3D-PSSM の詳細な手順(実例) 説明 ・fold ライブラリとは ・データベースの観測から得られたタンパク質らしい構造とは?