120 likes | 252 Views
ç”Ÿç‰©æƒ…å ±ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã«ãŠã‘ã‚‹ 分åé…åˆ—ã®æ¯”較. å‰ç”° å¹³æˆ 15 å¹´ 9 月 17 æ—¥. ç”Ÿç‰©æƒ…å ±ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã¨ã¯. DNA ã€è›‹ç™½è³ªã®åˆ†åé…åˆ—æƒ…å ±ã€æ§‹é€ æƒ…å ±ã€æ©Ÿèƒ½æƒ…å ±ãªã©ã‚’æ ¼ç´ã—ãŸãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ ãƒã‚¤ã‚ªã‚¤ãƒ³ãƒ•ォマティクスã®åˆ†é‡Žã«ã¯æ¬ ã‹ã›ãªã„é“å…·. 分åé…åˆ—æƒ…å ±ã®æ¤œç´¢. データベースä¸ã«ã‚る分åé…列ã®ä¸ã‹ã‚‰å•åˆã›é…列ã¨é¡žä¼¼åº¦ ( スコア ) ã®é«˜ã„分åé…列を探㙠ダイナミック・プãƒã‚°ãƒ©ãƒŸãƒ³ã‚°æ³•を用ã„ãŸé…列アライメントを行ã†ã“ã¨ã§é…列間ã®é¡žä¼¼åº¦ã‚’求ã‚ã‚‹. é…列アライメント. - A L I G N S E Q. é…列 A ALIGNSEQ.
E N D
生物情報データベースにおける分子配列の比較生物情報データベースにおける分子配列の比較 吉田 平成15年9月17日
生物情報データベースとは • DNA、蛋白質の分子配列情報、構造情報、機能情報などを格納したデータベース • バイオインフォマティクスの分野には欠かせない道具
分子配列情報の検索 • データベース中にある分子配列の中から問合せ配列と類似度(スコア)の高い分子配列を探す • ダイナミック・プログラミング法を用いた配列アライメントを行うことで配列間の類似度を求める
配列アライメント - A L I G N S E Q 配列A ALIGNSEQ S Q L L - N - - K 配列B SQLLNK - - A L I G N S E Q S Q L L - - N K - - A L I G N S E Q - - - - ー:挿入・欠失 - - - - - S - Q L L N K
ダイナミック・プログラミング法(1) • 与えられた最適化問題を多段決定問題としてとらえ、決定すべきN個の最適決定を順次行うことによって、問題全体の最適解を模索 • この場合、最も類似度が大きくなるアライメントを求めることが最適化問題
ダイナミック・プログラミング法(2) • グローバル・アライメント • 配列全体における類似度が最も高くなるようなアライメントを求める • ローカル・アライメント • 配列同士の類似性のある部分配列のうち、最も類似度が高い部分配列を求める
0 -1 -2 -3 -4 -5 -1 1 0 -1 -2 -3 -2 0 2 1 0 -1 -3 -1 1 1 2 1 -4 -2 0 0 1 1 グローバル・アライメント C M N F A C M N F A C M F D C M - F D ギャップ:-1 不一致:-1 一致:+1 Needleman&Wunschアルゴリズム
ローカル・アライメント C M N A C C M N A C C M F D C M F D ギャップ:-1 不一致:-1 一致:+1 Smith&Watermanのアルゴリズム
FASTAのアルゴリズム(1) • 対角線法を用いて、問い合わせ配列とデータベースの配列で類似度の高い領域を見つける • 見つかった領域の類似度を計算 • それらの領域を結合 • DP法を利用して最適アライメントを見つける
FASTAのアルゴリズム(2) • 対角線法の例 T K G S T R T K G R
その他のアルゴリズム • BLAST • PSI-BLAST • PHI-BLAST
今後の研究のために • 検索・整列の基本アルゴリズムの勉強 • 公開されている生物情報データベースのアルゴリズムを知る • バイオインフォマティクスの現状を知る