80 likes | 219 Views
資料挖掘技術推論未知 PLTP. 出處:成功大學碩士論文 作者:郭弘志 日期: 2003 報告者:陳昭全 2010/06/23. 環境. 生物資訊已經轉變 取得知識 -> 分享知識 顯性知識 -> 隱性知識 管理資料 -> 利用資料產生知識 PLTP 在植物的成長中扮演重要的角色 PLTP 屬於 family protein. 環境. family protein 的問題 大量序列 複雜的分析工具 無法被管理的文獻資料 無法重用的分析結果. 目的. 從知識管理的角度切入
E N D
資料挖掘技術推論未知PLTP 出處:成功大學碩士論文 作者:郭弘志 日期:2003 報告者:陳昭全 2010/06/23
環境 • 生物資訊已經轉變 • 取得知識->分享知識 • 顯性知識->隱性知識 • 管理資料->利用資料產生知識 • PLTP在植物的成長中扮演重要的角色 • PLTP屬於family protein
環境 • family protein的問題 • 大量序列 • 複雜的分析工具 • 無法被管理的文獻資料 • 無法重用的分析結果
目的 • 從知識管理的角度切入 • 提出新架構 Knowledge sharing for plant lipid transfer protein(KS-PLTP) • KS-PLTP • 精緻化 • 自動化 • 知識存取 • 兩個方向 • 推論未知序列 • 建立PLTP知識庫
方法 • 資料->蛋白序列、文獻資料 • 資訊->描述蛋白的負份或全部功能、序列特性 • 知識->利用獲得的資訊去預測未知蛋白序列或註解 該蛋白序列的過程 • 資料挖掘->將資料資訊轉成知識的一個知識技術 • 資料過濾 • 訓練資料 • 決策樹
技術 • 分類技術->決策樹 • 決策樹 • 根節點 • 內部節點 • 葉節點 學習演算法 訓練資料 學習模式 應用模式
實驗 • 利用KS-PLTP找到蝴蝶蘭的PLTP序列 • 預測成功率50%
結論 • KS-PLTP使研究PLTP的生物團隊有管理這些生物資料(處理序列資料)、產生知識(決策樹規則、PLTP知識庫)、分享知識的能力。