10 likes | 148 Views
利用染色質免疫沉澱定序資料研究 TR4 核受體結合位 Uncovering TR4 Binding Motif using Chromatin Immuno-Precipitation Sequencing Data 專題組員 : 呂姿穎、李懿容、林佳穎、柯鈺彤 指導老師 : 董其樺老師. 摘要. 主要成果. 孤核受體 TR4(testicular orphan nuclear receptor 4) ,部分參與生物體的代謝調節、胚胎發育、細胞分化和基因表達 。
E N D
利用染色質免疫沉澱定序資料研究TR4核受體結合位利用染色質免疫沉澱定序資料研究TR4核受體結合位 Uncovering TR4 Binding Motif using Chromatin Immuno-Precipitation Sequencing Data專題組員:呂姿穎、李懿容、林佳穎、柯鈺彤 指導老師:董其樺老師 摘要 主要成果 孤核受體TR4(testicular orphan nuclear receptor 4),部分參與生物體的代謝調節、胚胎發育、細胞分化和基因表達。 本專題研究接續前人的研究,利用TR4之ChIP-seq資料,定位出TR4在DNA上結合的位置並加以擴充長度,再利用MEME-ChIP軟體,找出可能的Motif。最後我們探討TR4 binding motif與致病基因之間的關係,推論出當TR4出現異常時,會導致人類產生何種疾病。 [1-4] 根據結果觀察,我們發現多個TR4作用位置之序列呈現高度保留性,可被MEME-ChIP網站偵測出motif。而這些motife又與特定的罕見疾病有關。以下我們針對其中統計數據與出現次數較顯著的motif以及影響下游重要的致病基因作結果討論。 A) LRPPRC: TR4可能調控此基因。此致病基因若發生基因異常,則會導致Leigh症候群(Leigh Syndrome,LS)的產生。根據我們的發現,這種TR4結合位置,可能呈現的motif型樣有兩種。AGAGTTCTCGGTATTTTTACTAGTTGGCC以及 C[CT](2)T[CG]C[CG][AC]C[GA] [TA]CCTGGGA(如圖四)。 圖一、孤核受體TR4結合DNA示意圖 研究目的 1.利用TR4之ChIP-seq資料定位出TR4在DNA上結合的位置及調控的基因 2.使用MEME ChIP軟體,找出可能的Motif 3.探討TR4 binding motif與致病基因 圖四、Leigh Syndrome,LS MEME-ChIP Motif Overview。可能的motif共兩種。 B) PALB2:TR4的調控在該基因上游若產生異常,將可能導致胰臟癌的發生(Fanconi anemia, complementation group N)。胰臟癌是一種「高度惡性的疾病」,有90%的病人無法以手術根除治療。死亡率極高,此疾病是在美國是排名第四大癌症。在我們的研究結果中顯示,其可能的motif為A[GC]TC[TA]T[TC][CG]A[GC]AG [AC][TG][TC][CG][CG][GC][GT]CT[AC]CTT[CT][CA]GGC、CTCCTCCACTTCCGC TCCAGGTGGCCCACT(如圖五)。 研究動機 為了確定TR4在體內的結合位置,我們將找出TR4後端位置和Motif,就能夠更進一步了解TR4在生物體內扮演多重要的角色。 專題進行方式 前人建立的TR4資料庫中, TR4結合部位之DNA序列共約100多萬筆,其中我們只選擇位於某個基因上游的資料,共548,514筆。接著利用blast的快速比對,分別將這些ChIP-seq之序列找出在人類染色體上對應的位置,之後將其結果分別依照染色體編號寫入至檔案紀錄之。接著,再使用MEME網站輸入ChIP-seq序列,建立出motif。最後我們探討較具意義的TR4 binding motif、會影響的基因及可能致病的關聯性。[5.6]專題製作流程步驟如下圖二所示。 圖五、Fanconi anemia, complementation group N MEME-ChIP Motif Overview。可能的motif型樣共兩種。 C) SRP72: 此基因也可能受到TR4結合異常時而致病,其基因會導致骨髓造血缺陷(Bone marrow failure, familial)。此遺傳疾病又稱「再生障礙貧血症」,其中一個引起的因素是先天性體質。根據我們的推測,TR4與此基因的上游位置結合,可能會調控此基因。若TR4有先天性的異常,亦可能導致此疾病的發生。結果發現,此TR4結合部位共有兩種可能的motif:(如圖六) GGCTGAAGACACTCCCAACTCGGCGACGCT、TAGCAATCATCGACTTCCTCCTCCTCTTGG 圖六、Bone marrow failure, familial MEME-ChIP Motif Overview。可能的motif型樣共兩種 評估與展望 圖二、專題步驟流程圖 3.1 TR4相關資料蒐集 (http://140.126.132.67/phpadmin) 根據前人的研究,所建立的TR4資料庫,挑選所有ChIP-seq資料中只結合在某特定基因上游的TR4結合序列,長度皆為32bp。總數共548,514筆。 3.2 撰寫程式 A) Run_blast.php:用以執行blast,比對TR4 ChIP-seq序列在人類基因體GRCh37p10[7]中出現在哪個染色體上的位置。將比對結果記錄在得到result.txt。 B)Seperate-dnaseq.php:將人類基因體序列GRCh37p10檔案透過此程式,將序列依照染色體編號區分成出多個檔案,以利下個程式的執行。 C) get_dnaseq.php: 將ChIP-seq序列(TR4結合部位)對應在基因體上的序列,延長其範圍,從32bp擴充至100bp(如圖三)。序列結果依照染色體編號分別記錄下來。 D) 最後得到儲存在CHIP-result資料夾裡的各個以染色體區分的檔案chrN。每個檔案裡記錄TR4結合在該染色體上的位置,以及其長度100bp的ChIP序列為何。 除了前文所舉的例子之外,我們找出五個以上的致病基因,皆有TR4在其上游結合。根據我們的推測,這些致病基因產生異常後,會導致罕見疾病,有部分原因可能正是TR4的調控出現。我們認為人類致病基因與TR4調控變異是有相關的,並且找出TR4結合部位的motif。未來可以利用這些motif進一步去搜尋基因體是否有其他位置符合這些motif,進而深入了解這些遺傳疾病的發生原因,也了解TR4的重要性。 結語 根據前人建立的TR4資料庫,我們將ChIP-seq資料中只結合在某特定基因上游的TR4序列32bp長度擴充至100bp。本專題透過PHP程式撰寫,定位出TR4在DNA上結合的位置及調控的基因,再進一步的探討TR4異常時導致人類產生何種疾病,在這548,514筆序列裡,我們找到五個以上罕見疾病可能與TR4調控有關。 銘謝 製作專題期間,在董老師耐心指導下,使我們學會了MEME-ChIP的使用。在製作過程中,有問題也有耐心的考驗,組員之間的互相互助,董老師總是耐心的教導著我們每一個步驟的重要,且指導我們如何學會使用軟體的方便與功能性。因為大家的高度互動,提升了彼此之間的感情,使我們在專題期間,有問題共同解決且不拖延任何一點能夠利用的時間,在專題裡不僅僅學到了本科系專業知識,也學到了團體之間的相處及互助。 參考文獻 1. Du, L., et al., Evidence for orphan nuclear receptor TR4 in the etiology of Cushing disease. Proc Natl Acad Sci U S A, 2013. 110(21): p. 8555-60. 2. Hwang, S.B., J.P. Burbach, and C. Chang, TR4 orphan receptor crosstalks to chicken ovalbumin upstream protein-transcription factor and thyroid hormone receptor to induce the transcriptional activity of the human immunodeficiency virus type 1 long-terminal repeat. Endocrine, 1998. 8(2): p. 169-75. 3. Lee, Y.F., et al., Identification of direct repeat 4 as a positive regulatory element for the human TR4 orphan receptor. A modulator for the thyroid hormone target genes. J Biol Chem, 1997. 272(18): p. 12215-20. 4. O'Geen, H., et al., Genome-wide binding of the orphan nuclear receptor TR4 suggests its general role in fundamental biological processes. BMC Genomics, 2010. 11: p. 689. 5. Viens, A., et al., Use of protein biotinylation in vivo for chromatin immunoprecipitation. Anal Biochem, 2004. 325(1): p. 68-76. 6. 紀郁祥, 曾景宏, 陳敬凱, Discovering TR4 Nuclear Receptor Binding Information from ChIP-seq Data.2012年第七屆專題成果報告, 2012: p. 1-6. 7. Genome Reference Consortium Human Build 37 patch release 10 (GRCh37.p10). 2012/08/31]; Available from: http://www.ncbi.nlm.nih.gov/assembly/GCF_000001405.22/. 圖三、TR4結合部位擴展示意圖 3.3 MEME網站分析ChIP序列 (http://meme.nbcr.net/meme/cgi-bin/meme-chip.cgi) 根據get_dnaseq.php中所獲得ChIP序列(100bp),經Excel排序後,每個染色體裡各挑選前三十名TR4影響最多的基因,每筆基因蒐集TR4結合序列成FASTA格式,再利用MEME網頁工具分析,建立成無間隔的序列motif。 依照motif的統計數據及出現次數,挑選出合適的結果。挑選的標準為:統計數據E-value小於10-50、出現次數大於10次。最後討論TR4蛋白質結合motif和可能影響之下游的致病基因。 3.4 疾病探討 我們透過以下兩個網頁搜尋疾病名稱,協助我們了解致病基因及相關知識。 A) 衛生福利部國民健康署 (http://gene.hpa.gov.tw/index.php?mo=DiseasePaper&action=paper1_cate&cate=Set1) B) 疾病資料庫--罕見遺傳疾病一點通 (http://www.genes-at-taiwan.com.tw/genehelp/dbIndex.asp) 中華大學生物資訊學系系統開發專題報告專題編號:PROJ2013-BIOINFO-9907