730 likes | 841 Views
真核基因表达的调控. 学生:王海涛 学号:2001406022333. 目录. 一、真核生物的转录作用 二、真核基因组的复杂性 三、真核基因转录水平的调控 四、真核基因表达调控的特点. 一、真核生物的转录作用. 1、真核细胞中的 RNA 聚合酶 细菌只有一种 RNA 聚合酶,它完成细胞中所有 RNA 的合成。真核细胞的转录机构更加复杂。 真核细胞核内产生三种 RNA 聚合酶,位于不同的部位,且均有复杂的亚基结构。每种酶负责不同种类基因的转录。它们的一般性质见表。.
E N D
真核基因表达的调控 学生:王海涛 学号:2001406022333
目录 一、真核生物的转录作用 二、真核基因组的复杂性 三、真核基因转录水平的调控 四、真核基因表达调控的特点
一、真核生物的转录作用 1、真核细胞中的RNA聚合酶 • 细菌只有一种RNA聚合酶,它完成细胞中所有RNA的合成。真核细胞的转录机构更加复杂。 • 真核细胞核内产生三种RNA聚合酶,位于不同的部位,且均有复杂的亚基结构。每种酶负责不同种类基因的转录。它们的一般性质见表。
RNA聚合酶Ⅰ合成RNA的活性最显著。它位于核仁中,负责转录编码rRNA的基因(称rRNA),而细胞内绝大部分RNA是rRNA。RNA聚合酶Ⅰ合成RNA的活性最显著。它位于核仁中,负责转录编码rRNA的基因(称rRNA),而细胞内绝大部分RNA是rRNA。 • 另一主要的酶是RNA聚合酶Ⅱ,它位于核浆中,负责核内不匀一RNA(hnRNA)的合成。而hnRNA是mRNA的前体。 • RNA聚合酶Ⅲ负责合成tRNA和许多小的核内RNAs。转录抑制剂常用来区分这三类酶的活性。某些常用抑制剂的性质见表-。其中最主要的是一种双环八肽──α-鹅膏蕈碱。
在不论何种真核细胞中,RNA聚合酶Ⅱ的活性均可被低浓度的α-鹅膏蕈碱所迅速抑制,而聚合酶Ⅰ却不被抑制。聚合酶Ⅲ对α-鹅膏蕈碱的反应则不尽相同:在动物细胞中聚合酶Ⅲ可被高浓度α-鹅膏蕈碱所抑制,而在酵母和昆虫细胞中则不会被抑制。在不论何种真核细胞中,RNA聚合酶Ⅱ的活性均可被低浓度的α-鹅膏蕈碱所迅速抑制,而聚合酶Ⅰ却不被抑制。聚合酶Ⅲ对α-鹅膏蕈碱的反应则不尽相同:在动物细胞中聚合酶Ⅲ可被高浓度α-鹅膏蕈碱所抑制,而在酵母和昆虫细胞中则不会被抑制。
粗制的RNA聚合酶都是大而复杂的蛋白质,分子量达500KD或更多。其亚基组成亦很复杂:每个酶分子有两个大亚基(一般说,一个约200KD,另一约140KD),还有10个以下的小亚基,每个分子量约为10-90KD。三种酶中也有一些共同的亚基,所以可能是一个原始的酶在进化过程逐渐分化为在复杂的真核细胞中执行不同功能的三种酶。因为直到现在还不能用亚基来重建活性的酶分子。因此,还难以提出确切的证据说明这些亚基是否真正都是酶分子的固有的组成部分,也不知道哪些亚基负责催化,哪些负责调节功能。粗制的RNA聚合酶都是大而复杂的蛋白质,分子量达500KD或更多。其亚基组成亦很复杂:每个酶分子有两个大亚基(一般说,一个约200KD,另一约140KD),还有10个以下的小亚基,每个分子量约为10-90KD。三种酶中也有一些共同的亚基,所以可能是一个原始的酶在进化过程逐渐分化为在复杂的真核细胞中执行不同功能的三种酶。因为直到现在还不能用亚基来重建活性的酶分子。因此,还难以提出确切的证据说明这些亚基是否真正都是酶分子的固有的组成部分,也不知道哪些亚基负责催化,哪些负责调节功能。
线粒体和叶绿体中的RNA聚合酶要小得多,并且和细胞核中的酶完全不同。当然,细胞器的基因组小得很,故其聚合酶所需要转录的基因数也很少。而且转录的调控看来也要简单得多。所以这些酶类似于上文所述噬菌体RNA聚合酶。所有三种小体RNA聚合酶均有其对应的启动子和终止子。以聚合酶Ⅲ所识别的启动子研究得最多,并发现这种启动子很奇怪──不是位于转录顺序的前面,而是在此顺序的中间。线粒体和叶绿体中的RNA聚合酶要小得多,并且和细胞核中的酶完全不同。当然,细胞器的基因组小得很,故其聚合酶所需要转录的基因数也很少。而且转录的调控看来也要简单得多。所以这些酶类似于上文所述噬菌体RNA聚合酶。所有三种小体RNA聚合酶均有其对应的启动子和终止子。以聚合酶Ⅲ所识别的启动子研究得最多,并发现这种启动子很奇怪──不是位于转录顺序的前面,而是在此顺序的中间。
RNA聚合酶Ⅱ合成mRNA,它是最直接和遗传调节相关的酶。因此对聚合酶Ⅱ的研究是目前的热点之一。困难之处在于:[1]除非有一些现在还不能确定的一些蛋白质存在,完全纯化的酶似乎不能在天然启动子上工作。这些不确定的蛋白质可能包括一些起始因子(类似细菌中的σ因子),但是肯定还有其他几种因子。[2]用突变分析方法证明,影响转录作用的DNA节段远比细菌启动子要长得多。[3]在细胞内增强子对启动子的活性很重要;对增强子的研究也是目前的热点之一。RNA聚合酶Ⅱ合成mRNA,它是最直接和遗传调节相关的酶。因此对聚合酶Ⅱ的研究是目前的热点之一。困难之处在于:[1]除非有一些现在还不能确定的一些蛋白质存在,完全纯化的酶似乎不能在天然启动子上工作。这些不确定的蛋白质可能包括一些起始因子(类似细菌中的σ因子),但是肯定还有其他几种因子。[2]用突变分析方法证明,影响转录作用的DNA节段远比细菌启动子要长得多。[3]在细胞内增强子对启动子的活性很重要;对增强子的研究也是目前的热点之一。
转录因子 • 真核生物在转录时往往需要多种蛋白质因子的协助。一种蛋白质是不是转录机构的一部分往往是通过体外系统看它是否是转录起始所必须的。一般可将这些转录所需的蛋白质分为三大类: • (1)RNA聚合酶的亚基,它们是转录必须的,但并不对某一启动子有特异性。
(2)某些转录因子能与RNA聚合酶结合形成起始复合物,但不组成游离聚合酶的成分。这些因子可能是所有启动子起始转录所必须的。但亦可能仅是譬如说转录终止所必须的。但是,在这一类因子中,要严格区分开哪些是RNA聚合酶的亚基,哪些仅是辅助因子,是很困难的。(2)某些转录因子能与RNA聚合酶结合形成起始复合物,但不组成游离聚合酶的成分。这些因子可能是所有启动子起始转录所必须的。但亦可能仅是譬如说转录终止所必须的。但是,在这一类因子中,要严格区分开哪些是RNA聚合酶的亚基,哪些仅是辅助因子,是很困难的。 • (3)某些转录因子仅与其靶启动子中的特异顺序结合。如果这些顺序存在于启动子中,则这些顺序因子是一般转录机构的一部分。如果这些顺序仅存在于某些种类的启动子中,则识别这些顺序的因子也只是在这些特异启动子上起始转录必须的。
第三类转录因子被研究得最多。现将某些这类因子列表如下第三类转录因子被研究得最多。现将某些这类因子列表如下 • *TK是胸苷激酶(thymidine kinase)的简称 • **GC盒含有的顺序是GGGCGG,它也是某些启动子中的共同顺序。常有几个拷贝GC盒存在于同一个启动子中,而且方向往往不定。
黑腹果蝇的RNA聚合酶需要至少两个转录因子方能在体外起始转录。其中一个是B因子,它与含TATA盒的部位结合。人的因子TFⅡD亦和类似的部位结合。同样,CTF(CAAT结合因子)则与腺病毒的主要晚期启动子中与CAAT盒同源的部位相结合。结合在上游区的另一个转录因子是USF(亦称MLTF),则可以识别腺病毒晚期启动子中靠近-55的顺序。黑腹果蝇的RNA聚合酶需要至少两个转录因子方能在体外起始转录。其中一个是B因子,它与含TATA盒的部位结合。人的因子TFⅡD亦和类似的部位结合。同样,CTF(CAAT结合因子)则与腺病毒的主要晚期启动子中与CAAT盒同源的部位相结合。结合在上游区的另一个转录因子是USF(亦称MLTF),则可以识别腺病毒晚期启动子中靠近-55的顺序。
转录因子Sp1则能和GC盒相结合。在SC40启动子中有多个GC盒,位于-70到-110之间。它们均能和Sp1相结合。然而含有GC盒的不同的DNA顺序与Sp1的亲和力却各不相同。可见GC盒两侧的顺序对Sp1-GC盒的结合究竟如何能影响转录。有时候需要几个转录因子才能起始转录。例如胞苷激酶的启动子需要Sp1与GC盒结合和CTF与CAAT盒结合;腺病毒晚期启动子需要TFⅡD与TATA盒结合和USF与其邻近部位相结合。转录因子Sp1则能和GC盒相结合。在SC40启动子中有多个GC盒,位于-70到-110之间。它们均能和Sp1相结合。然而含有GC盒的不同的DNA顺序与Sp1的亲和力却各不相同。可见GC盒两侧的顺序对Sp1-GC盒的结合究竟如何能影响转录。有时候需要几个转录因子才能起始转录。例如胞苷激酶的启动子需要Sp1与GC盒结合和CTF与CAAT盒结合;腺病毒晚期启动子需要TFⅡD与TATA盒结合和USF与其邻近部位相结合。
以上所述的因子是一般转录都需要的,似乎并没有什么调节功能。另一些转录因子则可以调控一组特殊基因的转录。热休克基因就是一个很好的例子。真核生物的热休克基因在转录起始点的上游15bp处有一个共同顺序。HSTF因子仅在热休克细胞中有活性。它与包括热休克共同顺序在内的一段DNA相结合,所以这个因子的激活可以引起约包括20个基因的一组基因起始转录。在这里,转录因子和RNA聚合酶Ⅱ之间关系很类似细菌的σ因子与核心酶之间的关系。以上所述的因子是一般转录都需要的,似乎并没有什么调节功能。另一些转录因子则可以调控一组特殊基因的转录。热休克基因就是一个很好的例子。真核生物的热休克基因在转录起始点的上游15bp处有一个共同顺序。HSTF因子仅在热休克细胞中有活性。它与包括热休克共同顺序在内的一段DNA相结合,所以这个因子的激活可以引起约包括20个基因的一组基因起始转录。在这里,转录因子和RNA聚合酶Ⅱ之间关系很类似细菌的σ因子与核心酶之间的关系。
增强子 • 增强子能大大增强启动子的活性。增强子有别于启动子处有两点: • [1]增强子对于启动子的位置不固定,而能有很大的变动; • [2]它能在两个方向产生相作用。一个增强子并不限于促进某一特殊启动子的转录,它能刺激在它附近的任一启动子。首先被发现的增强子是SV40增强子。两个增强子位于基因组的两个串连的72nbp重复中,约在转录起始点上游200bp处,每个72bp重复中有一个。
缺失实验显示两个重复缺失一个并不产生什么影响,而如两个均缺失即将大大降低活体内的转录。有人发现,如果将β珠蛋白基因放在含有72bp重复的DNA分子中,它的转录作用在活体内将增高约200倍以上,甚至当此72bp顺序位于离转录起点上游1400bp或下游3000bp时仍有作用。各个基因中的增强子顺序差别较大,但有一个基本的核心顺序(core sequence):AAAGGTGTGGGTTTGG
增强子具有组织特异性,例如免疫球蛋白基因的增强子只有在B淋巴胞内,活性才最高。除此以外,在胰岛素基因和胰凝乳蛋白酶基因的增强子中都发现了有很强的组织特异性。此外,所有的增强子中均有一段由交替的嘧啶-嘌呤残基组成的DNA,这种DNA极易形成Z-DNA型;故有人认为在形成一小段Z-DNA后,增强子才有功能。增强子具有组织特异性,例如免疫球蛋白基因的增强子只有在B淋巴胞内,活性才最高。除此以外,在胰岛素基因和胰凝乳蛋白酶基因的增强子中都发现了有很强的组织特异性。此外,所有的增强子中均有一段由交替的嘧啶-嘌呤残基组成的DNA,这种DNA极易形成Z-DNA型;故有人认为在形成一小段Z-DNA后,增强子才有功能。
在酵母中有类似增强子的顺序,称为上游激活顺序(UAS)。UAS能向两个方向起作用。并位于启动子上游的任何距离处,但在启动子下游则无作用(有别于一般的增强子)。小鼠乳腺肿瘤病毒(MMTV)DNA的转录可受糖类固醇激素的刺激。这个能受激素影响的顺序位于转录起点上游约100bp处。此顺序能和激素及其蛋白受体组成的复合物相结合。在酵母中有类似增强子的顺序,称为上游激活顺序(UAS)。UAS能向两个方向起作用。并位于启动子上游的任何距离处,但在启动子下游则无作用(有别于一般的增强子)。小鼠乳腺肿瘤病毒(MMTV)DNA的转录可受糖类固醇激素的刺激。这个能受激素影响的顺序位于转录起点上游约100bp处。此顺序能和激素及其蛋白受体组成的复合物相结合。
当将此顺序放在某基因的启动子的任一方面(即上游或下游)和各种不同的距离时,它仍能刺激该基因的转录。所以增强子激活作用可能是糖类固醇能调控一组靶基因的机制:糖类固醇激素进入细胞后即与其受体结合。结合作用激活受体,使其能识别存在于增强子中的共同顺序,进而激活了在增强子附近能对糖类固醇起反应的基因。即当糖类固醇-受体复合物和增强子结合时,其附近的启动子即起始转录。当将此顺序放在某基因的启动子的任一方面(即上游或下游)和各种不同的距离时,它仍能刺激该基因的转录。所以增强子激活作用可能是糖类固醇能调控一组靶基因的机制:糖类固醇激素进入细胞后即与其受体结合。结合作用激活受体,使其能识别存在于增强子中的共同顺序,进而激活了在增强子附近能对糖类固醇起反应的基因。即当糖类固醇-受体复合物和增强子结合时,其附近的启动子即起始转录。
RNA聚合酶Ⅲ的启动子 • 一般说,启动子均位于转录起点的上游。但后来发现,在由RNA聚合酶Ⅲ转录的5SRNA基因中,其启动子位于转录单位之中,在转录起点的下游50个碱基以后。一般说,5SRNA基因的启动子约在+55到+80之间。在tRNA基因中,更奇怪的是,其启动子分为两段,均在基因内部。A段在+8和+30之间,B段在+51和+72之间。两段必须同时存在,否则不能起始。
RNA聚合酶Ⅲ能识别各种各样不同的启动子顺序,当然,还是要依靠一些辅助因子,例如,RNA聚合酶Ⅲ在转录爪蟾的5SRNA基因时,需要一个转录因子,37KD的蛋白质TFⅢA的协助。TFⅢA结合在+45到+96的部位。它有双重作用(另外一个作用是在卵母细胞中与5SRNA相结合)。另外还需要两个因子(TFⅢB和TFⅢC),但这两个因子对所有第Ⅲ类基因的转录都需要的。而TFⅢA则是对5S基因专一的。RNA聚合酶Ⅲ能识别各种各样不同的启动子顺序,当然,还是要依靠一些辅助因子,例如,RNA聚合酶Ⅲ在转录爪蟾的5SRNA基因时,需要一个转录因子,37KD的蛋白质TFⅢA的协助。TFⅢA结合在+45到+96的部位。它有双重作用(另外一个作用是在卵母细胞中与5SRNA相结合)。另外还需要两个因子(TFⅢB和TFⅢC),但这两个因子对所有第Ⅲ类基因的转录都需要的。而TFⅢA则是对5S基因专一的。
与原核生物比较 • 真核基因组比原核基因组大得多,大肠杆菌基因组约4×106bp,哺乳类基因组在109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有10万个基因。 • 真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。 • 原核生物的基因组基本上是单倍体,而真核基因组是二倍体。
如前所述,细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的单元,共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽链形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。如前所述,细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的单元,共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽链形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。
原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组的中仅约10%的序列是编码蛋白质或rRNA、tRNA等的基因,其余约90%的序列功能至今还不清楚。原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组的中仅约10%的序列是编码蛋白质或rRNA、tRNA等的基因,其余约90%的序列功能至今还不清楚。 • 原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),在转录后经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。
原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物基因组中则存在大量重复序列(repetitive sequences)。
用复性动力学等实验表明有三类重复序列: • ①高度重复序列(high repetitive sequences),这类序列一般较短,长10-300bp,在哺乳类基因组中重复106次左右,占基因组DNA序列总量的10-60%,人的基因组中这类序列约占20%,功能还不明了。 • ②中度重复序列(moderate repetitive sequences),这类序列序列多数长100-500bp,重复101-105次,占基因组10-40%。例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3-5×105次,在人的基因组中约占7%,功能也还不很清楚。在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成族重复30-40次,这些基因都可归入中度重复序列范围。 • ③单拷贝序列(single copy sequences)。这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中约占65%。绝大多数真核生物生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因。
总结 • 从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,即使现在国际上制订的人基因组研究计划(human gene project)完成,绘出人全部基因的染色体定位图、测出人基因组109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系、特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程。
真核细胞的三种RNA聚合酶(Ⅰ、Ⅱ和Ⅲ)中,只有RNA聚合酶Ⅱ能转录生成mRNA,以下主要讨论RNA聚合酶Ⅱ的转录调控。真核细胞的三种RNA聚合酶(Ⅰ、Ⅱ和Ⅲ)中,只有RNA聚合酶Ⅱ能转录生成mRNA,以下主要讨论RNA聚合酶Ⅱ的转录调控。
顺式作用元件(cis-acting elements) • 真核基因的顺式调控元件是基因周围能与特异转录因子结合而影响转录的DNA序列。其中主要是起正性调控作用的顺式作用元件, • 包括启动子(promoter)、 • 增强子(enhancer); • 近年又发现起负性调控作用的元件──沉寂子(silencer)。
启动子 • 与原核启动子的含义相同,是指RNA聚合酶结合并起动转录的DNA序列,但真核不同启动子间不像原核那样有明显共同一致的序列,而且单靠RNA聚合酶难以结合DNA而起动转录,而是需要多种蛋白质因子的相互协调作用,不同蛋白质因子又能与不同DNA序列相互作用,不同基因转录起始及其调控所需的蛋白因子也完全相同,因而不同启动子序列也很不相同,要比原核更复杂、序列也更长。真核启动子一般包括转录起始点及其上游约100-200bp序列,包含有若干具有独立功能的DNA序列元件,每个元件约长7-30bp。最常见的哺乳类RNA聚合酶Ⅱ启动子中的元件序列见表 。
启动子中的元件可以分为两种 • ①核心启动子元件(core promoter element) 指RNA聚合酶起始转录所必需的最小的DNA序列,包括转录起始点及其上游-25/-30bp处的TATA盒。核心元件单独起作用时只能确定转录起始位点和产生基础水平的转录。 • ②上游启动子元件(upstream promoter elements) 包括通常位于-70bp附近的CAAT盒和GC盒、以及距转录起始点更远的上游元件。这些元件与相应的蛋白因子结合能提高或改变转录效率。不同基因具有不同的上游启动子元件组成,其位置也不相同,就使得不同的基因表达分别有不同的调控。
增强子 • 是一种能够提高转录效率的顺式调控元件,最早是在SV40病毒中发现长约200bp的一段DNA,可使旁侧的基因转录提高100倍,其后在多种真核生物、甚至在原核生物中都发现了增强子。增强子通常占100-200bp长度,也和启动子一样由若干组件构成,其基本核心组件常为8-12bp,可以单拷贝或多拷贝串连形式存在。增强子的作用有以下特点:
①增强子提高同一条DNA链上基因转录效率,可以远距离起作用,通常可距离1-4kb、个别情况下离开所调控的基因30kb仍能发挥作用,而且在基因的上游或下游都能起作用。①增强子提高同一条DNA链上基因转录效率,可以远距离起作用,通常可距离1-4kb、个别情况下离开所调控的基因30kb仍能发挥作用,而且在基因的上游或下游都能起作用。 • ②增强子的作用与其序列的正反方向无关,将增强子方向倒置依然能起作用。而将启动子倒置就不能起作用,可见增强子与启动子是很不相同的。 • ③增强子要有启动子才能发挥作用,没有启动子存在,增强子不能表现活性。但增强子对启动子没有严格的专一性,同一增强子可以影响不同类型启动子的转录。例如当含有增强子的病毒基因组整合入宿主细胞基因组时,可能够增强整合区附近宿主某些基因的转录;当增强子随某些染色体段落移位时,也能提高移到的新位置周围基因的转录。使某些癌基因转录表达增强,可能是肿瘤发生的因素之一。 • ④增强子的作用机理虽然还不明确,但与其他顺式调控元件一样,必须与特定的蛋白质因子结合后才能发挥增强转录的作用。增强子一般具有组织或细胞特异性,许多增强子只在某些细胞或组织中表现活性,是由这些细胞或组织中具有特异性蛋白质因子所决定的。
沉寂子 • 最早在酵母中发现,以后在T淋巴细胞的T抗原受体基因的转录和重排中证实这种负调控顺式元件的存在。目前对这种在基因转录降低或关闭中起作用的序列研究还不多,但从已有的例子看到:沉寂子的作用可不受序列方向的影响,也能远距离发挥作用,并可对异源基因的表达起作用。
反式作用因子(trans-acting factors) • 以反式作用影响转录的因子可统称为转录因子(transcription factors,TF)。RNA聚合酶就是一种反式作用于转录的蛋白因子。在真核细胞中RNA聚合酶通常不能单独发挥转录作用,而需要与其他转录因子共同协作。与RNA聚合酶Ⅰ、Ⅱ、Ⅲ相应的转录因子分别称为TFⅠ、TFⅡ、TFⅢ,对TFⅡ研究最多。表 列出对真核基因转录需要基本的TFⅡ。
以前认为与TATA盒结合的蛋白因子是TFⅡ-D,后来发现TFⅡ-D实际包括两类成分:与TATA盒结合的蛋白是TBP(TATAbox binding protein),是唯一能识别TATA盒并与其结合的转录因子,是三种RNA聚合酶转录时都需要的;其他称为TBP相关因子TAF(TBP-associated factors),至少包括8种能与TBP紧密结合的因子。转录前先是TFⅡ-D与TATA盒结合;继而TFⅡ-B以其C端与TBP-DNA复合体结合,其N端则能与RNA聚合酶Ⅱ亲和结合;接着由两个亚基组成的TFⅡ-F加入装配,TFⅡ-F能与RNA聚合酶形成复合体,还具有依赖于ATP供给能量的DNA解旋酶活性,能解开前方的DNA双螺旋,在转录链延伸中起作用。这样,启动子序列就与TFⅡ-D、B、F及RNA聚合酶Ⅱ结合形成一个“最低限度”能有转录功能基础的转录前起始复合物(pre-initiation complex, PIC),能转录mRNA。 TFⅡ-H是多亚基蛋白复合体,具有依赖于ATP供给能量的DNA解旋酶活性,在转录链延伸中发挥作用;TFⅡ-E是两个亚基组成的四聚体,不直接与DNA结合而可能是与TFⅡ-B联系,能提高ATP酶的活性;TFⅡ-E和TFⅡ-H的加入就形成完整的转录复合体(图 ),能转录延伸生成长链RNA。 TFⅡ-A能稳定TFⅡ-D与TATA盒的结合,提高转录效率;但不是转录复合体一定需要的。
以上所述是典型的启动子上转录复合体的形成,但有的真核启动子不含TATA盒或不通过TATA盒开始转录的。例如有的无TATA盒的启动子是靠TFⅡ-I和TFⅡ-D共同组成稳定的转录起始复合体开始转录的。由此可以看到真核转录起始的复杂性。以上所述是典型的启动子上转录复合体的形成,但有的真核启动子不含TATA盒或不通过TATA盒开始转录的。例如有的无TATA盒的启动子是靠TFⅡ-I和TFⅡ-D共同组成稳定的转录起始复合体开始转录的。由此可以看到真核转录起始的复杂性。
不同基因有不同的上游启动子元件组成,能与不同的转录因子结合,这些转录因子通过与基础的转录复合体影响转录的效率。现在已经发现有许多不同的转录因子,看到的现象是:同一DNA序列可被不同的蛋白因子所识别;能直接结合DNA序列的蛋白因子是少数,但不同的蛋白因子间可以相互作用,因而多数转录因子是通过蛋白质-蛋白质间作用与DNA序列联系并影响转录效率的。转录因子之间或转录因子与DNA的结合都会引起构象的变化,从而影响转录的效率。不同基因有不同的上游启动子元件组成,能与不同的转录因子结合,这些转录因子通过与基础的转录复合体影响转录的效率。现在已经发现有许多不同的转录因子,看到的现象是:同一DNA序列可被不同的蛋白因子所识别;能直接结合DNA序列的蛋白因子是少数,但不同的蛋白因子间可以相互作用,因而多数转录因子是通过蛋白质-蛋白质间作用与DNA序列联系并影响转录效率的。转录因子之间或转录因子与DNA的结合都会引起构象的变化,从而影响转录的效率。
作为蛋白质的转录因子从功能上分析其结构可包含有不同区域:作为蛋白质的转录因子从功能上分析其结构可包含有不同区域: • ①DNA结合域(DNA binding domain),多由60-100个氨基酸残基组成的几个亚区组成; • ②转录激活域(activating domain),常由30-100氨基酸残基组成,这结构域有富含酸性氨基酸、富含谷氨酰胺、富含脯氨酸等不同种类,一酸性结构域最多见; • ③连接区,即连接上两个结构域的部分。不与DNA直接结合的转录因子没有DNA结合域,但能通过转录激活域直接或间接作用与转录复合体而影响转录效率。