1.15k likes | 1.28k Views
第十章 外源基因的表达. 基因重组的 主要目的 是要使目的基因在某一细胞中能得到高效表达,即产生人们所需要的高产目的的基因产物,如蛋白质、多肽类生物药物。. 基因工程技术的 核心 是 基因表达技术 。 基因表达 是指结构基因在调控序列的作用下转录成 mRNA ,经加工后在核糖体的协助下又转译出相应的基因产物 —— 蛋白质,再在受体细胞环境中经修饰而显示出相应的功能。从基因到有功能的产物这整个转录、转译及所有的加工过程就是基因表达的过程,它是在一系列酶和调控序列的共同作用下完成的。. 基因表达在原核生物与真核生物中的差别?.
E N D
基因重组的主要目的是要使目的基因在某一细胞中能得到高效表达,即产生人们所需要的高产目的的基因产物,如蛋白质、多肽类生物药物。基因重组的主要目的是要使目的基因在某一细胞中能得到高效表达,即产生人们所需要的高产目的的基因产物,如蛋白质、多肽类生物药物。 基因工程技术的核心是基因表达技术。 基因表达是指结构基因在调控序列的作用下转录成mRNA,经加工后在核糖体的协助下又转译出相应的基因产物——蛋白质,再在受体细胞环境中经修饰而显示出相应的功能。从基因到有功能的产物这整个转录、转译及所有的加工过程就是基因表达的过程,它是在一系列酶和调控序列的共同作用下完成的。
基因表达在原核生物与真核生物中的差别? • 目前已构建出了多种基因表达系统,包括原核生物表达系统和真核生物表达系统,不同的表达系统具有各自的特点。 • 在原核生物中,基因表达是以操纵子的形式进行的。当操纵子的调节基因与RNA聚合酶作用时,结构基因则开始转录成相应的mRNA,与此同时, mRNA立即与核糖体结合转译出相应的多肽或蛋白质,转录完毕时转译也完成,随之mRNA也被水解掉。 • 在真核生物基因表达系统中,转录是在核内进行的,先生成hnRNA,再加工去掉内含子,外显子相连接,并修饰5′和3′末端后才形成mRNA。而mRNA只能在细胞浆中的核糖体上转译成多肽或蛋白质,再经过加工、糖化、形成高级结构。
1 基因表达的机制 1.1 外源基因的起始转录 外源基因的起始转录是基因表达的关键步骤。转录起始的速率是基因表达的限速步骤。选择可调控的启动子和相关的调控序列,是构建一个表达系统首先要考虑的问题。 诱导型启动子: 如lac、trp、λPR、 λPL、 tac等的启动子 原核生物启动子 组成型启动子: 如T7噬菌体的启动子 真核生物启动子也可分为诱导型和组成型等类型。
1.2 mRNA的延伸与稳定 外源基因起始转录后,保持mRNA的有效延伸、终止及稳定存在是外源基因有效表达的关键。 一方面,要防止因转录物内的衰减和非特异性终止而诱发的mRNA转录提前终止的现象; 另一方面,又要存在正常的转录终止序列以防止产生不必要的转录产物,使mRNA的长度限制在一定的范围内,从而增加外源基因表达的稳定性。
1.3 外源基因mRNA的有效翻译 外源基因mRNA有效翻译必须考虑的基本原则: • AUG(ATG)是首选的起始密码子。 • SD序列为与核糖体16S rRNA互补结合的位点,该序列至少含有AGGAGG序列中的4个碱基。 • SD序列与翻译起始密码子之间的距离为3~9个碱基。 • 在翻译起始区周围序列不易形成明显的mRNA二级结构。
不同基因组使用密码子具有选择性。 主密码子(major codon) 罕用密码子(rare codon) 如果外源基因mRNA的主密码子与受体细胞基因组的主密码子相同或接近,则该基因表达的效率就高; 反之,若外源基因含有较多的罕用密码子,其表达效率就低。
1.4 表达蛋白在细胞中的稳定性 避免外源基因表达蛋白降解的对策: 构建融合蛋白表达系统 构建分泌蛋白表达系统 构建包涵体表达系统 选择蛋白水解酶基因缺陷型的受体系统
1.5 目的基因沉默 位置效应的基因沉默: 是指基因在基因组中的位置对其表达的影响 基因沉默的作用机制 转录水平的基因沉默: 是在DNA水平上的基因调控 转录后水平的基因沉默: 是在RNA水平上的基因调控
2 基因表达的调控元件 2.1 启动子 启动子(promoter):是一段提供RNA聚合酶识别和结合的DNA序列,它位于基因的上游。RNA聚合酶正是通过与它的结合而启动基因的转录。原核基因启动子具有-10和-35序列等结构元件,而真核基因启动子则具有TATA盒及上游元件等特征结构。 序列特异性 方向性 位置特性 种属特异性 *启动子的特征
2.1.1 原核生物的启动子 • 转录起始位点:大多数细菌启动子转录起始区的序列为CAT,转录从第二个碱基开始,该碱基为嘌呤碱基(A/G)。 • Pribnow框: -10bp处的TATA区,又称-10序列区。 • Sextama框:-35bp处的TTGACA区,又称-35区。 • 间隔区:内部无明显的保守性,其序列的碱基组成对启动子的功能不十分重要,但其长度却是影响启动子功能的重要因素。
3’ 5’ -35 -10 TTGACA 16-19 bp TATAAT 5-9 bp T82T84G78A65C54A45 T80A95T45A60A50T96 Transcriptional start site The prokaryotic promoter The sequence of DNA needed for RNA polymerase to bind to the template and accomplish the initiation reaction.
2.1.1 真核生物的启动子 Ⅰ型:rRNA基因启动子 Ⅱ型:mRNA基因启动子 Ⅲ型:tRNA基因启动子
Ⅰ型启动子 所属基因编码的产物为rRNA前体,经剪切加工后成为各种成熟的rRNA分子。 核心启动子: 紧邻转录起始位点,可以启动基因的转录。 人体细胞 Ⅰ型启动子 上游控制元件(UCE): 位于起始位点上游 -180~-190bp处,它可以大幅度增强转录效率。
Ⅱ型启动子 Ⅱ型启动子所属基因绝大多数编码蛋白质。 转录起始位点 TATA框(Hogness框):富含AT的保守序列区,它与DNA双链的解链有关,并决定转录起始点的选择。其中心点位于转录起始点上游-20~-30bp的位置。 启动子基本区 CAAT框:位于转录起始位点上游-75bp处,与RNA聚合酶的结合有关。 辅助区 GC框:位于转录起始位点上游-100~-300bp处,与转录因子的结合有关。
Ⅲ型启动子 内启动子: 位于转录起始位点的下游,如tRNA和5SRNA的启动子。 外启动子: 位于转录起始位点的上游,缺乏相应的内部序列,如脊椎动物U6核小RNA和7SKRNA启动子,结构类似于真核生物Ⅱ型启动子。
2.1.3 启动子与转录启动 大肠杆菌RNA聚合酶的亚基成分 RNA聚合酶: 核心酶(α2ββ′)+σ亚基=全酶( α2ββ′ σ)
2.1.4 启动子的分离 随机克隆法 聚合酶保护法 过滤膜结合法 PCR扩增法
2.2 增强子 增强子(enhancer):是能够增强启动子转录活性的DNA顺式作用序列,又称强化子。 • 增强子的特性: • 双向性。 • 重复序列。 • 增强子行使功能与所处的位置无关。 • 特异性。 • 增强子不仅与同源基因相连时有调控功能,与异源基因相连时也有功能。
2.3 终止子 本征终止子:不需要其他蛋白辅助因子便可在特殊的RNA结构区内实现终止作用。 依赖终止信号的终止子:要依赖专一的蛋白质辅助因子。
①本征终止子 发夹结构(茎环结构):延缓RNA聚合酶的运动,不终止RNA的合成,但为转录终止创造条件。 两大特征 寡聚U组成的尾部:转录的终止信号。
②依赖型终止子 终止位点上游50~90bp区域,是ρ因子的识别位点。 ρ因子依赖型终止子也能形成茎环结构,但茎环的GC含量较低,因此RNA聚合酶在此移动的速度减慢,但停留时间较短,并且茎环结构的下游没有寡聚U结构,RNA聚合酶只能在ρ因子的协助下才能有效终止转录。 ρ因子是一个相对分子量为2.0×105的六聚体蛋白质分子,它能水解各种核苷三磷酸,实际上是一种NTP酶。由于它催化NTP的水解, ρ因子能促使新生的RNA链从三元转录复合物中解离出来,从而终止转录。
在RNA合成起始以后,ρ因子即附着在新生的RNA链上,靠ATP水解产生的能量,沿着5’ 3’方向朝RNA聚合酶移动,到达RNA的3’-OH端后取代了暂停在终止位点上的RNA聚合酶,并从模板和酶上释放RNA,完成转录过程。终止过程需要消耗能量,所以, ρ因子有终止转录和核苷三磷酸酶两种功能。
2.4 衰减子 衰减子(attenuator):是位于mRNA分子前导序列中的一段控制蛋白质合成起始速率的调节区,亦即发生弱化作用的转录终止信号序列,又称弱化子。 衰减子最先发现于大肠杆菌色氨酸(trp)操纵子中。 trp前导区的4个片段(1、2、3、4)能以两种不同的方式进行碱基配对,有时以1-2和3-4配对,有时只以2-3配对。 在前导肽基因中有两个相邻的色氨酸密码子,所以前导肽的翻译对tRNATrp的浓度很敏感。当培养基中trp浓度很低时,负载有trp的tRNATrp也就少,这样翻译通过两个相邻trp密码子的速度就很慢,当4区被转录完成时,核糖体才进行到1区(或停留在两个相邻的trp 密码子处),这时前导区结构是2-3配对,不形成3-4配对的终止结构,所以转录可继续进行,直到trp操纵子中的结构基因全部转录。而当trp浓度高时,核糖体可顺利通过两个相邻的trp密码子,在4区被转录之前,核糖体就到达2区,这样使2-3不能配对,3-4区可自由配对形成茎-环状终止子结构,终止转录。所以,弱化子对RNA聚合酶的影响依赖于前导肽翻译中核糖体所处的位置。
Low Trp High Trp
2.5 绝缘子 • 绝缘子(insulator): • 既是基因表达的调控元件,也是一种边界元件; • 它能阻止邻近的调控元件对其所界定基因的启动子起增强或抑制作用; • 绝缘子抑制增强子的功能是有极性的。它只能抑制处于绝缘子所在边界另一侧的增强子的作用,而对处于同一结构域的增强子没有抑制作用; • 绝缘子对基因表达的调控是一个非常复杂的过程,它是通过细胞内特定的蛋白质因子相互作用而产生调控效应的。
2.6 反义子 反义RNA(antisence RNA):同某种天然mRNA反向互补的RNA分子称为反义RNA,它是由双链DNA中的无意义链转录产生的,可以用来阻止被其转化的细胞中存在的与之互补mRNA的转译活性。现在编码反义RNA的基因已在基因工程中得到应用,此项技术特称为反义技术学(antisence techology)。 反义子:编码反义RNA的DNA称为反义子。 反义子在DNA的复制、转录和翻译三个水平对基因的表达起调节作用,其中以对蛋白质合成的抑制最为普遍。
复制水平的调节 • 直接抑制——反义RNA与引物RNA前体互补,使得引物RNA无法与DNA模板结合,进而抑制DNA复制的频率。 • 间接抑制——反义RNA通过阻断复制激活蛋白因子的合成而间接抑制DNA的复制。 • 转录水平的调节 • 反义RNA通过与mRNA的5 ′端互补结合而阻止转录的延伸; • 作用于mRNA的poly(A)区域,抑制mRNA的成熟及其运输; • 与真核生物mRNA结合而影响其剪切加工。
翻译水平的调节 • 通过与mRNA的5 ′端SD序列结合,改变其空间构象,从而影响核糖体在mRNA上的定位; • 通过与mRNA的5′端编码区(如起始密码)结合,直接抑制翻译的起始。 SD序列(SD sequence):系Shine-Dalgarno序列的简称,此为纪念最早发现该序列的研究者而命名的。它是原核生物中核糖体的结合位点,亦即存在于mRNA分子AUG起始密码子之前的多聚嘌呤序列AGGAGGG的部分或全部,可与16S rRNA的3 ′-末端序列互补。SD序列在核糖体同mRNA的结合过程中起重要作用。
3 外源基因表达系统 外源基因表达系统:泛指目的基因与表达载体重组后,导入合适的受体细胞,并能在其中有效表达,产生目的基因产物(目的蛋白)。 基因表达载体 外源基因表达系统 受体细胞 原核生物基因表达系统:如大肠杆菌表达系统、芽孢杆菌表达系统、链霉菌表达系统、蓝藻表达系统等。 基因表达系统 真核生物基因表达系统:如酵母表达系统、植物细胞表达系统、昆虫细胞表达系统、哺乳动物细胞表达系统等。
原核生物作为基因表达系统的受体细胞所具有的特点:原核生物作为基因表达系统的受体细胞所具有的特点: • 原核生物大多数为单细胞异养,生长快,代谢易于控制,可通过发酵迅速获得大量基因表达产物。 • 基因组结构简单,便于基因操作和分析。 • 多数原核生物细胞内含有质粒或噬菌体,便于构建相应的表达载体。 • 生理代谢途径及基因表达调控机制比较清楚。 • 不具备真核生物的蛋白质加工系统,表达产物无特定的空间构相。 • 内源蛋白酶会降解表达的外源蛋白,造成表达产物的不稳定。
3.1 大肠杆菌基因表达系统 大肠杆菌——是一种革兰氏阴性细菌,其遗传背景清楚,目标基因表达的水平高,培养周期短。目前大多数外源基因都是以大肠杆菌为受体系统进行表达的,是目前应用最广泛的基因表达系统。 • 与其它表达系统相比,大肠杆菌表达系统所具有的优越性: ①经过长期研究,人们已经掌握了十分丰富的有关大肠杆菌基础生物学、遗传学以及分子生物学等方面的背景知识,特别是对其基因表达调控的分子机理有了深刻的了解; ②大肠杆菌已被发展成为一种安全的基因工程实验体系,拥有各类适用的寄主菌株和不同类型的载体系列; ③实验已经证明,许多克隆的真核基因,例如抑制生长素基因和胰岛素基因等,都可以在大肠杆菌细胞中实现有效的、高水平的表达; ④大肠杆菌培养方便、操作简单、成本低廉,易于进行工业化批量生产。
大肠杆菌基因表达载体可分为3个系统: DNA复制及重组载体的选择系统 外源目的基因的转录系统 蛋白质的翻译系统
(1)DNA复制及重组载体的选择系统 • 复制子 复制子:是一段包含复制起始位点(ori)和反式因子作用区在内的DNA片段。 大肠杆菌基因表达载体一般是质粒表达载体,含有能在大肠杆菌中有效复制的复制子。 pMB1、p15A、ColE1:松弛复制型,每细胞质粒拷贝数10~20个。 常见的复制子 pSC101:严谨复制型,每细胞质粒拷贝数少于5个。 在同一大肠杆菌细胞内,含同一类型复制子的不同质粒载体不能共存,但含不同类型复制子的不同质粒载体则可以共存于同一细胞中。
选择标记 目的:使转化体产生新的表型,将转化了的细胞从大量的菌群中分离出来。 显性标记 微生物表型选择标记 营养缺陷型标记 在基因克隆中采用的质粒载体的选择标记记号,包括有新陈代谢特性、对大肠杆菌素E1的免疫性,以及抗菌素抗性等多种。而绝大多数的质粒载体都是使用抗菌素抗性记号,并且主要集中在氨苄青霉素抗性、四环素抗性、链霉素抗性、氯霉素抗性以及卡那霉素抗性等少数几种抗菌素抗性记号上。其原因一方面是由于许多质粒本身就是带有抗菌素抗性基因的抗药性R因子;另一方面则是因为抗菌素抗性记号具有便于操作、易于选择等优点。
大肠杆菌表达载体上一般都带有一个以上的抗生素抗性基因。表达载体上的抗药性基因赋予宿主特定的抗药性,使其能在抗生素的培养条件下正常生长。这样就可以筛除掉不含载体的宿主,同时保证载体在宿主中的稳定存在。在构建大肠杆菌表达载体的过程中,选择何种抗生素抗性基因,还必须考虑到是否会对特定宿主细胞的代谢活动产生影响。大肠杆菌表达载体上一般都带有一个以上的抗生素抗性基因。表达载体上的抗药性基因赋予宿主特定的抗药性,使其能在抗生素的培养条件下正常生长。这样就可以筛除掉不含载体的宿主,同时保证载体在宿主中的稳定存在。在构建大肠杆菌表达载体的过程中,选择何种抗生素抗性基因,还必须考虑到是否会对特定宿主细胞的代谢活动产生影响。
(2)外源目的基因的转录系统 这一系统包括启动子、抑制物基因和转录终止子。 启动子和终止子因宿主的不同而有差别,往往在不同的宿主中表达的效率也不一样,特别是原核生物和真核生物宿主间完全不同,相互间不能通用。 • 启动子 启动子(promotor):是一段能被宿主RNA聚合酶特异性识别和结合并指导目的基因转录的DNA序列,是基因表达调控的重要元件。 外源目的基因转录的起始是基因表达的关键步骤。选择可调控的强启动子是构建一个理想的表达系统首先要考虑的问题。
启动子位于基因的上游,其序列的长度因生物的种类而异。当RNA聚合酶定位并结合到启动子序列上时,便可启动基因的转录。启动子位于基因的上游,其序列的长度因生物的种类而异。当RNA聚合酶定位并结合到启动子序列上时,便可启动基因的转录。 启动子具有序列特异性、启动的方向性、作用位点的特异性和种属特异性等特征。 在大肠杆菌细胞中大多数基因的启动子与转录起始位点间的距离为6~9bp,但对于要表达的外源基因来说,启动子与转录起始位点的最佳距离还有待实验来确定。 外源基因在强启动子的控制下容易发生转录过头的现象,形成长短不一的mRNA混合物,而过长的转录产物不仅会影响到mRNA的翻译效率,同时也会使外源基因的转录速度大大降低。因此,在构建表达载体的时候一般采用强的启动子和强的终止子,以达到高效表达的目的。
抑制物基因 抑制物基因的产物是一种控制启动子功能的蛋白质,对启动子的起始转录功能产生抑制作用。在适当的诱导条件下可使抑制物失活,启动子功能重新恢复。 通过抑制物基因产物可使目的基因在宿主培养到最佳状态时进行转录,从而保证转录的有效进行,特别是表达产物对宿主有害时,控制转录的时机尤其重要。理想的可调控的启动子在细胞生长的初期往往不表达或低水平表达,而当细胞增殖到一定的密度后,在某种特定的诱导因子(如光、温度或化学药物等)的诱导下,RNA聚合酶才开始启动转录,合成mRNA。
转录终止子 转录终止子(terminator):是一段终止RNA聚合酶转录的DNA序列。 转录终止子可分为本征终止子和依赖终止信号的终止子两类。 转录终止子的功能不同于启动子,但它对基因的正常表达同样有着重要的意义。一方面,它使转录在目的基因之后立即停止,避免多余的转录以节省宿主内RNA的合成底物,提高目的基因的转录量;另一方面,正常转录终止子的存在能够防止产生不必要的转录产物,有效地控制目的基因mRNA的长度,提高mRNA的稳定性,避免质粒上其它基因的异常表达。
(3)蛋白质的翻译系统 在原核生物中影响翻译起始的因素有:起始密码子、核糖体结合位点(SD序列)、起始密码子于SD序列之间的距离和碱基组成、mRNA的二级结构、mRNA上游的5′端非翻译序列和蛋白编码区的5′端序列等。 核糖体结合位点(SD序列) 蛋白质的翻译系统 翻译起始密码子 翻译终止密码子
核糖体结合位点 核糖体结合位点:是指原核基因转录起始位点下游的一段DNA序列,即Shine-Dalgarno序列(简称SD序列)。SD序列与核糖体16S rRNA特异配对而与宿主核糖体结合,它对mRNA的翻译起着决定性的作用。 核糖体与mRNA的结合程度越强,翻译的起始效率越高,而核糖体与mRNA 的结合程度主要取决于SD序列与核糖体16S rRNA碱基的互补性,因此,在构建表达载体时,要尽可能使SD序列与16S rRNA序列互补配对。 影响mRNA翻译效率的因素:包括SD序列、翻译的起始密码子和SD序列与翻译起始密码子之间的距离和碱基组成等。 大肠杆菌SD序列的碱基组成为5 ′AGGAGG 3 ′,其中以GGAG四个碱基最为重要,这四个碱基中的任何一个发生突变都会引起翻译效率的大幅度下降。
SD序列与起始密码子之间的距离对保证准确和高效翻译也很重要。SD序列与起始密码子之间的距离一般为6~8bp,多数情况下为7bp,此间的碱基多一个或少一个都会影响翻译的起始效率。SD序列与起始密码子之间的距离对保证准确和高效翻译也很重要。SD序列与起始密码子之间的距离一般为6~8bp,多数情况下为7bp,此间的碱基多一个或少一个都会影响翻译的起始效率。 SD序列与起始密码子之间的碱基组成也影响翻译的起始效率。研究表明,SD序列后面的碱基为AAAA或UUUU时,翻译的起始效率最高,而当序列为CCCC或GGGG时,翻译的起始效率分别为最高值的50%和25%。 有的载体的启动子后接有SD序列,而另一些载体的启动子后没有接SD序列,那么则需要目的基因上游带进SD序列。 若在大肠杆菌中表达真核基因或本身所含核糖体结合位点较弱的原核基因,则必须从外部同时提供启动子和有效的核糖体结位点。
翻译起始密码子 起始密码子是翻译的起始位点,通常为AUG(ATG),编码甲硫氨酸(MET),是首选的起始密码子。也有极少数生物利用其它密码子作为翻译的起始位点,如GUG、UUG等。 • 翻译终止密码子 翻译终止密码子与核糖体相遇时,能使核糖体从mRNA模板上脱落下来,终止蛋白质的翻译过程。 在大肠杆菌中,合成多肽链的释放由RF1和RF2两个释放因子所调控, RF1识别终止密码UAA和UAG, 而RF2识别终止密码UAA和UGA,由于UAA同时为两个释放因子所识别,一般被选作翻译的终止密码。
在实际应用中,为了保证翻译的有效终止,通常将几个终止密码串连在一起。具报道,在大肠杆菌中以四个核苷酸组成的顺式序列UAAU作为终止密码,可有效地终止多肽链的合成。在实际应用中,为了保证翻译的有效终止,通常将几个终止密码串连在一起。具报道,在大肠杆菌中以四个核苷酸组成的顺式序列UAAU作为终止密码,可有效地终止多肽链的合成。 不同生物基因组甚至是同种生物不同蛋白质的基因,所用的密码子都具有一定的选择性。有的密码子在一种基因组中使用的频率高,被称为主密码子,而在另一种基因组中使用的频率较低,被称为罕用密码子。 如果外源目的基因mRNA的主密码子和受体细胞基因组的主密码子相同或接近,则该基因的表达效率就高;反之,若外源基因含有较多的罕用密码子,其表达水平就低。因此,在构建大肠杆菌表达载体时,要考虑所表达基因的种类和性质,或对外源基因的碱基进行适当置换,或对克隆载体上的调控序列进行适当的调整。
3.1.2 常见的大肠杆菌表达系统 Lac和Tac表达系统:是以lac操纵子调控机制为基础设计和构建的表达系统。 PL和PR表达系统:是以λ噬菌体早期转录启动子PL和PR构建的。 T7表达系统:是利用大肠杆菌T7噬菌体转录系统元件构建的表达系统,它具有很高的表达能力。