750 likes | 1.01k Views
第二节 基因. 一、 基因的概念. 1. 基因的生物学意义 1) 1865年 Mendel( 孟德尔) 在《植物的杂交试验》中提 出一个遗传因子决定生物 体一个性状。. 2) 1926年 Morgen( 摩尔根)在
E N D
第二节 基因 一、 基因的概念 1.基因的生物学意义 1) 1865年 Mendel(孟德尔) 在《植物的杂交试验》中提 出一个遗传因子决定生物 体一个性状。
2) 1926年 Morgen(摩尔根)在 《 基因论》中提出了遗传因子是 特定在染色体上,基因是直线 排列在染色体上遗传颗粒。一 个基因控制一个性状。
3)1941年 Beadle 和 Tatum 提出了 “一个基因一个酶” 学说 1950’s Linus 和 Pauling 通过镰状细胞贫血的研究后,提出一个 基因一个蛋白质;由于 有的蛋白质由多 个亚基组成, 提出一个基因决定一种 多肽链。 Benzer 提出了“一个顺反子,一条 多肽链”
2.基因的分子定义 ** 用分子生物学的术语来给基因下定义: 基因是合成有功能的蛋白多肽链或RNA 所必需的全部核酸序列(通常是 DNA 序列)。即除了编码蛋白质或 RNA 的 核酸序列,还包括转录所必须的调控序 列,5’端非翻译序列,内含子以及 3’端 非翻译序列等所有的核酸序列。
二、 基因的分类与结构 1. 基因的分类: 1) 结构基因(structural gene): 可转 录成mRNA并翻译成蛋白质多肽链的基因。 2) 调控基因(regulatory gene): 一些调 控结构基因表达的基因,其产物往往是反 式转录因子或DNA结合蛋白。
3) 管家基因(housekeeping gene): 在绝大多数细胞中都表达为维持各种细 胞基本活动所必需的结构和功能蛋白质 编码的基因。 如:糖酵解中3-磷酸甘油醛脱氢酶 (glyceraldehyde 3-phosphate dehydrogenase, GPDH)
4) 奢侈基因(luxury gene): 对细胞自身生存并无影响,但这种基 因产物通常只在特化细胞类型中大量 合成。 如:红细胞中合成血红蛋白 浆细胞中合成免疫球蛋白
5)假基因(pseudo gene) : 在核苷酸序列上与有功能的基因相似, 但它们或者不能转录,或者转录后生 成无功能的基因产物。
2. 基因的结构 DNA两条链,一个基因的序列或基因结 构往往用有意义链(sense chain)来表示 有意义链 模板链 上游区域 转录区域 下游区域
三、基因的大小与数量 哺乳动物基因的大小在5~100 kb, 很少小于2 kb。 基因的大小与mRNA长短无关,与 外显子数量无关
基因的数量: 生殖道支原体 470 嗜血流感菌 1,743 大肠杆菌 4,288 线虫 19,099 人类 30,000~ 40,000
第三节 基因组的结构与功能 基因组(genome): 是指导一个物种的结构与功能的所有 遗传信息的总和。 ** 人类基因组通常是指细胞核23对染色 体中的所有DNA。 ** 人线粒体基因组 (human mitochondria genome) 是人细胞线粒体中基因及DNA 。
基因组学 (genomics)定义: 基因组学是研究基因组的结构与功能 的科学。
二、 原核生物基因组 1. 大肠杆菌的DNA是环状双链DNA分子, 染色体密集的区域形成核质体 (nucleiod) 2. 原核生物绝大多数是单倍体
超螺旋 结构域 核质体中央
3. 细菌基因组织的特点 1)DNA两条链上都有基因。功能上相 关的几个基因往往在一起组成操纵子 结构
2)基因组中只有一个复制起始点 3)没有内含子(intron)成分, 转录后 不需要剪接加工。 4)细菌的 DNA绝大部分用于编码蛋白 质,只有小部分是非翻译区,其中包 含基因表达调控的DNA序列。 5)细菌的结构基因极少有重迭现象。 6)基因组中重复序列很少。
三、病毒和噬菌体基因组 1. 病毒颗粒(virion) 外壳蛋白 内部基因组DNA或RNA
2. 病毒和噬菌体基因组的特点 1) 在每种病毒中核酸成分只能是一种。 *肝炎病毒(hepatitis virus): 甲肝病毒( HAV ) RNA病毒 乙肝病毒 (HBV )DNA病毒 丙肝病毒( HCV) RNA病毒 丁肝病毒 (HDV )RNA病毒 戊肝病毒 (HEV )RNA病毒
2) 病毒核酸大小差别很大。 3) 大部分病毒核酸是一条单链或双链 分子,少数病毒由几个核酸片段组 成。 4) 病毒基因组也具有操纵子结构。 5) 噬菌体基因中无内含子,而感 染真核细胞病毒有内含子。
(一)真核生物基因组织的C值矛盾 (C-value paradox) * 每种真核生物的单倍体基因组中 的全部DNA量称C值
1.有的同类生物 中C值差别有10 倍以上。
2. DNA的量远远大于编码蛋白质所需 要的量。 各种生物的的基因数目与DNA量的比较 编码序列 占基因组% DNA分子大小 基因数 大肠杆菌 4.2*106 98以上 2350 酵母 1.3 *107 70 6100 果蝇 5 1.4 *108 8750 3.2 *109 2 人 30000-35000
630 1.9 0.0013
快复性组分 中间复性组分 慢复性组分 占基因组百分数 25 30 45 1 Cot / 0.0013 1.9 630 2 340 5 8 复杂性 bp 6*10 3*10 350 重复频率 500000 1 -4 -2 Cot 值范围 10 ~2*10 0.2~100 80~10000 功能 不能转录 仅能转录 能编码 卫星DNA rRNA,tRNA,组蛋白基因 (能编码) 例子 血红蛋白
(二) 高度重复顺序 * 复性极快,由寡核苷酸串联、重复 排列而成的DNA序列 * 长度从几个bp到几百bp个或更长 * 重复次数105~106,在基因组DNA 中约占25%。
* 高度重复序列具有的特点是: ⅰ. 重复顺序中一部分常以“祖先序列片 段” 形式出现,进化上是原始的,趋 向保守。另一部分则以新进化的家 族形式出现。
ⅱ. 不同家族常源于同一个“祖先重复 序列” , 故结构很相似,但同一家 族中各个体成员间存在个体突变。 ⅲ. 新的高度重复序列家族,往往是在 新的物种衍化时或在进化中,通过 一定机制形成,随基因扩大而被扩 大。
1. 卫星DNA (Statellite DNA) 1)卫星DNA 的概念: 真核生物DNA剪切后离心,显示一个 主峰和小峰。真核生物大部分DNA的 G-C含量在30% ~50%形成一个主峰 另外有些DNA的 G-C含量高于或低于 30%~ 50%会出现小峰,称卫星DNA 。
2)卫星DNA的产生与C-G 含量有关 3) 卫星DNA序列非常简单,重复性极高
父亲 …GTCGTACGTGACACACACACACACACACACAGTACGATACGT… 42bp 42bp 46bp 40bp 42bp 40bp …GTCGTACGTGACACACACACACACACACACAGTACGATACGT… 母亲 …GTCGTACGTGACACACACACACACACACACACAGTACGATACGT… …GTCGTACGTGACACACACACACACACACAGTACGATACGT… 孩子 …GTCGTACGTGACACACACACACACACACACAGTACGATACGT… …GTCGTACGTGACACACACACACACACACAGTACGATACGT… PCR结果的凝胶电泳: 父亲 母亲 孩子 46bp 42bp 40bp 图:某个CA2核苷酸重复的微卫星在一个家系中的PCR检测结果示意图
2.反向重复顺序(inverted repeats) 1)概念:具有方向相反、序列相同的 DNA区域称反向重复顺序 2) 邻近(adjacent) 反向重复顺序 也称回文结构(palindrome) 。 … GGTACC… …CCATGG… 3) 分隔(Separated)反向重复顺序。 … GGTNNNNACC… … CCANNNNTGG…
4) 在基因组约含5% 。 5) 常见于基因组调控区中, 可能与 复制和转录调控有关。
(三)中度重复序列 (intermediate repeat , moderately repetitive DNA, middle repetitive sequence) • 在基因组DNA中约占30%,重复 • 出现几十次到几千次。 • 2. 重复单位序列相似,散在分布在基 • 因组中, 序列的长度和拷贝数非常 • 不均一。
1. Alu家族(短片段间隔型) ⅰ占人类基因组 3 % ~10% 重复 30万~50万次, Alu序列高度同源, 大部分序列有限制性内切酶AluⅠ 酶切位点。 ⅱ.人Alu顺序长300bp,由两个130bp 的重复 序列中间有 31bp 间隔序列, 两端各有一段 7~21bp正向重复序列。
ⅲ . 在人类基因组中,大约5kbDNA中就 有一个Alu序列 ⅳ.Alu序列可能是在300~500万年 前起源于7SL RNA基因 Ⅴ. Alu序列有部分序列与感染哺乳动物 的DNA病毒的复制起始序列同源, 提 示Alu序列可能与DNA的复制有关。
2. 可转移的DNA 元件(mobile DNA elements) 也称转位因子(transposable element)、 * 40年代 B. McClintock 首先在玉米的 遗传学研究中发现 * 1968年 Jordan 分子水平证实了在大肠 杆菌存在, 引起重视. * 现在认为所有的生物体内都存在
** 插入序列(insertion sequences, IS) 是一类较小的转移元件 * IS 两端有反向重复顺序和正向重复顺 序,重复序列之间只有编码与转位有 关的蛋白质基因,如转位酶(transposase) * IS已发现很多种,每种IS元件都有 不同序列。
**转座子(transposon , Tn) 除了带有转座有关基因外还带有其他 基因。 如抗药基因 Tn3 tnpA tnpR ampr 反向重复序列 38bp 3086bp 558bp 861bp 38bp tnpA 转座酶基因 (转座酶基因作用于原有转座子末端) tnpR 解体酶基因 (作用于复制拷贝) ampr 抗氨苄青酶素的ampr 基因
**真核生物中的转座子 逆转录转座子(retroposon) 先转录成RNA然后逆转录成cDNA, 再整合到基因组中。 ⅰ)非病毒样反转录转座子 ⅱ)病毒样逆转录转座子
4)转位的遗传效应 Ⅰ. 基因重排 Ⅱ. 基因突变 Ⅲ. 插入位点引入新基因 Ⅳ. 转移DNA元件可通过增强子的 组合与分布来影响基因的表达
丁昇 许田 吴晓晖 piggyBac ( PB ) 转座子在哺乳动物细胞和小鼠中的高效转座 ( Cell No.122 2005)
发现携带多个基因的 PB 因子不仅能在人和小鼠的细胞中,而且能在小鼠体内高效转座。 PB 允许所携 基因的表达。 PB 因子在生殖细胞中转座时能从原始插入位点精确切离,并转座到小鼠基因组的不同位点,尤其是基因区。这些数据为在小鼠和其他脊椎动物中建立一个可作为转基因和插入突变等遗传操作工具的高效转座系统迈出了关键性的第一步。
4. 多基因家族(multigene family) 也称基因家族( gene family ) 1) 概念 多基因家族是指一组具有类似功能, 核苷酸序列又有同源性的基因。多基 因家族是真核生物基因组织中最显著 的特征之一。它的家族成员在核酸上 的同源性提示它们是由同一个祖先基 因进化而来的。