1 / 47

基因、基因组的结构

基因、基因组的结构. 李 凌. 讨论题. 基本概念: 基因、基因组、基因组学、人类基因组计划 真核生物基因组与原核生物基因组有何主要区别?以图解说明真核细胞编码蛋白质的基因的一般结构。. 第一节 基因的概念. 遗传因子,“一个因子决定一个性状” 。 “基因论”,基因是直线排列在染色体上的遗传颗粒 三位一体的概念: 携带生物体遗传信息的结构单位。 控制一个特定性状的功能单位。 突变单位和交换单位。 “一个基因一个酶” “一个顺反子,一条多肽链;一个基因一条多肽链. 基因的定义. 基因 (gene)

hollace
Download Presentation

基因、基因组的结构

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 基因、基因组的结构 李 凌

  2. 讨论题 • 基本概念: 基因、基因组、基因组学、人类基因组计划 • 真核生物基因组与原核生物基因组有何主要区别?以图解说明真核细胞编码蛋白质的基因的一般结构。

  3. 第一节 基因的概念 • 遗传因子,“一个因子决定一个性状” 。 • “基因论”,基因是直线排列在染色体上的遗传颗粒 三位一体的概念: • 携带生物体遗传信息的结构单位。 • 控制一个特定性状的功能单位。 • 突变单位和交换单位。 • “一个基因一个酶” • “一个顺反子,一条多肽链;一个基因一条多肽链

  4. 基因的定义 基因 (gene) • 合成有功能的蛋白质多肽链或RNA所必需的全部核苷酸序列。 • 一般是DNA序列(或RNA病毒中的RNA)。 • 具有编码一定生物功能分子的核苷酸序列。

  5. 一个典型的真核基因 ①编码序列:外显子(exon) ②插入外显子之间的非编码序列:内合子(intron) ③5'-端和3'-端非翻译区(UTR) ④调控序列(可位于上述三种序列中)

  6. 基因组(genome) • 是指一种生物体中的整套遗传信息,一般为一个受精卵或一个体细胞的细胞核中所有DNA分子的总和。 • 一特定生物体的整套(单倍体)遗传物质的总和。 • 基因组的大小用全部DNA的碱基对总数表示。 • 每种真核生物的单倍体基因组中的全部DNA量称为C值 (C-Value)。

  7. 人的23对染色体

  8. C值 (C-Value)

  9. 第二节 原核生物基因组 一、细菌基因组的特点 • 细菌染色体基因组:通常仅由一条环状双链DNA分子组成 1.细菌DNA大部分为编码序列。 2.结构基因中没有内含子,也无重叠现象。 3.具有操纵子结构。 • 质粒:某些细菌中独立于染色体外的能自主复制的共价环状双链DNA。

  10. 第二节 原核生物基因组 二、病毒基因组的特点 1.每种病毒核酸只有一种,或者DNA,或者RNA; 2.病毒核酸大小差别很大,3 kb-300kb; 3.大部分病毒核酸是由一条双链或单链分子(RNA或DNA),仅少数RNA病毒由几个核酸片段组成. 4.具有操纵子的结构,具有重叠基因的结构. 5.真核病毒基因有内含子,而噬菌体(感染细菌的病毒)基因中无内含子. 6.除逆病毒外,所有病毒基因都是单拷贝的。

  11. 第三节 真核生物基因组 一、真核生物基因组的特点: 1. 体细胞内的基因组为二倍体。 2.基因组远远大于原核生物的基因组,具有多 复制起点。 3. 基因组中不编码的区域多于编码区域。 4.大部分基因含有内含子,因此,基因是不连 续的(断裂基因)。 5. 真核细胞基因转录产物为单顺反子。一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。 6. 单一序列为主,存在大量重复序列。

  12. 真核生物基因组 二、真核基因组中DNA序列的分类 (一)高度重复序列(重复次数:>1O6) (二)中度重复序列(重复次数: 1O2-1O5) (三)单拷贝序列(Unique Sequence) 包括大多数编码蛋白质的结构基因和基因间 间隔序列。

  13. Types of repeat

  14. 二、真核基因组DNA序列的分类 (一)高度重复序列(重复次数>lO6) 约占10-60%,在人基因组中约占20% 1. 卫星DNA (Satellite DNA) 2. 反相重复DNA: 回文结构: GGTACC CCATGG 常见于基因的调控区和特异蛋白结合区。

  15. 卫星DNA (Satellite DNA)

  16. (二)中度重复序列 1.中度重复序列的特点 ① 重复单位序列相似,但不完全一样, ② 散在分布于基因组中. ③ 序列的长度和拷贝数非常不均一, ④ 中度重复序列一般具有种属特异性,可作为DNA标记. ⑤ 中度重复序列可能是转座元件。

  17. (二)中度重复序列 2.中度重复序列的分类 ① long interspersed repeated segments,LINES,长散在重复序列 长度>1000bp(可达7Kb),拷贝数104-105,如人LINES ② Short interspersed repeated segments, SINES,短散在重复序列 长度<500bp,拷贝数>105.如人Alu序列

  18. *人类基因组中的重复序列标记 1、A1u序列 2、可变数目串联重复序列(VNTR) (小微卫星DNA) 3、微卫星DNA(microstallite DNA)

  19. 1、A1u序列 • 含有Alu酶切位点 • 重复单位长300bp:130bp+31bp+130bp,其5′端有-17-21bp的正向重复序列。 • 通过RNA,再反转录成cDNA,插入人类基因组 • 可转录成hnRNA,但在mRNA成熟过程中被切除

  20. 2、可变数目串联重复序列 • Variable number tandem repeat, VNTR. 又称小卫星DNA (minisatellite DNA) • 短重复单位(6-70bp)串联重复(6-100次以上),核心序列:GGT GGG。 • VNTR多态性—分子标记—DNA指纹图(fingerprint)

  21. 3、微卫星DNA(microstallite DNA) • Simple repeat sequence, SRS • 2-6个核苷酸组成的重复单位串联重复(10-60次),两侧为特异的单拷贝序列。 • 双核苷酸重复:(AC)n、(TG)n, 5万-10万拷贝. • 新一代遗传标记,人类基因组研究,肿瘤,遗传病.

  22. 三、基因家族(gene family) • 一组功能相似、核苷酸序列具有同源性的基因. • 可能由某一共同祖先基因经重复和突变产生。

  23. 基因家族的特点: ① 基因家族的成员可以串联排列在一起,形成基因簇(gene cluster)或串联重复基因,如rRNA、tRNA和组蛋白的基因; ②有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因; ③有些成员不产生有功能的基因产物,这种基因称为假基因 (Pseudogene). Ψa1表示与a1相似的假基因.

  24. 基因家族分类 • 编码RNA的: • rRNA 、tRNA、 snRNA等; • 编码蛋白质的: • 组蛋白基因 • 珠蛋白基因 • 生长激素

  25. rRNA 基因 • >l00copy. • rRNA基因簇(重复单元18S - 5.8S - 28S RNA)

  26. 珠蛋白基因

  27. 四、超基因家族(Supergene family) • 由基因家族和单基因组成的大基因家族,结构上有程度不等的同源性,但功能不同. • 免疫球蛋白超基因家族,丝氨酸蛋白酶族,ras超基因家族

  28. 线粒体基因组 人线粒体基因组的特点: 1、人线粒体基因组为16,569bp的双链闭环分子,一条链为重链(H链),一条链为轻链(L链),两条链均有编码功能,每个mtDNA分于编码13种蛋白质和24种结构RNA (22rRNA,2tRNA). 2、线粒体DNA为母系遗传.

  29. 人线粒体基因组的特点: 3、结构基因不含内含子,部分区域有基因重叠,因此病理性mtDNA突变更易发生. 4、mtDNA突变频率更高. 5、线粒体DNA突变的表型表达与核DNA不同。

  30. 第四节 人类基因组计划 • Gene 基因 • Genetics 遗传学 • Genome 基因组 • Genomics 基因组学

  31. 基因组学与人类基因组计划 • 基因组学(genomics): • 结构基因组学(structural genomics) • 功能基因组学(functional genomics) • 蛋白质组(proteome)、蛋白质组学(proteomics) • 人类基因组计划(human genome project, HGP)

  32. 二十世纪的三大计划

  33. 癌症研究的转折点-----人类基因组的全序列分析Dulbecco R Science 1986 回顾了70年代以来癌症研究的进展,使人们认识到包括癌症在人类疾病的发生,都与基因直接、间接有关;同时指出,要么仍处在零打碎敲的方法研究,要么从整体上研究和分析整个人类基因组及其序列。这一计划的意义,可以与征服宇宙的计划媲美。这样的工作是任何一个实验室难以单独承担的项目。这个世界所发生的一切事情,都与这一人类的DNA序列息息相关

  34. HGP的研究内容 • 总体目标:15年内投入30亿美元,完成人类24条染色体的30亿个核苷酸序列分析 • 主要内容: • 1. 基因组制图(遗传图谱、物理图谱、序列图谱、基因图谱) • 2. 基因的定位与分析 • 3. 基因组研究技术的建立、改进 • 4. 模式生物基因组的图谱绘制及测序 • 5. 相关课题的研究

  35. 人类基因组计划大事记 • 1986年 Dulbecco 在“Science”首次提出 • 1990年 国际人类基因组计划正式启动 • 1996年 真核生物酵母(15Mb) • 1997年 大肠杆菌(4,653,831 bp,4283个基因) • 1997年底 线虫(28Mb,19,000基因) • 1998年5月 celera公司宣布加入该计划

  36. 人类基因组计划大事记 • 1999年初 celera公司宣布完成果蝇(120Mb)的测序 • 1999年9月 中国获准加入该计划,测1%的基因组,也就是3号染色体上的30,000,000个硷基对。 • 1999年12月 国际人类基因组计划联合研究小组宣布完成对第22对染色体的测序,长度为3340万碱基,编码有545个基因和134个“假基因”,某些遗传性疾病相关基因,如猫眼综合征。表明用克隆技术可以完成一条完整染色体全长的测序

  37. 人类基因组计划大事记 • 2000年4月 中国科学家按照国际人类基因组计划的部署,完成了1%人类基因组的工作框架图 • 2000年5月 德国和日本等国科学家组成的科研小组基本完成了人体第21对染色体的测序工作。 • 2000年6月26日 Celera公司宣布完成人类基因组测序工作,进入功能基因组学时代 • 2002年10月29日 由美、英、中、日、加等五国合作进行国际遗传变异图谱计划

  38. 中国的步伐 • 1994年初,吴闵院士、强伯勤院士和杨焕明教授倡导启动中国的HGP • 1998年,国家自然科学基金委员会和‘863’高科技计划的支持,启动了“中华民族基因组若干位点基因结构的研究”和“重大疾病相关基因的定位、克隆、结构与功能研究” • 1998年,在上海,由陈竺院士挂帅成立“中国南方基因组中心” • 1999年,在北京,由强伯勤院士挑头成立“北方人类基因组中心”

  39. 陈竺           强伯勤

  40. 《科学》杂志发表中国科学家关于水稻基因组论文《科学》杂志发表中国科学家关于水稻基因组论文 • 1999年10月起,科学家开始酝酿杂交水稻基因组计划。 • 2000年5月11日,中科院基因组信息学中心暨北京华大基因研究中心、国家杂交水稻工程技术研究中心和中科院遗传所3家单位联合宣布实施“中国超级杂交水稻基因组计划”,进行从基因组到分子育种、大田实验的全方位研究开发。 • 2001年4月,曙光3000大型计算机到位,研究团队开始杂交水稻父本的测序。 • 2001年7月,SUN一万大型计算机到位,杂交水稻父本全方面采用“鸟枪法”测序。 • 2001年9月20日,完成杂交水稻父本4倍的测序任务,“工作框架图”基本完成。 • 2001年10月12日,中科院、国家计委、科技部联合宣布我国科学家完成了水稻基因组的“工作框架图”,标志着我国进入世界基因组研究的前列。国务院副总理温家宝致信中科院祝贺。 • 2002年4月4日,中国科学院和美国《科学》杂志在京联合举行通报会宣布,中国科学家成功绘制出水稻基因组图谱。4月5日在美国出版的《科学》杂志以封面文章的形式发表了中国科学家有关水稻基因的论文,获得国际同行的高度评价,引起全世界的关注。

  41. 后基因组时代的工作 • 分析所有的这些基因及其编码产物(主要是蛋白质)是如何单独和共同在生命过程中发挥作用的 。 • 在目前阶段研究蛋白比研究基因难得多,而成千上万的结构和功能都复杂多样的蛋白分子才是生命过程的最后执行者。 • 我们现在还没有有效的研究手段去揭示蛋白分子在生物体内究竟完成什么功能、又是通过何种机制去完成其生物功能的等等。

  42. 真核生物基因组与原核生物基因组的主要区别:真核生物基因组与原核生物基因组的主要区别: (1)真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因组是双份的(即双倍体)。细菌染色体基因组通常由一条环状双链DNA分子组成,染色体形成类核,无核膜与胞浆分开。 (2)基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。 (3)真核细胞基因转录产物为单顺反子。一个结构基因经过转录和翻译生成一个mRNA分子和一条肽链。原核生物基因转录产物为多顺反子,功能上相关的几个基因往往在一起组成操纵子结构。

  43. 真核生物基因组与原核生物基因组的主要区别 (4)真核基因组大部分基因含有内含子,因此,基因是不连续的,称为断裂基因,需要进行转录后加工;原核基因组没有内含子结构,不需进行转录后剪接加工。 (5)真核基因组中不编码的区域多于编码区域。原核基因组大部分为编码序列,不编码区域仅占一小部分。 (6)真核生物基因组存在重复序列,重复次数可达百万次以上基因组远远大于原核生物的基因组。 (7)真核生物基因组存在多基因家族、超基因家族和假基因。

More Related