第二章 基因和染色体
教学目的:在掌握基因的概念,基因的类别,基因的结构和功能的基础上,学习细胞增殖周期中DNA 、染色质和染色体的行为,人类的配子发生和减数分裂。
教学要求:
1、掌握基因的概念、基因的分子结构。
2、掌握人类配子的发生过程和减数分裂过程中各时期的染色体变化特点,熟悉减数分裂的生物学意义。
3、熟悉DNA 、染色质和染色体的相互关系,熟悉细胞有丝分裂过程中染色体的行为。 重点:人类配子的发生过程。
难点:人类配子的发生过程。染色体的形成过程。减数分裂过程。
教学提纲:
1、掌握基因的概念、基因的分子结构。
2、掌握人类基因组的概念、分类、核基因组。熟悉线粒体基因组。
3、有丝分裂和减数分裂:
人类的配子发生:
(1) 精子的发生。
(2) 卵子的发生。
课前提问
1. 遗传性疾病有哪些特征?
2. 遗传病与先天性疾病或家族性疾病的联系和区别是怎样的?
基因(gene )是细胞内遗传物质的结构和功能单位,它以脱氧核糖核酸(deoxyribonucleic acid,DNA )化学形式存在于染色体上。在人类,基因通过生殖细胞从亲代向子代传递。早在1944年,A very 等用实验的方法就直接证明了DNA 是生物的遗传物质。1953年Watson 和Crick 在前人的工作基础上,提出了著名的DNA 分子双螺旋结构模型,奠定了基因复杂功能的结构基础。从此,遗传学的研究在医学领域取得了突飞猛进的发展。
人类对基因的认识经历了一个由浅入深的历史发展过程。早在19世纪60年代,奥地利神甫孟德尔就采用豌豆作为实验材料,进行了8年的杂交试验研究,提出生物的性状是由遗传因子(hereditary factor )
决定的,并总结出遗传因子传递的分离定律和自由组合定律。20世纪初丹麦遗传学家Johannsen 将遗传因子更名为基因(gene ),并一直沿用至今。随后美国遗传学家摩尔根及其学生Sturtevent 、Mü11er 等通过果蝇的杂交试验证实,基因在染色体上呈直线排列,并提出了基因传递的连锁交换定律,发表了著名的《基因论》;1927年Müller 等人证明用人为因素(如X 线等)可使基因发生突变;在此之前Garrod (1908)认为人类的黑尿酸症是一种遗传病,病因是患者缺乏某种相关生化反应的酶。于是人们开始将基因与酶联系起来。1936年Beadle 等对果蝇(Drosophila melanogaster )朱矽眼型、朱红眼型和野生型进行研究,再次证实了基因与酶的关系。1941年他们又根据对粗糙链抱霉(Neurospora crassa)的研究结果,提出了“一个基因决定一种酶”的学说;然而,后来的研究揭示,基因除了决定酶之外,还决定其他蛋白质,于是有人提出了“—个基因一种蛋白质”的假说。但人们又发现有的蛋白质可以由几条多肽链组成,因此又修正成“一个基因一条多肽链”假说;经过100余年的研究,基因的概念逐渐清晰。但直到20世纪50年代,人们对基因的认识还仅仅停留在逻辑概念阶段,关于基因的物质基础和理化本质的认识,仍然是一个谜。首次揭开这—谜底的是1944年A very 等人的工作,他们用实验方法直接证明了DNA 是生物的遗传物质。1953年Watson 和Crick 在前人的工作基础上,应用现代物理学和化学的新技术,对DNA 的分子结构进行了深入研究,提出了著名的DNA 分子双螺旋(double helix)结构模型。这个模型显示DNA 具有自我复制功能,正式揭示了遗传之谜。至此人们认识到,基因是具有特定“遗传效应”的DNA 片段、它决定细胞内RNA 和蛋白质(包括酶分子)等的合成,从而决定生物遗传性状。
现代遗传学认为,基因是决定一定功能产物的DNA 序列。这种功能产物主要是蛋白质和RNA 。一个基因的结构除了编码特定功能产物的DNA 序列外,还包括对这个特定产物表达所需的邻接DNA 序列。在对某些遗传病的家系研究中发现,虽然基因的编码部分结构完整未发生改变,但它的邻接DNA 序列发生了改变,如常见的邻接序列某些区域单个碱基的替换可使此功能产物不能表达,从而引起遗传病。
第一节 基因的结构和功能
研究证明,DNA 是生命体的遗传物质;但在某些仅含有RNA 和蛋白质的病毒,其RNA 是遗传物质。例如,烟草花叶病毒不含DNA ,仅含有一条单链的RNA 。实验证实,这条单链RNA 能感染宿主细胞,并繁殖后代。在整个生物界中,绝大部分生物(包括人类)基因的化学本质是DNA 。
一、DNA 的分子组成和结构
1.DNA 的分子组成
组成DNA 分子的基本单位是脱氧核苷酸。每个脱氧核苷酸由磷酸、脱氧核糖和含氮碱基组成。碱基有4种:腺嘌吟(A )、鸟嘌岭(G )、胞嘧啶(C )和胸腺嘧啶(T )。因碱基的不同,可以构成4种不同的脱氧核苷酸:脱氧腺嘌呤核苷酸(dAMP ,A )、脱氧鸟嘌呤核苷酸(dGMP ,G )、脱氧胞嘧啶核苷酸(dCMP ,
C )和脱氧胸腺嘧啶核苷酸(dTMP ,T )。这4种脱氧核苷酸按一定顺序排列起来构成脱氧多核苷酸长链(DNA
单链),两个相邻的脱氧核苷酸之间通过磷酸二酯键相连接。每条脱氧核苷酸单链都有3′端和5′端。生物的遗传性状是以脱氧核苷酸的排列序列来储存遗传信息的。因此,脱氧核苷酸的排列是DNA 遗传的核心。
2.DNA 的分子结构
Watson 和Crick (1953)提出了DNA 分子的双螺旋结构模型,阐明了DNA 空间结构的基本形式,要点如下:①DNA 由两条碱基互补的、反向平行排列的脱氧多核苷酸单链所组成,一条是5′→3′端,另一条是3′→5′端,碱基互补的方式是A 与T 或T 与A ,C 与G 或G 与C 相对应;②在自然情况下,绝大多数DNA 分子的两条互补链围绕一“主轴”向右盘旋形成双螺旋结构;③4种碱基(A 、T 、G 、C )的排列顺序在不同的DNA 分子中各不相同,储存着各种生物性状的遗传信息;④双螺旋的表面形成两条凹槽,一面宽而深,称之深沟;另一面狭而浅,称之浅沟。这两条沟,对于有特定功能的蛋白质(酶)识别并调节DNA 双螺旋结构上的遗传信息是非常重要的;⑤由于DNA 链通常很长,所包含的碱基数目很多,所以碱基排列顺序的组合方式是无限的,可以形成多种不同的DNA 分子。例如,某一DNA 分子有100个碱基对,因碱基排列组合的不同,就可以形成至少4100种DNA 分子。实际上,由于DNA 分子量巨大,所以其碱基对的排列方式可以说是多种多样,因而DNA 分子也是种类繁多。在如此众多结构复杂的DNA 分子内蕴藏着生物界无穷无尽的遗传信息,决定了形形色色、千姿百态的生命自然界。
二、人类基因和基因组的结构特点
人类基因组(genome )是人的所有遗传信息的总和。人类基因组包括两个相对独立而相互关联的基因组:核基因组与线粒体基因组。如果不特别注明,人类基因组通常是指核基因组(图1)。
(一)细胞核基因组
1. 基因的分类
随着人类基因组计划研究的深入和结构基因组学的基本完成,已知人类基因组共有2.6383(≈3)万~
3.9114(≈4)万个基因,比蚯蚓仅多1万个,比果蝇多2万个。另外,科学家还发现与蛋白质合成有关的基因序列只占整个基因组序列的2%。人类的基因或人类基因组中的功能序列可分为4大类,即单一基因、基因家族、拟基因和串联重复基因。
(1).单一基因 在人的基因中,25%~50%的蛋白质基因在单倍体基因组中只有一份,称为单一基因(solitary gene)或单一序列(unique sequence)。
(2).基因家族 从已克隆的许多基因它们都不完全是单拷贝,有的是重复的多拷贝,这一部分基因属于两个或更多个相似基因的家族,称为基因家族(gene family),类同的蛋白质则组成蛋白质家族(protein
A family ),其蛋白质成员由数个到数十个,个别的可达数百。β珠蛋白基因家族包括5个功能基因:β、δ、γ、
G γ和ε,它们分别在生活史的不同阶段表达,具有不尽相同的功能。细胞骨架蛋白、肌动蛋白、微管蛋白、中间纤丝等也形成不同的蛋白质家族,可能对同一个体的不同细胞类型,呈现差别性表达,以合理搭配,
发挥其生理作用。
(3).假基因 在人的β珠蛋白基因家族中至少有两个区的序列ψβl 和ψβ2与有功能的β珠蛋白基因相似,但是它没有相应的蛋白质产生,为拟基因或假基因(pseudogene )。拟基因是一种畸变基因,即核苷酸序列同有功能的正常基因有很大的同源性,但由于突变、缺失或插入以致不能表达,所以没有功能。
(4).串联重复基因 45SrRNA 、5SrRNA 、各种tRNA 基因以及蛋白质家族中的组蛋白基因是呈串联重复排列的,这类基因叫做串联重复基因(tandemly repeated genes)。它们不同于成倍基因,编码了同一种或近乎同一种的RNA 或蛋白质,rRNA 、tRNA 基因的每个拷贝完全或几乎完全相同,但在基因间的间隔DNA (linker DNA)相差很大。组蛋白基因家族较复杂,但每种组蛋白基因的拷贝完全相同。
2. 断裂基因
真核生物的结构基因是断裂基因(图2),由编码的外显子和非编码的内含子组成,二者相间排列。不同基因所含内含子数目和大小也不同,例如,导致杜氏肌营养不良症(Duchenne muscular dystrophy,DMD )基因(dystrophin 基因)全长2.5Mb ,是目前已知人类最大的基因,大约由80个外显子和相应的内含子组成,cDNA 全长为11000bp ,编码分子量为427000的蛋白质,从dystrophin 转录形成一条完整的mRNA 分子需要16小时。
图2 断裂基因的结构及其表达
断裂基因中的内含子和外显子的关系不完全是固定不变的,有时会出现这样的情况,即在同一条DNA 分子上的某一段DNA 顺序,在作为编码某一条多肽链的基因时是外显子,但是它作为编码另一条多肽链的基因时是内含子,这是由于mRNA 剪接加工的方式不同所致。结果使同一个基因(确切地说是同一段DNA 顺序)产生两条或者两条以上的mRNA 链。这在真核生物基因的表达中,由于一个基因的内含子成为另一个基因的外显子,产生基因的差别表达,而构成了断裂基因结构上一个重要特点。每个断裂基因中第一个外显子的上游和最末一个外显子的下游,都有一段不被转录的非编码区,称为侧翼顺序。
断裂基因结构中外显子-内含子的接头区是一高度保守的一致顺序,称为外显子-内含子接头。这是形成断裂基因结构上又一个重要特点。每一个内含子的两端具有广泛的同源性和互补性,5′端起始的两个碱基是GT ,3′端最后的两个碱基是AG ,通常把这种接头形式叫做GT-AG 法则(GT-AG rule )。这两个序列是高度保守的,在各种真核生物基因的内含子中均相同。
3. 基因组的组成
人类基因组按DNA 序列分类既有单拷贝序列,也有重复频率不等的多拷贝序列。
(1). 单拷贝序列
又称非重复序列。在基因组中仅有单一拷贝或少数几个拷贝,单拷贝序列的长度在800bp ~1000bp 之间,其中有些是编码细胞中各种蛋白质和酶的结构基因。单拷贝或低拷贝DNA 序列可占到人类基因组的60%~70%。
(2). 重复多拷贝序列
重复多拷贝序列有的较短,有的较长,分散地穿插于整个基因组,这些重复DNA 是通过变性、复性实验而被发现的,重复DNA 的复性速度较非重复DNA 快。根据复性的速度,又可分为简单序列DNA 和中度重复DNA 。
a .简单序列DNA 简单序列DNA (simple-sequence DNA)以5bp 、10bp 或20bp 、200bp 为一个重复单位,它们串联重复很多次,约占整个基因组的10%~15%,大多数重复次数多(高度重复),长度可达105bp ,即为简单序列DNA 或卫星DNA (satellite DNA)。通过原位分子杂交检测,已知简单序列的DNA 大多数位于染色体的着丝粒或染色体的臂和端粒区,进一步研究证明是位于染色体的异染色质区。
由15bp ~100bp 组成的重复单位(常富含GC ),重复20~50次形成的lkb ~5kb 的短DNA ,叫做小卫星DNA (minisateliite DNA),又叫做可变数目串联重复(variable number of tandem repeats,VNTR ),比上述的卫星DNA (10bp )短。而在基因组的间隔序列和内含子等非编码区内,广泛存在着与小卫星DNA 相似的一类小重复单位,重复序列为lbp ~6bp ,称为微卫星DNA (microsatellite DNA)或STR ,如(A )n /(T )n 、(CA )n /(TG )n 、(CT )n 、(AG )n 等。由于这些微卫星DNA 区域在人类基因组中出现的数目和频率不同,表现为多态性,为人类遗传分析提供了大量的多态遗传标志,其多态信息量大于RFLPs ,可用于基因定位、群体进化以及基因诊断等研究。近年来在脆性X 染色体综合征、脊髓小脑性共济失调等疾病中发现微卫星DNA 如(CAG )n 、(CTG )n 等的不稳定性,往往发生三核苷酸重复扩增突变。
b .中度重复DNA 和可动DNA 因子 中度重复DNA (intermediate repeat DNA )是以不同的量分布于整个基因组的不同部位。这些间隔的DNA 长度可短至100bp ~500bp ,称为短分散元件(short interspersed element ),也可长达6000bp ~7000bp ,称为长分散元件(long interspersed element),占整个基因组的25%~40%。
Alu 家族(Alu family)是短分散元件典型的例子,是人类基因组含量最丰富的中度重复顺序,占基因组总DNA 含量的3%~6%,长达300bp ,在一个基因组中重复30万~50万次。在Alu 序列内含有一个限制性内切酶Alu Ⅰ的特异性识别位点AGCT ,因此这一序列称为Alu 序列,它可被Alu Ⅰ酶裂解为一个170bp 和130bp 的两个片段。研究表明神经母细胞纤维瘤发生是由于NF1抑癌基因突变所致,发现一患者的1对NF1等位基因之一有一新的Alu 序列,使这一NF1基因失活,当另一个NF1基因发生突变后,遂造成肿瘤的发生。某些隐性遗传病也是由于Alu 序列插入到外显子中,致使蛋白质编码区的结构改变,出现临床症状。 5
Kpn Ⅰ家族(Kpn Ⅰ family )是长分散元件的典型例子,是中度重复顺序中仅次于Alu 家族的第二大家族,用限制性内切酶Kpn Ⅰ消化,可分解成四个长度不等的片段,分别是1.2、1.5、1.8和1.9kb ,即所谓的Kpn Ⅰ家族,形成6.5kb 的中度重复顺序,拷贝数为3000~4800个。Kpn Ⅰ家族成员顺序比Alu 家族长,散在分布,约占人体基因组的3%~6%。其功能不清。
三、结构基因的分子结构与特点
大多数真核生物基因的编码序列不是连续排列的,被非编码序列隔开,因此,称为断裂基因(split gene)。
(一)外显子(exon )与内含子(intron )
1. 外显子: 出现在成熟mRNA 中的基因序列,外显子序列可以是编码氨基酸的编码序列,也可以是非编码序列,如存在于起始密码之前和终止密码之后的外显子序列,这些序列出现在成熟mRNA 中,但并不编码氨基酸,所以称为非翻译区(untranslated region ,UTR ),在基因3’端非翻译区内存在RNA 加尾信号,其序列为5’-AA TAAA-3’。
2. 内含子: 位于两外显子之间的序列。
3. 外显子内含子接头序列: 在外显子与内含子接头有一段高度保守的序列,是RNA 剪接的信号,称为接头序列。每个内含子的5’端以GT 开始,在3’端以AG 结束,所以又称为GT-AG 法则。
(二)侧翼序列(flanking sequences)
在基因的两侧不被转录的非编码序列,这些序列在转录调控中起重要作用。它们包括位于转录起始点上游的启动子序列、位于转录终止点下游的终止子序列和位置不固定的转录调控序列,如增强子、终止子等。
1. 启动子(promoters ): 是一段特异的核苷酸序列,通常位于基因转录起始点上游的100bp 范围,是RNA 聚合酶的结合部位,能启动和促进转录过程。启动子决定了双链DNA 中的转录链,常见序列有:
(1)T AT A 框(T AT A box): 位于转录起始点上游大约-20~-30bp 处,是高度保守的一段序列,由7个碱基组成,即TA TAA (T )AA (T ),其中只有两个碱基可以有变化。TA TA 框能够与转录因子TF Ⅱ结合,再与RNA 聚合酶Ⅱ形成复合物,从而准确地识别转录的起始位置,对于转录水平有着定量效应。
(2)CAAT 框(CAAT box ): 位于转录起始点上游-70~-80bp ,也是一段保守序列,由9个碱基组成,其序列为GGC (T )CAA TCA ,其中只有一个碱基可以变化。转录因子CTF 能够识别CAA T 框并且与之结合,其C 端有着激活转录的功能。所以CAA T 框有促进转录的功能。
(3)GC 框(GC box): 其顺序为GGCGGG ,有两个拷贝,位于CAA T 框两侧。转录因子Sp1能识别GC 框并且与之结合,其N 端有激活转录的作用。所以,GC 框有激活转录的功能。
2. 增强子(enhancer ): 增强子能增强启动子发动转录的作用,从而明显地提高基因转录的效率。增强子的位置不固定,可以位于启动子上游,也可以位于启动子下游,可以距离启动子很远,也可以距离启动子较近。
3. 终止子(terminator ): 终止子为反向重复序列,是RNA 聚合酶停止工作的信号,反向重复序列转录后,可以形成发夹式结构,并且形成一串U 。发夹式结构阻碍了RNA 聚合酶的移动,一串U 的U 与DNA 模板中的A 结合不稳定,从模板上脱落下来,转录终止。
综上所述,人类基因结构如图5所示:
四、人类基因组计划
“人类基因组计划(human genome project ,HGP )”是20世纪90年代初开始的全球范围的全面研究人类基因组的重大科学项目。HGP 是美国科学家在1985年率先提出的,旨在阐明人类基因组DNA 3.2×109核苷酸的序列,发现所有人类基因并阐明其在染色体上的位置,破译人类全部遗传信息,使得人类第一次在分子水平上全面地认识自我。
HGP 的整体目标是阐明人类遗传信息的组成和表达,为人类遗传多样性的研究提供基本数据,揭示1万余种人类单基因异常(有临床意义的约计6000种)和上百种严重危害人类健康的多基因病(例如冠心病、高血压、糖尿病、恶性肿瘤、自身免疫性疾病等)的致病基因或者疾病易感基因,建立对各种基因病新的诊治方法,从而推动整个生命科学和医学领域发展。HGP 的基本任务是建立人类基因组的结构图谱,即遗传图、物理图、转录图与序列图,并在“制图-测序”的基础上鉴定人类的基因,绘出人类的基因图。
从基因组学的范畴来说,1990年~2003年HGP 的重点在于研究人类基因组的结构,属于基因组学的最基础的结构基因组学(structural genomics)的研究。HGP 的科学意义是奠定了阐明人类所有基因功能的功能基因组学(functional genomics)研究的基础。
(一)结构基因组学
结构基因组学主要包括四张图,即遗传图、物理图、转录图与序列图的制作。
1. 遗传图
遗传图(genetic map)又称“连锁图(linkage map)”。它是以具有遗传多态性的遗传标志作为“位标”,以遗传学距离为“图距”的基因组图。连锁遗传的基因彼此之间距离较近,独立遗传的基因相距甚远。遗传标志之间是否存在连锁与其相对位置和遗传距离有关。遗传学距离以厘摩(centi-Morgan ,cM )表示。两个基因在精卵形成时的染色体交换中分离的几率为1%时,其间距为1cM ,相当于10bp (1Mb )。随着人类基因组计划的研究和认识的深入,作为DNA 的遗传标志也经历了从粗到细的转变过程,即从第一代
6
标志限制性片段长度多态性(restriction fragment length polymorphism,RFLP )、第二代标志短串联重复(short tandem repeat,STR )到第三代标志单个核苷酸多态性(single nucleotide polymorphism,SNP )的发展,两个标志之间的平均距离为0.7cM ,即两个位点之间有0.7%的机率进行遗传重组。人类基因组的遗传距离大小为3600cM 。由于所有“遗传多态性”的分子基础都是核苷酸的差异,在理论上,SNP 有可能在核苷酸水平上,把“序列图”、“物理图”与“遗传图”最终有机地整合、统一起来。
2. 物理图
物理图(physical map)是以一段已知核苷酸序列的DNA 片段,称为序列标记部位(sequence tagged site,STS )为“位标”,以bp 、kb 和Mb 作为图距的基因组图。物理图的基本原理是把庞大的无从下手的人类基因组先“敲碎”,再拼接,以便既能随意研究又能清楚地知道研究内容所处的染色体位置。
3. 转录图
转录图(transcription map )将最终成为基因图,就是在人类基因组中鉴别出占据2%长度的全部基因的位置、结构与功能。现已确定,人类有3万~4万个蛋白编码基因。在每一种细胞中,编码蛋白质序列仅有10%左右专一表达。如果获得了mRNA (或cDNA )序列,就获得了基因功能的主要部分。cDNA 片段称为表达序列标记(expressed sequence tag,EST )或“表达序列”图,即人类的“基因图”的雏形。现阶段,转录图与EST 还有多方面的现实意义:①它能为估计人类基因的数目提供较为可靠的依据;②它提供的不同组织(空间)、不同发育阶段(时间)的基因表达的数目、种类及结构,特别是序列的信息;③提供了鉴定基因的探针,以EST 就可从“全长cDNA 文库”到全长cDNA ,再进而从不同“基因组文库”中筛选全长的基因;④本身就有直接的经济价值,如作为基因诊断的探针。
4. 序列图
序列图(sequence map)人类基因组的核苷酸序列图也就是分子水平的最高层次的、最详尽的物理图。测定的总长度约为1米,由30多亿核苷酸组成的序列图是人类基因组计划中最为明确、最为艰巨的定量、定质(准确性)、定时的任务。
(二)后基因组时代
随着HGP 遗传图、物理图、转录图与序列图等结构基因组学任务的基本完成,科学家们又启动了后基因组计划(post-genome era)。它主要研究基因组的功能,即功能基因组学。
功能基因组学就是在基因组的层次上,研究基因的表达、调控与功能。人类基因图的雏形“转录图”是最初步的人类基因组功能图。基因的转录具有组织、发育阶段的特异性,并受所有生理、病理及环境因素的调节。因此,转录图除了提供基因序列的结构信息外,还提供了该基因表达的组织、发育阶段、生理状况的信息。绘制人类基因组的一张三维的“转录图”或称“基因表达图”,反映某一基因在不同发育阶段、不同组织中不同水平的表达,反映某一组织中不同时间,不同基因的不同水平的表达,以及在某一生长、发育阶段在不同组织中不同基因的不同水平的表达。
后基因组计划还包括人类基因组多样性计划、比较基因组学、工业基因组学、药物基因组学、疾病基因组学以及蛋白质组学等方面。
人类基因组多样性计划(human genome diversity project,HGDP )是研究各人群的基因组,比较不同人种、民族、族群(ethnic group)基因组的差异,探讨人类进化的历史,研究不同人群间对疾病的易感性和抗性上的差异,为预防医学提供基础。
比较基因组学(comparative genomics )是指在基因组的层次上,比较不同基因组之间的异同。“人类基因组计划”的启动意味着比较基因组的问世。致病基因的鉴定、肿瘤“表达图”的构建,及不同组织、不同时间的“基因图”的构建,都已属于比较基因组的范畴。而“人类基因组计划”中的“模式动物”基因组研究,更是比较基因组学的重要内容。基因组学在人类基因组研究中的成功,使它很快进入了所有其他生物基因组的研究。“人类基因组计划”的四大模式生物:酵母、线虫、果蝇、小鼠,在人类基因组研究与人类基因鉴定中已发挥了重要的作用。
工业基因组学(industrial genomics)将是本世纪的支柱工业之一,是研究基因组学的工业应用的学科。随着人类及其他生物基因组学研究的进展,它的前景已展现在人们面前。作为动物反应器来生产人类生物制品的转基因猪、牛、鸡都已问世。能够提供人体器官的转基因动物已在实验室进行尝试。在基因组层次上改良原有的遗传结构来培育新的动、植物品种也已取得可喜的进展。可以预料,在本世纪里,新的食品、药品将越来越多地打上基因组学的印记。
药物基因组学(pharmacogenomics )是研究药物人体作用的遗传分布,以满足临床需要。遗传多样性对个体差异,临床症状的长短、费用和临床治疗的疗效等有决定因素,全基因组扫描可以用来寻找这些遗传多态性。得到影响药物作用的多态性后,可以优化药物设计和发现新化合物等。应用大规模系统研究基因组以加速发现对药物反应的标记,标记包括作用到药物目标、药物代谢或疾病通路上。
疾病基因组学(morbid genomics)主要任务是分离重要疾病的致病基因与相关基因,以及确定其发病机制。我国许多疾病的发生可能与西方人群可能存在一定的差别。以肿瘤为例,中国人肝癌、鼻咽癌、食管癌的发生率明显高于西方;又如,中国人1型糖尿病发生率明显低于西方。对这些差别的分析表明,除环境因素之外,遗传因素也有重要的作用。近年来,心血管病、糖尿病、老年痴呆症、精神分裂症等多基因疾病的发生率在中国不断增高,在大城市已接近西方国家水平。利用这些疾病遗传资源,分离在我国发生率高、危害性大的重要疾病的致病基因或相关易感基因将是今后医学研究的重点。
蛋白质组学(proteomics )研究细胞或组织中基因组所表达的全部蛋白质,尤其是不同生命时期,或正常、或疾病或给药前后的全部蛋白质的变化。
后基因组研究的进展将为医学发展提供的线索和机遇,从基因表达谱的变化、细胞内信号转导过程异常等角度认识疾病将是医学发展中的重要变化。后基因组研究将对各种疾病的发生机制做出最终的解释,也将在各个层次和水平上为疾病的诊治提供新的线索。
第三节 染色质和染色体
一、DNA 、染色质和染色体的相互关系
(一)染色质类型
细胞核内能被碱性染料染色的物质,称为染色质(chromatin )。染色质可以分为常染色质(euchromatin )和异染色质(heterochromatin )两大类:常染色质呈较松散状态,它们均匀地分布在整个细胞核内,染色较浅,具有转录活性;异染色质在整个细胞周期都处于高度螺旋化状态,在细胞核中形成染色较深的团块,存在于异染色质中的基因是没有转录活性的。在人类有两类异染色质,一类是兼性异染色质(facultative heterochromatin ),另一类为结构异染色质(constitutive heterochromatin)。兼性异染色质又称功能性异染色质,在特定细胞或在特定发育阶段呈凝缩状态而失去功能,在另一发育阶段时又呈松散状态而恢复功能,如X 染色质。结构异染色质总是呈凝缩状态,所含DNA 一般为高度重复序列,没有转录活性,常见于着丝粒、端粒区、Y 染色体长臂远端2/3区段和次缢痕区等。
(二)染色质组成
染色质由DNA 、组蛋白(histone )、非组蛋白和少量RNA 组成。DNA 与组蛋白的重量比比较稳定,接近于1∶1,非组蛋白的种类及含量随不同细胞而异。
组蛋白为碱性蛋白,含有大量的碱性氨基酸。组成人类染色质的组蛋白共有5种,分别称为H1、H2A 、H2B 、H3和H4,它们在进化中高度保守。组蛋白的功能与染色质的结构构成有关。
(三)染色质结构
染色质是间期核中遗传物质的存在形式,由许
多重复的结构单位组成,这些结构单位称为核小体
(nucleosome )。核小体是由一条DNA 双链分子串
联起来,形似一串念珠。每个核小体分为核心部和
连接区二部分。核心部是由组蛋白H2A 、H2B 、H3
和H4各二个分子形成的组蛋白八聚体及围绕在八
聚体周围的DNA 组成,这段DNA 约146bp ,绕八
聚体外围1.75圈。两个核心部之间的DNA 链称为
连接区。这段DNA 的长度变异较大,组蛋白H1位
于连接区DNA 表面。
(四)核小体包装成染色质与染色体
由直径为2nm 的双链DNA 分子形成直径为10nm 核小体细丝后,DNA 的长度已压缩了7倍。核小体进一步螺旋化,形成外径为30nm 的染色质纤维(螺线管),其长度为DNA 的1/42。当细胞进入分裂期,染色质进一步螺旋折叠,形成染色体。中期染色体长度约为DNA 长度的10-5。
第四节 细胞增殖
(一)有丝分裂(mitosis )
有丝分裂是体细胞增殖方式,分为
间期和分裂期,分裂期又分为前、中、
后和末四个时期。在细胞周期中染色体
发生一系列变化:在间期,DNA 进行复
制,进入分裂期染色质螺旋折叠形成染
色体,在中期染色体由两条姊妹染色单
体构成,两条姊妹染色单体以着丝粒相
连;进入分裂后期,每条染色体的着丝
粒纵裂,染色单体分开,分别移向两极。
因此,经过一次有丝分裂过程,DNA 复制一次,细胞分裂一次,染色体也分裂一次,并平均分配到两个子细胞中。这样保证了新的子细胞具有与母细胞相同的全套遗传物质,从而保证了所有细胞的染色体数目恒定。
(二)减数分裂(meiosis )
生殖细胞发生过程中的一种特殊分
裂方式,DNA 复制一次,细胞连续分裂
两次,因此,由一个细胞形成4个子细
胞,子细胞的遗传物质是母细胞的一半。
减数分裂由两次连续分裂构成:
1、减数分裂I :在第一次减数分裂的间
期,DNA 进行复制;第一次减数分裂前
期非常复杂,分细线期、偶线期、粗线
期、双线期和终变期。在偶线期同源染
色体进行配对,同源染色体配对的结果,
每对染色体形成一个紧密相伴的二价
体,在人类细胞中形成23个二价体;每
个二价体都是由两条同源染色体组成,每一同源染色体含两条复制而来的姐妹染色单体,两条姐妹染色单体由着丝粒相连。这样,每个二价体由四条染色单体组成,称为四分体。在粗线期,同源染色体间的非姐妹染色单体发生片段交换(crossing-over );在第一次减数分裂后期,二价体中的两条同源染色体彼此分开,分别向两极移动。每一极只获得每对同源染色体的一条。每条同源染色体由两条姐妹染色单体组成。
2、减数分裂II :间期很短,不进行DNA 复制,在第二次减数分裂中期,着丝粒纵裂,两条姊妹染色单体分开,分别移向细胞两极。
第五节 生殖细胞的发生
一、精子的发生
在男性,精子发生于睾丸曲细精管的生精上皮cell ,由生精上皮cell 中的精原cell 经减数分裂而成,精原cell 相当于体cell ,故在精原cell 经减数分裂而成,精砂cell 相当于体cell ,故在精原cell 中具有44条常染色体及2条性染色体;即XY ,精原cell 经增殖期(即有丝分裂期)增殖形成许多与其遗传组成一致的cell ,这些cell 经生长期,体积增大,cell 中胞质成分增加,形成初级精母cell ,初级精母cell 的染色体组成与精原cell 一致,具有44条常染色体及2条性染色体XY ,由初级精母cell 经成熟期(减数分裂期)最终形成精cell ,在成熟期中,首先初级精母cell 在分裂间期DNA 复制一次,经过减数分裂中的第一次分裂,形成2个cell ,称为次级精母cell ,次级精母cell 中染色体减半,一个次级精母cell ,次级精母cell 中染色体减半,一个次级精母cell 中具有22条常染色体和一条X 染色体,每一个次级精母cell 再经减数分裂第二次分裂,各形成二个cell ,即总共4个cell ,为精cell ,精cell 的染色体组成与次级精母cell 一致,二个精cell 为22+X,二个精cell 为22+Y,精cell 经变形时,形成鞭毛等附属结构,形成精子。
二、卵子的发生
在女性,卵子发生于卵巢的上皮组织,由卵原cell 减数分裂形成,卵原cell 发生形成卵子的过程中,也经过增殖期,生长期及成熟期,卵原cell 经增殖期形成许多cell ,经生长期,形成初级卵母cell ,经成熟期先形成次级卵母cell ,最终形成卵子,卵子的发生与精子的发生虽然大致相同,但也有不同之处。
(1)在精子发生中,一个精原cell 最终形成四个精cell ,而在卵子发生中,由初级卵母cell 经减数第一次分裂形成一个次级卵母cell 和一个极体(polar body),极体的染色体组成也为22+X,但体积比次级卵母cell 小得多,其细胞质含量很少,不能正常发育,由次级卵母cell 再经减数第二次分裂形成一个卵cell 和一个极体:原来的第一极体经分裂形成2个第二极体,故一个卵原cell 在卵子发生中只形成一个成熟卵 cell 和三个极体。
(2)精子的发生是连续的,男性达到性成熟时,大量的精原cell 同时进行减数分裂,而且不停地进行,卵子的发生是不连续进行的,卵原cell 的增殖期在胚胎期进行,随着胚胎的发育,增殖产生的cell 大量退化,大约只留下400个左右的cell 经生长期成为初级卵母cell ,这400个初级卵母cell 在女性达到性成熟时能进入成熟期,但停止在减数第一次分裂的前期中的双线期,每月有一个初级卵母cell 发育形成次级卵母cell 停留在减数第二次分裂的中期,受精时,它才完成第二次分裂,形成卵cell ,若未受精,次级卵母cell 就不能完成减数分裂而死亡。
(3)精子的发生中具有变形期,由精原cell 形成的精cell 必须形成鞭毛等附属结构后才能变形形成精子,卵子的发生中不具有变形期,由卵原cell 形成的卵cell 可直接成为卵子。
人体精、卵发生的基本过程如下图:
人类的性别决定和性别分化
一、性别的决定
人类性别是由细胞中的性染色体所决定的。在人类的体细胞中有23对染色体,其中22对染色体与性别无直接关系,称为常染色体(autosome )。常染色体中的每对同源染色体的形态、结构和大小都基本相同;而另外一对与性别的决定有明显而直接关系的染色体,X 染色体和Y 染色体,称为性染色体(sex chromosome )。两个性染色体的形态、结构和大小都有明显的差别。X 染色体的长度介于C 组第6号和第7号染色体之间,而Y 染色体的大小与G 组第21号和22号染色体相当。男性的性染色体组成为XY ,而在女性细胞中的性染色体组成为XX ,即男性为异型性染色体,女性为同型性染色体。这种性别决定方式为XY 型性别决定。因此,在配子发生时,男性可以产生两种精子,含有X 染色体的X 型精子和含有Y 染色体的Y 型精子,两种精子的数目相等;而女性则由于细胞中有两条相同的X 染色体,因此,只能形成一种含有X 染色体的卵子。受精时,X 型精子与卵子结合,形成性染色体组成为XX 的受精卵,将来发育成为女性;而Y 型精子与卵子结合则形成性染色体组成为XY 的受精卵,发育成为男性。所以人类的性别使精子和卵子在受精的瞬间决定的,确切地说是由精子决定的。在自然状态下,不同的精子与卵子的结合是随机的,因此人类的男女比例大致保持1∶1。
很显然,性别决定实际上是由精子中带有的是X 染色体还是Y 染色体所决定的,而X 染色体和Y 染色体在人类性别决定中的作用并不相等。一个个体无论其有几条X 染色体,只要有Y 染色体就决定男性表型(睾丸女性化患者除外)。因为Y 染色体的短臂上有一个决定男性的基因,即睾丸决定因子(testis-determining factor,TDF )基因,TDF 基因是性别决定的关键基因。性染色体异常的个体,如核型为47,XXY 或48,XXXY 等,他们的表型是男性,但却是一个不正常的男性。没有Y 染色体的个体,其性腺发育基本上是女性特征,即使只有一条X 染色体如核型为45,X
的个体,其表型也是女性,但却是
一个表型异常的女性。
目前认为人类Y 染色体是由两个在遗传学上明显不同的部分组成,即拟常染色体区域和Y 特异区域所组成。拟常染色体区域位于X 和Y 染色体的短臂末端,是X 和Y 染色体的同源区,X 染色体和Y 染色体之间可以在拟常染色体区域重组,此区内的交换并不表现典型的连锁关系。通过重组分析可以绘制该区域的基因图。Y 特异区域在正常情况下不与X 染色体发生重组,在减数分裂中作为一个整体分离并编码几个基因,睾丸决定因子基因位于这个区域内,这些基因对性腺分化及男性生育能力是必需的。
1. 寻找性别决定基因
自从1922年Painter 等首先提出人类的性别决定机制为XX/XY,人们就开始寻找性别决定基因,但直到标准人类染色体分析方法建立以后,这项工作才得以进行。1959年人们发现45,X 的个体表现为女性,而47,XXY 的个体表现为男性,与正常男女性染色体组成相比,决定男性性别的是Y 染色体,因此认为性别决定基因在Y 染色体上。为进一步确定性别决定基因在Y 染色体上的位置,人们对不同Y 染色体畸变个体进行了分析,到1966年将性别决定基因定位于Y 染色体短臂上。在Y 染色体短臂末端是能与X 染色体配对的拟常染色体区,性别决定基因应该位于该区以下。1986年人们将拟常染色体区以下的Y 染色体短臂分为4个区,发现性别决定基因位于第1区。1987年又有人进一步将1区分为1A1、1A2、1B 和1C 4个区,并认为性别决定基因位于1A2区,并从该区分离出一个锌指蛋白基因(ZFY ),认为ZFY 基因为性别决定基因。但1989年人们发现性别决定基因不是位于1A2区的ZFY ,而是位于1A1区,在此区的35kb 片段中含有编码204个氨基酸的基因,命名为SRY (sex-related Y )。SRY 蛋白的第58-137个氨基酸为进化上高度保守的DNA 结合结构域,它与HMG (high mobility group )蛋白同源,该蛋白的功能是与DNA 结合激活基因转录。
2. 支持SRY 为性别决定基因的证据
第一,小鼠胚胎期性腺发育中Sry 基因的表达:在XY 小鼠胚胎发育中,Sry (小鼠Y 染色体上约14kb 的片段,与人类SRY 片段同源,但小鼠基因写作Sry )仅在第10.5天和12.5天之间表达。雄性小鼠的生殖腺发育也是在这短暂表达时间内启动的。
第二,Sry 转基因的XX 小鼠发育成雄性:将携带Y 染色体Sry 区域的14kb 的DNA 片段转入XX 小鼠胚泡后,这种携带Sry 基因的XX 小鼠发育成雄性。
第三,不同类型患者的SRY 基因分析:对XX 男性分析表明,这类患者带有SRY 基因;相反,XY 女性个体尽管具有Y 染色体,但并不具有SRY 基因或带有异常的SRY 基因。
二、性别的分化
性分化包括许多受遗传因素调节的发育步骤。性腺、生殖管道和外生殖器均从未分化的原始状态而来。在人类孕期第6周末,在胚胎的原基生殖细胞迁移形成初期未分化的性腺,此期的性腺可分为内部的髓质和外部的皮质。在存在正常的Y 染色体时,在性别决定基因的影响下,使原始性腺的髓质部分化成睾丸,
皮质部退化。睾丸的间质细胞产生的雄性激素使Wolffian 管及外生殖器原基分别分化为男性内生殖管道和外生殖器。睾丸的支持细胞分泌Mullerian 管抑制因子使Mullerian 管退化。如果不存在性别决定基因,原始性腺的髓质部退化,皮质部分化为卵巢。Mullerian 管和Wolffian 管因无雄激素和Mullerian 管抑制因子的作用,后者不分化,前者在雌激素的作用下分化成女性内生殖管道,原始外生殖器也分化为女性外生殖器。
有关名词
性状(character ):生物体的形态特征和生理特性统称为性状。
显性性状(dominant character):在杂合子状态下表现出来的性状。
隐性性状(recessive character):在杂合子状态下不表现的性状。
基因型(genotype ):个体的基因组成。
表现型(phenotype ):表现出来的形态特征和生理特性等,是基因型和环境相互作用的结果。
纯合子(homozygote ):带有两个相同等位基因的个体。
杂合子(heterozygote ):带有两个不同等位基因的个体。
显性基因(dominant gene):在杂合子状态下表现出特征的基因,用大写字母表示。
隐性基因(recessive gene):在杂合子状态下不表现特征的基因,用小写字母表示。
第六节 概率定理在遗传分析中的应用
有关名词
概率(probability ):也称机率,是指某一事件发生的可能性大小的度量。
必然事件:在一定条件下必然出现的现象叫必然事件。如“纯种的紫花豌豆,它们的后代一定是紫花”是必然事件。
不可能事件:在一定条件下必然不出现的现象叫不可能事件。如“纯种的紫花豌豆,它们的后代不是紫花”是不可能事件。
随机事件:在一定条件下可能出现也可能不出现的现象称为随机事件,可用A 、B 、C 等表示。如“杂种的紫花豌豆,其后代是紫花”是随机事件。
互斥事件:如果事件A 与事件B 不能同时发生,就叫做事件A 与事件B 互不相容或互斥。如豌豆豆粒颜色有“黄色”和“绿色”,一粒豌豆不能同时出现黄色与绿色,所以“黄色”与“绿色”是互斥事件
一、概率的基本定理
(一)加法定理
当一个事件出现时,另一个事件就被排除,这样的两个事件为互斥事件或交互事件。这种互斥事件出现的概率是它们各自概率的和。例如,肤色正常(A)对白化(a)是显性。一对夫妇的基因型都是Aa ,他们的孩子的基因型可能是:AA 、Aa 、aA 、aa ,概率都是1/4。然而这些基因型都是互斥事件,一个孩子是AA ,
就不可能同时又是其他。所以一个孩子表现型正常的概率是1/4(AA)+1/4(Aa)+1/4(aA)=3/4(AA或Aa 或aA) 。
(二)乘法定理
当一个事件的发生不影响另一事件的发生时,这样的两个独立事件同或相继出现的概率是它们各自出现概率的乘积。例如,生男孩和生女孩的概率都分别是1/2,由于第一胎不论生男还是生女都不会影响第二胎所生孩子的性别,因此属于两个独立事件。第一胎生女孩的概率是1/2,第二胎生女孩的概率也是1/2,那么两胎都生女孩的概率是1/2×1/2=1/4。
二、概率定理在遗传分析中的应用
豌豆子粒黄色(Y)对绿色(y)是显性,圆粒(R)对皱粒(r)是显性。控制两对相对性状的非等位基因是按自由组合定律遗传的。如果黄色圆粒豌豆甲(YyRr)和绿色圆粒豌豆乙(yyRr)杂交,问后代出现基因型YyRR 的概率是多少?
首先分析甲、乙产生配子的种类和概率。根据一对等位基因与另一对等位基因的分离是各自独立的,非等位基因是互不干扰地分配到配子中去的原理,甲产生含有Y 和y 配子的概率分别是1/2,产生含有R 和r 配子的概率也分别是1/2。又因为Y 和R 是同时出现在一个配子中的,因此,它们同时出现在配子中的概率是:1/2(Y)×1/2(R)=1/4(YR)。根据同样道理,甲可以产生4种配子,它们的概率分别是1/4 YR、1/4 Yr、1/4 yR和1/4 yr乙可以产生2种配子,它们的概率分别是1/2 yR和1/2 yr。由于甲、乙产生的配子结合是随机的独立事件,只有甲的YR 配子和乙的yR 配子结合才会得到基因型YyRR 的后代,因此,YyRR 基因型出现的概率是1/4(YR)×1/2(yR)=1/8(YyRR)。
此题也可以这样分析:先分别考虑基因型中的一对基因。单从豌豆的颜色考虑,甲和乙杂交后代的概率为:Yy×yy→1/2Yy、1/2yy单从豌豆的形状考虑,甲和乙杂交后代的概率为:Rr×Rr→1/4RR、1/4rr、1/2Rr。因此,甲和乙杂交,后代出现基因型YyRR 的概率为:1/4(Yy)×1/4(RR)=1/8(YyRR)。
课堂小结
1、细胞增殖周期中DNA 、染色质与染色体的行为:
(1)DNA、染色质和染色体的相互关系:染色体的四级结构模型(核小体→螺线管→超螺线管→染色单体)
(2)细胞分裂过程中染色体的行为:有丝分裂和减数分裂的基本过程。
2、人类的配子发生:
精子的发生过程。
卵子的发生过程。
精子发生和卵子发生的异同点:在精子发生中,一个精原cell 最终形成四个精cell ,而一个卵原cell 在卵子发生中只形成一个成熟卵cell 和三个极体;精子的发生是连续的,而卵子的发生是不连续的;精子的发生中具有变形期,而卵子的发生中不具有变形期。精卵发生中都具有增殖期,生长期和成熟期。
3、概率定理在遗传分析中的应用:
概率的基本定理(加法定理和乘法定理)、概率定理在遗传分析中的应用。
教材:《医学遗传学教程》(第二版) 王培林 傅松滨 主编
参考书:1. 《医学分子遗传学》卢大儒 主编。
2. 《遗传咨询(遗传病防治的关键问题)》刘权章 主编。
3. 《医学遗传学》陈竺 主编。
复习思考题
1. 说明DNA ,染色质和染色体之间的相互关系?
2. 比较说明有丝分裂与减数分裂的不同点?
3. 幼儿黑蒙性白痴是一种严重的精神病,属于常染色体隐性遗传.
(1)如果两个正常的双亲生了一个患此病的女儿和一个正常的儿子,那么这个儿子携带此隐性基因的几率是多少?
(2)这个儿子与正常女人结婚,他们生的第一个孩子患有此病,那么第二个孩子患有此病的几率是多少?
第二章 基因和染色体
教学目的:在掌握基因的概念,基因的类别,基因的结构和功能的基础上,学习细胞增殖周期中DNA 、染色质和染色体的行为,人类的配子发生和减数分裂。
教学要求:
1、掌握基因的概念、基因的分子结构。
2、掌握人类配子的发生过程和减数分裂过程中各时期的染色体变化特点,熟悉减数分裂的生物学意义。
3、熟悉DNA 、染色质和染色体的相互关系,熟悉细胞有丝分裂过程中染色体的行为。 重点:人类配子的发生过程。
难点:人类配子的发生过程。染色体的形成过程。减数分裂过程。
教学提纲:
1、掌握基因的概念、基因的分子结构。
2、掌握人类基因组的概念、分类、核基因组。熟悉线粒体基因组。
3、有丝分裂和减数分裂:
人类的配子发生:
(1) 精子的发生。
(2) 卵子的发生。
课前提问
1. 遗传性疾病有哪些特征?
2. 遗传病与先天性疾病或家族性疾病的联系和区别是怎样的?
基因(gene )是细胞内遗传物质的结构和功能单位,它以脱氧核糖核酸(deoxyribonucleic acid,DNA )化学形式存在于染色体上。在人类,基因通过生殖细胞从亲代向子代传递。早在1944年,A very 等用实验的方法就直接证明了DNA 是生物的遗传物质。1953年Watson 和Crick 在前人的工作基础上,提出了著名的DNA 分子双螺旋结构模型,奠定了基因复杂功能的结构基础。从此,遗传学的研究在医学领域取得了突飞猛进的发展。
人类对基因的认识经历了一个由浅入深的历史发展过程。早在19世纪60年代,奥地利神甫孟德尔就采用豌豆作为实验材料,进行了8年的杂交试验研究,提出生物的性状是由遗传因子(hereditary factor )
决定的,并总结出遗传因子传递的分离定律和自由组合定律。20世纪初丹麦遗传学家Johannsen 将遗传因子更名为基因(gene ),并一直沿用至今。随后美国遗传学家摩尔根及其学生Sturtevent 、Mü11er 等通过果蝇的杂交试验证实,基因在染色体上呈直线排列,并提出了基因传递的连锁交换定律,发表了著名的《基因论》;1927年Müller 等人证明用人为因素(如X 线等)可使基因发生突变;在此之前Garrod (1908)认为人类的黑尿酸症是一种遗传病,病因是患者缺乏某种相关生化反应的酶。于是人们开始将基因与酶联系起来。1936年Beadle 等对果蝇(Drosophila melanogaster )朱矽眼型、朱红眼型和野生型进行研究,再次证实了基因与酶的关系。1941年他们又根据对粗糙链抱霉(Neurospora crassa)的研究结果,提出了“一个基因决定一种酶”的学说;然而,后来的研究揭示,基因除了决定酶之外,还决定其他蛋白质,于是有人提出了“—个基因一种蛋白质”的假说。但人们又发现有的蛋白质可以由几条多肽链组成,因此又修正成“一个基因一条多肽链”假说;经过100余年的研究,基因的概念逐渐清晰。但直到20世纪50年代,人们对基因的认识还仅仅停留在逻辑概念阶段,关于基因的物质基础和理化本质的认识,仍然是一个谜。首次揭开这—谜底的是1944年A very 等人的工作,他们用实验方法直接证明了DNA 是生物的遗传物质。1953年Watson 和Crick 在前人的工作基础上,应用现代物理学和化学的新技术,对DNA 的分子结构进行了深入研究,提出了著名的DNA 分子双螺旋(double helix)结构模型。这个模型显示DNA 具有自我复制功能,正式揭示了遗传之谜。至此人们认识到,基因是具有特定“遗传效应”的DNA 片段、它决定细胞内RNA 和蛋白质(包括酶分子)等的合成,从而决定生物遗传性状。
现代遗传学认为,基因是决定一定功能产物的DNA 序列。这种功能产物主要是蛋白质和RNA 。一个基因的结构除了编码特定功能产物的DNA 序列外,还包括对这个特定产物表达所需的邻接DNA 序列。在对某些遗传病的家系研究中发现,虽然基因的编码部分结构完整未发生改变,但它的邻接DNA 序列发生了改变,如常见的邻接序列某些区域单个碱基的替换可使此功能产物不能表达,从而引起遗传病。
第一节 基因的结构和功能
研究证明,DNA 是生命体的遗传物质;但在某些仅含有RNA 和蛋白质的病毒,其RNA 是遗传物质。例如,烟草花叶病毒不含DNA ,仅含有一条单链的RNA 。实验证实,这条单链RNA 能感染宿主细胞,并繁殖后代。在整个生物界中,绝大部分生物(包括人类)基因的化学本质是DNA 。
一、DNA 的分子组成和结构
1.DNA 的分子组成
组成DNA 分子的基本单位是脱氧核苷酸。每个脱氧核苷酸由磷酸、脱氧核糖和含氮碱基组成。碱基有4种:腺嘌吟(A )、鸟嘌岭(G )、胞嘧啶(C )和胸腺嘧啶(T )。因碱基的不同,可以构成4种不同的脱氧核苷酸:脱氧腺嘌呤核苷酸(dAMP ,A )、脱氧鸟嘌呤核苷酸(dGMP ,G )、脱氧胞嘧啶核苷酸(dCMP ,
C )和脱氧胸腺嘧啶核苷酸(dTMP ,T )。这4种脱氧核苷酸按一定顺序排列起来构成脱氧多核苷酸长链(DNA
单链),两个相邻的脱氧核苷酸之间通过磷酸二酯键相连接。每条脱氧核苷酸单链都有3′端和5′端。生物的遗传性状是以脱氧核苷酸的排列序列来储存遗传信息的。因此,脱氧核苷酸的排列是DNA 遗传的核心。
2.DNA 的分子结构
Watson 和Crick (1953)提出了DNA 分子的双螺旋结构模型,阐明了DNA 空间结构的基本形式,要点如下:①DNA 由两条碱基互补的、反向平行排列的脱氧多核苷酸单链所组成,一条是5′→3′端,另一条是3′→5′端,碱基互补的方式是A 与T 或T 与A ,C 与G 或G 与C 相对应;②在自然情况下,绝大多数DNA 分子的两条互补链围绕一“主轴”向右盘旋形成双螺旋结构;③4种碱基(A 、T 、G 、C )的排列顺序在不同的DNA 分子中各不相同,储存着各种生物性状的遗传信息;④双螺旋的表面形成两条凹槽,一面宽而深,称之深沟;另一面狭而浅,称之浅沟。这两条沟,对于有特定功能的蛋白质(酶)识别并调节DNA 双螺旋结构上的遗传信息是非常重要的;⑤由于DNA 链通常很长,所包含的碱基数目很多,所以碱基排列顺序的组合方式是无限的,可以形成多种不同的DNA 分子。例如,某一DNA 分子有100个碱基对,因碱基排列组合的不同,就可以形成至少4100种DNA 分子。实际上,由于DNA 分子量巨大,所以其碱基对的排列方式可以说是多种多样,因而DNA 分子也是种类繁多。在如此众多结构复杂的DNA 分子内蕴藏着生物界无穷无尽的遗传信息,决定了形形色色、千姿百态的生命自然界。
二、人类基因和基因组的结构特点
人类基因组(genome )是人的所有遗传信息的总和。人类基因组包括两个相对独立而相互关联的基因组:核基因组与线粒体基因组。如果不特别注明,人类基因组通常是指核基因组(图1)。
(一)细胞核基因组
1. 基因的分类
随着人类基因组计划研究的深入和结构基因组学的基本完成,已知人类基因组共有2.6383(≈3)万~
3.9114(≈4)万个基因,比蚯蚓仅多1万个,比果蝇多2万个。另外,科学家还发现与蛋白质合成有关的基因序列只占整个基因组序列的2%。人类的基因或人类基因组中的功能序列可分为4大类,即单一基因、基因家族、拟基因和串联重复基因。
(1).单一基因 在人的基因中,25%~50%的蛋白质基因在单倍体基因组中只有一份,称为单一基因(solitary gene)或单一序列(unique sequence)。
(2).基因家族 从已克隆的许多基因它们都不完全是单拷贝,有的是重复的多拷贝,这一部分基因属于两个或更多个相似基因的家族,称为基因家族(gene family),类同的蛋白质则组成蛋白质家族(protein
A family ),其蛋白质成员由数个到数十个,个别的可达数百。β珠蛋白基因家族包括5个功能基因:β、δ、γ、
G γ和ε,它们分别在生活史的不同阶段表达,具有不尽相同的功能。细胞骨架蛋白、肌动蛋白、微管蛋白、中间纤丝等也形成不同的蛋白质家族,可能对同一个体的不同细胞类型,呈现差别性表达,以合理搭配,
发挥其生理作用。
(3).假基因 在人的β珠蛋白基因家族中至少有两个区的序列ψβl 和ψβ2与有功能的β珠蛋白基因相似,但是它没有相应的蛋白质产生,为拟基因或假基因(pseudogene )。拟基因是一种畸变基因,即核苷酸序列同有功能的正常基因有很大的同源性,但由于突变、缺失或插入以致不能表达,所以没有功能。
(4).串联重复基因 45SrRNA 、5SrRNA 、各种tRNA 基因以及蛋白质家族中的组蛋白基因是呈串联重复排列的,这类基因叫做串联重复基因(tandemly repeated genes)。它们不同于成倍基因,编码了同一种或近乎同一种的RNA 或蛋白质,rRNA 、tRNA 基因的每个拷贝完全或几乎完全相同,但在基因间的间隔DNA (linker DNA)相差很大。组蛋白基因家族较复杂,但每种组蛋白基因的拷贝完全相同。
2. 断裂基因
真核生物的结构基因是断裂基因(图2),由编码的外显子和非编码的内含子组成,二者相间排列。不同基因所含内含子数目和大小也不同,例如,导致杜氏肌营养不良症(Duchenne muscular dystrophy,DMD )基因(dystrophin 基因)全长2.5Mb ,是目前已知人类最大的基因,大约由80个外显子和相应的内含子组成,cDNA 全长为11000bp ,编码分子量为427000的蛋白质,从dystrophin 转录形成一条完整的mRNA 分子需要16小时。
图2 断裂基因的结构及其表达
断裂基因中的内含子和外显子的关系不完全是固定不变的,有时会出现这样的情况,即在同一条DNA 分子上的某一段DNA 顺序,在作为编码某一条多肽链的基因时是外显子,但是它作为编码另一条多肽链的基因时是内含子,这是由于mRNA 剪接加工的方式不同所致。结果使同一个基因(确切地说是同一段DNA 顺序)产生两条或者两条以上的mRNA 链。这在真核生物基因的表达中,由于一个基因的内含子成为另一个基因的外显子,产生基因的差别表达,而构成了断裂基因结构上一个重要特点。每个断裂基因中第一个外显子的上游和最末一个外显子的下游,都有一段不被转录的非编码区,称为侧翼顺序。
断裂基因结构中外显子-内含子的接头区是一高度保守的一致顺序,称为外显子-内含子接头。这是形成断裂基因结构上又一个重要特点。每一个内含子的两端具有广泛的同源性和互补性,5′端起始的两个碱基是GT ,3′端最后的两个碱基是AG ,通常把这种接头形式叫做GT-AG 法则(GT-AG rule )。这两个序列是高度保守的,在各种真核生物基因的内含子中均相同。
3. 基因组的组成
人类基因组按DNA 序列分类既有单拷贝序列,也有重复频率不等的多拷贝序列。
(1). 单拷贝序列
又称非重复序列。在基因组中仅有单一拷贝或少数几个拷贝,单拷贝序列的长度在800bp ~1000bp 之间,其中有些是编码细胞中各种蛋白质和酶的结构基因。单拷贝或低拷贝DNA 序列可占到人类基因组的60%~70%。
(2). 重复多拷贝序列
重复多拷贝序列有的较短,有的较长,分散地穿插于整个基因组,这些重复DNA 是通过变性、复性实验而被发现的,重复DNA 的复性速度较非重复DNA 快。根据复性的速度,又可分为简单序列DNA 和中度重复DNA 。
a .简单序列DNA 简单序列DNA (simple-sequence DNA)以5bp 、10bp 或20bp 、200bp 为一个重复单位,它们串联重复很多次,约占整个基因组的10%~15%,大多数重复次数多(高度重复),长度可达105bp ,即为简单序列DNA 或卫星DNA (satellite DNA)。通过原位分子杂交检测,已知简单序列的DNA 大多数位于染色体的着丝粒或染色体的臂和端粒区,进一步研究证明是位于染色体的异染色质区。
由15bp ~100bp 组成的重复单位(常富含GC ),重复20~50次形成的lkb ~5kb 的短DNA ,叫做小卫星DNA (minisateliite DNA),又叫做可变数目串联重复(variable number of tandem repeats,VNTR ),比上述的卫星DNA (10bp )短。而在基因组的间隔序列和内含子等非编码区内,广泛存在着与小卫星DNA 相似的一类小重复单位,重复序列为lbp ~6bp ,称为微卫星DNA (microsatellite DNA)或STR ,如(A )n /(T )n 、(CA )n /(TG )n 、(CT )n 、(AG )n 等。由于这些微卫星DNA 区域在人类基因组中出现的数目和频率不同,表现为多态性,为人类遗传分析提供了大量的多态遗传标志,其多态信息量大于RFLPs ,可用于基因定位、群体进化以及基因诊断等研究。近年来在脆性X 染色体综合征、脊髓小脑性共济失调等疾病中发现微卫星DNA 如(CAG )n 、(CTG )n 等的不稳定性,往往发生三核苷酸重复扩增突变。
b .中度重复DNA 和可动DNA 因子 中度重复DNA (intermediate repeat DNA )是以不同的量分布于整个基因组的不同部位。这些间隔的DNA 长度可短至100bp ~500bp ,称为短分散元件(short interspersed element ),也可长达6000bp ~7000bp ,称为长分散元件(long interspersed element),占整个基因组的25%~40%。
Alu 家族(Alu family)是短分散元件典型的例子,是人类基因组含量最丰富的中度重复顺序,占基因组总DNA 含量的3%~6%,长达300bp ,在一个基因组中重复30万~50万次。在Alu 序列内含有一个限制性内切酶Alu Ⅰ的特异性识别位点AGCT ,因此这一序列称为Alu 序列,它可被Alu Ⅰ酶裂解为一个170bp 和130bp 的两个片段。研究表明神经母细胞纤维瘤发生是由于NF1抑癌基因突变所致,发现一患者的1对NF1等位基因之一有一新的Alu 序列,使这一NF1基因失活,当另一个NF1基因发生突变后,遂造成肿瘤的发生。某些隐性遗传病也是由于Alu 序列插入到外显子中,致使蛋白质编码区的结构改变,出现临床症状。 5
Kpn Ⅰ家族(Kpn Ⅰ family )是长分散元件的典型例子,是中度重复顺序中仅次于Alu 家族的第二大家族,用限制性内切酶Kpn Ⅰ消化,可分解成四个长度不等的片段,分别是1.2、1.5、1.8和1.9kb ,即所谓的Kpn Ⅰ家族,形成6.5kb 的中度重复顺序,拷贝数为3000~4800个。Kpn Ⅰ家族成员顺序比Alu 家族长,散在分布,约占人体基因组的3%~6%。其功能不清。
三、结构基因的分子结构与特点
大多数真核生物基因的编码序列不是连续排列的,被非编码序列隔开,因此,称为断裂基因(split gene)。
(一)外显子(exon )与内含子(intron )
1. 外显子: 出现在成熟mRNA 中的基因序列,外显子序列可以是编码氨基酸的编码序列,也可以是非编码序列,如存在于起始密码之前和终止密码之后的外显子序列,这些序列出现在成熟mRNA 中,但并不编码氨基酸,所以称为非翻译区(untranslated region ,UTR ),在基因3’端非翻译区内存在RNA 加尾信号,其序列为5’-AA TAAA-3’。
2. 内含子: 位于两外显子之间的序列。
3. 外显子内含子接头序列: 在外显子与内含子接头有一段高度保守的序列,是RNA 剪接的信号,称为接头序列。每个内含子的5’端以GT 开始,在3’端以AG 结束,所以又称为GT-AG 法则。
(二)侧翼序列(flanking sequences)
在基因的两侧不被转录的非编码序列,这些序列在转录调控中起重要作用。它们包括位于转录起始点上游的启动子序列、位于转录终止点下游的终止子序列和位置不固定的转录调控序列,如增强子、终止子等。
1. 启动子(promoters ): 是一段特异的核苷酸序列,通常位于基因转录起始点上游的100bp 范围,是RNA 聚合酶的结合部位,能启动和促进转录过程。启动子决定了双链DNA 中的转录链,常见序列有:
(1)T AT A 框(T AT A box): 位于转录起始点上游大约-20~-30bp 处,是高度保守的一段序列,由7个碱基组成,即TA TAA (T )AA (T ),其中只有两个碱基可以有变化。TA TA 框能够与转录因子TF Ⅱ结合,再与RNA 聚合酶Ⅱ形成复合物,从而准确地识别转录的起始位置,对于转录水平有着定量效应。
(2)CAAT 框(CAAT box ): 位于转录起始点上游-70~-80bp ,也是一段保守序列,由9个碱基组成,其序列为GGC (T )CAA TCA ,其中只有一个碱基可以变化。转录因子CTF 能够识别CAA T 框并且与之结合,其C 端有着激活转录的功能。所以CAA T 框有促进转录的功能。
(3)GC 框(GC box): 其顺序为GGCGGG ,有两个拷贝,位于CAA T 框两侧。转录因子Sp1能识别GC 框并且与之结合,其N 端有激活转录的作用。所以,GC 框有激活转录的功能。
2. 增强子(enhancer ): 增强子能增强启动子发动转录的作用,从而明显地提高基因转录的效率。增强子的位置不固定,可以位于启动子上游,也可以位于启动子下游,可以距离启动子很远,也可以距离启动子较近。
3. 终止子(terminator ): 终止子为反向重复序列,是RNA 聚合酶停止工作的信号,反向重复序列转录后,可以形成发夹式结构,并且形成一串U 。发夹式结构阻碍了RNA 聚合酶的移动,一串U 的U 与DNA 模板中的A 结合不稳定,从模板上脱落下来,转录终止。
综上所述,人类基因结构如图5所示:
四、人类基因组计划
“人类基因组计划(human genome project ,HGP )”是20世纪90年代初开始的全球范围的全面研究人类基因组的重大科学项目。HGP 是美国科学家在1985年率先提出的,旨在阐明人类基因组DNA 3.2×109核苷酸的序列,发现所有人类基因并阐明其在染色体上的位置,破译人类全部遗传信息,使得人类第一次在分子水平上全面地认识自我。
HGP 的整体目标是阐明人类遗传信息的组成和表达,为人类遗传多样性的研究提供基本数据,揭示1万余种人类单基因异常(有临床意义的约计6000种)和上百种严重危害人类健康的多基因病(例如冠心病、高血压、糖尿病、恶性肿瘤、自身免疫性疾病等)的致病基因或者疾病易感基因,建立对各种基因病新的诊治方法,从而推动整个生命科学和医学领域发展。HGP 的基本任务是建立人类基因组的结构图谱,即遗传图、物理图、转录图与序列图,并在“制图-测序”的基础上鉴定人类的基因,绘出人类的基因图。
从基因组学的范畴来说,1990年~2003年HGP 的重点在于研究人类基因组的结构,属于基因组学的最基础的结构基因组学(structural genomics)的研究。HGP 的科学意义是奠定了阐明人类所有基因功能的功能基因组学(functional genomics)研究的基础。
(一)结构基因组学
结构基因组学主要包括四张图,即遗传图、物理图、转录图与序列图的制作。
1. 遗传图
遗传图(genetic map)又称“连锁图(linkage map)”。它是以具有遗传多态性的遗传标志作为“位标”,以遗传学距离为“图距”的基因组图。连锁遗传的基因彼此之间距离较近,独立遗传的基因相距甚远。遗传标志之间是否存在连锁与其相对位置和遗传距离有关。遗传学距离以厘摩(centi-Morgan ,cM )表示。两个基因在精卵形成时的染色体交换中分离的几率为1%时,其间距为1cM ,相当于10bp (1Mb )。随着人类基因组计划的研究和认识的深入,作为DNA 的遗传标志也经历了从粗到细的转变过程,即从第一代
6
标志限制性片段长度多态性(restriction fragment length polymorphism,RFLP )、第二代标志短串联重复(short tandem repeat,STR )到第三代标志单个核苷酸多态性(single nucleotide polymorphism,SNP )的发展,两个标志之间的平均距离为0.7cM ,即两个位点之间有0.7%的机率进行遗传重组。人类基因组的遗传距离大小为3600cM 。由于所有“遗传多态性”的分子基础都是核苷酸的差异,在理论上,SNP 有可能在核苷酸水平上,把“序列图”、“物理图”与“遗传图”最终有机地整合、统一起来。
2. 物理图
物理图(physical map)是以一段已知核苷酸序列的DNA 片段,称为序列标记部位(sequence tagged site,STS )为“位标”,以bp 、kb 和Mb 作为图距的基因组图。物理图的基本原理是把庞大的无从下手的人类基因组先“敲碎”,再拼接,以便既能随意研究又能清楚地知道研究内容所处的染色体位置。
3. 转录图
转录图(transcription map )将最终成为基因图,就是在人类基因组中鉴别出占据2%长度的全部基因的位置、结构与功能。现已确定,人类有3万~4万个蛋白编码基因。在每一种细胞中,编码蛋白质序列仅有10%左右专一表达。如果获得了mRNA (或cDNA )序列,就获得了基因功能的主要部分。cDNA 片段称为表达序列标记(expressed sequence tag,EST )或“表达序列”图,即人类的“基因图”的雏形。现阶段,转录图与EST 还有多方面的现实意义:①它能为估计人类基因的数目提供较为可靠的依据;②它提供的不同组织(空间)、不同发育阶段(时间)的基因表达的数目、种类及结构,特别是序列的信息;③提供了鉴定基因的探针,以EST 就可从“全长cDNA 文库”到全长cDNA ,再进而从不同“基因组文库”中筛选全长的基因;④本身就有直接的经济价值,如作为基因诊断的探针。
4. 序列图
序列图(sequence map)人类基因组的核苷酸序列图也就是分子水平的最高层次的、最详尽的物理图。测定的总长度约为1米,由30多亿核苷酸组成的序列图是人类基因组计划中最为明确、最为艰巨的定量、定质(准确性)、定时的任务。
(二)后基因组时代
随着HGP 遗传图、物理图、转录图与序列图等结构基因组学任务的基本完成,科学家们又启动了后基因组计划(post-genome era)。它主要研究基因组的功能,即功能基因组学。
功能基因组学就是在基因组的层次上,研究基因的表达、调控与功能。人类基因图的雏形“转录图”是最初步的人类基因组功能图。基因的转录具有组织、发育阶段的特异性,并受所有生理、病理及环境因素的调节。因此,转录图除了提供基因序列的结构信息外,还提供了该基因表达的组织、发育阶段、生理状况的信息。绘制人类基因组的一张三维的“转录图”或称“基因表达图”,反映某一基因在不同发育阶段、不同组织中不同水平的表达,反映某一组织中不同时间,不同基因的不同水平的表达,以及在某一生长、发育阶段在不同组织中不同基因的不同水平的表达。
后基因组计划还包括人类基因组多样性计划、比较基因组学、工业基因组学、药物基因组学、疾病基因组学以及蛋白质组学等方面。
人类基因组多样性计划(human genome diversity project,HGDP )是研究各人群的基因组,比较不同人种、民族、族群(ethnic group)基因组的差异,探讨人类进化的历史,研究不同人群间对疾病的易感性和抗性上的差异,为预防医学提供基础。
比较基因组学(comparative genomics )是指在基因组的层次上,比较不同基因组之间的异同。“人类基因组计划”的启动意味着比较基因组的问世。致病基因的鉴定、肿瘤“表达图”的构建,及不同组织、不同时间的“基因图”的构建,都已属于比较基因组的范畴。而“人类基因组计划”中的“模式动物”基因组研究,更是比较基因组学的重要内容。基因组学在人类基因组研究中的成功,使它很快进入了所有其他生物基因组的研究。“人类基因组计划”的四大模式生物:酵母、线虫、果蝇、小鼠,在人类基因组研究与人类基因鉴定中已发挥了重要的作用。
工业基因组学(industrial genomics)将是本世纪的支柱工业之一,是研究基因组学的工业应用的学科。随着人类及其他生物基因组学研究的进展,它的前景已展现在人们面前。作为动物反应器来生产人类生物制品的转基因猪、牛、鸡都已问世。能够提供人体器官的转基因动物已在实验室进行尝试。在基因组层次上改良原有的遗传结构来培育新的动、植物品种也已取得可喜的进展。可以预料,在本世纪里,新的食品、药品将越来越多地打上基因组学的印记。
药物基因组学(pharmacogenomics )是研究药物人体作用的遗传分布,以满足临床需要。遗传多样性对个体差异,临床症状的长短、费用和临床治疗的疗效等有决定因素,全基因组扫描可以用来寻找这些遗传多态性。得到影响药物作用的多态性后,可以优化药物设计和发现新化合物等。应用大规模系统研究基因组以加速发现对药物反应的标记,标记包括作用到药物目标、药物代谢或疾病通路上。
疾病基因组学(morbid genomics)主要任务是分离重要疾病的致病基因与相关基因,以及确定其发病机制。我国许多疾病的发生可能与西方人群可能存在一定的差别。以肿瘤为例,中国人肝癌、鼻咽癌、食管癌的发生率明显高于西方;又如,中国人1型糖尿病发生率明显低于西方。对这些差别的分析表明,除环境因素之外,遗传因素也有重要的作用。近年来,心血管病、糖尿病、老年痴呆症、精神分裂症等多基因疾病的发生率在中国不断增高,在大城市已接近西方国家水平。利用这些疾病遗传资源,分离在我国发生率高、危害性大的重要疾病的致病基因或相关易感基因将是今后医学研究的重点。
蛋白质组学(proteomics )研究细胞或组织中基因组所表达的全部蛋白质,尤其是不同生命时期,或正常、或疾病或给药前后的全部蛋白质的变化。
后基因组研究的进展将为医学发展提供的线索和机遇,从基因表达谱的变化、细胞内信号转导过程异常等角度认识疾病将是医学发展中的重要变化。后基因组研究将对各种疾病的发生机制做出最终的解释,也将在各个层次和水平上为疾病的诊治提供新的线索。
第三节 染色质和染色体
一、DNA 、染色质和染色体的相互关系
(一)染色质类型
细胞核内能被碱性染料染色的物质,称为染色质(chromatin )。染色质可以分为常染色质(euchromatin )和异染色质(heterochromatin )两大类:常染色质呈较松散状态,它们均匀地分布在整个细胞核内,染色较浅,具有转录活性;异染色质在整个细胞周期都处于高度螺旋化状态,在细胞核中形成染色较深的团块,存在于异染色质中的基因是没有转录活性的。在人类有两类异染色质,一类是兼性异染色质(facultative heterochromatin ),另一类为结构异染色质(constitutive heterochromatin)。兼性异染色质又称功能性异染色质,在特定细胞或在特定发育阶段呈凝缩状态而失去功能,在另一发育阶段时又呈松散状态而恢复功能,如X 染色质。结构异染色质总是呈凝缩状态,所含DNA 一般为高度重复序列,没有转录活性,常见于着丝粒、端粒区、Y 染色体长臂远端2/3区段和次缢痕区等。
(二)染色质组成
染色质由DNA 、组蛋白(histone )、非组蛋白和少量RNA 组成。DNA 与组蛋白的重量比比较稳定,接近于1∶1,非组蛋白的种类及含量随不同细胞而异。
组蛋白为碱性蛋白,含有大量的碱性氨基酸。组成人类染色质的组蛋白共有5种,分别称为H1、H2A 、H2B 、H3和H4,它们在进化中高度保守。组蛋白的功能与染色质的结构构成有关。
(三)染色质结构
染色质是间期核中遗传物质的存在形式,由许
多重复的结构单位组成,这些结构单位称为核小体
(nucleosome )。核小体是由一条DNA 双链分子串
联起来,形似一串念珠。每个核小体分为核心部和
连接区二部分。核心部是由组蛋白H2A 、H2B 、H3
和H4各二个分子形成的组蛋白八聚体及围绕在八
聚体周围的DNA 组成,这段DNA 约146bp ,绕八
聚体外围1.75圈。两个核心部之间的DNA 链称为
连接区。这段DNA 的长度变异较大,组蛋白H1位
于连接区DNA 表面。
(四)核小体包装成染色质与染色体
由直径为2nm 的双链DNA 分子形成直径为10nm 核小体细丝后,DNA 的长度已压缩了7倍。核小体进一步螺旋化,形成外径为30nm 的染色质纤维(螺线管),其长度为DNA 的1/42。当细胞进入分裂期,染色质进一步螺旋折叠,形成染色体。中期染色体长度约为DNA 长度的10-5。
第四节 细胞增殖
(一)有丝分裂(mitosis )
有丝分裂是体细胞增殖方式,分为
间期和分裂期,分裂期又分为前、中、
后和末四个时期。在细胞周期中染色体
发生一系列变化:在间期,DNA 进行复
制,进入分裂期染色质螺旋折叠形成染
色体,在中期染色体由两条姊妹染色单
体构成,两条姊妹染色单体以着丝粒相
连;进入分裂后期,每条染色体的着丝
粒纵裂,染色单体分开,分别移向两极。
因此,经过一次有丝分裂过程,DNA 复制一次,细胞分裂一次,染色体也分裂一次,并平均分配到两个子细胞中。这样保证了新的子细胞具有与母细胞相同的全套遗传物质,从而保证了所有细胞的染色体数目恒定。
(二)减数分裂(meiosis )
生殖细胞发生过程中的一种特殊分
裂方式,DNA 复制一次,细胞连续分裂
两次,因此,由一个细胞形成4个子细
胞,子细胞的遗传物质是母细胞的一半。
减数分裂由两次连续分裂构成:
1、减数分裂I :在第一次减数分裂的间
期,DNA 进行复制;第一次减数分裂前
期非常复杂,分细线期、偶线期、粗线
期、双线期和终变期。在偶线期同源染
色体进行配对,同源染色体配对的结果,
每对染色体形成一个紧密相伴的二价
体,在人类细胞中形成23个二价体;每
个二价体都是由两条同源染色体组成,每一同源染色体含两条复制而来的姐妹染色单体,两条姐妹染色单体由着丝粒相连。这样,每个二价体由四条染色单体组成,称为四分体。在粗线期,同源染色体间的非姐妹染色单体发生片段交换(crossing-over );在第一次减数分裂后期,二价体中的两条同源染色体彼此分开,分别向两极移动。每一极只获得每对同源染色体的一条。每条同源染色体由两条姐妹染色单体组成。
2、减数分裂II :间期很短,不进行DNA 复制,在第二次减数分裂中期,着丝粒纵裂,两条姊妹染色单体分开,分别移向细胞两极。
第五节 生殖细胞的发生
一、精子的发生
在男性,精子发生于睾丸曲细精管的生精上皮cell ,由生精上皮cell 中的精原cell 经减数分裂而成,精原cell 相当于体cell ,故在精原cell 经减数分裂而成,精砂cell 相当于体cell ,故在精原cell 中具有44条常染色体及2条性染色体;即XY ,精原cell 经增殖期(即有丝分裂期)增殖形成许多与其遗传组成一致的cell ,这些cell 经生长期,体积增大,cell 中胞质成分增加,形成初级精母cell ,初级精母cell 的染色体组成与精原cell 一致,具有44条常染色体及2条性染色体XY ,由初级精母cell 经成熟期(减数分裂期)最终形成精cell ,在成熟期中,首先初级精母cell 在分裂间期DNA 复制一次,经过减数分裂中的第一次分裂,形成2个cell ,称为次级精母cell ,次级精母cell 中染色体减半,一个次级精母cell ,次级精母cell 中染色体减半,一个次级精母cell 中具有22条常染色体和一条X 染色体,每一个次级精母cell 再经减数分裂第二次分裂,各形成二个cell ,即总共4个cell ,为精cell ,精cell 的染色体组成与次级精母cell 一致,二个精cell 为22+X,二个精cell 为22+Y,精cell 经变形时,形成鞭毛等附属结构,形成精子。
二、卵子的发生
在女性,卵子发生于卵巢的上皮组织,由卵原cell 减数分裂形成,卵原cell 发生形成卵子的过程中,也经过增殖期,生长期及成熟期,卵原cell 经增殖期形成许多cell ,经生长期,形成初级卵母cell ,经成熟期先形成次级卵母cell ,最终形成卵子,卵子的发生与精子的发生虽然大致相同,但也有不同之处。
(1)在精子发生中,一个精原cell 最终形成四个精cell ,而在卵子发生中,由初级卵母cell 经减数第一次分裂形成一个次级卵母cell 和一个极体(polar body),极体的染色体组成也为22+X,但体积比次级卵母cell 小得多,其细胞质含量很少,不能正常发育,由次级卵母cell 再经减数第二次分裂形成一个卵cell 和一个极体:原来的第一极体经分裂形成2个第二极体,故一个卵原cell 在卵子发生中只形成一个成熟卵 cell 和三个极体。
(2)精子的发生是连续的,男性达到性成熟时,大量的精原cell 同时进行减数分裂,而且不停地进行,卵子的发生是不连续进行的,卵原cell 的增殖期在胚胎期进行,随着胚胎的发育,增殖产生的cell 大量退化,大约只留下400个左右的cell 经生长期成为初级卵母cell ,这400个初级卵母cell 在女性达到性成熟时能进入成熟期,但停止在减数第一次分裂的前期中的双线期,每月有一个初级卵母cell 发育形成次级卵母cell 停留在减数第二次分裂的中期,受精时,它才完成第二次分裂,形成卵cell ,若未受精,次级卵母cell 就不能完成减数分裂而死亡。
(3)精子的发生中具有变形期,由精原cell 形成的精cell 必须形成鞭毛等附属结构后才能变形形成精子,卵子的发生中不具有变形期,由卵原cell 形成的卵cell 可直接成为卵子。
人体精、卵发生的基本过程如下图:
人类的性别决定和性别分化
一、性别的决定
人类性别是由细胞中的性染色体所决定的。在人类的体细胞中有23对染色体,其中22对染色体与性别无直接关系,称为常染色体(autosome )。常染色体中的每对同源染色体的形态、结构和大小都基本相同;而另外一对与性别的决定有明显而直接关系的染色体,X 染色体和Y 染色体,称为性染色体(sex chromosome )。两个性染色体的形态、结构和大小都有明显的差别。X 染色体的长度介于C 组第6号和第7号染色体之间,而Y 染色体的大小与G 组第21号和22号染色体相当。男性的性染色体组成为XY ,而在女性细胞中的性染色体组成为XX ,即男性为异型性染色体,女性为同型性染色体。这种性别决定方式为XY 型性别决定。因此,在配子发生时,男性可以产生两种精子,含有X 染色体的X 型精子和含有Y 染色体的Y 型精子,两种精子的数目相等;而女性则由于细胞中有两条相同的X 染色体,因此,只能形成一种含有X 染色体的卵子。受精时,X 型精子与卵子结合,形成性染色体组成为XX 的受精卵,将来发育成为女性;而Y 型精子与卵子结合则形成性染色体组成为XY 的受精卵,发育成为男性。所以人类的性别使精子和卵子在受精的瞬间决定的,确切地说是由精子决定的。在自然状态下,不同的精子与卵子的结合是随机的,因此人类的男女比例大致保持1∶1。
很显然,性别决定实际上是由精子中带有的是X 染色体还是Y 染色体所决定的,而X 染色体和Y 染色体在人类性别决定中的作用并不相等。一个个体无论其有几条X 染色体,只要有Y 染色体就决定男性表型(睾丸女性化患者除外)。因为Y 染色体的短臂上有一个决定男性的基因,即睾丸决定因子(testis-determining factor,TDF )基因,TDF 基因是性别决定的关键基因。性染色体异常的个体,如核型为47,XXY 或48,XXXY 等,他们的表型是男性,但却是一个不正常的男性。没有Y 染色体的个体,其性腺发育基本上是女性特征,即使只有一条X 染色体如核型为45,X
的个体,其表型也是女性,但却是
一个表型异常的女性。
目前认为人类Y 染色体是由两个在遗传学上明显不同的部分组成,即拟常染色体区域和Y 特异区域所组成。拟常染色体区域位于X 和Y 染色体的短臂末端,是X 和Y 染色体的同源区,X 染色体和Y 染色体之间可以在拟常染色体区域重组,此区内的交换并不表现典型的连锁关系。通过重组分析可以绘制该区域的基因图。Y 特异区域在正常情况下不与X 染色体发生重组,在减数分裂中作为一个整体分离并编码几个基因,睾丸决定因子基因位于这个区域内,这些基因对性腺分化及男性生育能力是必需的。
1. 寻找性别决定基因
自从1922年Painter 等首先提出人类的性别决定机制为XX/XY,人们就开始寻找性别决定基因,但直到标准人类染色体分析方法建立以后,这项工作才得以进行。1959年人们发现45,X 的个体表现为女性,而47,XXY 的个体表现为男性,与正常男女性染色体组成相比,决定男性性别的是Y 染色体,因此认为性别决定基因在Y 染色体上。为进一步确定性别决定基因在Y 染色体上的位置,人们对不同Y 染色体畸变个体进行了分析,到1966年将性别决定基因定位于Y 染色体短臂上。在Y 染色体短臂末端是能与X 染色体配对的拟常染色体区,性别决定基因应该位于该区以下。1986年人们将拟常染色体区以下的Y 染色体短臂分为4个区,发现性别决定基因位于第1区。1987年又有人进一步将1区分为1A1、1A2、1B 和1C 4个区,并认为性别决定基因位于1A2区,并从该区分离出一个锌指蛋白基因(ZFY ),认为ZFY 基因为性别决定基因。但1989年人们发现性别决定基因不是位于1A2区的ZFY ,而是位于1A1区,在此区的35kb 片段中含有编码204个氨基酸的基因,命名为SRY (sex-related Y )。SRY 蛋白的第58-137个氨基酸为进化上高度保守的DNA 结合结构域,它与HMG (high mobility group )蛋白同源,该蛋白的功能是与DNA 结合激活基因转录。
2. 支持SRY 为性别决定基因的证据
第一,小鼠胚胎期性腺发育中Sry 基因的表达:在XY 小鼠胚胎发育中,Sry (小鼠Y 染色体上约14kb 的片段,与人类SRY 片段同源,但小鼠基因写作Sry )仅在第10.5天和12.5天之间表达。雄性小鼠的生殖腺发育也是在这短暂表达时间内启动的。
第二,Sry 转基因的XX 小鼠发育成雄性:将携带Y 染色体Sry 区域的14kb 的DNA 片段转入XX 小鼠胚泡后,这种携带Sry 基因的XX 小鼠发育成雄性。
第三,不同类型患者的SRY 基因分析:对XX 男性分析表明,这类患者带有SRY 基因;相反,XY 女性个体尽管具有Y 染色体,但并不具有SRY 基因或带有异常的SRY 基因。
二、性别的分化
性分化包括许多受遗传因素调节的发育步骤。性腺、生殖管道和外生殖器均从未分化的原始状态而来。在人类孕期第6周末,在胚胎的原基生殖细胞迁移形成初期未分化的性腺,此期的性腺可分为内部的髓质和外部的皮质。在存在正常的Y 染色体时,在性别决定基因的影响下,使原始性腺的髓质部分化成睾丸,
皮质部退化。睾丸的间质细胞产生的雄性激素使Wolffian 管及外生殖器原基分别分化为男性内生殖管道和外生殖器。睾丸的支持细胞分泌Mullerian 管抑制因子使Mullerian 管退化。如果不存在性别决定基因,原始性腺的髓质部退化,皮质部分化为卵巢。Mullerian 管和Wolffian 管因无雄激素和Mullerian 管抑制因子的作用,后者不分化,前者在雌激素的作用下分化成女性内生殖管道,原始外生殖器也分化为女性外生殖器。
有关名词
性状(character ):生物体的形态特征和生理特性统称为性状。
显性性状(dominant character):在杂合子状态下表现出来的性状。
隐性性状(recessive character):在杂合子状态下不表现的性状。
基因型(genotype ):个体的基因组成。
表现型(phenotype ):表现出来的形态特征和生理特性等,是基因型和环境相互作用的结果。
纯合子(homozygote ):带有两个相同等位基因的个体。
杂合子(heterozygote ):带有两个不同等位基因的个体。
显性基因(dominant gene):在杂合子状态下表现出特征的基因,用大写字母表示。
隐性基因(recessive gene):在杂合子状态下不表现特征的基因,用小写字母表示。
第六节 概率定理在遗传分析中的应用
有关名词
概率(probability ):也称机率,是指某一事件发生的可能性大小的度量。
必然事件:在一定条件下必然出现的现象叫必然事件。如“纯种的紫花豌豆,它们的后代一定是紫花”是必然事件。
不可能事件:在一定条件下必然不出现的现象叫不可能事件。如“纯种的紫花豌豆,它们的后代不是紫花”是不可能事件。
随机事件:在一定条件下可能出现也可能不出现的现象称为随机事件,可用A 、B 、C 等表示。如“杂种的紫花豌豆,其后代是紫花”是随机事件。
互斥事件:如果事件A 与事件B 不能同时发生,就叫做事件A 与事件B 互不相容或互斥。如豌豆豆粒颜色有“黄色”和“绿色”,一粒豌豆不能同时出现黄色与绿色,所以“黄色”与“绿色”是互斥事件
一、概率的基本定理
(一)加法定理
当一个事件出现时,另一个事件就被排除,这样的两个事件为互斥事件或交互事件。这种互斥事件出现的概率是它们各自概率的和。例如,肤色正常(A)对白化(a)是显性。一对夫妇的基因型都是Aa ,他们的孩子的基因型可能是:AA 、Aa 、aA 、aa ,概率都是1/4。然而这些基因型都是互斥事件,一个孩子是AA ,
就不可能同时又是其他。所以一个孩子表现型正常的概率是1/4(AA)+1/4(Aa)+1/4(aA)=3/4(AA或Aa 或aA) 。
(二)乘法定理
当一个事件的发生不影响另一事件的发生时,这样的两个独立事件同或相继出现的概率是它们各自出现概率的乘积。例如,生男孩和生女孩的概率都分别是1/2,由于第一胎不论生男还是生女都不会影响第二胎所生孩子的性别,因此属于两个独立事件。第一胎生女孩的概率是1/2,第二胎生女孩的概率也是1/2,那么两胎都生女孩的概率是1/2×1/2=1/4。
二、概率定理在遗传分析中的应用
豌豆子粒黄色(Y)对绿色(y)是显性,圆粒(R)对皱粒(r)是显性。控制两对相对性状的非等位基因是按自由组合定律遗传的。如果黄色圆粒豌豆甲(YyRr)和绿色圆粒豌豆乙(yyRr)杂交,问后代出现基因型YyRR 的概率是多少?
首先分析甲、乙产生配子的种类和概率。根据一对等位基因与另一对等位基因的分离是各自独立的,非等位基因是互不干扰地分配到配子中去的原理,甲产生含有Y 和y 配子的概率分别是1/2,产生含有R 和r 配子的概率也分别是1/2。又因为Y 和R 是同时出现在一个配子中的,因此,它们同时出现在配子中的概率是:1/2(Y)×1/2(R)=1/4(YR)。根据同样道理,甲可以产生4种配子,它们的概率分别是1/4 YR、1/4 Yr、1/4 yR和1/4 yr乙可以产生2种配子,它们的概率分别是1/2 yR和1/2 yr。由于甲、乙产生的配子结合是随机的独立事件,只有甲的YR 配子和乙的yR 配子结合才会得到基因型YyRR 的后代,因此,YyRR 基因型出现的概率是1/4(YR)×1/2(yR)=1/8(YyRR)。
此题也可以这样分析:先分别考虑基因型中的一对基因。单从豌豆的颜色考虑,甲和乙杂交后代的概率为:Yy×yy→1/2Yy、1/2yy单从豌豆的形状考虑,甲和乙杂交后代的概率为:Rr×Rr→1/4RR、1/4rr、1/2Rr。因此,甲和乙杂交,后代出现基因型YyRR 的概率为:1/4(Yy)×1/4(RR)=1/8(YyRR)。
课堂小结
1、细胞增殖周期中DNA 、染色质与染色体的行为:
(1)DNA、染色质和染色体的相互关系:染色体的四级结构模型(核小体→螺线管→超螺线管→染色单体)
(2)细胞分裂过程中染色体的行为:有丝分裂和减数分裂的基本过程。
2、人类的配子发生:
精子的发生过程。
卵子的发生过程。
精子发生和卵子发生的异同点:在精子发生中,一个精原cell 最终形成四个精cell ,而一个卵原cell 在卵子发生中只形成一个成熟卵cell 和三个极体;精子的发生是连续的,而卵子的发生是不连续的;精子的发生中具有变形期,而卵子的发生中不具有变形期。精卵发生中都具有增殖期,生长期和成熟期。
3、概率定理在遗传分析中的应用:
概率的基本定理(加法定理和乘法定理)、概率定理在遗传分析中的应用。
教材:《医学遗传学教程》(第二版) 王培林 傅松滨 主编
参考书:1. 《医学分子遗传学》卢大儒 主编。
2. 《遗传咨询(遗传病防治的关键问题)》刘权章 主编。
3. 《医学遗传学》陈竺 主编。
复习思考题
1. 说明DNA ,染色质和染色体之间的相互关系?
2. 比较说明有丝分裂与减数分裂的不同点?
3. 幼儿黑蒙性白痴是一种严重的精神病,属于常染色体隐性遗传.
(1)如果两个正常的双亲生了一个患此病的女儿和一个正常的儿子,那么这个儿子携带此隐性基因的几率是多少?
(2)这个儿子与正常女人结婚,他们生的第一个孩子患有此病,那么第二个孩子患有此病的几率是多少?