2005年2月
世界科技研究与发展
21世纪青年学者论坛
全长基因的克隆
王闵霞 马欣荣 代富英 谭 红
(中国科学院成都生物研究所,成都610041)
摘 要:新基因全长cDNA序列、全长DNA序列的获得常常是分子生物学工作者面临的难题。本
文就克隆全长基因的各种技术如文库筛选法、各种PCR技术及新发展起来的电子克隆法等方法作一简单综述。
关键词:全长基因 克隆 文库筛选法 PCR 电子克隆
TheCloningofWANGMinxia TANHong
(ChengduofSciences,Chengdu610041)
Abstract:ToreDNAorcDNAsequenceofanewgeneisaproblemforresearchers.The
articledescribedthetechniquesthatareusedtoclonetheentiregene,forexample:screeningli2braries,agreatvarietyofPCRtechniquesandnewdevelopedsilicocloning.
Keywords:entiregene,cloning,screeninglibraries,PCRtechniques,silicocloning
研究一个基因的结构、功能及其表达产物的特性,完整的基因信息是必需的,但是新基因全长cD2NA序列的获得常常是分子生物学工作者面临的难
概念早在七十年代就已提出,Maniatis于1978年设计了随机片段克隆的方案。选择含有目的基因的基因组DNA,应用物理或酶学方法打断,再选择合适的载体与DNA片段连接,然后转化至受体细胞,培养得到基因组文库。然后选择合适的方法,如Southern杂交筛选法、HDR(高密度影印膜)杂交筛选或者PCR法等,对基因组文库进行筛选、测序。Shuichi等使用的两步PCR鉴定技术可在一天内找
题。随着分子生物学技术的飞速发展和广泛应用,
对基因进行克隆的技术在原有的基础上也有了许多新的发展,例如差别显示杂交、抑制性差减杂交、RAP2PCR、代表性差异显示、酵母双杂交系统、cD2NA直接捕捉法等。本文就克隆全长基因的各种技
术作一简单介绍。
1 文库筛选法
文库筛选法是克隆基因最经典的方法,至今仍广泛应用。构建文库主要有两种类型:基因组文库和cDNA文库。
1.1 从DNA入手,建立基因组文库
作为遗传学科研究的重要内容,基因组文库的
到所需的克隆。王瑛等以λ噬菌体EMBL23为基因载体,构建大麻哈鱼(Oncorhynchusketa)的基因组文库,并从中分离出了全长3361bp的生长激素(cs2GH)基因的克隆[1]。
然而有时候筛选的结果得到的仅仅是基因片段,这时有必要进行染色体步行以得到基因片段旁边的序列。染色体步行(ChromosomeWalking)是指由基因组或基因组文库中的已知序列出发逐步探知
Vol.27No.1 第 81页
www.globesci.com
21世纪青年学者论坛
世界科技研究与发展
2005年2月
其旁邻的未知序列或与已知序列呈线性关系的目的序列的核苷酸组成的方法和过程[2]。染色体步行是利用基因库片段的重叠性而设计的。先根据已知序列制作筛选用的探针,再用杂交法筛选与探针具有相同序列的克隆,此为一步克隆。根据一步克隆所得的片段末端序列重新设计新的探针,杂交筛选与一步克隆具有重复序列的新克隆,称之为二步克隆。如此重复进行多次,就能得到完整的基因序列。
虽然现在有基因芯片构建文库,但基因文库的构建与筛选工作量仍然很大,步骤烦琐,而且往往筛选不到目的基因。而后发展的基因小库有效解决了这个问题。构建基因小库,需要先将基因组DNA片段化,然后杂交,从而找到含有目的基因的片段。回收相应大小的DNA片段,克隆到载体上,获得基因小库。基因小库的构建使得获得目的基因的概率提高,而且降低了工作量。张平武等在试探性的Southernblot基础上构建基因小库,从中筛选目的基因,的成功率[3]个,展阶段,,这对于杂交筛选法一步克隆全长基因提供了更多的可能性。
1.2 从cDNA入手,构建cDNA文库真核基因往往含有内含子和外显子部分,外显子表达产生基因产物。cDNA就是真核基因的外显子,是与mRNA互补的基因编码部分。70年代初首例cDNA克隆问世后,选择从cDNA入手,构建cDNA文库成为克隆真核基因的一种常用的方法。构建cDNA文库需要提取mRNA,进而反转录(RT2PCR)合成cDNA并插入克隆载体,构建cDNA文库。近年来发展了一系列建立全长cDNA文库的方法,如1994年Maruyama等建立的oligo2capping法[4]和CLONTECH公司推出的CapFinder(SMARTTM)[5]等均可以得到含有大量全长cDNA序列的文库。
用核酸、抗体探针筛选cDNA文库是早期寻找基因的主要手段,也是目前克隆功能相关基因的常用方法。如果杂交、筛选或其他办法筛选的cDNA片段不是基因全长序列,可以用3’RACR及5’RACE法得到基因全长。RACE(PapidAmplifica2tionofcDNAEnds,cDNA末端快速扩增技术)由
第 82页 Vol.27No.1
Frohman1988年首次报道[6],是一种从低丰度转录
本中快速扩增cDNA5’和3’末端简单而有效的方
法。RACE是基于PCR技术由已知的部分cDNA顺序来获得完整cDNA5’和3’端的方法。该方法也被称为锚定PCR(AnchoredPCR)[7]和单边PCR(One2sidedPCR)[8]。详见后锚定PCR部分。改良和优化了的RACE被广泛地应用于克隆全长cD2NA。
使用PCR技术扩增目的基因的全长基因
2
PCR技术由美国Centus公司的Mullis首创,是一种体外迅速扩增基因的方法,类似于DNA的体内复制过程。PCR[9]首创PCR技,对PCR技术进,极大地提高了分离克隆目的基。如果目的基因较长,普通的PCR方法很难一次性获得全长基因,长距离PCR的应用有效的解决了这一问题。然而,因为目的基因背景知识的限制,一般可以通过普通PCR方法获得基因的部分保守序列,就需要在此基础上通过染色体步行获得基因全长。反向PCR、锅饼PCR(PanhandlePCR)、VectorettePCR、连接介导PCR(ligationmediatedPCR)和捕获/寡盒介导PCR(Capture/OligocassettemediatedPCR)等就是建立在PCR技术基础上的染色体步行技术,为扩增已知序列旁侧的未知DNA片段提供了捷径。这些方法的建立可以不必经过烦琐的建库和筛选过程而获得全长基因序列。
2.1 长距离PCR技术(LongPCR)
长PCR(LongPCR)对于克隆全长基因具有重要的意义,但它要求对目的基因了解较多,或者知道基因的两末端序列。长PCR是指能扩增长度达5kb以上的DNA片段的PCR技术[24]。常规PCR只能扩增数百个至上千个碱基的DNA片段,这在许多研究中是不够的,于是长片段DNA的PCR法便应运而生。最初,有人选择不同的耐热DNA聚合酶,改进缓冲液成分及循环条件等,可以扩增长10~15kb的片段,但产量极低。直到1994年Barnes和Cheng等解决了DNA合成中碱基错配现象和模板DNA损伤两个问题才正式建立了长PCR技术。它可使PCR扩增λ噬菌体长达42kb,扩增复杂的
www.globesci.com
2005年2月
世界科技研究与发展
21世纪青年学者论坛
人类基因组达22kb。长PCR的建立引起了人们的
普遍关注,因为它不仅能扩增出DNA片段,更重要的是可利用长PCR来研究分析更长的基因片段,甚至在合适的引物基础上可以一步扩增出较长的全长基因。
2.2 反向PCR(InversePCR,IPCR)反向PCR是扩增一段已知顺序的旁侧序列时常用的一种技术。常规PCR技术是扩增两个引物之间的DNA片段,而反向PCR是用反链的互补引物来扩增两引物之外的DNA片段。此法所选择的引物虽与已知DNA序列互补,但两引物3’端是反向的。反向PCR扩增前,先用限制性内切酶酶解DNA,然后用连接酶使带有粘性末端的靶片段自身环化,最后用一对反向引物进行PCR,得到的线性DNA将含有两引物外侧的未知序列。早期的反向PCR只能扩增几百上千的短片段,后来由于LA聚
一种用于扩增cDNA序列的技术,在一条未知或可变的DNA末端加上一个已知的“尾巴”,再通过扩增进行鉴定的PCR法。先设计特异的PCR扩增引物,通过单侧特异引物搭配锚定引物,在低严谨条件下扩增各种组织的cDNA分子库以富集目标片段;再以单向锚定PCR扩增产物为模板,用双侧特异引物再次扩增,获得特异PCR产物。若要扩增一条3’端序列已知、5’端序列不清楚的mRNA,先用反转录酶将mRNA转录成cDNA,然后在DNA末端转移酶的作用下,在cDNA3’末端加入Poly(dG)尾巴,根据已知一端的特异序列合成第一条引物,带有Poly(dG)尾巴的“锚顺序”作为第二条引物,用PCR扩增出感兴趣的cDNA。这也就是前面提到过的5’RACE。3’RACE是利用类似的原理扩增3’端末端序列的技术和方法。Matsunaga[14]等通sp.Strain。
PCR(ligationmediatedpolymese,LMPCR)
连接介导聚合酶链反应是以连接反应为基础的单侧PCR技术,首先在DNA片段的一端连接上一个公共连接子,而后在这个连接子与另一个DNA序列特异的引物间扩增。LMPCR可应用于扩增钩端螺旋体的重复序列IS1533的毗邻序列[15],先用BglII内切染色体DNA,酶切片段再与相应的连接子连接,以连接后的DNA为模板,与连接子对应的片段及重复片段IS1533为引物扩增,得到了包含IS1533重复序列及重复序列旁侧序列的多个片段。LMPCR方法得到含有IS1533片段的序列较RFLP方法少,更迅速,更准确。
2.6 捕获/寡盒介导PCR(Capture/Oligocas2settemediatedPCR)[17,18]
捕获PCR是一种灵敏的扩增目的基因的方法,大致可以分为两类:(1)先捕获目的DNA或RNA,再进行PCR扩增目的基因;(2)先进行PCR扩增,再捕获目的扩增产物。程序如下:(1)用生物素化探针在链亲和素包被的磁珠上捕获目的DNA或RNA,捕获的目的DNA或RNA用核糖核酸酶释放,用通用引物或已知序列引物进行PCR或RT2PCR,分离、克隆PCR产物;(2)先进行PCR,PCR产物再用生物素标记的捕获探针在链亲和素标记的微量板孔中杂交捕获PCR产物。现在发展的捕获PCR有多种,如基因组捕获PCR(GeneCapture
Vol.27No.1 第 83页
合酶的应用,反向PCR也可以获得长至几千的片
段。TriliaT等于1988年建立了反向PCR技术,通过反向PCR技术成功克隆E・Coli列的上游及下游序列[10]。反应难以控制产物,,使扩增效率下降。
李竹红[11]等人于1999年对传统的反向PCR技术进行了一些改进:用巢式PCR扩增含量极少的靶序列,然后在PCR反应体系中加入5%的甲酰胺以减少非特异性扩增。实验结果表明,改进的反向PCR技术可以高度灵敏、高度特异地克隆基因组已知片段旁侧的序列。
2.3 锅饼PCR(PanhandlePCR,P2PCR)[12])P2PCR是除反向PCR外,另一种环状PCR技
术,因其以一个类似锅饼结构的DNA分子为模板,所以称为锅饼PCR,可以扩增229kb的大片段未知序列。基因组DNA用限制性内切酶作用成片段,在片段末端连接上含有3’自由端的单链寡核苷酸链(3’自由端与已知序列中部分片段完全反向互补),含有连接片段的单链DNA在合适的温度下自身退火形成一个含有锅饼结构的环,然后用在已知序列内呈线性排列的三个单引物进行三次扩增。DouglasH.Jons通过P2PCR获得了囊性纤维化跨膜传导调节蛋白5’端长657bp的片段。
2.4 锚定PCR(AnchoredPCR)
锚定PCR(AnchoredPCR)是Loh[13]等设计的
www.globesci.com
21世纪青年学者论坛
世界科技研究与发展
2005年2月
PCR,GC2PCR)[17],抗原捕获PCR、抗体捕获PCR(AC2PCR),biotin2capturePCR,Jenson于1990年发
展了免疫捕捉PCR[19](ImmunocapturePCR,ICPCR)技术,可以减轻PCR抑制物的作用。在对目的基因背景知识了解较少时,捕获PCR对于获得全长基因具有重要的意义。捕获PCR只需要知道待克隆基因具有合适长度的保守序列,就可以获得其全长cDNA序列。DonnaRounds[20]等于1995年用亲和捕获PCR法获得了鼠粘粒的近轴端序列。RenatoMastrangeli[17]等于1996年从所有激活的胸腺细胞RNA中用GC2PCR法获得了LAG23(淋巴细胞激活基因23)全长cDNA。
2.7 载体介导的PCR(VectorettePCR)[21]载体是一个含有中心错配区域和粘性末端的双链DNA片段。由于突出末端的关系,载体可以与含有相应互补序列的染色体DNA片段连接,连接产物组成了载体文库。然后以载体文库作为PCR的模板,用基因特异引物与载体特异引物扩增,PCR合成。在第二轮PCRPCR会得到几个片段,之间的距离。或者说,PCR产物的大小反映了片段在染色体上的位置,其多少反映了插入片段的拷贝数。基因特异引物来源于已知基因片段,载体介导的PCR产物就是已知序列的旁侧序列。
重复载体介导PCR法可以获得全长基因,或者载体介导PCR法与文库筛选法结合获得全长基因。应用后者分离与克隆三个人类新基因的全长cD2NA,结果全部获得成功。这三个人类新基因分别是H2RalGDS基因、H2CIS基因和H2S6PK基因。结果
退火温度的短的随机引物,通过特殊的热循环程序
(低严谨性PCR和高严谨性PCR交替进行)使得特异性PCR产物得以有效扩增。刘耀光和RobertF.Whittier通过这种方法成功地从P1、YAC克隆中得到了末端插入序列。
2.9 单核苷酸套式PCR(SingleoligonucleotidenestedPCR,SONPCR)[23]
单核苷酸套式PCR是最新的一种染色体步行PCR技术,由ZsuzannaAntal等人2004年9月首次报道。ZsuzannaAntal等在TAIL2PCR的基础上进行改进,只用嵌套式单向特异引物,采用特殊的热循环方式(变性后进行少量的高退火温度循环,然后进行一个超低退火温度循环,最后又进行多个高退火温度循环)进行扩增。在超低退火温度循环中,特异PCR已成功应用于pacCSONPCR的,。
方法2PCR、不均一PCR等方法也是染色体步移的PCR方法,只是没有被广泛应用,所以从略。以上介绍的几种PCR技术是在已知序列片段的基础上,进一步得到其旁侧序列。将得到的片段进行测序分析,如果得到的还不是全长基因,就需要在测定序列的基础上重新设计引物,重复上面的工作。通过以上的方法获得全长基因信息后,可以根据两端序列设计引物,普通PCR或长PCR法一步扩增得到全长基因克隆。
3 电子克隆(silicocloning)
电子克隆方法也称“电子cDNA文库筛选”,是在基因组计划的实施与发展及EST数据库的基础上发展起来的一种高效的克隆基因的策略,在克隆基因的全长cDNA序列以前,很有必要首先采用生物信息学的方法进行电子克隆。
电子克隆是利用计算机技术,依托现有的网络资源、EST数据库、核苷酸数据库、基因组数据库等,采用生物信息学方法(包括同源性检索聚类、序列拼接等)延伸EST序列,以期获得部分乃至全长cDNA序列的一种方法[24]。电子克隆的基本思路是:①利用序列同源性比较软件(例如Blast软件)将待进行电子克隆的序列(以下简称种子序列)对库检索;②从数据库中挑选出全部相关序列;③对所有序列进行片段整合分析(即Contig分析),形成延伸后
显示这一方法对于克隆呈低丰度的基因转录本全长序列具有较高的实用价值。
2.8 热不对称性PCR(ThermalAsymmetricInterlacedPCR,TAIL2PCR)[22]
TAIL2PCR是随机引物PCR的一种,随机引物PCR是用一种特异性引物结合在已知区域,随机引
物结合在已知区域旁侧的未知区域,从而引发包括已知区域在内的片段的扩增,如TargetdegenewalkingPCR和SingleprimerPCR,但因为其PCR
产物中有很多的非特异性扩增,不被广泛应用。TAIL2PCR使用长的高退火温度的长特异引物和低
第 84页 Vol.27No.1
www.globesci.com
2005年2月
世界科技研究与发展
21世纪青年学者论坛
的序列(以下简称新生序列)。随后,将此新生序列
作为种子序列重复进行上述三步过程,直至新生序列不能够进一步延伸为止[25]。电子克隆现已广泛应用于克隆cDNA。如FENGYou2Jun等利用电子克隆法成功克隆了CpUBC全长cDNA[26]。电子克隆法相比文库筛选、传统PCR法的优点是节省时间和经费,起到事半功倍的效果。然而该方法的主要缺点是可能出现错误拼接,同时必须将结果回到实验室进行验证。
电子克隆法常用于克隆全长或较长cDNA,也可以克隆基因组DNA,但较少使用。目前国际上最重要的三家核酸序列数据库是:GenBank(http://www.ncbi.nlm.nih.gov)、EMBL和DDBJ,最主要的蛋白质数据库是:GenBank、EMBL、PIR和SwissPORT。序列装配软件有SequencherTM等。
atingcDNAlibraries[J].Crer,1983,25263~269
[8]OharaO,DoritRL.One2sidedpolymerasechainreaction:theamplifi2cationofcDNA.ProcNatI[J].SciUSA,1989,86:5673~5677[9]MullisKBetal.Meth.Enzymol[J].1987,55:335
[10]TriliaT,PetersonMG,KempDJ.NucleicAcidsResearch,1988,16
(16):8186[11]李竹红,刘德培,梁植权.改进的反向PCR技术克隆转移基因的
旁侧序列[J].生物化学与生物物理进展,1999,26(6):600~603[12]JonesDH.WinistorferSC[J].BioTechniques,1997,23(1):132[13]LohEYetal.Science,1989,243;217
[14]TadashiMatsunaga,NoriyukiTsujimura,YoshikoOkamuraand
HarukoTakeyama.CloningandCharacterizationofaGene,mpsA,EncodingaProteinAssociatedwithIntracellularMagneticParticlesfromMagnetospirillumsp.StrainAMB21.BiochemicalandBiophys2icalResearchCommunications,2000,(3):932~937
[15]JacquelineS.RedstoneandMartinJ.Woodward.Thedevelopment
ofaligasemediatedPCRwithpotentialfortheofserovarswithLeptospirainterrogans.VeterinaryMicrobiology,1996,51(324):351~362
[16]姜国忠,谢华,郭玉忠,,.2种PCR方法扩增盐藻
3’.(医学版)2004,
1)17,,SilviaDonini.Cloningof
byMagneticBeadBoundHomologousProbesandGENE2CAPTUREPCR)[J].AnalyticalBiochemistry,1996,241(1):93~102
[18]MariaLagerstr
2005年2月
世界科技研究与发展
21世纪青年学者论坛
全长基因的克隆
王闵霞 马欣荣 代富英 谭 红
(中国科学院成都生物研究所,成都610041)
摘 要:新基因全长cDNA序列、全长DNA序列的获得常常是分子生物学工作者面临的难题。本
文就克隆全长基因的各种技术如文库筛选法、各种PCR技术及新发展起来的电子克隆法等方法作一简单综述。
关键词:全长基因 克隆 文库筛选法 PCR 电子克隆
TheCloningofWANGMinxia TANHong
(ChengduofSciences,Chengdu610041)
Abstract:ToreDNAorcDNAsequenceofanewgeneisaproblemforresearchers.The
articledescribedthetechniquesthatareusedtoclonetheentiregene,forexample:screeningli2braries,agreatvarietyofPCRtechniquesandnewdevelopedsilicocloning.
Keywords:entiregene,cloning,screeninglibraries,PCRtechniques,silicocloning
研究一个基因的结构、功能及其表达产物的特性,完整的基因信息是必需的,但是新基因全长cD2NA序列的获得常常是分子生物学工作者面临的难
概念早在七十年代就已提出,Maniatis于1978年设计了随机片段克隆的方案。选择含有目的基因的基因组DNA,应用物理或酶学方法打断,再选择合适的载体与DNA片段连接,然后转化至受体细胞,培养得到基因组文库。然后选择合适的方法,如Southern杂交筛选法、HDR(高密度影印膜)杂交筛选或者PCR法等,对基因组文库进行筛选、测序。Shuichi等使用的两步PCR鉴定技术可在一天内找
题。随着分子生物学技术的飞速发展和广泛应用,
对基因进行克隆的技术在原有的基础上也有了许多新的发展,例如差别显示杂交、抑制性差减杂交、RAP2PCR、代表性差异显示、酵母双杂交系统、cD2NA直接捕捉法等。本文就克隆全长基因的各种技
术作一简单介绍。
1 文库筛选法
文库筛选法是克隆基因最经典的方法,至今仍广泛应用。构建文库主要有两种类型:基因组文库和cDNA文库。
1.1 从DNA入手,建立基因组文库
作为遗传学科研究的重要内容,基因组文库的
到所需的克隆。王瑛等以λ噬菌体EMBL23为基因载体,构建大麻哈鱼(Oncorhynchusketa)的基因组文库,并从中分离出了全长3361bp的生长激素(cs2GH)基因的克隆[1]。
然而有时候筛选的结果得到的仅仅是基因片段,这时有必要进行染色体步行以得到基因片段旁边的序列。染色体步行(ChromosomeWalking)是指由基因组或基因组文库中的已知序列出发逐步探知
Vol.27No.1 第 81页
www.globesci.com
21世纪青年学者论坛
世界科技研究与发展
2005年2月
其旁邻的未知序列或与已知序列呈线性关系的目的序列的核苷酸组成的方法和过程[2]。染色体步行是利用基因库片段的重叠性而设计的。先根据已知序列制作筛选用的探针,再用杂交法筛选与探针具有相同序列的克隆,此为一步克隆。根据一步克隆所得的片段末端序列重新设计新的探针,杂交筛选与一步克隆具有重复序列的新克隆,称之为二步克隆。如此重复进行多次,就能得到完整的基因序列。
虽然现在有基因芯片构建文库,但基因文库的构建与筛选工作量仍然很大,步骤烦琐,而且往往筛选不到目的基因。而后发展的基因小库有效解决了这个问题。构建基因小库,需要先将基因组DNA片段化,然后杂交,从而找到含有目的基因的片段。回收相应大小的DNA片段,克隆到载体上,获得基因小库。基因小库的构建使得获得目的基因的概率提高,而且降低了工作量。张平武等在试探性的Southernblot基础上构建基因小库,从中筛选目的基因,的成功率[3]个,展阶段,,这对于杂交筛选法一步克隆全长基因提供了更多的可能性。
1.2 从cDNA入手,构建cDNA文库真核基因往往含有内含子和外显子部分,外显子表达产生基因产物。cDNA就是真核基因的外显子,是与mRNA互补的基因编码部分。70年代初首例cDNA克隆问世后,选择从cDNA入手,构建cDNA文库成为克隆真核基因的一种常用的方法。构建cDNA文库需要提取mRNA,进而反转录(RT2PCR)合成cDNA并插入克隆载体,构建cDNA文库。近年来发展了一系列建立全长cDNA文库的方法,如1994年Maruyama等建立的oligo2capping法[4]和CLONTECH公司推出的CapFinder(SMARTTM)[5]等均可以得到含有大量全长cDNA序列的文库。
用核酸、抗体探针筛选cDNA文库是早期寻找基因的主要手段,也是目前克隆功能相关基因的常用方法。如果杂交、筛选或其他办法筛选的cDNA片段不是基因全长序列,可以用3’RACR及5’RACE法得到基因全长。RACE(PapidAmplifica2tionofcDNAEnds,cDNA末端快速扩增技术)由
第 82页 Vol.27No.1
Frohman1988年首次报道[6],是一种从低丰度转录
本中快速扩增cDNA5’和3’末端简单而有效的方
法。RACE是基于PCR技术由已知的部分cDNA顺序来获得完整cDNA5’和3’端的方法。该方法也被称为锚定PCR(AnchoredPCR)[7]和单边PCR(One2sidedPCR)[8]。详见后锚定PCR部分。改良和优化了的RACE被广泛地应用于克隆全长cD2NA。
使用PCR技术扩增目的基因的全长基因
2
PCR技术由美国Centus公司的Mullis首创,是一种体外迅速扩增基因的方法,类似于DNA的体内复制过程。PCR[9]首创PCR技,对PCR技术进,极大地提高了分离克隆目的基。如果目的基因较长,普通的PCR方法很难一次性获得全长基因,长距离PCR的应用有效的解决了这一问题。然而,因为目的基因背景知识的限制,一般可以通过普通PCR方法获得基因的部分保守序列,就需要在此基础上通过染色体步行获得基因全长。反向PCR、锅饼PCR(PanhandlePCR)、VectorettePCR、连接介导PCR(ligationmediatedPCR)和捕获/寡盒介导PCR(Capture/OligocassettemediatedPCR)等就是建立在PCR技术基础上的染色体步行技术,为扩增已知序列旁侧的未知DNA片段提供了捷径。这些方法的建立可以不必经过烦琐的建库和筛选过程而获得全长基因序列。
2.1 长距离PCR技术(LongPCR)
长PCR(LongPCR)对于克隆全长基因具有重要的意义,但它要求对目的基因了解较多,或者知道基因的两末端序列。长PCR是指能扩增长度达5kb以上的DNA片段的PCR技术[24]。常规PCR只能扩增数百个至上千个碱基的DNA片段,这在许多研究中是不够的,于是长片段DNA的PCR法便应运而生。最初,有人选择不同的耐热DNA聚合酶,改进缓冲液成分及循环条件等,可以扩增长10~15kb的片段,但产量极低。直到1994年Barnes和Cheng等解决了DNA合成中碱基错配现象和模板DNA损伤两个问题才正式建立了长PCR技术。它可使PCR扩增λ噬菌体长达42kb,扩增复杂的
www.globesci.com
2005年2月
世界科技研究与发展
21世纪青年学者论坛
人类基因组达22kb。长PCR的建立引起了人们的
普遍关注,因为它不仅能扩增出DNA片段,更重要的是可利用长PCR来研究分析更长的基因片段,甚至在合适的引物基础上可以一步扩增出较长的全长基因。
2.2 反向PCR(InversePCR,IPCR)反向PCR是扩增一段已知顺序的旁侧序列时常用的一种技术。常规PCR技术是扩增两个引物之间的DNA片段,而反向PCR是用反链的互补引物来扩增两引物之外的DNA片段。此法所选择的引物虽与已知DNA序列互补,但两引物3’端是反向的。反向PCR扩增前,先用限制性内切酶酶解DNA,然后用连接酶使带有粘性末端的靶片段自身环化,最后用一对反向引物进行PCR,得到的线性DNA将含有两引物外侧的未知序列。早期的反向PCR只能扩增几百上千的短片段,后来由于LA聚
一种用于扩增cDNA序列的技术,在一条未知或可变的DNA末端加上一个已知的“尾巴”,再通过扩增进行鉴定的PCR法。先设计特异的PCR扩增引物,通过单侧特异引物搭配锚定引物,在低严谨条件下扩增各种组织的cDNA分子库以富集目标片段;再以单向锚定PCR扩增产物为模板,用双侧特异引物再次扩增,获得特异PCR产物。若要扩增一条3’端序列已知、5’端序列不清楚的mRNA,先用反转录酶将mRNA转录成cDNA,然后在DNA末端转移酶的作用下,在cDNA3’末端加入Poly(dG)尾巴,根据已知一端的特异序列合成第一条引物,带有Poly(dG)尾巴的“锚顺序”作为第二条引物,用PCR扩增出感兴趣的cDNA。这也就是前面提到过的5’RACE。3’RACE是利用类似的原理扩增3’端末端序列的技术和方法。Matsunaga[14]等通sp.Strain。
PCR(ligationmediatedpolymese,LMPCR)
连接介导聚合酶链反应是以连接反应为基础的单侧PCR技术,首先在DNA片段的一端连接上一个公共连接子,而后在这个连接子与另一个DNA序列特异的引物间扩增。LMPCR可应用于扩增钩端螺旋体的重复序列IS1533的毗邻序列[15],先用BglII内切染色体DNA,酶切片段再与相应的连接子连接,以连接后的DNA为模板,与连接子对应的片段及重复片段IS1533为引物扩增,得到了包含IS1533重复序列及重复序列旁侧序列的多个片段。LMPCR方法得到含有IS1533片段的序列较RFLP方法少,更迅速,更准确。
2.6 捕获/寡盒介导PCR(Capture/Oligocas2settemediatedPCR)[17,18]
捕获PCR是一种灵敏的扩增目的基因的方法,大致可以分为两类:(1)先捕获目的DNA或RNA,再进行PCR扩增目的基因;(2)先进行PCR扩增,再捕获目的扩增产物。程序如下:(1)用生物素化探针在链亲和素包被的磁珠上捕获目的DNA或RNA,捕获的目的DNA或RNA用核糖核酸酶释放,用通用引物或已知序列引物进行PCR或RT2PCR,分离、克隆PCR产物;(2)先进行PCR,PCR产物再用生物素标记的捕获探针在链亲和素标记的微量板孔中杂交捕获PCR产物。现在发展的捕获PCR有多种,如基因组捕获PCR(GeneCapture
Vol.27No.1 第 83页
合酶的应用,反向PCR也可以获得长至几千的片
段。TriliaT等于1988年建立了反向PCR技术,通过反向PCR技术成功克隆E・Coli列的上游及下游序列[10]。反应难以控制产物,,使扩增效率下降。
李竹红[11]等人于1999年对传统的反向PCR技术进行了一些改进:用巢式PCR扩增含量极少的靶序列,然后在PCR反应体系中加入5%的甲酰胺以减少非特异性扩增。实验结果表明,改进的反向PCR技术可以高度灵敏、高度特异地克隆基因组已知片段旁侧的序列。
2.3 锅饼PCR(PanhandlePCR,P2PCR)[12])P2PCR是除反向PCR外,另一种环状PCR技
术,因其以一个类似锅饼结构的DNA分子为模板,所以称为锅饼PCR,可以扩增229kb的大片段未知序列。基因组DNA用限制性内切酶作用成片段,在片段末端连接上含有3’自由端的单链寡核苷酸链(3’自由端与已知序列中部分片段完全反向互补),含有连接片段的单链DNA在合适的温度下自身退火形成一个含有锅饼结构的环,然后用在已知序列内呈线性排列的三个单引物进行三次扩增。DouglasH.Jons通过P2PCR获得了囊性纤维化跨膜传导调节蛋白5’端长657bp的片段。
2.4 锚定PCR(AnchoredPCR)
锚定PCR(AnchoredPCR)是Loh[13]等设计的
www.globesci.com
21世纪青年学者论坛
世界科技研究与发展
2005年2月
PCR,GC2PCR)[17],抗原捕获PCR、抗体捕获PCR(AC2PCR),biotin2capturePCR,Jenson于1990年发
展了免疫捕捉PCR[19](ImmunocapturePCR,ICPCR)技术,可以减轻PCR抑制物的作用。在对目的基因背景知识了解较少时,捕获PCR对于获得全长基因具有重要的意义。捕获PCR只需要知道待克隆基因具有合适长度的保守序列,就可以获得其全长cDNA序列。DonnaRounds[20]等于1995年用亲和捕获PCR法获得了鼠粘粒的近轴端序列。RenatoMastrangeli[17]等于1996年从所有激活的胸腺细胞RNA中用GC2PCR法获得了LAG23(淋巴细胞激活基因23)全长cDNA。
2.7 载体介导的PCR(VectorettePCR)[21]载体是一个含有中心错配区域和粘性末端的双链DNA片段。由于突出末端的关系,载体可以与含有相应互补序列的染色体DNA片段连接,连接产物组成了载体文库。然后以载体文库作为PCR的模板,用基因特异引物与载体特异引物扩增,PCR合成。在第二轮PCRPCR会得到几个片段,之间的距离。或者说,PCR产物的大小反映了片段在染色体上的位置,其多少反映了插入片段的拷贝数。基因特异引物来源于已知基因片段,载体介导的PCR产物就是已知序列的旁侧序列。
重复载体介导PCR法可以获得全长基因,或者载体介导PCR法与文库筛选法结合获得全长基因。应用后者分离与克隆三个人类新基因的全长cD2NA,结果全部获得成功。这三个人类新基因分别是H2RalGDS基因、H2CIS基因和H2S6PK基因。结果
退火温度的短的随机引物,通过特殊的热循环程序
(低严谨性PCR和高严谨性PCR交替进行)使得特异性PCR产物得以有效扩增。刘耀光和RobertF.Whittier通过这种方法成功地从P1、YAC克隆中得到了末端插入序列。
2.9 单核苷酸套式PCR(SingleoligonucleotidenestedPCR,SONPCR)[23]
单核苷酸套式PCR是最新的一种染色体步行PCR技术,由ZsuzannaAntal等人2004年9月首次报道。ZsuzannaAntal等在TAIL2PCR的基础上进行改进,只用嵌套式单向特异引物,采用特殊的热循环方式(变性后进行少量的高退火温度循环,然后进行一个超低退火温度循环,最后又进行多个高退火温度循环)进行扩增。在超低退火温度循环中,特异PCR已成功应用于pacCSONPCR的,。
方法2PCR、不均一PCR等方法也是染色体步移的PCR方法,只是没有被广泛应用,所以从略。以上介绍的几种PCR技术是在已知序列片段的基础上,进一步得到其旁侧序列。将得到的片段进行测序分析,如果得到的还不是全长基因,就需要在测定序列的基础上重新设计引物,重复上面的工作。通过以上的方法获得全长基因信息后,可以根据两端序列设计引物,普通PCR或长PCR法一步扩增得到全长基因克隆。
3 电子克隆(silicocloning)
电子克隆方法也称“电子cDNA文库筛选”,是在基因组计划的实施与发展及EST数据库的基础上发展起来的一种高效的克隆基因的策略,在克隆基因的全长cDNA序列以前,很有必要首先采用生物信息学的方法进行电子克隆。
电子克隆是利用计算机技术,依托现有的网络资源、EST数据库、核苷酸数据库、基因组数据库等,采用生物信息学方法(包括同源性检索聚类、序列拼接等)延伸EST序列,以期获得部分乃至全长cDNA序列的一种方法[24]。电子克隆的基本思路是:①利用序列同源性比较软件(例如Blast软件)将待进行电子克隆的序列(以下简称种子序列)对库检索;②从数据库中挑选出全部相关序列;③对所有序列进行片段整合分析(即Contig分析),形成延伸后
显示这一方法对于克隆呈低丰度的基因转录本全长序列具有较高的实用价值。
2.8 热不对称性PCR(ThermalAsymmetricInterlacedPCR,TAIL2PCR)[22]
TAIL2PCR是随机引物PCR的一种,随机引物PCR是用一种特异性引物结合在已知区域,随机引
物结合在已知区域旁侧的未知区域,从而引发包括已知区域在内的片段的扩增,如TargetdegenewalkingPCR和SingleprimerPCR,但因为其PCR
产物中有很多的非特异性扩增,不被广泛应用。TAIL2PCR使用长的高退火温度的长特异引物和低
第 84页 Vol.27No.1
www.globesci.com
2005年2月
世界科技研究与发展
21世纪青年学者论坛
的序列(以下简称新生序列)。随后,将此新生序列
作为种子序列重复进行上述三步过程,直至新生序列不能够进一步延伸为止[25]。电子克隆现已广泛应用于克隆cDNA。如FENGYou2Jun等利用电子克隆法成功克隆了CpUBC全长cDNA[26]。电子克隆法相比文库筛选、传统PCR法的优点是节省时间和经费,起到事半功倍的效果。然而该方法的主要缺点是可能出现错误拼接,同时必须将结果回到实验室进行验证。
电子克隆法常用于克隆全长或较长cDNA,也可以克隆基因组DNA,但较少使用。目前国际上最重要的三家核酸序列数据库是:GenBank(http://www.ncbi.nlm.nih.gov)、EMBL和DDBJ,最主要的蛋白质数据库是:GenBank、EMBL、PIR和SwissPORT。序列装配软件有SequencherTM等。
atingcDNAlibraries[J].Crer,1983,25263~269
[8]OharaO,DoritRL.One2sidedpolymerasechainreaction:theamplifi2cationofcDNA.ProcNatI[J].SciUSA,1989,86:5673~5677[9]MullisKBetal.Meth.Enzymol[J].1987,55:335
[10]TriliaT,PetersonMG,KempDJ.NucleicAcidsResearch,1988,16
(16):8186[11]李竹红,刘德培,梁植权.改进的反向PCR技术克隆转移基因的
旁侧序列[J].生物化学与生物物理进展,1999,26(6):600~603[12]JonesDH.WinistorferSC[J].BioTechniques,1997,23(1):132[13]LohEYetal.Science,1989,243;217
[14]TadashiMatsunaga,NoriyukiTsujimura,YoshikoOkamuraand
HarukoTakeyama.CloningandCharacterizationofaGene,mpsA,EncodingaProteinAssociatedwithIntracellularMagneticParticlesfromMagnetospirillumsp.StrainAMB21.BiochemicalandBiophys2icalResearchCommunications,2000,(3):932~937
[15]JacquelineS.RedstoneandMartinJ.Woodward.Thedevelopment
ofaligasemediatedPCRwithpotentialfortheofserovarswithLeptospirainterrogans.VeterinaryMicrobiology,1996,51(324):351~362
[16]姜国忠,谢华,郭玉忠,,.2种PCR方法扩增盐藻
3’.(医学版)2004,
1)17,,SilviaDonini.Cloningof
byMagneticBeadBoundHomologousProbesandGENE2CAPTUREPCR)[J].AnalyticalBiochemistry,1996,241(1):93~102
[18]MariaLagerstr