・20・《上海生物医学工程》杂志2006年第26卷第1期
蛋白质结构与功能研究中的分子模拟技术
刘 伟 丁祖泉 王海芸
同济大学生命科学与技术学院 (上海200092)
【摘要】 分子模拟技术为蛋白质的研究提供了一种崭新的手段,在理论上解决了结构预测和功能分析以及蛋白质工程实施方面所面临的难题。它在蛋白质的结构预测和模建工作中占有举足轻重的地位,实现了生物技术与计算机技术的完美结合。本文简要阐述了该技术的基本步骤和工作原理,并以目前应用最广的生物大分子领域的商品化分子模拟软件Accelrys公司基于Linux系统开发的InsightII为例,介绍了相关程序模块的功能和作用,同时结合该技术在蛋白质的结构预测和模建、、分子设计等过程中的开发与应用,加以具体说明和展望。
【关键词】 PDB数据库 分子模拟技术 MolecularStructureandFunctionResearch
LiuWei Dingzuquan Wanghaiyun
Tongjiuniversity,InstituteofLifeScienceandMedicalEngineering (Shanghai200092)
【Abstract】 Molecularmodelingmethodologyhasinspiredmuchnewhopefortheresearchesofprotein,foritsolvestheproblemintheproteinstructureprediction,functionanalysisandproteinengineeringtheoretically.Ithassuc2cessfullyappliedcomputertechnologyinthefieldofbiologyandplayedthekeyroleintheproteinstructurepredictionandfunctionresearches.Thispaperdescribesbasicprincipleandstepsofsuchmodelingmethodology,introducesthefunctionofsoftwaremodulesusingmolecularmodelingcommercialsoftwareInsightIIasanexamplewhichisdevelopedbyAccel2rysCompanybasingonLinuxoperatingsystem,andalsoilluminatesfurthercurrentapplicationandprospectofsuchtech2nologyinmodelingprediction,functionanalysisandmoleculesinteraction.
【Keywords】 PDBdatabase molecularmodelingmethodology homologousmodeling drugdesign
核酸和蛋白质是生命的主要物质基础,前者负构,现在则以每天超过5个结构的速度增长。到责生命机体的世代遗传,后者是生命机体几乎所有2001年底,蛋白质PDB数据库中已有被X射线衍射重要活动的承担者,人和动植物几乎所有重要的功和MRI方法测定的蛋白质结构16917个,但是,这些能性活动,诸如代谢、发育、生长、思维、记忆、免疫、只是数以百万计的蛋白质中微不足道的一小部分。光合作用、固氮作用等都离不开蛋白质。蛋白质空间结构的测定已经成为生命科学发展的
尽管组成所有蛋白质的氨基酸只有20种,但是“瓶颈”。虽然世界各国都在加大投入,不断提高测每一个蛋白质都有它自己特有的一定的氨基酸组成定速度,但相对于巨大数目的未知蛋白质结构,也只和排列顺序,其不同排列方式的所有可能性却是一是“杯水车薪”。并且,除了需要大量资金投入外,在个巨大的天文数字,加之多肽链在空间的折叠卷曲,技术上还存在种种不可逾越的障碍,即有些蛋白质导致其结构与功能的多样性。蛋白质晶体X射线根本不能被结晶(例如膜蛋白)。除非近期内试验技衍射和MRI测定技术仍然是当今蛋白质空间结构术上的重大突破,实验方法将不能胜任全部蛋白质测定的主要方法。由于蛋白质三维结构的多样性和结构的测定工作[1]。复杂性,在20世纪90年代大约是一天解出一个结同时,以1982年Winter等[2]首次报道通过基因
《上海生物医学工程》杂志2006年第26卷第1期
定位诱变获得改性酪氨酸tRNA合成酶;1983年Ul2
mer[3]在“Science”上发表以“ProteinEngineering”为题的专论为标志,蛋白质工程的诞生,意味着人们可以通过有控制的基因修饰和基因合成,对现有蛋白质加以定向改造、设计、构建并最终生产性能比自然界存在的蛋白质更加优良、更加符合人类社会需要的新型蛋白质。那么同样,在改造、设计、构建蛋白质的过程中,如果仅通过分子生物学实验进行的话,不仅耗资大、而且出效慢,这亦成为蛋白质工程实施中的艰巨的课题。
以计算机技术为依托的分子模拟技术的应运而生,从理论上解决了上述两方面的难题。分子模拟技术被誉为除实验与理论研究之外,了解、认识微观世界的”第三种手段”,它是以量子化学、统计力学为理论基础的一门新兴学科,(计算分子的性质)和分子模拟(行为,)的手段,举足轻重的地位,实现了生物技术与计算机技术的完美结合,同时该技术在结构与功能关系分析、分子设计等过程中也得到了广泛深入的开发与应用,正不断显示出巨大的生命力。由于其在理论、方法和计算技术方面所取得的成就,分子模拟取得了引人瞩目的进展,已成为化学、物理、生物、材料研究中的有力工具[4,5]。1 关于分子模拟技术1.1 蛋白质结构与功能的分子模拟研究的基本步骤
如图1所示,首先确定所要研究的目标蛋白质,然后或者通过蛋白质晶体学得到其结构,或者从PDB数据库中找到其已知的结构,而对于仍无法得到结构的蛋白质则需要通过结构预测的办法进行同源模建,其理论依据是Anfinsen原理,即蛋白质分子的一级序列完全决定其三维空间结构。如果能在蛋白质结构数据库中找到序列同源性大于30%的已知结构作模板,即可以进行一定程度的预测,特别是结构域部分的预测。
当前,蛋白质空间结构模拟主要有两类方法:同源模建(homologymodeling)和从头设计(denovode2sign)。对于药物设计还可应用三维定量构效关系(3D-QSAR)的方法和虚拟受体的方法。
・21・
在分析其结构与功能的关系过程中,可引入突变(如氨基酸的突变、二硫键的突变等)来进一步验证预测模型的合理性。最后,需要通过能量优化及蛋白质动力学计算以得到所模拟的最终构象,用理论力学的方法计算蛋白质三级结构的基本假设是:蛋白质天然构象是能量最小的构象。提出这一假说的实验根据是,许多蛋白质可以在体外从完全去折叠状态自发地折叠成天然构象。根据这一假设,只要计算出蛋白质肽链所有可能构象的能量(范德华力、共价能、溶剂化能、氢键等等),从中取出能量最小的构象,就是蛋白质的天然构象[1,6]
。
图1 分子模拟技术的工作流程图
1.2 应用软件介绍
目前,应用于生物大分子领域的商品化分子模拟软件主要有Accelrys公司基于Linux系统开发的InsightII和基于Windows系统开发的DSModeling。
以及Quanta和Tripos公司的Sybyl软件。在国内,北京大学物理化学研究所也开发了一套“北京大学蛋白质分子设计系统”。而RasMol是一个非常有名的免费软件,用来显示蛋白质、核酸以及小分子的三维结构。
以InsightII为例,它是提供分子建模与模拟的专业工具,从严格意义上说,InsightII并不完全是一个生物信息学软件,它实际上是一个三维图形环境软件包,集成了生物分子及有机小分子建模和显示工具、功能分析工具、结构改造工具、动力学模拟工具等,帮助研究人员在实验前全面了解生物分子的结构与功能,从而有针对性地设计实验方案,提高实验效率,节省时间,降低科研成本。其具体的功能模块有:
・22・《上海生物医学工程》杂志2006年第26卷第1期
传统方法快30倍的速度模拟分子运动和特性,提高
了计算效率,也简化了动力学模拟分析[7]。
除了商品化软件之外,网上也有很多蛋白质研究的自由软件,例如用于三维分子结构的阅读软件有Chime、Cn3da、Rasmol、MolMol、Swiss3Dviewer等[8],均可以在网上免费下载获得。2 分子模拟技术的主要应用领域2.1 蛋白质的结构预测与模建
根据Anfinsen原理,在无法利用NMR得到蛋白质结构的情况下,如果能在PDB中找到序列同源性大于30%的已知结构作模板,然后根据分子力学、分子动力学等能量优化理论对其进行优化。在一定条件下,。
[9],对脯氨酸酶的,以大肠杆菌甲硫氨酸肽酶IMAT)为模板,模建了人脯氨酸酶C端的结构域的空间结构。通过对该模建结构的分析,预测了可能的物理化学性质。
ShuqunLiu[10]曾运用计算机模拟人类CCR5受体的蛋白结构,以及其与HIV-1包膜上的糖蛋白gp120的对接方式,其模拟结果不仅强烈支持了理论上gp120-CCR5互作机理,而且也有助于新一类抑制剂的研究。
冠状病毒的主要蛋白酶或称3CL蛋白酶是病毒复制的关键蛋白,其主要功能是水解病毒所表达的两个多聚蛋白质。序列分析表明3CL蛋白酶在已测定的SARS基因组中是完全保守的,有可能是药物设计的关键靶标之一。刘士勇等[11]利用BLASTP程序检索,发现SARS冠状病毒3CL蛋白酶与猪传染性肠胃炎病毒(TGEV)3CL蛋白酶同源性达43%,序列相似性达57%,他们用InsightII的MODELER程序进行了SARS冠状病毒3CL蛋白酶的同源模建;选择所给出的最优结构进行能量极小化,利用PROCHECK程序检查所得到的结构模型的合理性;计算使用CHARMM程序,对该蛋白酶的活性位点的两个环区进行了构象模拟,找到了两种代表性构象。2.2 蛋白质的结构与功能关系分析
各种因素都将引起蛋白质结构和功能的改变,借助于计算机建立的原子水平的分子模型来模拟分子的结构和行为,例如通过替换、添加、删除残基来
(1)生物大分子结构建模与性质分析
Biopolymer;Homology;MODELER;Profiles23D;Seq2Fold;DelPhi;BindingSiteAnalysis等都是有关大分子
结构建模与性质分析的程序模块,Biopolymer可用来
构建和调整生物大分子的结构,包括蛋白质、多肽、核酸及糖类;Homology可利用结构和序列的同源性进行未知结构蛋白质的结构预测,比如根据蛋白质的氨基酸序列通过在PDB库中搜索同源蛋白质模板,预测此蛋白质的三维结构;MODELER利用来自经验的空间约束条件,自动地为蛋白质生成一个完整的模型,研究人员只需提供与至少一个已知三维结构的蛋白质的序列比对关系;Profiles-3D提供一个蛋白质反向折叠的结构预测方法,首先检测蛋白质序列和已知结构的相容性,然后利用相容性的信息来处理蛋白质的反向折叠问题;SeqFold提供一个用于蛋白质的功能识别程序;DelPhi,子表面静电势,;BindingSiteAnalysis。
(2)基于靶点结构的分子设计
Affinity是一个自动灵活的分子对接程序;Ludi
是配体设计工具;MCSS是用于配体结合部位分析和表征的模块,它也是一个基于结构进行小分子设计的程序,可以单独使用也可与Ludi配合使用;Search/Compare用于生成及比较不同分子的构象特征,便于用户进行多个分子的叠合,系统检索立体构象的特点;Converter可以从一个包含二维结构的数据库自动生成三维结构。
(3)结构模型构建工具
用Sketcher画出分子的二维结构,仅需要定义元素类型、连接键和立体选择性,该模块可将二维绘图转化为三维构象。
(4)能量计算工具
Discover是分子力学计算的工具,进行分子力学及分子动力学模拟,优化和搜索构象,预测分子系统的能量和特性;CHARMm是由哈佛大学开发的分子动力学计算工具,模拟过程提供了有关分子结构、相互作用、能量等信息,与其他模块相结合,可完成各种模拟计算;CFF力场中的参数是通过对近2000个不同分子的超过200万次基于量子力学的能量及能量导数的计算而得,特别适合用于对复合物体系的相互作用研究;MBO(N)D即多体动力学方法,以比
《上海生物医学工程》杂志2006年第26卷第1期
对多肽进行调整;或用旋转异构体优化侧链构象;或
利用不能形成氢键的残基(如丙氨酸)取代在天然态中形成氢键的残基等方法,模拟实现蛋白质的“突变”。并以此分析分子体系的静电势、键强弱、亲疏水性、能量分布等各种物理和化学性质,以及稳定态和折叠过程的动力学性质等,以揭示其结构与功能的关系。
膜联蛋白AnxB1是一个新的膜联蛋白亚家族成员,具有较强的抗凝血活性和血栓亲和性。颜宏利等[12]首先利用FASTA搜索PDB数据库,选择与AnxB1具有45.2%同源性的AnxV作为第一模板,通
・23・
酶的同源性进行了分析,进而对其三维结构进行了成功的同源建模,并根据所模建的三维结构对3CL蛋白水解酶的活性位点进行分析,获得了作为抗SARS药物作用靶点的3CL蛋白水解酶的详细信息,为尽快找到有效药物打下了坚实的基础[15]。通过将凝血酶抑制剂水蛭素的C端20肽片段嫁接到血小板结合蛋白AnnexinV上,可以期望获得既有抗凝血活性,同时又具有导向性的新型工程蛋白质分子。范圭等[16]利用PDB中已被X衍射测定的AnnexinV结构,将水蛭素(取自它与凝血酶的复合物PDBcode:htc4)的C端20肽片段与AnnexinV的C端(Asp320)以伸展构象连接,形成初始构象,再利用InsightII的Discover(C)对初始构象进行,(对接)进行了动力学模拟和优化。最后分析的结果支持了上述想法。2.3 蛋白质小分子设计
蛋白质工程的长远目标之一就是蛋白质分子的从头设计,根据所掌握的蛋白质结构与功能关系的精确规律,按照预先确定的活性和结构,对蛋白质分子进行设计、剪接,最后按人类的意愿产生全新的蛋白质。而就近期目标而言,在对蛋白质和其配体之间结构-活性关系有足够了解的基础上,设计具有特异性的小分子抑制剂将是十分可行的。基于结构的药物设计是发现和开发治疗制剂的一个新方法,是蛋白质工程在医药工业中应用的闪光点。
HIV-1蛋白酶容易通过残基突变产生耐药性。以HIV-1PR切割前体蛋白质上的位点序列为蓝本,通过对病毒蛋白酶序列的多重序列比对(align2ment)分析,即可发现活性部位的关键性区域,应用高通量筛选技术已经能够发现酶的高亲和力配体,并利用计算机模拟技术确定少数认为在理论上不可变异的侧链及其对应的配体,然后对先导化合物(例如Haloperidol等)进行结构修饰,得到了改进的抑制剂化合物,使之专一性地作用于这些侧链,以达到改善其抗耐药性的目的。目前临床上应用的多为此类药物,即拟肽类HIV-1PR抑制剂(HIVPI),它们能与HIV-1PR结合但不被水解,从而产生竞争性抑制作用。如Martin[17]对原有的抑制剂进行了优化,得到Ro31-8959,该抑制剂于1995年底获FDA批准,临床显示了较强的抗病毒性,尤其和逆转录酶抑
过InsightII的Homology程序建模;Discover进行分子力学和分子动力学优化;采用Profiles-3D程序进行合理性检测。发现AnxB1具有四个内部同源结构域,以此为基础构建了四个序列缺失突变体,肠杆菌中表达,、GSTM4,大降低,、栓药物奠定了基础。
戴林森等[13]以大肠杆菌碱性磷酸酶(BAP)为主要结构模板,用计算机同源建模方法构建了耐热碱性磷酸酶(FD-TAP)的三维结构,对它们的结构特征进行了分析比较,并用Profile-3D和Ramachan2dran图等方法分析了结构的合理性。在此基础上,又构建了FD-TAP的3个突变体的结构,用CHAR2MM能量计算法研究了FD-TAP及其3个突变体的
能量与酶蛋白热稳定性之间的关系,得到了与实验完全一致的结果。结果表明,如果氨基酸残基置换使蛋白质分子的总能量降低,疏水性增高和柔韧性减小,往往使蛋白质的耐热性增加。
MiyabenolC(MiyC)和KobophenolA(KobA)是两种新型的植物雌激素。为了探讨MiyC和KobA与雌激素受体(ER)的结合位点,田春艳等[14]运用计算机模拟技术构建它们与ER结合的空间模型,找出结合位点,设计ER的两个突变体M1ER和M2ER;运用PCR技术将ER与MiyC和KobA的结合位点进行突变;通过报告基因检测MiyC和KobA对突变的ER是否具有激活功能。结果显示MiyC激活M1ER,KobA对M1ER无作用;MiyC和KobA对M2ER均无激活作用。从而判断出MiyC和KobA与ER结合的可能位点。
利用分子模拟,对SARS病毒的3CL蛋白水解
・24・《上海生物医学工程》杂志2006年第26卷第1期
2 WinterG,FershtAR,WilkinsonAJ,etal.Redesigning
enzymestructurebysite2directedmutagenesis:tyrosyltRNAsynthetaseandATPbinding.Nature1982Oct
21,299(5885):7562758
3 Ulmer.Proteinengineering.Science1983,219:6662
671
4 赵雨杰.医学生物信息学.北京:人民卫生出版
制剂AZT和ddC合并使用效果更为明显。WangS
等[18]利用计算机模拟技术对新型HIV21蛋白酶抑制剂的研究也取得了满意的效果。
同时,由于数据库中已经存在的化合物(先导化合物),其合成方法是已知的,甚至有些化合物已经商品化,可以直接购买,从而可以较快地进入生物测试阶段,提高新药开发的效率。基于受体三维结构的搜索方法已经广泛应用于先导药物分子设计中,并取得了一些令人鼓舞的结果,如蛋白质激活酶C配体[19],血管紧张素转化酶抑制剂[20]等的发现。3 展望
社,2002:P425
5 王志新.蛋白质结构预测的现状与展望.生命的化学1999,6:P1926 DavidW.Mount.生物信息学.北京:高等教育出
随着蛋白质晶体学和NMR测定技术的飞快发
展,获得高分辨率蛋白质结构信息的速度将会更快;人类基因组序列的破译,为蛋白质设计提供了更多的靶位;随着对药物作用机理的认识,数目及多样性的要求会逐步降低,高;算、搜索等,将使计算机分子模拟技术得到不断的改进和完善。可以预言,下一步将能够逐步实现对所设计的小分子的代谢进行毒理学预测。
从HIV病毒发现到现在,共有16种抗病毒药物完成注册并上市,其中包括10种逆转录酶抑制剂以及6种蛋白酶抑制剂。逆转录酶抑制剂大都是通过传统的临床“筛选”方法得到;但在蛋白酶抑制剂的设计中,基于结构的药物设计方法以及计算机分子模拟技术辅助药物分子设计方法则扮演了重要的角色。
1982年,在美国只有Merck公司组织了一个研究小组从事以分子模拟为基础的药物设计。今天,美国和世界几乎所有的大医药公司都有了这样的研究团队,在美国甚至还出现了主要利用结构预测方法设计药物的公司。
尽管离蛋白质结构预测和分子设计的最终目标还很遥远,但是分子模拟技术作为药物设计的重要方法已经扎下根来,正在为维护人类的健康和创造人类的未来作出贡献。
参考文献
1 王大成.蛋白质工程.北京:化学工业出版社,
2001:P2252227
版社,2003:P34623487 郑珩,王非..北京:化学工业出ww),,陈润生,等.人脯氨酸酶活性中
心结构的计算机模拟.中国生物化学与分子生物学报2002818(4):P499250510 LiuShuqun,FanShixiu,SunZhirong.Structural
andfunctionalcharacterizationofthehumanCCR5
receptorincomplexwithHIVgp120envelopeglyco2proteinandCD4receptorbymolecularmodelingstudies.JMolModel2003,9:P3292336
11 刘士勇,裴剑锋,陈浩,等.SARS冠状病毒主要
蛋白酶结构建模及活性部位运动性分析.首届分子模拟与化学、生物、材料信息学软件应用学
术研讨会2004,P6526912 颜宏利,宋云龙,刘凡等.膜联蛋白AnxB1的同
源模建及降低免疫原性研究.中国科学C辑生命科学2004,34(1):P5426013 戴林森,季朝能,王健,等.耐热碱性磷酸酶(FD2
TAP)的结构模型研究.中国生物化学与分子生物学报20016,17(3):P365237114 田春艳,高海东,张宇早,等.MiyabenolC和
KobophenolA与雌激素受体的结合位点.生物
化学与生物物理学报2003,35(1):P77281
15 XiongB.ModelingofSARScoronavirusmainpro2
teinaseandconformationalflexibilityoftheactivesite.ActaPharamacolSin2003Jun:24(6):P497250416 范圭,王进,杨杉,等.一种水蛭素类融合蛋白与
凝血酶作用的动力学模拟.生物化学与生物物
《上海生物医学工程》杂志2006年第26卷第1期
理进展2001,28(1):P86289
17 MartinJ.RecentadvancesinthedesignofHIV21
PRoteinaseinhibitors.AntiviralRes1992,17:P26518 WangS,MilneGWA,YanX,etal.Discoveryof
novel,non2petideHIV21proteaseinhibitorsbyphar2
macophoresearching.JMedChem199639:P204722054
19 WangS,ZaharevitzDW,SharmaR,etal.The
discoveryofnovel,structurallydiverseproteinki2
・25・
naseCagoniststhroughcomputer3D2databasepharmacophoresearchmolecularmodelingstudies.JMedChem1994,37:P447924489
20 MayerD,Naylor.Auniquegeometryofactivesiteof
angiotensin2convertingenzymeconsistentwithstruc2ture2activitystudies.JComput2AidedMolDes1987,1:P3216
(收稿日期:2006201217)
中美PACS高级研讨会在沪召开
以“RIS(放射科信息系统)/PACS集成与IHE()PACS高级研讨会于
2006年2月6日在上海召开。30研讨。国际著名PACS专家、“Dr・BernieHung主持了本次研讨会。、秘书长钟国康副主任技师及RADinfosystems技术总监张一荃博士、对RIS/PACS集成的指导意义”“、IHE2China工作情况”及“IHE在美国与中国的实践经验”。
著名影像学专家陈星荣、沈天真、陈克敏、缪竞陶、许茂盛、周敏及曹厚德等多位专家教授参与讨论。当今的PACS应用,已不仅局限在传统的放射信息化(RadiologyInformatics)领域,而是延伸到医疗信息共享及工作流集成。RSNA与HIMSS共同倡导的IHE(IntergratingHealthcareEnterprise)理念,更是有力地推动HIS、RIS、PACS及影像设备的紧密集成,为构架数字化医疗奠定基础。
IHE前瞻性地提供一个开放式的技术框架,不仅能引导厂商清除不同系统的“孤岛现象”,而且能够促进
厂商逐步提升已有系统,以适应应用户对医疗信息一体化的需要。IHE虽然源于美国,但在各地得到了广泛的认同与接受。在欧洲、日本、韩国、我国台湾等地都有相应的机构在推广与应用IHE技术框架。我国于2005年诞生了IHE2China组织。相信IHE会给我国的医疗影像信息系统集成提供指导意义及当今RIS/PACS应用的发展方向。本次研讨会在理论与实践方面交流与探索了与此有关的问题。(曹厚德)
动态血糖监测仪
动态血糖监测仪(CGMS)近年来已用于临床,它可不间断地监测病人1天中的每时每刻的血糖值,即通过CGMS可以对受试者的血糖进行“全天候”跟踪监测观察。这是人类第一次了解到血糖变化趋势。CGMS可谓是血糖检测领域的一个新突破。该仪器仅有手机大小,内有微电脑芯片,有一细微软管连接仪器与探测头,探测头插入腹部皮下组织。仪器每10秒钟从探测器接受一次反映血糖变化的电信号,将每5分钟的电信号平均值转换成血糖值存储起来。每天可记录、存储288个血糖值。该仪器同时还可记录和贮存进餐、运动、用药等事件。CGMS可连续监测3天(72小时)血糖的动态变化,而后可把数据下载到普通电脑中。CGMS的应用可发现许多以往的检测方法所不能探测到的糖代谢紊乱之特点。病人在CGMS测试中无痛苦感,可以照常生活、工作、运动等。并为拟定更为合理化的治疗方案提供了临床依据。
・20・《上海生物医学工程》杂志2006年第26卷第1期
蛋白质结构与功能研究中的分子模拟技术
刘 伟 丁祖泉 王海芸
同济大学生命科学与技术学院 (上海200092)
【摘要】 分子模拟技术为蛋白质的研究提供了一种崭新的手段,在理论上解决了结构预测和功能分析以及蛋白质工程实施方面所面临的难题。它在蛋白质的结构预测和模建工作中占有举足轻重的地位,实现了生物技术与计算机技术的完美结合。本文简要阐述了该技术的基本步骤和工作原理,并以目前应用最广的生物大分子领域的商品化分子模拟软件Accelrys公司基于Linux系统开发的InsightII为例,介绍了相关程序模块的功能和作用,同时结合该技术在蛋白质的结构预测和模建、、分子设计等过程中的开发与应用,加以具体说明和展望。
【关键词】 PDB数据库 分子模拟技术 MolecularStructureandFunctionResearch
LiuWei Dingzuquan Wanghaiyun
Tongjiuniversity,InstituteofLifeScienceandMedicalEngineering (Shanghai200092)
【Abstract】 Molecularmodelingmethodologyhasinspiredmuchnewhopefortheresearchesofprotein,foritsolvestheproblemintheproteinstructureprediction,functionanalysisandproteinengineeringtheoretically.Ithassuc2cessfullyappliedcomputertechnologyinthefieldofbiologyandplayedthekeyroleintheproteinstructurepredictionandfunctionresearches.Thispaperdescribesbasicprincipleandstepsofsuchmodelingmethodology,introducesthefunctionofsoftwaremodulesusingmolecularmodelingcommercialsoftwareInsightIIasanexamplewhichisdevelopedbyAccel2rysCompanybasingonLinuxoperatingsystem,andalsoilluminatesfurthercurrentapplicationandprospectofsuchtech2nologyinmodelingprediction,functionanalysisandmoleculesinteraction.
【Keywords】 PDBdatabase molecularmodelingmethodology homologousmodeling drugdesign
核酸和蛋白质是生命的主要物质基础,前者负构,现在则以每天超过5个结构的速度增长。到责生命机体的世代遗传,后者是生命机体几乎所有2001年底,蛋白质PDB数据库中已有被X射线衍射重要活动的承担者,人和动植物几乎所有重要的功和MRI方法测定的蛋白质结构16917个,但是,这些能性活动,诸如代谢、发育、生长、思维、记忆、免疫、只是数以百万计的蛋白质中微不足道的一小部分。光合作用、固氮作用等都离不开蛋白质。蛋白质空间结构的测定已经成为生命科学发展的
尽管组成所有蛋白质的氨基酸只有20种,但是“瓶颈”。虽然世界各国都在加大投入,不断提高测每一个蛋白质都有它自己特有的一定的氨基酸组成定速度,但相对于巨大数目的未知蛋白质结构,也只和排列顺序,其不同排列方式的所有可能性却是一是“杯水车薪”。并且,除了需要大量资金投入外,在个巨大的天文数字,加之多肽链在空间的折叠卷曲,技术上还存在种种不可逾越的障碍,即有些蛋白质导致其结构与功能的多样性。蛋白质晶体X射线根本不能被结晶(例如膜蛋白)。除非近期内试验技衍射和MRI测定技术仍然是当今蛋白质空间结构术上的重大突破,实验方法将不能胜任全部蛋白质测定的主要方法。由于蛋白质三维结构的多样性和结构的测定工作[1]。复杂性,在20世纪90年代大约是一天解出一个结同时,以1982年Winter等[2]首次报道通过基因
《上海生物医学工程》杂志2006年第26卷第1期
定位诱变获得改性酪氨酸tRNA合成酶;1983年Ul2
mer[3]在“Science”上发表以“ProteinEngineering”为题的专论为标志,蛋白质工程的诞生,意味着人们可以通过有控制的基因修饰和基因合成,对现有蛋白质加以定向改造、设计、构建并最终生产性能比自然界存在的蛋白质更加优良、更加符合人类社会需要的新型蛋白质。那么同样,在改造、设计、构建蛋白质的过程中,如果仅通过分子生物学实验进行的话,不仅耗资大、而且出效慢,这亦成为蛋白质工程实施中的艰巨的课题。
以计算机技术为依托的分子模拟技术的应运而生,从理论上解决了上述两方面的难题。分子模拟技术被誉为除实验与理论研究之外,了解、认识微观世界的”第三种手段”,它是以量子化学、统计力学为理论基础的一门新兴学科,(计算分子的性质)和分子模拟(行为,)的手段,举足轻重的地位,实现了生物技术与计算机技术的完美结合,同时该技术在结构与功能关系分析、分子设计等过程中也得到了广泛深入的开发与应用,正不断显示出巨大的生命力。由于其在理论、方法和计算技术方面所取得的成就,分子模拟取得了引人瞩目的进展,已成为化学、物理、生物、材料研究中的有力工具[4,5]。1 关于分子模拟技术1.1 蛋白质结构与功能的分子模拟研究的基本步骤
如图1所示,首先确定所要研究的目标蛋白质,然后或者通过蛋白质晶体学得到其结构,或者从PDB数据库中找到其已知的结构,而对于仍无法得到结构的蛋白质则需要通过结构预测的办法进行同源模建,其理论依据是Anfinsen原理,即蛋白质分子的一级序列完全决定其三维空间结构。如果能在蛋白质结构数据库中找到序列同源性大于30%的已知结构作模板,即可以进行一定程度的预测,特别是结构域部分的预测。
当前,蛋白质空间结构模拟主要有两类方法:同源模建(homologymodeling)和从头设计(denovode2sign)。对于药物设计还可应用三维定量构效关系(3D-QSAR)的方法和虚拟受体的方法。
・21・
在分析其结构与功能的关系过程中,可引入突变(如氨基酸的突变、二硫键的突变等)来进一步验证预测模型的合理性。最后,需要通过能量优化及蛋白质动力学计算以得到所模拟的最终构象,用理论力学的方法计算蛋白质三级结构的基本假设是:蛋白质天然构象是能量最小的构象。提出这一假说的实验根据是,许多蛋白质可以在体外从完全去折叠状态自发地折叠成天然构象。根据这一假设,只要计算出蛋白质肽链所有可能构象的能量(范德华力、共价能、溶剂化能、氢键等等),从中取出能量最小的构象,就是蛋白质的天然构象[1,6]
。
图1 分子模拟技术的工作流程图
1.2 应用软件介绍
目前,应用于生物大分子领域的商品化分子模拟软件主要有Accelrys公司基于Linux系统开发的InsightII和基于Windows系统开发的DSModeling。
以及Quanta和Tripos公司的Sybyl软件。在国内,北京大学物理化学研究所也开发了一套“北京大学蛋白质分子设计系统”。而RasMol是一个非常有名的免费软件,用来显示蛋白质、核酸以及小分子的三维结构。
以InsightII为例,它是提供分子建模与模拟的专业工具,从严格意义上说,InsightII并不完全是一个生物信息学软件,它实际上是一个三维图形环境软件包,集成了生物分子及有机小分子建模和显示工具、功能分析工具、结构改造工具、动力学模拟工具等,帮助研究人员在实验前全面了解生物分子的结构与功能,从而有针对性地设计实验方案,提高实验效率,节省时间,降低科研成本。其具体的功能模块有:
・22・《上海生物医学工程》杂志2006年第26卷第1期
传统方法快30倍的速度模拟分子运动和特性,提高
了计算效率,也简化了动力学模拟分析[7]。
除了商品化软件之外,网上也有很多蛋白质研究的自由软件,例如用于三维分子结构的阅读软件有Chime、Cn3da、Rasmol、MolMol、Swiss3Dviewer等[8],均可以在网上免费下载获得。2 分子模拟技术的主要应用领域2.1 蛋白质的结构预测与模建
根据Anfinsen原理,在无法利用NMR得到蛋白质结构的情况下,如果能在PDB中找到序列同源性大于30%的已知结构作模板,然后根据分子力学、分子动力学等能量优化理论对其进行优化。在一定条件下,。
[9],对脯氨酸酶的,以大肠杆菌甲硫氨酸肽酶IMAT)为模板,模建了人脯氨酸酶C端的结构域的空间结构。通过对该模建结构的分析,预测了可能的物理化学性质。
ShuqunLiu[10]曾运用计算机模拟人类CCR5受体的蛋白结构,以及其与HIV-1包膜上的糖蛋白gp120的对接方式,其模拟结果不仅强烈支持了理论上gp120-CCR5互作机理,而且也有助于新一类抑制剂的研究。
冠状病毒的主要蛋白酶或称3CL蛋白酶是病毒复制的关键蛋白,其主要功能是水解病毒所表达的两个多聚蛋白质。序列分析表明3CL蛋白酶在已测定的SARS基因组中是完全保守的,有可能是药物设计的关键靶标之一。刘士勇等[11]利用BLASTP程序检索,发现SARS冠状病毒3CL蛋白酶与猪传染性肠胃炎病毒(TGEV)3CL蛋白酶同源性达43%,序列相似性达57%,他们用InsightII的MODELER程序进行了SARS冠状病毒3CL蛋白酶的同源模建;选择所给出的最优结构进行能量极小化,利用PROCHECK程序检查所得到的结构模型的合理性;计算使用CHARMM程序,对该蛋白酶的活性位点的两个环区进行了构象模拟,找到了两种代表性构象。2.2 蛋白质的结构与功能关系分析
各种因素都将引起蛋白质结构和功能的改变,借助于计算机建立的原子水平的分子模型来模拟分子的结构和行为,例如通过替换、添加、删除残基来
(1)生物大分子结构建模与性质分析
Biopolymer;Homology;MODELER;Profiles23D;Seq2Fold;DelPhi;BindingSiteAnalysis等都是有关大分子
结构建模与性质分析的程序模块,Biopolymer可用来
构建和调整生物大分子的结构,包括蛋白质、多肽、核酸及糖类;Homology可利用结构和序列的同源性进行未知结构蛋白质的结构预测,比如根据蛋白质的氨基酸序列通过在PDB库中搜索同源蛋白质模板,预测此蛋白质的三维结构;MODELER利用来自经验的空间约束条件,自动地为蛋白质生成一个完整的模型,研究人员只需提供与至少一个已知三维结构的蛋白质的序列比对关系;Profiles-3D提供一个蛋白质反向折叠的结构预测方法,首先检测蛋白质序列和已知结构的相容性,然后利用相容性的信息来处理蛋白质的反向折叠问题;SeqFold提供一个用于蛋白质的功能识别程序;DelPhi,子表面静电势,;BindingSiteAnalysis。
(2)基于靶点结构的分子设计
Affinity是一个自动灵活的分子对接程序;Ludi
是配体设计工具;MCSS是用于配体结合部位分析和表征的模块,它也是一个基于结构进行小分子设计的程序,可以单独使用也可与Ludi配合使用;Search/Compare用于生成及比较不同分子的构象特征,便于用户进行多个分子的叠合,系统检索立体构象的特点;Converter可以从一个包含二维结构的数据库自动生成三维结构。
(3)结构模型构建工具
用Sketcher画出分子的二维结构,仅需要定义元素类型、连接键和立体选择性,该模块可将二维绘图转化为三维构象。
(4)能量计算工具
Discover是分子力学计算的工具,进行分子力学及分子动力学模拟,优化和搜索构象,预测分子系统的能量和特性;CHARMm是由哈佛大学开发的分子动力学计算工具,模拟过程提供了有关分子结构、相互作用、能量等信息,与其他模块相结合,可完成各种模拟计算;CFF力场中的参数是通过对近2000个不同分子的超过200万次基于量子力学的能量及能量导数的计算而得,特别适合用于对复合物体系的相互作用研究;MBO(N)D即多体动力学方法,以比
《上海生物医学工程》杂志2006年第26卷第1期
对多肽进行调整;或用旋转异构体优化侧链构象;或
利用不能形成氢键的残基(如丙氨酸)取代在天然态中形成氢键的残基等方法,模拟实现蛋白质的“突变”。并以此分析分子体系的静电势、键强弱、亲疏水性、能量分布等各种物理和化学性质,以及稳定态和折叠过程的动力学性质等,以揭示其结构与功能的关系。
膜联蛋白AnxB1是一个新的膜联蛋白亚家族成员,具有较强的抗凝血活性和血栓亲和性。颜宏利等[12]首先利用FASTA搜索PDB数据库,选择与AnxB1具有45.2%同源性的AnxV作为第一模板,通
・23・
酶的同源性进行了分析,进而对其三维结构进行了成功的同源建模,并根据所模建的三维结构对3CL蛋白水解酶的活性位点进行分析,获得了作为抗SARS药物作用靶点的3CL蛋白水解酶的详细信息,为尽快找到有效药物打下了坚实的基础[15]。通过将凝血酶抑制剂水蛭素的C端20肽片段嫁接到血小板结合蛋白AnnexinV上,可以期望获得既有抗凝血活性,同时又具有导向性的新型工程蛋白质分子。范圭等[16]利用PDB中已被X衍射测定的AnnexinV结构,将水蛭素(取自它与凝血酶的复合物PDBcode:htc4)的C端20肽片段与AnnexinV的C端(Asp320)以伸展构象连接,形成初始构象,再利用InsightII的Discover(C)对初始构象进行,(对接)进行了动力学模拟和优化。最后分析的结果支持了上述想法。2.3 蛋白质小分子设计
蛋白质工程的长远目标之一就是蛋白质分子的从头设计,根据所掌握的蛋白质结构与功能关系的精确规律,按照预先确定的活性和结构,对蛋白质分子进行设计、剪接,最后按人类的意愿产生全新的蛋白质。而就近期目标而言,在对蛋白质和其配体之间结构-活性关系有足够了解的基础上,设计具有特异性的小分子抑制剂将是十分可行的。基于结构的药物设计是发现和开发治疗制剂的一个新方法,是蛋白质工程在医药工业中应用的闪光点。
HIV-1蛋白酶容易通过残基突变产生耐药性。以HIV-1PR切割前体蛋白质上的位点序列为蓝本,通过对病毒蛋白酶序列的多重序列比对(align2ment)分析,即可发现活性部位的关键性区域,应用高通量筛选技术已经能够发现酶的高亲和力配体,并利用计算机模拟技术确定少数认为在理论上不可变异的侧链及其对应的配体,然后对先导化合物(例如Haloperidol等)进行结构修饰,得到了改进的抑制剂化合物,使之专一性地作用于这些侧链,以达到改善其抗耐药性的目的。目前临床上应用的多为此类药物,即拟肽类HIV-1PR抑制剂(HIVPI),它们能与HIV-1PR结合但不被水解,从而产生竞争性抑制作用。如Martin[17]对原有的抑制剂进行了优化,得到Ro31-8959,该抑制剂于1995年底获FDA批准,临床显示了较强的抗病毒性,尤其和逆转录酶抑
过InsightII的Homology程序建模;Discover进行分子力学和分子动力学优化;采用Profiles-3D程序进行合理性检测。发现AnxB1具有四个内部同源结构域,以此为基础构建了四个序列缺失突变体,肠杆菌中表达,、GSTM4,大降低,、栓药物奠定了基础。
戴林森等[13]以大肠杆菌碱性磷酸酶(BAP)为主要结构模板,用计算机同源建模方法构建了耐热碱性磷酸酶(FD-TAP)的三维结构,对它们的结构特征进行了分析比较,并用Profile-3D和Ramachan2dran图等方法分析了结构的合理性。在此基础上,又构建了FD-TAP的3个突变体的结构,用CHAR2MM能量计算法研究了FD-TAP及其3个突变体的
能量与酶蛋白热稳定性之间的关系,得到了与实验完全一致的结果。结果表明,如果氨基酸残基置换使蛋白质分子的总能量降低,疏水性增高和柔韧性减小,往往使蛋白质的耐热性增加。
MiyabenolC(MiyC)和KobophenolA(KobA)是两种新型的植物雌激素。为了探讨MiyC和KobA与雌激素受体(ER)的结合位点,田春艳等[14]运用计算机模拟技术构建它们与ER结合的空间模型,找出结合位点,设计ER的两个突变体M1ER和M2ER;运用PCR技术将ER与MiyC和KobA的结合位点进行突变;通过报告基因检测MiyC和KobA对突变的ER是否具有激活功能。结果显示MiyC激活M1ER,KobA对M1ER无作用;MiyC和KobA对M2ER均无激活作用。从而判断出MiyC和KobA与ER结合的可能位点。
利用分子模拟,对SARS病毒的3CL蛋白水解
・24・《上海生物医学工程》杂志2006年第26卷第1期
2 WinterG,FershtAR,WilkinsonAJ,etal.Redesigning
enzymestructurebysite2directedmutagenesis:tyrosyltRNAsynthetaseandATPbinding.Nature1982Oct
21,299(5885):7562758
3 Ulmer.Proteinengineering.Science1983,219:6662
671
4 赵雨杰.医学生物信息学.北京:人民卫生出版
制剂AZT和ddC合并使用效果更为明显。WangS
等[18]利用计算机模拟技术对新型HIV21蛋白酶抑制剂的研究也取得了满意的效果。
同时,由于数据库中已经存在的化合物(先导化合物),其合成方法是已知的,甚至有些化合物已经商品化,可以直接购买,从而可以较快地进入生物测试阶段,提高新药开发的效率。基于受体三维结构的搜索方法已经广泛应用于先导药物分子设计中,并取得了一些令人鼓舞的结果,如蛋白质激活酶C配体[19],血管紧张素转化酶抑制剂[20]等的发现。3 展望
社,2002:P425
5 王志新.蛋白质结构预测的现状与展望.生命的化学1999,6:P1926 DavidW.Mount.生物信息学.北京:高等教育出
随着蛋白质晶体学和NMR测定技术的飞快发
展,获得高分辨率蛋白质结构信息的速度将会更快;人类基因组序列的破译,为蛋白质设计提供了更多的靶位;随着对药物作用机理的认识,数目及多样性的要求会逐步降低,高;算、搜索等,将使计算机分子模拟技术得到不断的改进和完善。可以预言,下一步将能够逐步实现对所设计的小分子的代谢进行毒理学预测。
从HIV病毒发现到现在,共有16种抗病毒药物完成注册并上市,其中包括10种逆转录酶抑制剂以及6种蛋白酶抑制剂。逆转录酶抑制剂大都是通过传统的临床“筛选”方法得到;但在蛋白酶抑制剂的设计中,基于结构的药物设计方法以及计算机分子模拟技术辅助药物分子设计方法则扮演了重要的角色。
1982年,在美国只有Merck公司组织了一个研究小组从事以分子模拟为基础的药物设计。今天,美国和世界几乎所有的大医药公司都有了这样的研究团队,在美国甚至还出现了主要利用结构预测方法设计药物的公司。
尽管离蛋白质结构预测和分子设计的最终目标还很遥远,但是分子模拟技术作为药物设计的重要方法已经扎下根来,正在为维护人类的健康和创造人类的未来作出贡献。
参考文献
1 王大成.蛋白质工程.北京:化学工业出版社,
2001:P2252227
版社,2003:P34623487 郑珩,王非..北京:化学工业出ww),,陈润生,等.人脯氨酸酶活性中
心结构的计算机模拟.中国生物化学与分子生物学报2002818(4):P499250510 LiuShuqun,FanShixiu,SunZhirong.Structural
andfunctionalcharacterizationofthehumanCCR5
receptorincomplexwithHIVgp120envelopeglyco2proteinandCD4receptorbymolecularmodelingstudies.JMolModel2003,9:P3292336
11 刘士勇,裴剑锋,陈浩,等.SARS冠状病毒主要
蛋白酶结构建模及活性部位运动性分析.首届分子模拟与化学、生物、材料信息学软件应用学
术研讨会2004,P6526912 颜宏利,宋云龙,刘凡等.膜联蛋白AnxB1的同
源模建及降低免疫原性研究.中国科学C辑生命科学2004,34(1):P5426013 戴林森,季朝能,王健,等.耐热碱性磷酸酶(FD2
TAP)的结构模型研究.中国生物化学与分子生物学报20016,17(3):P365237114 田春艳,高海东,张宇早,等.MiyabenolC和
KobophenolA与雌激素受体的结合位点.生物
化学与生物物理学报2003,35(1):P77281
15 XiongB.ModelingofSARScoronavirusmainpro2
teinaseandconformationalflexibilityoftheactivesite.ActaPharamacolSin2003Jun:24(6):P497250416 范圭,王进,杨杉,等.一种水蛭素类融合蛋白与
凝血酶作用的动力学模拟.生物化学与生物物
《上海生物医学工程》杂志2006年第26卷第1期
理进展2001,28(1):P86289
17 MartinJ.RecentadvancesinthedesignofHIV21
PRoteinaseinhibitors.AntiviralRes1992,17:P26518 WangS,MilneGWA,YanX,etal.Discoveryof
novel,non2petideHIV21proteaseinhibitorsbyphar2
macophoresearching.JMedChem199639:P204722054
19 WangS,ZaharevitzDW,SharmaR,etal.The
discoveryofnovel,structurallydiverseproteinki2
・25・
naseCagoniststhroughcomputer3D2databasepharmacophoresearchmolecularmodelingstudies.JMedChem1994,37:P447924489
20 MayerD,Naylor.Auniquegeometryofactivesiteof
angiotensin2convertingenzymeconsistentwithstruc2ture2activitystudies.JComput2AidedMolDes1987,1:P3216
(收稿日期:2006201217)
中美PACS高级研讨会在沪召开
以“RIS(放射科信息系统)/PACS集成与IHE()PACS高级研讨会于
2006年2月6日在上海召开。30研讨。国际著名PACS专家、“Dr・BernieHung主持了本次研讨会。、秘书长钟国康副主任技师及RADinfosystems技术总监张一荃博士、对RIS/PACS集成的指导意义”“、IHE2China工作情况”及“IHE在美国与中国的实践经验”。
著名影像学专家陈星荣、沈天真、陈克敏、缪竞陶、许茂盛、周敏及曹厚德等多位专家教授参与讨论。当今的PACS应用,已不仅局限在传统的放射信息化(RadiologyInformatics)领域,而是延伸到医疗信息共享及工作流集成。RSNA与HIMSS共同倡导的IHE(IntergratingHealthcareEnterprise)理念,更是有力地推动HIS、RIS、PACS及影像设备的紧密集成,为构架数字化医疗奠定基础。
IHE前瞻性地提供一个开放式的技术框架,不仅能引导厂商清除不同系统的“孤岛现象”,而且能够促进
厂商逐步提升已有系统,以适应应用户对医疗信息一体化的需要。IHE虽然源于美国,但在各地得到了广泛的认同与接受。在欧洲、日本、韩国、我国台湾等地都有相应的机构在推广与应用IHE技术框架。我国于2005年诞生了IHE2China组织。相信IHE会给我国的医疗影像信息系统集成提供指导意义及当今RIS/PACS应用的发展方向。本次研讨会在理论与实践方面交流与探索了与此有关的问题。(曹厚德)
动态血糖监测仪
动态血糖监测仪(CGMS)近年来已用于临床,它可不间断地监测病人1天中的每时每刻的血糖值,即通过CGMS可以对受试者的血糖进行“全天候”跟踪监测观察。这是人类第一次了解到血糖变化趋势。CGMS可谓是血糖检测领域的一个新突破。该仪器仅有手机大小,内有微电脑芯片,有一细微软管连接仪器与探测头,探测头插入腹部皮下组织。仪器每10秒钟从探测器接受一次反映血糖变化的电信号,将每5分钟的电信号平均值转换成血糖值存储起来。每天可记录、存储288个血糖值。该仪器同时还可记录和贮存进餐、运动、用药等事件。CGMS可连续监测3天(72小时)血糖的动态变化,而后可把数据下载到普通电脑中。CGMS的应用可发现许多以往的检测方法所不能探测到的糖代谢紊乱之特点。病人在CGMS测试中无痛苦感,可以照常生活、工作、运动等。并为拟定更为合理化的治疗方案提供了临床依据。