生物信息学现状与展望

研 究 生 课 程 考 试 卷

学号、姓名: j20112001 苗天锦

年级、专业:2011生物化学与分子生物学

培养层次: 硕士

课程名称: 生物信息学

授课学时学分: 32学时 2学分

考试成绩:

授课或主讲教师签字:

生物信息学现状与展望

摘要:生物信息学是一门新兴学科,起步于20世纪90年代,至今已进入"后基因组时代",本文对生物信息学的产生背景及其研究现状等方面进行了综述,并展望生物信息学的发展前景。生物信息学的发展在国内、外基本上都处在起步阶段。

关键词:生物信息学;生物信息学背景;发展前景

一、生物信息学概述

1.生物信息学发展历史

随着生物科学技术的迅猛发展,生物信息数据资源的增长呈现爆炸之势,同时计算机运 算能力的提高和国际互联网络的发展使得对大规模数据的贮存、处理和传输成为可能,为了 快捷方便地对已知生物学信息进行科学的组织、有效的管理和进一步分析利用,一门由生命 科学和信息科学等多学科相结合特别是由分子生物学与计算机信息处理技术紧密结合而形 成的交叉学科——生物信息学(Bioinformatics)应运而生,并大大推动了相关研究的开展, 被誉为“解读生命天书的慧眼” 【1】。

研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:基因是以生物成分存在。1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等。与此同时,Wilkins与Franklin用X射线衍射技术测定了DNA纤维的结构。1953年James Watson 和FrancisCrick在Nature杂志上推测出DNA的三维结构(双螺旋)。Kornberg于1956年从大肠杆菌(E.coli)中分离出DNA聚合酶I(DNA polymerase I),能使4种dNTP连接成DNA。Meselson与Stahl(1958)用实验方法证明了DNA复制是一种半保留复制。Crick于1954年提出了遗传信息传递的规律,DNA是合成RNA的模板,RNA又是合成蛋白质的模板,称之为中心法则(Central dogma),这一中心法则对以后分子生物学和生物信息学的发展都起到了极其重要的指导作用。经过Nirenberg和Matthai(1963)的努力研究,编码20氨基酸的遗传密码得到了破译。限制性内切酶的发现和重组DNA的克隆(clone)奠定了基因工程的技术基础【2】。自1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日,被誉为生命“阿波罗计划”的人类基因组计划终于完成了工作草图,预示着完成人类基因组计划已经指日可待。生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。

2.生物信息学研究方向

2.1 序列比对

序列比对是指为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。序列比对是生物信息学的重要研究方向。生物信息学的研究重点主要体现在基因组学和蛋白质学两方面,具体地说就是从核酸和蛋白质序列出发, 分析序列中表达结构和功能的生物信息。生物信息学的基本任务是对各种生物分析序列进行分析, 也就是研究新的计算机方法, 从大量的序列信息中获取基因结构、功能和进化等知识。而在序列分析中, 将未知序列同已知序列进行相似性比较是一种强有力的研究手段,从序列的片段测定, 拼接, 基因的表达分析, 到RNA和蛋白质的结构功能预测。物种亲缘树的构建都需要进行生物分子序列的相似性比较。生物信息学中

【3】的序列比对算法的研究具有非常重要的理论意义和实践意义。

2.2 分子进化和比较基因组学

生物进化过程中生物大分子的演变,包括前生命物质的演变;蛋白质分子和核酸分子的演变以及细胞器和遗传机构(例如遗传密码)的演变。分子进化的研究可以为生物进化过程提供佐证,为深入研究进化机制提供重要依据。近年来较多模式生物基因组测序任务的完成,人们可从整个基因组的角度来研究分子进化。在匹配不同种族的基因时,一般须处理三种情况:Orthologous:不同种族,相同功能的基因;Paralogous:相同种族,不同功能的基因;Xenologs:有机体间采用其他方式传递的基因,如被病毒注入的基因。这一领域常采用的方法是构造进化树,通过基于特征(即DNA序列或蛋白质中的氨基酸的碱基的特定位置)和基于距离(对齐的分数)的方法和一些传统的聚类方法(如UPGMA)来实现【4】。

2.3 蛋白质信息学

目前对蛋白质组研究的技术手段很多,常用的主要有双向凝胶电泳和测序质谱技术等。与它们相比,生物信息学在蛋白质组学的研究中将起着特殊的重要作用。因为蛋白质组研究提供的数据的数量之大在生物学上是史无前例的。当前生物信息学已经不仅是高效地进行对蛋白质数据的分析,而且可以对已知的或新的基因产物进行全面的功能分析。对蛋白质的分析研究产生了蛋白质组信息学。蛋白质组信息学研究包括蛋白质序列对齐、序列比较分析、蛋白质结构-功能关系的研究、点突变的设计及家族鉴定,蛋白质空间结构预测、建模和分子设计以及蛋白质功能预测等。在蛋白质的结构预测方面,由于蛋白质的生物学功能在很大程度上依赖于其空间结构,因而进行蛋白质的结构预测对了解未知蛋白生物学功能具有重要意义。而对蛋白质结构的预测离不开由许许多多的蛋白质数据形成的各种蛋白质数据库。蛋白质由氨基酸组成,它的结构层次包括一级结构、二级结构、三级结构和四级结构等【5】。蛋白质空间结构预测就是利用已知的一级序列来构建其立体结构模型。目前对单一序列的二级结构预测的准确率较高,通过多序列比对可以显著提高预测的效能,如PHDsec程序。对蛋白质三级结构的预测由于

蛋白质折叠过程的复杂性变得更难,目前在利用生物信息学对蛋白质三维空间结构预测方面的主要方法有同源模建、折叠识别和从头预测3种。一般先将目标蛋白与蛋白质结构数据库中的已知结构相比较,如果两者序列同源性较高,则可用同源模建方法对目标蛋白质的结构进行预测。同源模建方法在蛋白质结构预测及药物设计中起着重要的作用【6】。

2.4 生物系统的建模和仿真

随着大规模实验技术的发展和数据累积,从全局和系统水平研究和分析生物学系统,揭示其发展规律已经成为后基因组时代的另外一个研究 热点-系统生物学。目前来看,其研究内容包括生物系统的模拟,系统稳定性分析,系统鲁棒性分析等方面。以SBML为代表的建模语言在迅速发展之中,以布尔网络、微分方程、随机过程、离散动态事件系统等方法在系统分析中已经得到应 用。很多模型的建立借鉴了电路和其它物理系统建模的方法,很多研究试图从信息流、熵和能量流等宏观分析思想来解决系统的复杂性问题。当然,建立生物系统的理论模型还需要很长时间的努力,现在实验观测数据虽然在海量增加,但是生物系统的模型辨识所需要的数据远远超过了目前数据的产出能力【7】。例如,对于时间序列的芯片数据,采样点的数量还不足以使用传统的时间序列建模方法,巨大的实验代价是目前系统建模主要困难。系统描述和建模方法也需要开创性的发展【8】。

3.生物信息学发展前景

生物学是生物信息学的核心和灵魂,数学与计算机技术则是它的基本工具。这一点必须着重指出。预测生物信息学的未来主要就是要预测他对生物学的发展将带来什么样的根本性的突破。信息学的商业价值十分显著。国外很多大学,研究机构,软件公司甚至政府机构纷纷成立各种生物信息机构,建立自立的生物信息集成系统,研制这方面的软件,重金招聘人才,期望从中获取更多的生物信息和数据加以研究和利用,缩短药物开发周期,抢注基因专利,获取更大利润【9】。国内一些科研单位已经开始摸索着从事这方面的工作。清华大学在基因调控及基因功能分析、蛋白质二级结构预测方面,天津大学物理系和中科院理论物理所在相关算法方面,中科院生物物理所在基因组大规模测序数据的组装和标识方面,北京大学化学学院物理化学研究所在蛋白质分子设计方面,华大基因组研究中心(中科院遗传所人类基因组研究中心)在大规模测序数据处理自动化流程体系及数据库系统建立方面均已展开相关研究。随着生物信息学在国内受到越来越多人的重视和关注,我们有理由相信生物信息学会在未来迅速发展壮大【10,11】。

参考文献:

【1】生命科学发展战略调研小组.迎接生命科学世纪的挑战.世界科技研究与发

展,2001,23(1):1-6

【2】陈润生.生物信息学.生物物理学报,1999,15(1):5-13.

【3】Humphery Smith I,Cordwell SJ,Blackstock WP.Proteome research: complementarity and limitations with respect to the RNA and DNA worlds. Electrophoresis 1997,18(8):1217-42

【4】郑国清,张瑞玲,段韶芬,徐丽敏;生物信息学的形成与发展,河南农业科学;2002(11)

【5】殷志祥.蛋白质结构预测方法的研究进展,计算机工程与应用,2004,40

(20):54-7

【6】Baker D,Sali A.Protein structure prediction and structural genomics.Science,2001,294(5540):93-6

【7】Krawetz SA,Womble DD.Design and implementation of an introductory course for computer applications in molecular genetics,A case study.Molecular Biotechnology,2001,17(1):27-41

【8】杨福愉. 展望 21 世纪的分子生物学 . 生物物理学报 ,1999 ;15 (1) :1-5

【9】黄科,曹家树.生物信息学.情报学报,2002(8):491-496

【10】陈成.生物信息学的现状与未来.生物技术通报,2000(2):51-53

【11】郝鲁江,梁泉峰.生物信息学的发展及其应用.山东轻工业学院学报,2000,14(2):37-41

研 究 生 课 程 考 试 卷

学号、姓名: j20112001 苗天锦

年级、专业:2011生物化学与分子生物学

培养层次: 硕士

课程名称: 生物信息学

授课学时学分: 32学时 2学分

考试成绩:

授课或主讲教师签字:

生物信息学现状与展望

摘要:生物信息学是一门新兴学科,起步于20世纪90年代,至今已进入"后基因组时代",本文对生物信息学的产生背景及其研究现状等方面进行了综述,并展望生物信息学的发展前景。生物信息学的发展在国内、外基本上都处在起步阶段。

关键词:生物信息学;生物信息学背景;发展前景

一、生物信息学概述

1.生物信息学发展历史

随着生物科学技术的迅猛发展,生物信息数据资源的增长呈现爆炸之势,同时计算机运 算能力的提高和国际互联网络的发展使得对大规模数据的贮存、处理和传输成为可能,为了 快捷方便地对已知生物学信息进行科学的组织、有效的管理和进一步分析利用,一门由生命 科学和信息科学等多学科相结合特别是由分子生物学与计算机信息处理技术紧密结合而形 成的交叉学科——生物信息学(Bioinformatics)应运而生,并大大推动了相关研究的开展, 被誉为“解读生命天书的慧眼” 【1】。

研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:基因是以生物成分存在。1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等。与此同时,Wilkins与Franklin用X射线衍射技术测定了DNA纤维的结构。1953年James Watson 和FrancisCrick在Nature杂志上推测出DNA的三维结构(双螺旋)。Kornberg于1956年从大肠杆菌(E.coli)中分离出DNA聚合酶I(DNA polymerase I),能使4种dNTP连接成DNA。Meselson与Stahl(1958)用实验方法证明了DNA复制是一种半保留复制。Crick于1954年提出了遗传信息传递的规律,DNA是合成RNA的模板,RNA又是合成蛋白质的模板,称之为中心法则(Central dogma),这一中心法则对以后分子生物学和生物信息学的发展都起到了极其重要的指导作用。经过Nirenberg和Matthai(1963)的努力研究,编码20氨基酸的遗传密码得到了破译。限制性内切酶的发现和重组DNA的克隆(clone)奠定了基因工程的技术基础【2】。自1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日,被誉为生命“阿波罗计划”的人类基因组计划终于完成了工作草图,预示着完成人类基因组计划已经指日可待。生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。

2.生物信息学研究方向

2.1 序列比对

序列比对是指为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。序列比对是生物信息学的重要研究方向。生物信息学的研究重点主要体现在基因组学和蛋白质学两方面,具体地说就是从核酸和蛋白质序列出发, 分析序列中表达结构和功能的生物信息。生物信息学的基本任务是对各种生物分析序列进行分析, 也就是研究新的计算机方法, 从大量的序列信息中获取基因结构、功能和进化等知识。而在序列分析中, 将未知序列同已知序列进行相似性比较是一种强有力的研究手段,从序列的片段测定, 拼接, 基因的表达分析, 到RNA和蛋白质的结构功能预测。物种亲缘树的构建都需要进行生物分子序列的相似性比较。生物信息学中

【3】的序列比对算法的研究具有非常重要的理论意义和实践意义。

2.2 分子进化和比较基因组学

生物进化过程中生物大分子的演变,包括前生命物质的演变;蛋白质分子和核酸分子的演变以及细胞器和遗传机构(例如遗传密码)的演变。分子进化的研究可以为生物进化过程提供佐证,为深入研究进化机制提供重要依据。近年来较多模式生物基因组测序任务的完成,人们可从整个基因组的角度来研究分子进化。在匹配不同种族的基因时,一般须处理三种情况:Orthologous:不同种族,相同功能的基因;Paralogous:相同种族,不同功能的基因;Xenologs:有机体间采用其他方式传递的基因,如被病毒注入的基因。这一领域常采用的方法是构造进化树,通过基于特征(即DNA序列或蛋白质中的氨基酸的碱基的特定位置)和基于距离(对齐的分数)的方法和一些传统的聚类方法(如UPGMA)来实现【4】。

2.3 蛋白质信息学

目前对蛋白质组研究的技术手段很多,常用的主要有双向凝胶电泳和测序质谱技术等。与它们相比,生物信息学在蛋白质组学的研究中将起着特殊的重要作用。因为蛋白质组研究提供的数据的数量之大在生物学上是史无前例的。当前生物信息学已经不仅是高效地进行对蛋白质数据的分析,而且可以对已知的或新的基因产物进行全面的功能分析。对蛋白质的分析研究产生了蛋白质组信息学。蛋白质组信息学研究包括蛋白质序列对齐、序列比较分析、蛋白质结构-功能关系的研究、点突变的设计及家族鉴定,蛋白质空间结构预测、建模和分子设计以及蛋白质功能预测等。在蛋白质的结构预测方面,由于蛋白质的生物学功能在很大程度上依赖于其空间结构,因而进行蛋白质的结构预测对了解未知蛋白生物学功能具有重要意义。而对蛋白质结构的预测离不开由许许多多的蛋白质数据形成的各种蛋白质数据库。蛋白质由氨基酸组成,它的结构层次包括一级结构、二级结构、三级结构和四级结构等【5】。蛋白质空间结构预测就是利用已知的一级序列来构建其立体结构模型。目前对单一序列的二级结构预测的准确率较高,通过多序列比对可以显著提高预测的效能,如PHDsec程序。对蛋白质三级结构的预测由于

蛋白质折叠过程的复杂性变得更难,目前在利用生物信息学对蛋白质三维空间结构预测方面的主要方法有同源模建、折叠识别和从头预测3种。一般先将目标蛋白与蛋白质结构数据库中的已知结构相比较,如果两者序列同源性较高,则可用同源模建方法对目标蛋白质的结构进行预测。同源模建方法在蛋白质结构预测及药物设计中起着重要的作用【6】。

2.4 生物系统的建模和仿真

随着大规模实验技术的发展和数据累积,从全局和系统水平研究和分析生物学系统,揭示其发展规律已经成为后基因组时代的另外一个研究 热点-系统生物学。目前来看,其研究内容包括生物系统的模拟,系统稳定性分析,系统鲁棒性分析等方面。以SBML为代表的建模语言在迅速发展之中,以布尔网络、微分方程、随机过程、离散动态事件系统等方法在系统分析中已经得到应 用。很多模型的建立借鉴了电路和其它物理系统建模的方法,很多研究试图从信息流、熵和能量流等宏观分析思想来解决系统的复杂性问题。当然,建立生物系统的理论模型还需要很长时间的努力,现在实验观测数据虽然在海量增加,但是生物系统的模型辨识所需要的数据远远超过了目前数据的产出能力【7】。例如,对于时间序列的芯片数据,采样点的数量还不足以使用传统的时间序列建模方法,巨大的实验代价是目前系统建模主要困难。系统描述和建模方法也需要开创性的发展【8】。

3.生物信息学发展前景

生物学是生物信息学的核心和灵魂,数学与计算机技术则是它的基本工具。这一点必须着重指出。预测生物信息学的未来主要就是要预测他对生物学的发展将带来什么样的根本性的突破。信息学的商业价值十分显著。国外很多大学,研究机构,软件公司甚至政府机构纷纷成立各种生物信息机构,建立自立的生物信息集成系统,研制这方面的软件,重金招聘人才,期望从中获取更多的生物信息和数据加以研究和利用,缩短药物开发周期,抢注基因专利,获取更大利润【9】。国内一些科研单位已经开始摸索着从事这方面的工作。清华大学在基因调控及基因功能分析、蛋白质二级结构预测方面,天津大学物理系和中科院理论物理所在相关算法方面,中科院生物物理所在基因组大规模测序数据的组装和标识方面,北京大学化学学院物理化学研究所在蛋白质分子设计方面,华大基因组研究中心(中科院遗传所人类基因组研究中心)在大规模测序数据处理自动化流程体系及数据库系统建立方面均已展开相关研究。随着生物信息学在国内受到越来越多人的重视和关注,我们有理由相信生物信息学会在未来迅速发展壮大【10,11】。

参考文献:

【1】生命科学发展战略调研小组.迎接生命科学世纪的挑战.世界科技研究与发

展,2001,23(1):1-6

【2】陈润生.生物信息学.生物物理学报,1999,15(1):5-13.

【3】Humphery Smith I,Cordwell SJ,Blackstock WP.Proteome research: complementarity and limitations with respect to the RNA and DNA worlds. Electrophoresis 1997,18(8):1217-42

【4】郑国清,张瑞玲,段韶芬,徐丽敏;生物信息学的形成与发展,河南农业科学;2002(11)

【5】殷志祥.蛋白质结构预测方法的研究进展,计算机工程与应用,2004,40

(20):54-7

【6】Baker D,Sali A.Protein structure prediction and structural genomics.Science,2001,294(5540):93-6

【7】Krawetz SA,Womble DD.Design and implementation of an introductory course for computer applications in molecular genetics,A case study.Molecular Biotechnology,2001,17(1):27-41

【8】杨福愉. 展望 21 世纪的分子生物学 . 生物物理学报 ,1999 ;15 (1) :1-5

【9】黄科,曹家树.生物信息学.情报学报,2002(8):491-496

【10】陈成.生物信息学的现状与未来.生物技术通报,2000(2):51-53

【11】郝鲁江,梁泉峰.生物信息学的发展及其应用.山东轻工业学院学报,2000,14(2):37-41


相关文章

  • 国外粉体技术现状与展望
  • 2007年增刊中国非金属矿工业导刊总第64期 [专题评述] 盖国胜 (清华大学粉体工程研究室,北京 中图分类号:TB44:T-12 文献标识码:A 100084) 文章编号:1007-9386(2007)增刊一0019-02 信息.生物和新 ...查看


  • 生物信息技术现状研究及发展趋势
  • 2014版中国生物信息技术市场调研与发展 前景预测报告 报告编号:1A07961 行业市场研究属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果以报告形式呈现,通常包含以下内容: 一份专业的行业研究报告,注重指导企业或投资者了 ...查看


  • 计算机图像识别技术的发展现状与展望
  • 计算机图像识别技术的发展现状与展望 摘要:简述了计算机图像识别技术的发展现状与展望,系统分析了计算机图像处理技术的主要优点.不足及制约其发展的因素,阐述了计算机图像处理技术研究的主要内容和将来的研究重点,概述了计算机图像处理技术未来的应用领 ...查看


  • 中国精细化工的现状和发展前景展望
  • 科技信息○科教前沿○ SCIENCE&TECHNOLOGYINFORMATION2011年第23期 中国精细化工的现状和发展前景展望 李小强1李留刚2关民普2 (1.河南省环境工程评估中心河南郑州450000:2.河南省正大环境科技 ...查看


  • 2016年生物技术行业现状及发展趋势分析
  • 中国生物技术市场调研与发展趋势预测报 告(2016年) 报告编号:1826020 行业市场研究属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果以报告形式呈现,通常包含以下内容: 一份专业的行业研究报告,注重指导企业或投资者了 ...查看


  • 人脸识别技术的研究现状与展望
  • 人脸识别技术的研究现状与展望 董琳 赵怀勋 武警工程学院通信工程系,陕西,710086 [摘 要]本文主要介绍了人脸识别技术(FRT)的常用方法,讨论和分析了人脸检测与定位.人脸特征提取.人脸识别方法等方面的研究成果,总结了人脸识别的未来发 ...查看


  • 特种陶瓷国内市场现状与展望
  • 特种陶瓷国内市场现状与展望 俞前 北京新材料发展中心 特种陶瓷是我国高技术产业的重点领域之一.我国电子信息.汽车.化工.建材.轻工及国防建设都对特种陶瓷产生巨大需求,市场前景十分广阔.预计2010年我国特种陶瓷产业要实现产值300亿元人民币 ...查看


  • 2015-2020年中国基因工程药物行业市场监测报告
  • 2015-2020年中国基因工程药物行业 市场监测及投资前景预测报告 中国产业信息网 什么是行业研究报告 行业研究是通过深入研究某一行业发展动态.规模结构.竞争格局以及综合经济信息等,为企业自身发展或行业投资者等相关客户提供重要的参考依据. ...查看


  • 2017年中国医药行业现状及发展趋势分析
  • ▄前言 行业研究是开展一切咨询业务的基石,通过对特定行业的长期跟踪监测,分析行业需求.供给.经营特性.获取能力.产业链和价值链等多方面的内容,整合行业.市场.企业.用户等多层面数据和信息资源,为客户提供深度的行业市场研究报告,以专业的研究方 ...查看


热门内容