如何查找基因序列信息

查找基因信息,好多网站都可以做到。一般常用的经典基因数据库有NCBI、UCSC。下面我们就以BCL2为例看一下如何在这两个数据库查找基因信息,比如最常查询DNA序列、mRNA序列以及启动子序列、UTR序列甚至蛋白质序列。

1F

DNA序列

1.打开NCBI中Gene选项,输入BCL2后,点击search.

2.首先寻找基因DNA序列,如图所示,可以看到基因在染色体定位。

3.在Genomic一栏中,点击Genbank后,可以看到如下界面,选择send-File-GenBank格式后,可以将序列导出到电脑桌面,这样可以得到基因的DNA序列。在导出序列时有两种格式:GenBnak格式,因为这个格式提供了很多该基因的信息;FASTA格式只含有基因序列。可以根据需求选择。

2F

mRNA序列

1.在mRNA and protein一栏中,可以看到BCL2基因有两个转录本NM_000633.2和NM_000633.2

2.点击NM_000633.2,可以查询基因编码区CDS、以及外显子exon等。

应用小故事(1)

比如,近年来异常火爆的cas9技术,是在DNA的水平进行编辑。在验证cas9对基因效率时,一般将突变型与野生型的基因序列交给测序公司,通过分析测序结果判断基因是否发生突变。而为了实现DNA的水平的突变,在进行设计时就会在mRNA序列中的mRNA序列的外显子上进行设计引物,为什么是外显子呢?因为内含子在翻译过程中被剪切,即便发生序列发生改变,功能也不会改变。

3F

启动子序列、UTR序列、蛋白序列

1.打开UCSC主页,选择物种,输入基因名称。

3.点击后进入以下页面,通过UCSC数据库可以查询该基因的基因组信息,蛋白质数据库UniprotKB相关信息,该基因在不同组织表达的RNA-seq数据,基因芯片数据,蛋白质功能域以及结构,GO富集分析等等内容。

(1)根据查询目的,比如查询基因启动子、UTR、CDS区,点击Genomic sequence。

(2)根据需求选择需要查询的内容,同时可以设置UTR、CDS区等,搜索结果会以大小写形式区分。转录起始位点前面是基因的调控区,启动子区没有明显的位置定义,大家也只是猜测它的大体位置,比如你要研究promoter区,建议选择转录起始位点前的2000个碱基进行研究。当然如果觉得长度太长,也可以只研究-1000到0这一千个碱基,一般情况下,启动子区的变异都在这个区域内。

应用小故事(2)

在mircroRNA的研究中,最关键的一步是验证mircroRNA与靶基因是否具有调控关系。可以通过将目的基因3’UTR区域构建至载体中报告基因luciferase的后面,通过比较过表达或者干扰miRNA后,监测萤光素酶的活性变化而验证报告基因表达的改变。

(3)如果想要查寻蛋白序列,点击protein即可得到.

当然,如果不满足于获得蛋白质序列,还可以看看蛋白质功能域与3D结构。

应用小故事(3)

蛋白质的许多特性可直接从序列上分析获得,我们根据序列预测蛋白质功能比较该蛋白序列是否与已知功能的蛋白质相似,或者查找未知蛋白中是否包含与特定蛋白质家族或功能域有关的亚序列或保守区段。

最后,不管是 Pubmed还是 UCSC数据库,数据库功能都非常强悍,而且数据库会链接到不同的数据库(Uniport,GO,MGI等等),让搜索变得更简单。所以需要我们不断地学习与探索......

“医学方”始终致力于服务“医学人”,将最前沿、最有价值的临床、科研原创文章推送给各位临床医师、科研人员

医学方已推出“实验室那些事儿”“SCI写作技巧”“文献精读与解析”“医学英语轻松学”“国自然基金申请”“临床数据挖掘”、“基因数据挖掘”、“R语言教程”、“医学统计学”、“微创动物实验培训”等多个专题课程,如需了解课程详细推文,可关注“医学方”公众号,点击“精品专题”进入

想了解“医学方”最新视频课程动态?可登陆腾讯课堂或网易云课堂收看

目前已有课程:

(1)医学方|医学统计学公开课|石小白老师教您轻松学统计(公益免费课程)

(2)医学方|医学数据挖掘精品课程|豪斯医生手把手教您如何数据挖掘

(3)医学方|R语言快速入门与数据清洗|一本R书走天涯系列课程

(4)医学方|R语言作图|缤纷灿烂R语言系列课程

腾讯课堂:https://medfun.ke.qq.com

网易云课堂:http://study.163.com/u/ykt[1**********]12

客服电话:[1**********]

客服微信:yixuefang1234

温馨提示:医学方还设有专门的讨论群哦~各位明星导师都在群中,可以解答各位的遇到的问题,如有兴趣,可以加客服微信后加入群聊~

查找基因信息,好多网站都可以做到。一般常用的经典基因数据库有NCBI、UCSC。下面我们就以BCL2为例看一下如何在这两个数据库查找基因信息,比如最常查询DNA序列、mRNA序列以及启动子序列、UTR序列甚至蛋白质序列。

1F

DNA序列

1.打开NCBI中Gene选项,输入BCL2后,点击search.

2.首先寻找基因DNA序列,如图所示,可以看到基因在染色体定位。

3.在Genomic一栏中,点击Genbank后,可以看到如下界面,选择send-File-GenBank格式后,可以将序列导出到电脑桌面,这样可以得到基因的DNA序列。在导出序列时有两种格式:GenBnak格式,因为这个格式提供了很多该基因的信息;FASTA格式只含有基因序列。可以根据需求选择。

2F

mRNA序列

1.在mRNA and protein一栏中,可以看到BCL2基因有两个转录本NM_000633.2和NM_000633.2

2.点击NM_000633.2,可以查询基因编码区CDS、以及外显子exon等。

应用小故事(1)

比如,近年来异常火爆的cas9技术,是在DNA的水平进行编辑。在验证cas9对基因效率时,一般将突变型与野生型的基因序列交给测序公司,通过分析测序结果判断基因是否发生突变。而为了实现DNA的水平的突变,在进行设计时就会在mRNA序列中的mRNA序列的外显子上进行设计引物,为什么是外显子呢?因为内含子在翻译过程中被剪切,即便发生序列发生改变,功能也不会改变。

3F

启动子序列、UTR序列、蛋白序列

1.打开UCSC主页,选择物种,输入基因名称。

3.点击后进入以下页面,通过UCSC数据库可以查询该基因的基因组信息,蛋白质数据库UniprotKB相关信息,该基因在不同组织表达的RNA-seq数据,基因芯片数据,蛋白质功能域以及结构,GO富集分析等等内容。

(1)根据查询目的,比如查询基因启动子、UTR、CDS区,点击Genomic sequence。

(2)根据需求选择需要查询的内容,同时可以设置UTR、CDS区等,搜索结果会以大小写形式区分。转录起始位点前面是基因的调控区,启动子区没有明显的位置定义,大家也只是猜测它的大体位置,比如你要研究promoter区,建议选择转录起始位点前的2000个碱基进行研究。当然如果觉得长度太长,也可以只研究-1000到0这一千个碱基,一般情况下,启动子区的变异都在这个区域内。

应用小故事(2)

在mircroRNA的研究中,最关键的一步是验证mircroRNA与靶基因是否具有调控关系。可以通过将目的基因3’UTR区域构建至载体中报告基因luciferase的后面,通过比较过表达或者干扰miRNA后,监测萤光素酶的活性变化而验证报告基因表达的改变。

(3)如果想要查寻蛋白序列,点击protein即可得到.

当然,如果不满足于获得蛋白质序列,还可以看看蛋白质功能域与3D结构。

应用小故事(3)

蛋白质的许多特性可直接从序列上分析获得,我们根据序列预测蛋白质功能比较该蛋白序列是否与已知功能的蛋白质相似,或者查找未知蛋白中是否包含与特定蛋白质家族或功能域有关的亚序列或保守区段。

最后,不管是 Pubmed还是 UCSC数据库,数据库功能都非常强悍,而且数据库会链接到不同的数据库(Uniport,GO,MGI等等),让搜索变得更简单。所以需要我们不断地学习与探索......

“医学方”始终致力于服务“医学人”,将最前沿、最有价值的临床、科研原创文章推送给各位临床医师、科研人员

医学方已推出“实验室那些事儿”“SCI写作技巧”“文献精读与解析”“医学英语轻松学”“国自然基金申请”“临床数据挖掘”、“基因数据挖掘”、“R语言教程”、“医学统计学”、“微创动物实验培训”等多个专题课程,如需了解课程详细推文,可关注“医学方”公众号,点击“精品专题”进入

想了解“医学方”最新视频课程动态?可登陆腾讯课堂或网易云课堂收看

目前已有课程:

(1)医学方|医学统计学公开课|石小白老师教您轻松学统计(公益免费课程)

(2)医学方|医学数据挖掘精品课程|豪斯医生手把手教您如何数据挖掘

(3)医学方|R语言快速入门与数据清洗|一本R书走天涯系列课程

(4)医学方|R语言作图|缤纷灿烂R语言系列课程

腾讯课堂:https://medfun.ke.qq.com

网易云课堂:http://study.163.com/u/ykt[1**********]12

客服电话:[1**********]

客服微信:yixuefang1234

温馨提示:医学方还设有专门的讨论群哦~各位明星导师都在群中,可以解答各位的遇到的问题,如有兴趣,可以加客服微信后加入群聊~


相关文章

  • 如何查找一个基因的启动子序列
  • 定义:启动子是参与特定基因转录及其调控的DNA 序列.包含核心启动子区域和调控区域.核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节. 区域:启动子的范围非常大,可以包含转录起始位点上游 ...查看


  • 基因多态性分析
  • 人 一.实验目的 1. 了解基因多态性在阐明人体对疾病.毒物的易感性与耐受性.疾病临床表现的多样性以及对药物治疗的反应性中的重要作用. 2. 了解分析基因多态性的基本原理和研究方法. 二.实验原理 基因多态性(gene polymorphi ...查看


  • 基因启动子分析基本流程
  • 基因启动子分析基本流程""分子生物学发展迅猛,新方法新技术新发现层出不穷,但是我想,我们的基础研究从 某种意义上来说,可以简单的分为两大部分,一个是基因的表达,另一个是基因的功能.当 然,这个基因的概念现在已经不仅仅是指 ...查看


  • 2电子克隆技术及其在植物基因工程中的应用
  • 电子克隆技术及其在植物基因工程中的应用 王冬冬 朱延明 李勇 李杰 柏锡 ( 东北农业大学生命科学学院,黑龙江哈尔滨150030) 摘要:电子克隆是随着基因组计划和EST 计划的实施而发展起来的, 是利用生物信息学手段进行基因克隆的新方法. ...查看


  • 生物信息学名词解释
  • 一.名词解释: 1.生物信息学: 研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体.利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存.检索.处理及分析,并以生物学知识对结果进行 ...查看


  • 各类软件及其用途文档
  • 三维分子类 RASMOL 2.7.2.1 观看生物分子3D 微观立体结构的软件.非常有名,巨棒! RasTop 2.0 为RasMol 2.7.1的图形用户界面软件 CHIME 2.6 SP3 直接在浏览器中观看3D 分子. MolMol ...查看


  • Haploview软件使用方法图解
  • Haploview 软件使用方法图解 Haploview 是一个进行单倍型分析的一个软件,该软件具有如下功能: 1.连锁不平衡与单倍型分析 2.单倍型人群频率估算 3.SNP 与单倍型关系分析 4.相互关系的排列测验 5.可以从 HapMa ...查看


  • EST或转录组分析
  • 开放共赢 关注创新 俞鸿 副总经理 手机:[1**********] E-mail: [email protected] 9qq [email protected] 1 ESTs(Expressed Sequence tags )是从cDNA文件 ...查看


  • 基因表达数据分析实验指导
  • 基因表达数据分析实验指导 2.7对差异表达基因送入功能注释 附 -- Matlab的Microarray Data Analysis 1. 实验基本情况 实验目的: 掌握和了解常用的基因表达分析过程,包括数据下载.数据预处理.差异表达分析和 ...查看


热门内容