全基因组关联分析(GWAS)解决方案
※ 概述
全基因组关联研究(Genome-wide association study,GWAS)是用来检测全基因组范围的遗传变异与
可观测的性状之间的遗传关联的一种策略。2005年,Science杂志报道了第一篇GWAS研究——年龄相关性黄 斑变性,之后陆续出现了有关冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂症等的研究报道。截至2010年 底,单是在人类上就有1212篇GWAS文章被发表,涉及210个性状。GWAS主要基于共变法的思想,该方法是 人类进行科学思维和实践的最重要工具之一;统计学研究也表明,GWAS很长时期内都将处于蓬勃发展期(如 下图所示)。
基因型数据和表型数据的获得,随着诸多新技术的发展变得日益海量、廉价、快捷、准确和全面:如 Affymetrix和Illumina公司的SNP基因分型芯片已经可以达到2M的标记密度;便携式电子器械将产生海量的表型 数据;新一代测序技术的迅猛发展,将催生更高通量、更多类别的基因型,以及不同类别的高通量表型。基于 此,我们推出GWAS的完整解决方案,协助您一起探索生物奥秘。
※ 实验技术流程
※ 基于芯片的GWAS
Affymetrix公司针对人类全基因组SNP检测推出多个版本检测芯片,2007年5月份,Affymetrix公司发布了 人全基因组SNP 6.0芯片,包含90多万个用于单核苷酸多态性(SNP)检测探针和更多数量的用于拷贝数变化 (CNV)检测的非多态性探针。因此这种芯片可检测超过180万个位点基因组序列变异,即可用于全基因组
SNP分析,又可用于CNV分析,真正实现了一种芯片两种用途,方便研究者挖掘基因组序列变异信息。
Illumina激光共聚焦微珠芯片平台为全世界的科研用户提供了最为先进的SNP(单核苷酸多态性)研究平
台。Illumina的SNP芯片有两类,一类是基于infinium技术的全基因组SNP检测芯片(Infinium Whole Genome Genotyping),适用于全基因组SNP分型研究及基因拷贝数变化研究,一张芯片检测几十万标签SNP位点,提 供大规模疾病基因扫描(Hap660,1M)。另一类是基于GoldenGate特定SNP位点检测芯片,根据研究需要挑选 SNP位点制作成芯片(48-1536位点),是复杂疾病基因定位的最佳工具。
罗氏NimbleGen根据人类基因组序列信息设计的2.1M超高密度CGH芯片,可以在1.1Kb分辨率下完成全基 因组检测,可有效检测人基因组中低至约5kb大小的拷贝数变异。
※ 基于高通量测序的GWAS
传统的基于芯片的GWAS取得了不少成功,但仍存在诸多局限,如发现的疾病相关变异多为非直接致病因 素,对表型效应或遗传力的贡献微弱,对SNP以外的其它变异检测效力低等。随着高通量测序技术的出现和不 断发展,一种广义的GWAS概念开始出现,即在全基因组范围内,利用关联分析的原理和方法进行各种组学研 究,不仅包括SNP,还包括插入缺失、结构变异(包括CNV)、基因表达、表观遗传修饰等。
※ 计算中心GWAS案例
华中农业大学玉米农艺性状GWAS数据分析。
基因型为玉米的600K芯片数据, 表型为各发育时期不同农艺性状的总共797种表型。利用计算中心高性 能计算机群的分布式计算能力,仅用1天半的时间便完成了全部分析工作。
※ 参考文献
1、Huang et al., Genome-wide association studies of 14 agronomic traits in rice landraces. Nature Genetics. 2010, 42: 961-967
2、Kim et al., Design of Association Studies with Pooled or Un-pooled Next-Generation Sequencing Data. Genetic Epidemiology. 2010, 34 : 479-491
3、The Wellcome Trust Case Control Consortium, Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls. Nature. 2007 June 7; 447(7145): 661-678
4、Zhang et al., Psoriasis genome-w ide association study identifies susceptibilit y variants w ithin LCE gene cluster at 1q21. Nat Genet. 2009 Feb;41(2):205-10
5、Yan et al., Rare genetic variation at Zea mays crtRB1 increases β-carotene in maize grain. Nature Genetics. 2010, 42: 322-327
6、Li et al., Low-coverage sequencing: Implications for design of complex trait association studies. Genome Res. 2011. 21: 940-951
全基因组关联分析(GWAS)解决方案
※ 概述
全基因组关联研究(Genome-wide association study,GWAS)是用来检测全基因组范围的遗传变异与
可观测的性状之间的遗传关联的一种策略。2005年,Science杂志报道了第一篇GWAS研究——年龄相关性黄 斑变性,之后陆续出现了有关冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂症等的研究报道。截至2010年 底,单是在人类上就有1212篇GWAS文章被发表,涉及210个性状。GWAS主要基于共变法的思想,该方法是 人类进行科学思维和实践的最重要工具之一;统计学研究也表明,GWAS很长时期内都将处于蓬勃发展期(如 下图所示)。
基因型数据和表型数据的获得,随着诸多新技术的发展变得日益海量、廉价、快捷、准确和全面:如 Affymetrix和Illumina公司的SNP基因分型芯片已经可以达到2M的标记密度;便携式电子器械将产生海量的表型 数据;新一代测序技术的迅猛发展,将催生更高通量、更多类别的基因型,以及不同类别的高通量表型。基于 此,我们推出GWAS的完整解决方案,协助您一起探索生物奥秘。
※ 实验技术流程
※ 基于芯片的GWAS
Affymetrix公司针对人类全基因组SNP检测推出多个版本检测芯片,2007年5月份,Affymetrix公司发布了 人全基因组SNP 6.0芯片,包含90多万个用于单核苷酸多态性(SNP)检测探针和更多数量的用于拷贝数变化 (CNV)检测的非多态性探针。因此这种芯片可检测超过180万个位点基因组序列变异,即可用于全基因组
SNP分析,又可用于CNV分析,真正实现了一种芯片两种用途,方便研究者挖掘基因组序列变异信息。
Illumina激光共聚焦微珠芯片平台为全世界的科研用户提供了最为先进的SNP(单核苷酸多态性)研究平
台。Illumina的SNP芯片有两类,一类是基于infinium技术的全基因组SNP检测芯片(Infinium Whole Genome Genotyping),适用于全基因组SNP分型研究及基因拷贝数变化研究,一张芯片检测几十万标签SNP位点,提 供大规模疾病基因扫描(Hap660,1M)。另一类是基于GoldenGate特定SNP位点检测芯片,根据研究需要挑选 SNP位点制作成芯片(48-1536位点),是复杂疾病基因定位的最佳工具。
罗氏NimbleGen根据人类基因组序列信息设计的2.1M超高密度CGH芯片,可以在1.1Kb分辨率下完成全基 因组检测,可有效检测人基因组中低至约5kb大小的拷贝数变异。
※ 基于高通量测序的GWAS
传统的基于芯片的GWAS取得了不少成功,但仍存在诸多局限,如发现的疾病相关变异多为非直接致病因 素,对表型效应或遗传力的贡献微弱,对SNP以外的其它变异检测效力低等。随着高通量测序技术的出现和不 断发展,一种广义的GWAS概念开始出现,即在全基因组范围内,利用关联分析的原理和方法进行各种组学研 究,不仅包括SNP,还包括插入缺失、结构变异(包括CNV)、基因表达、表观遗传修饰等。
※ 计算中心GWAS案例
华中农业大学玉米农艺性状GWAS数据分析。
基因型为玉米的600K芯片数据, 表型为各发育时期不同农艺性状的总共797种表型。利用计算中心高性 能计算机群的分布式计算能力,仅用1天半的时间便完成了全部分析工作。
※ 参考文献
1、Huang et al., Genome-wide association studies of 14 agronomic traits in rice landraces. Nature Genetics. 2010, 42: 961-967
2、Kim et al., Design of Association Studies with Pooled or Un-pooled Next-Generation Sequencing Data. Genetic Epidemiology. 2010, 34 : 479-491
3、The Wellcome Trust Case Control Consortium, Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls. Nature. 2007 June 7; 447(7145): 661-678
4、Zhang et al., Psoriasis genome-w ide association study identifies susceptibilit y variants w ithin LCE gene cluster at 1q21. Nat Genet. 2009 Feb;41(2):205-10
5、Yan et al., Rare genetic variation at Zea mays crtRB1 increases β-carotene in maize grain. Nature Genetics. 2010, 42: 322-327
6、Li et al., Low-coverage sequencing: Implications for design of complex trait association studies. Genome Res. 2011. 21: 940-951