第50卷第5期2014年5月
doi :10.11707/j.1001-7488.20140509
林
SCIENTIA
业科
SILVAE
学
SINICAE
Vol. 50,No. 5
2014May ,
*
2油桐花芽个不同发育时期转录组分析
孙
(中南林业科技大学
颖谭晓风罗敏李建安
长沙410004)
经济林育种与栽培国家林业局重点实验室经济林培育与保护省部共建教育部重点实验室
摘要:seq 技术对油桐2个不同发育时期的花芽的转录组进行比较分析,利用RNA-获得大量差异表达的
unigene 序列。通过GO 分类和Pathway 富集性分析,将这些差异表达unigene 分别归类于55个GO term 和128个代GA 途径和自主途谢途径。unigene 中有103个与植物开花相关,涉及4个开花调控途径(光周期途径、春化途径、径)。随着花芽发育,越来越多的unigene 表达量呈现上调趋势,上调的基因数量超过下调基因数量。研究结果可在一定程度上解析油桐花芽形态分化的分子调控模式与机制。关键词:
油桐;花芽;转录组测序;开花基因
文献标识码:A
文章编号:1001-7488(2014)05-0070-05
中图分类号:S718. 46
The Sequencing Analysis of Transcriptome of Vernicia fordii Flower Buds at Two Development Stages
Sun Ying
Tan Xiaofeng
Luo Min
Li Jian ’an
Key Laboratory of Cultivation and
Changsha 410004)
(Key Laboratory of Non-Wood Forest Breeding and Cultivation of State Forest Administration Protection for Non-Wood Forest Tree of Ministry of Education
Central South University of Forestry and Technology
Abstract :This research compared transcriptome of Vernicia fordii flower buds at two different developing stages using
RNA-seq technique and then obtained a lot of differentially expressed unigenes.Through GO classification and pathway enrichment analysis ,all of these differentially expressed unigenes were classified into 55GO terms and 128metabolism pathways ,respectively.One hundred and three unigenes identified from transcriptome data were referred to four major plant flowering regulation pathways including photoperiod pathway ,verbalization pathway ,GA-dependent pathway and autonomous pathway.With the development of flower buds ,more and more unigenes ’expression levels were up-regulated and the number of up-regulated genes was more than that of down-regulated genes.This research has resolved to some extent the molecular mechanisms regulating mode with flower bud morphological differentiation of V .fordii .Key words :
Vernicia fordii ;flower bud ;transcriptome sequencing ;flowering genes
油桐(Vernicia fordii )是我国特有的亚热带地区
代表性经济树种,也是重要的工业油料树种,新近人们又认识到油桐在生物能源方面具有重要开发利用价值。对于油桐的丰产栽培、油脂合成、生物柴油制备等已进行了较多的研究(Brown et al .,2005;Steven ,2010;Shang et al.,2002;孙汉洲等,2010;
2006;张玲玲等,2011;孙颖等,2007;龚谭晓风,
1996;黄福长,2011;曹建琦,1987;黄坤榜初等,
2008;朱世永等,1992;玄伟东等,2007;周燕等,
2008)。油桐具有童期短、君等,早花早实等重要生一般播种后3年便开花(故又名“三年物学特性,),,‘对年桐’桐”其中品种播种后翌年即开花;同
收稿日期:2014-01-16;修回日期:2014-03-28。
基金项目:国家林业公益性行业科研专项重大项目(201204403)。*李建安为通讯作者。
油桐核基因组较小、自然变异丰富、性状分化强时,
烈、对环境反应敏感,具有成为“经济林模式植物”2008)。探明油桐成花分子机制的潜力(李建安等,
将为油桐及其他果用经济林树种花期调控和分子育种提供重要基础,然而,受研究材料和研究手段所目前对油桐花发育基因调控途径及早花分子机限,
制的研究尚不深入。近年新兴的高通量测序技术(Illumina 测序技术)具有数据量大、准确性好、灵敏度高、运行成本低等优点(Chen et al.,2012;Tuskan et al.,2006;Wilhelm et al.,2009),已在很多木本植物如红豆杉(Taxus chinensis )(Hao et al.,2011)、2012)和茶橡胶树(Hevea brasiliensis )(Li et al.,
第5期孙颖等:油桐花芽2个不同发育时期转录组分析
71
2011)等转录组测树(Camellia sinensis )(Shi et al.,
序研究中应用,能够从整体水平了解植物在特定阶段的基因表达模式和功能,从而更加便利地揭示特
2011)。本文定生物学过程的分子机制(祁云霞等,
2个花利用Illumina 测序技术对油桐品种‘对年桐’
芽分化时期进行转录组测序,以期在转录水平上大规模发掘油桐开花相关基因,为阐明油桐成花分子机制提供部分依据。
1. 3
测序数据的分析
参照Jiang 等(2013)转录组数据的分析方法对测序数据进行原始数据处理、序列组装、功能注释、
Pathway 富集性分析、差异分析等。利用在线微卫星位点扫描工具SSRIT在转录组数据中查找SSR位点,查找标准位二、三、四、五、六核苷酸的最小重复7,5,5,5次,次数分别为9,并且SSR位点侧翼序列长度≥50bp 。
1
1. 1
材料与方法
材料
2
2. 1
结果与分析
供试材料为7年生油桐品种‘对年桐’实生株花芽,样本采自中南林业科技大学,采集时间为810月,月、分别处于花芽分化中期和末期。1. 2RNA提取与转录组测序
采用改良的CTAB +OMEGA RNA提取试剂盒
TM
提取,委托深圳华大基因公司采用Illumina HiSeq 2000测序仪对油桐花芽样本进行转录组测序。
转录组测序与组装
10月(Ⅱ期)的花芽转录对油桐8月(Ⅰ期)、
组测序后总共获得70511条unigene 序列,其中Ⅰ
期和Ⅱ期分别获得59270条和65481条序列(图1)。unigene 序列长度主要分布在300 3000nt 之间,长度大于3000nt 的序列数量有1549条,占总序列数量的2. 2%。unigene 序列数量随着序列长度的增加而平缓逐步递减,可见测试样品质量很好
。
图1
Fig.1
Unigene 序列长度分布
The length distribution of unigene sequence
GO 富集性分析将注释的unigene 序图2所示,
列分成分子功能、细胞组分、生物过程3个大类55个小类。其中细胞增殖、代谢过程、催化活性3类富集程度较高,这可能与花芽分化过程中分生组织不断进行细胞增殖来建成各种花器官原基,导致花芽内代谢活动旺盛有关。unigene 的Pathway 富集性分析将unigene 归类于128个代谢途径,其中花芽分化Ⅰ期和Ⅱ期差异unigene 的Pathway 富集性分析的前10个Pathway 数据列于表1。对油桐花芽2个发育时期的unigene 表达量进行比较后发现,随着花芽的发育,越来越多的unigene 表达量呈上调趋势且上调基因数超过下调基因数(图3)。
2. 2油桐SSR标记开发
利用在线微卫星位点扫描工具SSRIT在转录组数据中查找到2020个由二至六个核苷酸重复序列组成的SSR位点(表2),占unigene 总数的比例为3. 41%。二核苷酸重复类型所占比例最高,达到60. 04%,随后依次为三、四、五、六核苷酸重
7. 97%,复类型,所占比例分别为30. 10%,1. 00%,0. 89%。在检出的SSR中,共发现381种
基元类型,出现频率高的前10种重复基元为AC /GT (854个),AT /AT(278个),AAG /CTT(151
AAT /ATT(118个),ACC /GGT(91个),AC /个),
GT (81个),ATC /ATG(72个),AGG /CCT(63
72
林业科学50卷
AGC /CTG(49个),AAC /GTT(32个)。上个),
述SSR特征分析有助于开展油桐及其同属物种通用性分子标记开发和遗传图谱构建的研究
。
图2
Fig.2
Unigene 的GO 功能注释及分类统计结果
GO function annotation and classification of unigene
1)生物过程1:生物附着;2:生物调控;3:碳利用;4:细胞增殖;5:细胞成分组织;6:细胞过程;7:凋亡;8:发育过程;9:定位系统的建立;10:生长;11:免疫系统过程;12:定位;13:移动;14:代谢过程;15:多机体过程;16:多细胞组织过程;17:生物过程负调控;18:生物过程正调控;19:生物过程调控;20:再生;21:再生过程;22:刺激应答;23:信号;24:单一的生物过程。2)细胞成分25:细胞;26:胞间连丝;27:细胞要素;28:细胞外液;29:细胞外液要素;30:细胞间区域;31:细胞间区域要素;32:大分子复合物;33:膜;34:膜要素;35:膜结
3)分子功能40:抗氧化剂活性;41:结合剂活性;42:催化剂活性;43:通道合腔体;36:核状体;37:细胞器;38:细胞器要素;39:共质体。
调节因子活性;44:电荷载体活性;45:酶调控因子活性;46:金属伴侣活性;47:分子感应器活性;48:核苷酸结合转录因子活性;49:营养受
体活性;50:蛋白质结合转录因子活性;51:蛋白标签;52:受体活性;53:结构分子活性;54:翻译调控因子活性;55:转运因子活性。1)Biological process 1:Biological adhesion ;2:Biological regulation ;3:Carbon utilization ;4:Cell proliferation ;5:Cellular component organization or biogenesis ;6:Cellular process ;7:Death ;8:Developmental process ;9:Establishment of localization ;10:Growth ;11:Immune system process ;12:Localization ;13:Locomotion ;14:Metabolic process ;15:Multi-organism process ;16:Multicellular organismal process ;17:Negative regulation of biological process ;18:Positive regulation of biological process ;19:Regulationof biological process ;20:Reproduction;21:Reproductiveprocess ;22:Responseto stimulus ;23:Signaling ;24:Single-organism process.2)Cellular component 25:Cell ;26:Cell junction ;27:Cell part ;28:Extracellular matrix ;29:Extracellular matrix part ;30:Extracellular region ;31:Extracellular region part ;32:Macromolecular complex ;33:Membrane ;34:Membrane part ;35:Membrane-enclosed lumen ;36:Nucleoid ;37:Organelle ;38:Organelle part ;39:Symplast.3)Molecular function
40:
Antioxidant activity ;41:Binding ;42:Catalytic activity ;43:Channel regulator activity ;44:Electron carrier activity ;45:Enzyme regulator activity ;46:Metallochaperone activity ;47:Molecular transducer activity ;48:Nucleic acid binding transcription factor activity ;49:Nutrient reservoir activity ;50:Protein binding transcription factor activity ;51:Protein tag ;52:Receptoractivity ;53:Structural molecule activity ;54:Translation regulator activity ;55:Transporter activity.
表1Tab.1
编号No.[1**********]
转录组KEGG 代谢途径分类
代谢通路Pathway
DEG 数量DEG number
[***********][1**********]58
总数量Number [***********][**************]6
KEGG classification of transcriptome
植物激素信号转导Plant hormone signal transduction
二芳基庚和姜辣素的生物合成Stilbenoid ,diarylheptanoid and gingerol biosynthesis 次生代谢产物生物合成Biosynthesis of secondary metabolites 柠檬烯和α-蒎烯降解Limonene and pinene degradation pathogen interaction 植物-真菌互作Plant-类黄酮生物合成Flavonoid biosynthesis 苯丙烷生物合成Phenylpropanoid biosynthesis
双萜生物合成Diterpenoid biosynthesis 淀粉和蔗糖代谢Starch and sucrose metabolism 新陈代谢Metabolic pathways
2. 3
转录组中开花相关基因分析大量研究表明,显花植物花发育具有相对遗传ELF4和PIF1等,VIN3,春化途径相关基因如FLC ,
VRN1,VRN2LEO1和ACT1等,GA 途径相关基因如GAI ,RGL1和DELLA1等,自主途径相关基因如FCA ,FLD 和LD 等。此外,从转录组数据中还获得FES1和FRL1这3个与FRI依赖途径相关了FRI,
的调控基因以及与年龄调节相关的SPL 基因。
保守性。本研究从油桐花芽转录组数据中获得103个开花相关基因,其中包括光周期途径相关基因如PHYB ,PHYC 和PHYE ,光敏色素基因PHYA ,隐花色素基因CRY1和CRY2,生物节律相关基因如CO ,
第5期孙颖等:油桐花芽2
个不同发育时期转录组分析
73
PHYB ,光周期调控途径中,光敏色素PHYA ,
PHYC ,PHYD 和隐花色素基因CRY1,CRY2均为下
PIF3,LHY ,ZTL ,ELF3等基因调表达基因,而CDF2,则为该调控途径上调表达基因。与植物昼夜节律相
关的CCA1基因上调表达。春化途径中的上调基因VRN1。属于赤霉素成花调控途径的RGL有VIP2,
基因为上调基因而GAI 基因属于下调基因。自主调
图3
Fig.3
差异表达基因数
控途径基因全部为上调表达基因。整合子基因中上
AP1,SOC1。与花器官发育相关基调表达基因FLC ,
因属于上调表达基因。编码CO 基因的36个
unigene 中有14个下调表达,22个上调表达。
Number of different expressed unigene
表2SSR不同重复基元分布及优势碱基组成
Tab.2
重复类型
Repeattype
二核苷酸Dinucleotide 三核苷酸Trinucleotide 四核苷酸Tetranucleotide 五核苷酸Pentanucleotide 六核苷酸Hexanucleotide 总计Total
Distribution and compositions of the dominant repeat for the different SSR
SSR数量SSRnumber [***********]
比例Proportion (%)60. 0430. 107. 971. 000. 89100. 0
优势重复单元Advantage repeat AG /CTAAG /CTTAAAC /GTTTAAAAG /CTTTTAGAGGG /CCCTCT
3讨论
本研究转录组测序样品为处于形态分化阶段2
光周期途径和赤霉素途径最终通过激活开花整合基因FT 和SOC1促进植物开花(Samach et al.,2000;Suarez et al.,2001)。在油桐花芽转录组中发现5条与FT 高度同源的unigene 序列(Izawa et al.,2002;Kojima et al.,2002)。SOC1基因能够被长日照条件下的CO 激活或GA 途径激活(Lee et al.,2010),本研究在油桐转录组中发现4条与之高度相似的unigene 序列。花芽分化Ⅱ期光敏色素基因和昼夜节律钟基因CCA1隐花色素基因表达量上调,
ELF4的表达量下降,PIF3的表达量也上调,另外,的表达量升高,这表明此时油桐光周期途径被启动。
油桐在春季自然开花,需要春化作用的诱导。本研究发掘出需受长期低温诱导才能在春化初期表达的VIN3基因,但没有发掘到与春化稳定作用相关的VIN1基因和VIN2基因,可见其春化机制与拟南芥存在差异。同时鉴定出与小麦的春化相关基因VRN1和VRN2同源序列分别为16条和2条,表明油桐春化机制可能有2条或更多条途径调控。
春化途径、自主途径和FRI依赖途径均通过不同方式调控FLC 基因表达,从而影响植物成花。春化作用可降低FLC 的表达水平而促进植物开花,FRI基因与春化作用相拮抗,从而对FLC 的表达水平起正调控作用。自主途径的一系列基因则对FLC 的表达起负调控作用。本研究发掘出与上述3类调FY ,FLD ,FPA ,LD 等高度同源控途径基因如FCA ,
个不同时期的油桐花芽,是油桐成花转变的典型时期。研究结果在一定程度上解析了油桐花芽形态分并为进一步的花发育分化的分子调控模式与机制,
子机制研究提供了基础,也为油桐花期调控和分子育种提供了可利用的基因资源。
植物通过叶片感受光诱导,经过一系列生理生化反应传导到茎尖生长点,从而诱导成花。本研究发掘出在拟南芥(Arabidopsis thaliana )、小麦(Triticum
aestivum )、甘菊
(Dendranthema
lavandulifolium )中均有发现的一系列受体基因,如光敏色素基因PHYA 等,由此可见其进化遗传的保守性。本研究发掘出12条GI 基因同源序列,有研GI 基因通过感受昼夜节律变化,究表明,进而引起自身表达量变化,从而调控下游CO 基因的表达模式,最终影响植物的成花时间;本研究发现36条CO 基因的同源序列,在长日照的傍晚和短日照的晚上这2种光照条件下,当CO 基因的表达量超过一定数值后激活FT 基因表达,从而促使植物开花(孙昌辉等,2007)。也有研究表明,CO 在光周期调控途径中的作用与物种有关(Hayama et al .,2003),因此该基因在油桐花芽分化中的作用机制还有待进一步研究。
74
林业科学
6(6):e21220.sequencing.PLoS One ,
50卷
的若干unigene 序列。另外,还发现HOS1基因的同
HOS1基因独立于上述3条成花调源unigene 序列,
控途径,负调控FLC 基因的表达。转录组数据中发
现了与年龄调控途径相关SPL 基因的同源序列。以上分析表明油桐具有复杂的成花调控途径,其调控机制的解析有待于进一步研究。
春化途径和自主途径都是通过抑制FLC 基因的表达来参与成花调控(Amasino et al .,2010;Kim et al .,2009)。本研究鉴定出2条与FLC 基因高度同源的unigene 序列,大多数拟南芥天然早花突变体的FLC 基因表达较弱或者不表达。FLC 基因在拟南芥和其他物种中的功能存在差异(Locasdo et al.,2009),FLC 基因在油桐中的表达模式与功能是否与拟南芥相同还有待研究。
参
考
文
献
Hayama R,Yokio S ,Tamaki S ,et al.2003.Adaptation of photoperiodic
422:control pathways produces short-day flowering in rice.Nature ,719-722.
Izawa T ,Oikawa T ,Sugiyama N ,et al.2002.Phytochrome mediates the
external light signal to repress FT orthologs in photoperiodic flowering of rice.Genes &Development,16(15):2006-2020.Chen H ,Tan X F.2013.The expression analysis of genes in Jiang G X ,
fatty acid biosynthesis pathway during the seed development of tung tree.Int J Bioautomation ,17(2):73-82.
Kim D H ,Doyle M R,Sung S ,et al.2009.Vernalization :winter and
the timing of flowering in plants.Annual Reviewof Cell and 25:277-299.Developmental ,
Kojima S ,Takahashi Y ,Kobayashi Y ,et al.2002.Hd3a ,a rice ortholog
of the Arabidopsis FT gene ,promotes transition to flowering day conditions.Plant and Cell downstream of Hd1under short-Physiology ,43(10):1096-1105.
Lee J ,Lee I.2010.Regulationand function of SOC1,a flowering
61(9):2247-pathway integrator.Journal of Experimental Botany ,2254.
Li D ,Deng Z ,Qin B ,et al.2012.
De novo assembly and
characterization of bark transcriptome using Illumina sequencing and development of EST-SSRmarkers in rubber tree (Hevea brasiliensis Muell ).Arg BMC Genomics ,13:192.
Locasdo A ,Lucchin M ,Varollo S.2009.Characterization of a MADS
FLOWERINGLOCUSC-LIKE (MFL )intybus :
sequence in Cichorium
a comparative study of CiMFL and AtFLC reveals
(6):34-37.曹建琦.1987.谈谈桐油的β异构化.中国油脂,
14(1):51-53.龚榜初,蔡金标.1996.油桐育种研究进展.经济林研究,黄福长.2011.国内外油桐发展现状.佛山科学技术学院学报:自然
29(3):83-87.科学版,黄
坤,夏建陵.2008.桐油及其衍生物的改性在高分子材料中的27(10):1588-1592.应用进展.化工进展,李建安,孙
颖,陈鸿鹏,等.2008.油桐LEAFY 同源基因片段的克
28(4):21-26.隆与分析.中南林业科技大学学报,
Seq 及其应祁云霞,刘永斌,荣威恒.2011.转录组研究新技术:RNA-33(11):1191-1202.用.遗传,孙昌辉,邓晓建,方
军,等.2007.高等植物开花诱导研究进展.遗
29(10):1182-1190.传,
孙汉洲,杜勋军,谭晓风,等.2010.桐油制备生物柴油的工艺研究.
30(12):134-137.中南林业科技大学学报,孙
颖,卢彰显,李建安.2007.中国油桐栽培利用与应用基础研究25(2):84-87.进展.经济林研究,
24(3):谭晓风.2006.油桐的生产现状及其发展建议.经济林研究,
62-64.
玄伟东,张天顺,张汝坤,等.2007.桐油制取生物柴油的研究.农业
36(7):204-206.化研究,
张玲玲,彭俊华.2011.油桐资源价值及其开发利用前景.经济林研
29(3):130-135.究,
周燕君,陆向红,俞云良,等.2008.桐油制备生物柴油的研究.能源
工程,(5):33-35.
朱世永,任庆生.1992.涂料工业中桐油利用的方向.中国油脂,
(S1):390-398.
Amasino RM ,Michaels S D.2010.The timing of flowering.Plant
Physiology ,154(2):516-520.
Brown K ,Keeler W.2005.The history of tung oil.Wildland Weeds ,9
(1):4-24.
Chen Y H ,Chen J H ,Luo Y M.2012.Complementary biodiesel
combination from tung and medium-chain fatty acid oils.Renewable44:305-310.Energy ,
Hao D C ,Ge G B ,Xiao P G ,et al .2011.The first insight into the tissue
specific Taxus transcriptome via Illumina second generation
182homologies and divergences in gene function.New Phytologisl ,(3):630-643.
Samach A ,Onouchi H ,Gold S E ,et al.2000.Distinct roles of
CONSTANS target genes in reproductive development of Arabidopsis .288(5471):1613-1616.Science ,
Shang Q ,Jiang W ,Lu H ,et al.2002.Properties of tung oil biodiesel
and of methylsoyate.Journal of the American Oil Chemists Society ,79(9):915-920.
Shi C Y ,Yang H ,Wei C L ,et al.2011.Deep sequencing of the
Camellia sinensis transcriptome revealed candidate genes for major 12:metabolic pathways of tea-specific compounds.BMC Genomics ,131
Steven P.2010.Determining biological roles of four unique Vernicia
fordii acyl-CoA binging proteins.Louisiana :University of New Orleans.
Suarez L P ,Wheatley K ,RobsonF ,et al.2001.CONSTANS mediates
between the circadian clock and the control of flowering in Arabidopsis .Nature ,410(6832):1116-1120.
Tuskan G A ,Difazio S ,Jansson S ,et al.2006.The genome of black
cottonwood ,Populus trichocarpa (Torr.&Gray ).Science ,313:1596-1604.
Wilhelm B T ,Landry J R.2009.RNA-Seq-quantitative measurement of
expression through massively parallel RNA-sequencing.Methods ,48(3):249-257.
(责任编辑徐红)
第50卷第5期2014年5月
doi :10.11707/j.1001-7488.20140509
林
SCIENTIA
业科
SILVAE
学
SINICAE
Vol. 50,No. 5
2014May ,
*
2油桐花芽个不同发育时期转录组分析
孙
(中南林业科技大学
颖谭晓风罗敏李建安
长沙410004)
经济林育种与栽培国家林业局重点实验室经济林培育与保护省部共建教育部重点实验室
摘要:seq 技术对油桐2个不同发育时期的花芽的转录组进行比较分析,利用RNA-获得大量差异表达的
unigene 序列。通过GO 分类和Pathway 富集性分析,将这些差异表达unigene 分别归类于55个GO term 和128个代GA 途径和自主途谢途径。unigene 中有103个与植物开花相关,涉及4个开花调控途径(光周期途径、春化途径、径)。随着花芽发育,越来越多的unigene 表达量呈现上调趋势,上调的基因数量超过下调基因数量。研究结果可在一定程度上解析油桐花芽形态分化的分子调控模式与机制。关键词:
油桐;花芽;转录组测序;开花基因
文献标识码:A
文章编号:1001-7488(2014)05-0070-05
中图分类号:S718. 46
The Sequencing Analysis of Transcriptome of Vernicia fordii Flower Buds at Two Development Stages
Sun Ying
Tan Xiaofeng
Luo Min
Li Jian ’an
Key Laboratory of Cultivation and
Changsha 410004)
(Key Laboratory of Non-Wood Forest Breeding and Cultivation of State Forest Administration Protection for Non-Wood Forest Tree of Ministry of Education
Central South University of Forestry and Technology
Abstract :This research compared transcriptome of Vernicia fordii flower buds at two different developing stages using
RNA-seq technique and then obtained a lot of differentially expressed unigenes.Through GO classification and pathway enrichment analysis ,all of these differentially expressed unigenes were classified into 55GO terms and 128metabolism pathways ,respectively.One hundred and three unigenes identified from transcriptome data were referred to four major plant flowering regulation pathways including photoperiod pathway ,verbalization pathway ,GA-dependent pathway and autonomous pathway.With the development of flower buds ,more and more unigenes ’expression levels were up-regulated and the number of up-regulated genes was more than that of down-regulated genes.This research has resolved to some extent the molecular mechanisms regulating mode with flower bud morphological differentiation of V .fordii .Key words :
Vernicia fordii ;flower bud ;transcriptome sequencing ;flowering genes
油桐(Vernicia fordii )是我国特有的亚热带地区
代表性经济树种,也是重要的工业油料树种,新近人们又认识到油桐在生物能源方面具有重要开发利用价值。对于油桐的丰产栽培、油脂合成、生物柴油制备等已进行了较多的研究(Brown et al .,2005;Steven ,2010;Shang et al.,2002;孙汉洲等,2010;
2006;张玲玲等,2011;孙颖等,2007;龚谭晓风,
1996;黄福长,2011;曹建琦,1987;黄坤榜初等,
2008;朱世永等,1992;玄伟东等,2007;周燕等,
2008)。油桐具有童期短、君等,早花早实等重要生一般播种后3年便开花(故又名“三年物学特性,),,‘对年桐’桐”其中品种播种后翌年即开花;同
收稿日期:2014-01-16;修回日期:2014-03-28。
基金项目:国家林业公益性行业科研专项重大项目(201204403)。*李建安为通讯作者。
油桐核基因组较小、自然变异丰富、性状分化强时,
烈、对环境反应敏感,具有成为“经济林模式植物”2008)。探明油桐成花分子机制的潜力(李建安等,
将为油桐及其他果用经济林树种花期调控和分子育种提供重要基础,然而,受研究材料和研究手段所目前对油桐花发育基因调控途径及早花分子机限,
制的研究尚不深入。近年新兴的高通量测序技术(Illumina 测序技术)具有数据量大、准确性好、灵敏度高、运行成本低等优点(Chen et al.,2012;Tuskan et al.,2006;Wilhelm et al.,2009),已在很多木本植物如红豆杉(Taxus chinensis )(Hao et al.,2011)、2012)和茶橡胶树(Hevea brasiliensis )(Li et al.,
第5期孙颖等:油桐花芽2个不同发育时期转录组分析
71
2011)等转录组测树(Camellia sinensis )(Shi et al.,
序研究中应用,能够从整体水平了解植物在特定阶段的基因表达模式和功能,从而更加便利地揭示特
2011)。本文定生物学过程的分子机制(祁云霞等,
2个花利用Illumina 测序技术对油桐品种‘对年桐’
芽分化时期进行转录组测序,以期在转录水平上大规模发掘油桐开花相关基因,为阐明油桐成花分子机制提供部分依据。
1. 3
测序数据的分析
参照Jiang 等(2013)转录组数据的分析方法对测序数据进行原始数据处理、序列组装、功能注释、
Pathway 富集性分析、差异分析等。利用在线微卫星位点扫描工具SSRIT在转录组数据中查找SSR位点,查找标准位二、三、四、五、六核苷酸的最小重复7,5,5,5次,次数分别为9,并且SSR位点侧翼序列长度≥50bp 。
1
1. 1
材料与方法
材料
2
2. 1
结果与分析
供试材料为7年生油桐品种‘对年桐’实生株花芽,样本采自中南林业科技大学,采集时间为810月,月、分别处于花芽分化中期和末期。1. 2RNA提取与转录组测序
采用改良的CTAB +OMEGA RNA提取试剂盒
TM
提取,委托深圳华大基因公司采用Illumina HiSeq 2000测序仪对油桐花芽样本进行转录组测序。
转录组测序与组装
10月(Ⅱ期)的花芽转录对油桐8月(Ⅰ期)、
组测序后总共获得70511条unigene 序列,其中Ⅰ
期和Ⅱ期分别获得59270条和65481条序列(图1)。unigene 序列长度主要分布在300 3000nt 之间,长度大于3000nt 的序列数量有1549条,占总序列数量的2. 2%。unigene 序列数量随着序列长度的增加而平缓逐步递减,可见测试样品质量很好
。
图1
Fig.1
Unigene 序列长度分布
The length distribution of unigene sequence
GO 富集性分析将注释的unigene 序图2所示,
列分成分子功能、细胞组分、生物过程3个大类55个小类。其中细胞增殖、代谢过程、催化活性3类富集程度较高,这可能与花芽分化过程中分生组织不断进行细胞增殖来建成各种花器官原基,导致花芽内代谢活动旺盛有关。unigene 的Pathway 富集性分析将unigene 归类于128个代谢途径,其中花芽分化Ⅰ期和Ⅱ期差异unigene 的Pathway 富集性分析的前10个Pathway 数据列于表1。对油桐花芽2个发育时期的unigene 表达量进行比较后发现,随着花芽的发育,越来越多的unigene 表达量呈上调趋势且上调基因数超过下调基因数(图3)。
2. 2油桐SSR标记开发
利用在线微卫星位点扫描工具SSRIT在转录组数据中查找到2020个由二至六个核苷酸重复序列组成的SSR位点(表2),占unigene 总数的比例为3. 41%。二核苷酸重复类型所占比例最高,达到60. 04%,随后依次为三、四、五、六核苷酸重
7. 97%,复类型,所占比例分别为30. 10%,1. 00%,0. 89%。在检出的SSR中,共发现381种
基元类型,出现频率高的前10种重复基元为AC /GT (854个),AT /AT(278个),AAG /CTT(151
AAT /ATT(118个),ACC /GGT(91个),AC /个),
GT (81个),ATC /ATG(72个),AGG /CCT(63
72
林业科学50卷
AGC /CTG(49个),AAC /GTT(32个)。上个),
述SSR特征分析有助于开展油桐及其同属物种通用性分子标记开发和遗传图谱构建的研究
。
图2
Fig.2
Unigene 的GO 功能注释及分类统计结果
GO function annotation and classification of unigene
1)生物过程1:生物附着;2:生物调控;3:碳利用;4:细胞增殖;5:细胞成分组织;6:细胞过程;7:凋亡;8:发育过程;9:定位系统的建立;10:生长;11:免疫系统过程;12:定位;13:移动;14:代谢过程;15:多机体过程;16:多细胞组织过程;17:生物过程负调控;18:生物过程正调控;19:生物过程调控;20:再生;21:再生过程;22:刺激应答;23:信号;24:单一的生物过程。2)细胞成分25:细胞;26:胞间连丝;27:细胞要素;28:细胞外液;29:细胞外液要素;30:细胞间区域;31:细胞间区域要素;32:大分子复合物;33:膜;34:膜要素;35:膜结
3)分子功能40:抗氧化剂活性;41:结合剂活性;42:催化剂活性;43:通道合腔体;36:核状体;37:细胞器;38:细胞器要素;39:共质体。
调节因子活性;44:电荷载体活性;45:酶调控因子活性;46:金属伴侣活性;47:分子感应器活性;48:核苷酸结合转录因子活性;49:营养受
体活性;50:蛋白质结合转录因子活性;51:蛋白标签;52:受体活性;53:结构分子活性;54:翻译调控因子活性;55:转运因子活性。1)Biological process 1:Biological adhesion ;2:Biological regulation ;3:Carbon utilization ;4:Cell proliferation ;5:Cellular component organization or biogenesis ;6:Cellular process ;7:Death ;8:Developmental process ;9:Establishment of localization ;10:Growth ;11:Immune system process ;12:Localization ;13:Locomotion ;14:Metabolic process ;15:Multi-organism process ;16:Multicellular organismal process ;17:Negative regulation of biological process ;18:Positive regulation of biological process ;19:Regulationof biological process ;20:Reproduction;21:Reproductiveprocess ;22:Responseto stimulus ;23:Signaling ;24:Single-organism process.2)Cellular component 25:Cell ;26:Cell junction ;27:Cell part ;28:Extracellular matrix ;29:Extracellular matrix part ;30:Extracellular region ;31:Extracellular region part ;32:Macromolecular complex ;33:Membrane ;34:Membrane part ;35:Membrane-enclosed lumen ;36:Nucleoid ;37:Organelle ;38:Organelle part ;39:Symplast.3)Molecular function
40:
Antioxidant activity ;41:Binding ;42:Catalytic activity ;43:Channel regulator activity ;44:Electron carrier activity ;45:Enzyme regulator activity ;46:Metallochaperone activity ;47:Molecular transducer activity ;48:Nucleic acid binding transcription factor activity ;49:Nutrient reservoir activity ;50:Protein binding transcription factor activity ;51:Protein tag ;52:Receptoractivity ;53:Structural molecule activity ;54:Translation regulator activity ;55:Transporter activity.
表1Tab.1
编号No.[1**********]
转录组KEGG 代谢途径分类
代谢通路Pathway
DEG 数量DEG number
[***********][1**********]58
总数量Number [***********][**************]6
KEGG classification of transcriptome
植物激素信号转导Plant hormone signal transduction
二芳基庚和姜辣素的生物合成Stilbenoid ,diarylheptanoid and gingerol biosynthesis 次生代谢产物生物合成Biosynthesis of secondary metabolites 柠檬烯和α-蒎烯降解Limonene and pinene degradation pathogen interaction 植物-真菌互作Plant-类黄酮生物合成Flavonoid biosynthesis 苯丙烷生物合成Phenylpropanoid biosynthesis
双萜生物合成Diterpenoid biosynthesis 淀粉和蔗糖代谢Starch and sucrose metabolism 新陈代谢Metabolic pathways
2. 3
转录组中开花相关基因分析大量研究表明,显花植物花发育具有相对遗传ELF4和PIF1等,VIN3,春化途径相关基因如FLC ,
VRN1,VRN2LEO1和ACT1等,GA 途径相关基因如GAI ,RGL1和DELLA1等,自主途径相关基因如FCA ,FLD 和LD 等。此外,从转录组数据中还获得FES1和FRL1这3个与FRI依赖途径相关了FRI,
的调控基因以及与年龄调节相关的SPL 基因。
保守性。本研究从油桐花芽转录组数据中获得103个开花相关基因,其中包括光周期途径相关基因如PHYB ,PHYC 和PHYE ,光敏色素基因PHYA ,隐花色素基因CRY1和CRY2,生物节律相关基因如CO ,
第5期孙颖等:油桐花芽2
个不同发育时期转录组分析
73
PHYB ,光周期调控途径中,光敏色素PHYA ,
PHYC ,PHYD 和隐花色素基因CRY1,CRY2均为下
PIF3,LHY ,ZTL ,ELF3等基因调表达基因,而CDF2,则为该调控途径上调表达基因。与植物昼夜节律相
关的CCA1基因上调表达。春化途径中的上调基因VRN1。属于赤霉素成花调控途径的RGL有VIP2,
基因为上调基因而GAI 基因属于下调基因。自主调
图3
Fig.3
差异表达基因数
控途径基因全部为上调表达基因。整合子基因中上
AP1,SOC1。与花器官发育相关基调表达基因FLC ,
因属于上调表达基因。编码CO 基因的36个
unigene 中有14个下调表达,22个上调表达。
Number of different expressed unigene
表2SSR不同重复基元分布及优势碱基组成
Tab.2
重复类型
Repeattype
二核苷酸Dinucleotide 三核苷酸Trinucleotide 四核苷酸Tetranucleotide 五核苷酸Pentanucleotide 六核苷酸Hexanucleotide 总计Total
Distribution and compositions of the dominant repeat for the different SSR
SSR数量SSRnumber [***********]
比例Proportion (%)60. 0430. 107. 971. 000. 89100. 0
优势重复单元Advantage repeat AG /CTAAG /CTTAAAC /GTTTAAAAG /CTTTTAGAGGG /CCCTCT
3讨论
本研究转录组测序样品为处于形态分化阶段2
光周期途径和赤霉素途径最终通过激活开花整合基因FT 和SOC1促进植物开花(Samach et al.,2000;Suarez et al.,2001)。在油桐花芽转录组中发现5条与FT 高度同源的unigene 序列(Izawa et al.,2002;Kojima et al.,2002)。SOC1基因能够被长日照条件下的CO 激活或GA 途径激活(Lee et al.,2010),本研究在油桐转录组中发现4条与之高度相似的unigene 序列。花芽分化Ⅱ期光敏色素基因和昼夜节律钟基因CCA1隐花色素基因表达量上调,
ELF4的表达量下降,PIF3的表达量也上调,另外,的表达量升高,这表明此时油桐光周期途径被启动。
油桐在春季自然开花,需要春化作用的诱导。本研究发掘出需受长期低温诱导才能在春化初期表达的VIN3基因,但没有发掘到与春化稳定作用相关的VIN1基因和VIN2基因,可见其春化机制与拟南芥存在差异。同时鉴定出与小麦的春化相关基因VRN1和VRN2同源序列分别为16条和2条,表明油桐春化机制可能有2条或更多条途径调控。
春化途径、自主途径和FRI依赖途径均通过不同方式调控FLC 基因表达,从而影响植物成花。春化作用可降低FLC 的表达水平而促进植物开花,FRI基因与春化作用相拮抗,从而对FLC 的表达水平起正调控作用。自主途径的一系列基因则对FLC 的表达起负调控作用。本研究发掘出与上述3类调FY ,FLD ,FPA ,LD 等高度同源控途径基因如FCA ,
个不同时期的油桐花芽,是油桐成花转变的典型时期。研究结果在一定程度上解析了油桐花芽形态分并为进一步的花发育分化的分子调控模式与机制,
子机制研究提供了基础,也为油桐花期调控和分子育种提供了可利用的基因资源。
植物通过叶片感受光诱导,经过一系列生理生化反应传导到茎尖生长点,从而诱导成花。本研究发掘出在拟南芥(Arabidopsis thaliana )、小麦(Triticum
aestivum )、甘菊
(Dendranthema
lavandulifolium )中均有发现的一系列受体基因,如光敏色素基因PHYA 等,由此可见其进化遗传的保守性。本研究发掘出12条GI 基因同源序列,有研GI 基因通过感受昼夜节律变化,究表明,进而引起自身表达量变化,从而调控下游CO 基因的表达模式,最终影响植物的成花时间;本研究发现36条CO 基因的同源序列,在长日照的傍晚和短日照的晚上这2种光照条件下,当CO 基因的表达量超过一定数值后激活FT 基因表达,从而促使植物开花(孙昌辉等,2007)。也有研究表明,CO 在光周期调控途径中的作用与物种有关(Hayama et al .,2003),因此该基因在油桐花芽分化中的作用机制还有待进一步研究。
74
林业科学
6(6):e21220.sequencing.PLoS One ,
50卷
的若干unigene 序列。另外,还发现HOS1基因的同
HOS1基因独立于上述3条成花调源unigene 序列,
控途径,负调控FLC 基因的表达。转录组数据中发
现了与年龄调控途径相关SPL 基因的同源序列。以上分析表明油桐具有复杂的成花调控途径,其调控机制的解析有待于进一步研究。
春化途径和自主途径都是通过抑制FLC 基因的表达来参与成花调控(Amasino et al .,2010;Kim et al .,2009)。本研究鉴定出2条与FLC 基因高度同源的unigene 序列,大多数拟南芥天然早花突变体的FLC 基因表达较弱或者不表达。FLC 基因在拟南芥和其他物种中的功能存在差异(Locasdo et al.,2009),FLC 基因在油桐中的表达模式与功能是否与拟南芥相同还有待研究。
参
考
文
献
Hayama R,Yokio S ,Tamaki S ,et al.2003.Adaptation of photoperiodic
422:control pathways produces short-day flowering in rice.Nature ,719-722.
Izawa T ,Oikawa T ,Sugiyama N ,et al.2002.Phytochrome mediates the
external light signal to repress FT orthologs in photoperiodic flowering of rice.Genes &Development,16(15):2006-2020.Chen H ,Tan X F.2013.The expression analysis of genes in Jiang G X ,
fatty acid biosynthesis pathway during the seed development of tung tree.Int J Bioautomation ,17(2):73-82.
Kim D H ,Doyle M R,Sung S ,et al.2009.Vernalization :winter and
the timing of flowering in plants.Annual Reviewof Cell and 25:277-299.Developmental ,
Kojima S ,Takahashi Y ,Kobayashi Y ,et al.2002.Hd3a ,a rice ortholog
of the Arabidopsis FT gene ,promotes transition to flowering day conditions.Plant and Cell downstream of Hd1under short-Physiology ,43(10):1096-1105.
Lee J ,Lee I.2010.Regulationand function of SOC1,a flowering
61(9):2247-pathway integrator.Journal of Experimental Botany ,2254.
Li D ,Deng Z ,Qin B ,et al.2012.
De novo assembly and
characterization of bark transcriptome using Illumina sequencing and development of EST-SSRmarkers in rubber tree (Hevea brasiliensis Muell ).Arg BMC Genomics ,13:192.
Locasdo A ,Lucchin M ,Varollo S.2009.Characterization of a MADS
FLOWERINGLOCUSC-LIKE (MFL )intybus :
sequence in Cichorium
a comparative study of CiMFL and AtFLC reveals
(6):34-37.曹建琦.1987.谈谈桐油的β异构化.中国油脂,
14(1):51-53.龚榜初,蔡金标.1996.油桐育种研究进展.经济林研究,黄福长.2011.国内外油桐发展现状.佛山科学技术学院学报:自然
29(3):83-87.科学版,黄
坤,夏建陵.2008.桐油及其衍生物的改性在高分子材料中的27(10):1588-1592.应用进展.化工进展,李建安,孙
颖,陈鸿鹏,等.2008.油桐LEAFY 同源基因片段的克
28(4):21-26.隆与分析.中南林业科技大学学报,
Seq 及其应祁云霞,刘永斌,荣威恒.2011.转录组研究新技术:RNA-33(11):1191-1202.用.遗传,孙昌辉,邓晓建,方
军,等.2007.高等植物开花诱导研究进展.遗
29(10):1182-1190.传,
孙汉洲,杜勋军,谭晓风,等.2010.桐油制备生物柴油的工艺研究.
30(12):134-137.中南林业科技大学学报,孙
颖,卢彰显,李建安.2007.中国油桐栽培利用与应用基础研究25(2):84-87.进展.经济林研究,
24(3):谭晓风.2006.油桐的生产现状及其发展建议.经济林研究,
62-64.
玄伟东,张天顺,张汝坤,等.2007.桐油制取生物柴油的研究.农业
36(7):204-206.化研究,
张玲玲,彭俊华.2011.油桐资源价值及其开发利用前景.经济林研
29(3):130-135.究,
周燕君,陆向红,俞云良,等.2008.桐油制备生物柴油的研究.能源
工程,(5):33-35.
朱世永,任庆生.1992.涂料工业中桐油利用的方向.中国油脂,
(S1):390-398.
Amasino RM ,Michaels S D.2010.The timing of flowering.Plant
Physiology ,154(2):516-520.
Brown K ,Keeler W.2005.The history of tung oil.Wildland Weeds ,9
(1):4-24.
Chen Y H ,Chen J H ,Luo Y M.2012.Complementary biodiesel
combination from tung and medium-chain fatty acid oils.Renewable44:305-310.Energy ,
Hao D C ,Ge G B ,Xiao P G ,et al .2011.The first insight into the tissue
specific Taxus transcriptome via Illumina second generation
182homologies and divergences in gene function.New Phytologisl ,(3):630-643.
Samach A ,Onouchi H ,Gold S E ,et al.2000.Distinct roles of
CONSTANS target genes in reproductive development of Arabidopsis .288(5471):1613-1616.Science ,
Shang Q ,Jiang W ,Lu H ,et al.2002.Properties of tung oil biodiesel
and of methylsoyate.Journal of the American Oil Chemists Society ,79(9):915-920.
Shi C Y ,Yang H ,Wei C L ,et al.2011.Deep sequencing of the
Camellia sinensis transcriptome revealed candidate genes for major 12:metabolic pathways of tea-specific compounds.BMC Genomics ,131
Steven P.2010.Determining biological roles of four unique Vernicia
fordii acyl-CoA binging proteins.Louisiana :University of New Orleans.
Suarez L P ,Wheatley K ,RobsonF ,et al.2001.CONSTANS mediates
between the circadian clock and the control of flowering in Arabidopsis .Nature ,410(6832):1116-1120.
Tuskan G A ,Difazio S ,Jansson S ,et al.2006.The genome of black
cottonwood ,Populus trichocarpa (Torr.&Gray ).Science ,313:1596-1604.
Wilhelm B T ,Landry J R.2009.RNA-Seq-quantitative measurement of
expression through massively parallel RNA-sequencing.Methods ,48(3):249-257.
(责任编辑徐红)