核心家系中删失性状遗传方差分量模型的研究

467

核心家系中删失性状遗传方差分量模型的研究

 郜艳晖1 张丕德1 丁保国2 李丽霞1 姜庆五3 

  【提 要】 目的 研究核心家系资料中删失性状的遗传方差分量模型, 评价环境因素和遗传因素对删失性状的影响。方法 应用多变量脆弱模型研究删失性状的遗传方差分量, 基础模型选用Cox 比例危险模型,MCMC 方法用于参数估计, 原发性肝癌核心家系发病年龄资料的分析说明了该方法的实际应用。结果 实例分析结果符合专业解释, 该模型对生存时间分布没有要求因而有更广泛的适用性。结论 基于Cox 回归模型的遗传方差分量模型可用于家系资料, 研究生存时间资料的遗传和环境因素的作用。

【关键词】 删失性状 C ox 模型 遗传方差分量模型

  遗传流行病学中有关生存时间性状的研究是很常见的, 如研究疾病的发病年龄, 疾病并发症出现的时间

等等, 这种生存时间资料常常不满足正态分布, 而且有删失(censoring ) 发生。删失性状结局变量往往比质量性状提供更多的信息。遗传方差分量模型主要用于研究复杂性状的遗传和环境因素的影响, 数量性状和质

1,2〕

量性状时的遗传方差分量模型〔如果符合生物学解释, 可以进一步扩展到删失性状。删失性状的遗传方差分量模型可以基于参数模型构造, 如Weibull 回归模型, 但前提需要对生存时间分布作出假设; 也可以基于半参数模型, 如C ox 模型构造。Cox 模型在生存分析中有着重要的地位, 主要原因之一是不需对生存分布作出假设而具有更广泛的适用性。因此, 本研究在Cox 模型基础上构造生存时间资料的遗传方差分量模型。

模型构造

多个相关的生存时间数据可以用脆弱模型来模拟。假设每个家庭有一个无法测量的随机效应(也称为脆弱) ωi , (i 表示第i 个家庭) 。在脆弱条件下家庭内个体满足条件独立性假设。假设脆弱项以乘积的形式作用于基准危险函数, 则脆弱模型表示为

λβ) i (t ) =λ0(t ) ωi exp (X

(1)

量性状和质量性状的家庭相关成立, 进一步可将其推广到删失性状。

假定式(1) 中ω为对数正态分布, 令T =l n (ω) 称为对数脆弱, 则在脆弱项T ij (j 表示第i 个家庭中第

j 个个体) 条件下, 家庭内个体生存时间条件独立, 且

有相同的基准危险函数。在Cox 模型框架下, 构造删失性状的遗传方差分量模型

λβ+T ij ) i (t ) =λ0(t) exp (X

(2)

式(2) 中X 为固定效应设计矩阵, 表示影响生存时间的协变量向量; β为相应的回归系数向量。T ij =A ij +

D i j +C i j 表示随机效应, A 为遗传加性随机效应; D 为

遗传显性随机效应, 表现为同胞共享随机效应; C 为家庭共享的环境随机效应。假设T ij 服从均数为0的多变量正态分布, 方差协方差结构同数量性状和质量性状遗传方差分量模型〔1,2〕。因此, 模型(2) 可看作脆弱模型(1) 向多个脆弱的扩展, 并且假设脆弱项服从多变量对数正态分布。

类似质量性状, 为参数估计中模型指定的方便, 将模型(2) 重新参数化。对核心家系, 重新参数化后的模型

 父亲:λβ+F i +G i +SP ij ) ij (t) =λ0(t) exp (X  母亲:λβ+F i -G i +SP ij ) ij (t) =λ0(t) exp (X

β+F i +H i +SC ij )  子女:λij (t ) =λ0(t ) exp (X 式(3) 中, F i , G i , H i , S P i j , SC ij 分布假设如下:

22

 F i ~N (0, 1/2σa +σc ) , 22 G i ~N (0, 1/2σa +1/2σcs(f i x) ) , 22

σ H i ~N (0, σcs +1/2M a (f i x ) ) , 2

 S P ij ~N (0, 1/2σc s (f i x ) ) , 2

σ S C ij ~N (0, 1/2M a (f ix) )

222

σσ式(4) 中M 为家庭中最大子女数。a , σcs 和c 分别为

(3)

通常假设式(1) 中脆弱项ωi 服从某连续分布, 如gam 2ma 分布或对数正态分布。

对复杂的家系资料, 不同亲缘类型个体对间的家庭相关不尽相同, 所以单个脆弱仍不足以描述这种复杂的相关结构。传统的遗传方差分量模型中, 家庭相关来源可以分解为遗传加性效应, 遗传显性效应(共享同胞环境效应) 和共享环境效应。如果这个假设对数

3:国家自然科学基金资助项目(30500421)

11广东药学院公共卫生学院卫生统计学教研室(510310) 21江苏泰兴市疾病预防和控制中心(225400)

31复旦大学公共卫生学院流行病学教研室(200032)

(4)

遗传加性效应方差分量, 遗传显性效应方差分量和家庭共享环境方差分量。三种方差分量占总方差的比例分别反映遗传加性效应、显性效应和家庭共享环境效

467

核心家系中删失性状遗传方差分量模型的研究

 郜艳晖1 张丕德1 丁保国2 李丽霞1 姜庆五3 

  【提 要】 目的 研究核心家系资料中删失性状的遗传方差分量模型, 评价环境因素和遗传因素对删失性状的影响。方法 应用多变量脆弱模型研究删失性状的遗传方差分量, 基础模型选用Cox 比例危险模型,MCMC 方法用于参数估计, 原发性肝癌核心家系发病年龄资料的分析说明了该方法的实际应用。结果 实例分析结果符合专业解释, 该模型对生存时间分布没有要求因而有更广泛的适用性。结论 基于Cox 回归模型的遗传方差分量模型可用于家系资料, 研究生存时间资料的遗传和环境因素的作用。

【关键词】 删失性状 C ox 模型 遗传方差分量模型

  遗传流行病学中有关生存时间性状的研究是很常见的, 如研究疾病的发病年龄, 疾病并发症出现的时间

等等, 这种生存时间资料常常不满足正态分布, 而且有删失(censoring ) 发生。删失性状结局变量往往比质量性状提供更多的信息。遗传方差分量模型主要用于研究复杂性状的遗传和环境因素的影响, 数量性状和质

1,2〕

量性状时的遗传方差分量模型〔如果符合生物学解释, 可以进一步扩展到删失性状。删失性状的遗传方差分量模型可以基于参数模型构造, 如Weibull 回归模型, 但前提需要对生存时间分布作出假设; 也可以基于半参数模型, 如C ox 模型构造。Cox 模型在生存分析中有着重要的地位, 主要原因之一是不需对生存分布作出假设而具有更广泛的适用性。因此, 本研究在Cox 模型基础上构造生存时间资料的遗传方差分量模型。

模型构造

多个相关的生存时间数据可以用脆弱模型来模拟。假设每个家庭有一个无法测量的随机效应(也称为脆弱) ωi , (i 表示第i 个家庭) 。在脆弱条件下家庭内个体满足条件独立性假设。假设脆弱项以乘积的形式作用于基准危险函数, 则脆弱模型表示为

λβ) i (t ) =λ0(t ) ωi exp (X

(1)

量性状和质量性状的家庭相关成立, 进一步可将其推广到删失性状。

假定式(1) 中ω为对数正态分布, 令T =l n (ω) 称为对数脆弱, 则在脆弱项T ij (j 表示第i 个家庭中第

j 个个体) 条件下, 家庭内个体生存时间条件独立, 且

有相同的基准危险函数。在Cox 模型框架下, 构造删失性状的遗传方差分量模型

λβ+T ij ) i (t ) =λ0(t) exp (X

(2)

式(2) 中X 为固定效应设计矩阵, 表示影响生存时间的协变量向量; β为相应的回归系数向量。T ij =A ij +

D i j +C i j 表示随机效应, A 为遗传加性随机效应; D 为

遗传显性随机效应, 表现为同胞共享随机效应; C 为家庭共享的环境随机效应。假设T ij 服从均数为0的多变量正态分布, 方差协方差结构同数量性状和质量性状遗传方差分量模型〔1,2〕。因此, 模型(2) 可看作脆弱模型(1) 向多个脆弱的扩展, 并且假设脆弱项服从多变量对数正态分布。

类似质量性状, 为参数估计中模型指定的方便, 将模型(2) 重新参数化。对核心家系, 重新参数化后的模型

 父亲:λβ+F i +G i +SP ij ) ij (t) =λ0(t) exp (X  母亲:λβ+F i -G i +SP ij ) ij (t) =λ0(t) exp (X

β+F i +H i +SC ij )  子女:λij (t ) =λ0(t ) exp (X 式(3) 中, F i , G i , H i , S P i j , SC ij 分布假设如下:

22

 F i ~N (0, 1/2σa +σc ) , 22 G i ~N (0, 1/2σa +1/2σcs(f i x) ) , 22

σ H i ~N (0, σcs +1/2M a (f i x ) ) , 2

 S P ij ~N (0, 1/2σc s (f i x ) ) , 2

σ S C ij ~N (0, 1/2M a (f ix) )

222

σσ式(4) 中M 为家庭中最大子女数。a , σcs 和c 分别为

(3)

通常假设式(1) 中脆弱项ωi 服从某连续分布, 如gam 2ma 分布或对数正态分布。

对复杂的家系资料, 不同亲缘类型个体对间的家庭相关不尽相同, 所以单个脆弱仍不足以描述这种复杂的相关结构。传统的遗传方差分量模型中, 家庭相关来源可以分解为遗传加性效应, 遗传显性效应(共享同胞环境效应) 和共享环境效应。如果这个假设对数

3:国家自然科学基金资助项目(30500421)

11广东药学院公共卫生学院卫生统计学教研室(510310) 21江苏泰兴市疾病预防和控制中心(225400)

31复旦大学公共卫生学院流行病学教研室(200032)

(4)

遗传加性效应方差分量, 遗传显性效应方差分量和家庭共享环境方差分量。三种方差分量占总方差的比例分别反映遗传加性效应、显性效应和家庭共享环境效


相关文章

  • 利用连锁不平衡进行畜禽QTL定位的研究进展
  • ・36・遗传繁育中国畜牧兽医 2007年第34卷第6期 利用连锁不平衡进行畜禽QTL定位的研究进展 谢水华1,李加琪1,张豪1,陈瑶生2 (1.华南农业大学动物科学学院,广州 510642;2.中山大学生命科学学院,广州 510275) 摘 ...查看


  • 第17章.遗传流行病学(赵仲堂)
  • 第十七章 遗传流行病学 遗传流行病学(genetic epidemiology)产生于20世纪70年代,是医学遗传学.流行病学与数理统计学相互结合而形成的一门边缘学科,是流行病学的分支之一. 遗传学家阐明了正常性状的传递规律及一些遗传性疾病 ...查看


  • 水产动物育种学名词解释
  • (4)名词解释: 育种:是指应用各种遗传学方法,改造水产动物的遗传结构,培育出适合人类需要的品种的过程 品种:人类根据自身需要创造出的一种生产资料,一般是指经多代人工选择育成,具有遗传稳定.优良经济性状及其他表型性状,并有别于原种或同种内其 ...查看


  • [彭中镇文集]:1-03_母猪年生产力及其遗传改良
  • 母猪年生产力及其遗传改良 彭中镇 樊 斌 朱猛进 赵书红 刘 榜 (华中农业大学农业动物遗传育种与繁殖教育部重点实验室,武汉 430070) 摘要 本文介绍和讨论了母猪年生产力的概念.组分性状.影响因素.遗传力估值.改良策略和措施.改良措施 ...查看


  • 973课题结题报告
  • 973课题结题报告 课题名称:大豆重要新基因的发掘与有效利用研究 课题编号:TG1998010206 负责人:喻德跃 承担单位:南京农业大学.中国农科院品资所.吉林省农科院 协作单位:中国科学院遗传发育所 2003年10月15日 一.计划任 ...查看


  • 林木遗传 (1)
  • 名词解释 1.遗传资源:指以种为单位的群体内的全部遗传物质,或种内基因组,基因型变异的总和 1.种质资源:是指选育新品基础材料,包括各种植物的栽培种.野生种的繁殖材料以及利用上述繁殖材料人工创造的各种植物的遗传材料. 2.育种资源:是遗传资 ...查看


  • 遗传学课后习题及答案-刘祖洞
  • 第二章 孟德尔定律 1. 为什么分离现象比显.隐性现象有更重要的意义? 答:因为1.分离规律是生物界普遍存在的一种遗传现象,而显性现象的表现是相对的.有条件的:2.只有遗传因子的分离和重组,才能表现出性状的显隐性.可以说无分离现象的存在,也 ...查看


  • 安徽农业大学茶树育种学
  • 第一章种质资源 一.茶树染色体以x=15为基数,染色体在体细胞中为30条,性细胞中为15条. 二.核型分析:一个物种细胞核内染色体的数目及各个染色体的形态特征.不同物种的染色体都有各自特定的形态特征,包括染色体总数.染色体组数.每条染色体的 ...查看


  • 水产动物分子育种研究进展_孙效文
  • 第16卷第6期2009年11月 中国水产科学 Vol.16 No.6 Journal of Fishery Sciences of China November 2009 ·综述· 水产动物分子育种研究进展 孙效文,鲁翠云,贾智英, 梁利群 ...查看


热门内容