467
核心家系中删失性状遗传方差分量模型的研究
郜艳晖1 张丕德1 丁保国2 李丽霞1 姜庆五3
【提 要】 目的 研究核心家系资料中删失性状的遗传方差分量模型, 评价环境因素和遗传因素对删失性状的影响。方法 应用多变量脆弱模型研究删失性状的遗传方差分量, 基础模型选用Cox 比例危险模型,MCMC 方法用于参数估计, 原发性肝癌核心家系发病年龄资料的分析说明了该方法的实际应用。结果 实例分析结果符合专业解释, 该模型对生存时间分布没有要求因而有更广泛的适用性。结论 基于Cox 回归模型的遗传方差分量模型可用于家系资料, 研究生存时间资料的遗传和环境因素的作用。
【关键词】 删失性状 C ox 模型 遗传方差分量模型
遗传流行病学中有关生存时间性状的研究是很常见的, 如研究疾病的发病年龄, 疾病并发症出现的时间
等等, 这种生存时间资料常常不满足正态分布, 而且有删失(censoring ) 发生。删失性状结局变量往往比质量性状提供更多的信息。遗传方差分量模型主要用于研究复杂性状的遗传和环境因素的影响, 数量性状和质
1,2〕
量性状时的遗传方差分量模型〔如果符合生物学解释, 可以进一步扩展到删失性状。删失性状的遗传方差分量模型可以基于参数模型构造, 如Weibull 回归模型, 但前提需要对生存时间分布作出假设; 也可以基于半参数模型, 如C ox 模型构造。Cox 模型在生存分析中有着重要的地位, 主要原因之一是不需对生存分布作出假设而具有更广泛的适用性。因此, 本研究在Cox 模型基础上构造生存时间资料的遗传方差分量模型。
模型构造
多个相关的生存时间数据可以用脆弱模型来模拟。假设每个家庭有一个无法测量的随机效应(也称为脆弱) ωi , (i 表示第i 个家庭) 。在脆弱条件下家庭内个体满足条件独立性假设。假设脆弱项以乘积的形式作用于基准危险函数, 则脆弱模型表示为
λβ) i (t ) =λ0(t ) ωi exp (X
(1)
量性状和质量性状的家庭相关成立, 进一步可将其推广到删失性状。
假定式(1) 中ω为对数正态分布, 令T =l n (ω) 称为对数脆弱, 则在脆弱项T ij (j 表示第i 个家庭中第
j 个个体) 条件下, 家庭内个体生存时间条件独立, 且
有相同的基准危险函数。在Cox 模型框架下, 构造删失性状的遗传方差分量模型
λβ+T ij ) i (t ) =λ0(t) exp (X
(2)
式(2) 中X 为固定效应设计矩阵, 表示影响生存时间的协变量向量; β为相应的回归系数向量。T ij =A ij +
D i j +C i j 表示随机效应, A 为遗传加性随机效应; D 为
遗传显性随机效应, 表现为同胞共享随机效应; C 为家庭共享的环境随机效应。假设T ij 服从均数为0的多变量正态分布, 方差协方差结构同数量性状和质量性状遗传方差分量模型〔1,2〕。因此, 模型(2) 可看作脆弱模型(1) 向多个脆弱的扩展, 并且假设脆弱项服从多变量对数正态分布。
类似质量性状, 为参数估计中模型指定的方便, 将模型(2) 重新参数化。对核心家系, 重新参数化后的模型
父亲:λβ+F i +G i +SP ij ) ij (t) =λ0(t) exp (X 母亲:λβ+F i -G i +SP ij ) ij (t) =λ0(t) exp (X
β+F i +H i +SC ij ) 子女:λij (t ) =λ0(t ) exp (X 式(3) 中, F i , G i , H i , S P i j , SC ij 分布假设如下:
22
F i ~N (0, 1/2σa +σc ) , 22 G i ~N (0, 1/2σa +1/2σcs(f i x) ) , 22
σ H i ~N (0, σcs +1/2M a (f i x ) ) , 2
S P ij ~N (0, 1/2σc s (f i x ) ) , 2
σ S C ij ~N (0, 1/2M a (f ix) )
222
σσ式(4) 中M 为家庭中最大子女数。a , σcs 和c 分别为
(3)
通常假设式(1) 中脆弱项ωi 服从某连续分布, 如gam 2ma 分布或对数正态分布。
对复杂的家系资料, 不同亲缘类型个体对间的家庭相关不尽相同, 所以单个脆弱仍不足以描述这种复杂的相关结构。传统的遗传方差分量模型中, 家庭相关来源可以分解为遗传加性效应, 遗传显性效应(共享同胞环境效应) 和共享环境效应。如果这个假设对数
3:国家自然科学基金资助项目(30500421)
11广东药学院公共卫生学院卫生统计学教研室(510310) 21江苏泰兴市疾病预防和控制中心(225400)
31复旦大学公共卫生学院流行病学教研室(200032)
(4)
遗传加性效应方差分量, 遗传显性效应方差分量和家庭共享环境方差分量。三种方差分量占总方差的比例分别反映遗传加性效应、显性效应和家庭共享环境效
467
核心家系中删失性状遗传方差分量模型的研究
郜艳晖1 张丕德1 丁保国2 李丽霞1 姜庆五3
【提 要】 目的 研究核心家系资料中删失性状的遗传方差分量模型, 评价环境因素和遗传因素对删失性状的影响。方法 应用多变量脆弱模型研究删失性状的遗传方差分量, 基础模型选用Cox 比例危险模型,MCMC 方法用于参数估计, 原发性肝癌核心家系发病年龄资料的分析说明了该方法的实际应用。结果 实例分析结果符合专业解释, 该模型对生存时间分布没有要求因而有更广泛的适用性。结论 基于Cox 回归模型的遗传方差分量模型可用于家系资料, 研究生存时间资料的遗传和环境因素的作用。
【关键词】 删失性状 C ox 模型 遗传方差分量模型
遗传流行病学中有关生存时间性状的研究是很常见的, 如研究疾病的发病年龄, 疾病并发症出现的时间
等等, 这种生存时间资料常常不满足正态分布, 而且有删失(censoring ) 发生。删失性状结局变量往往比质量性状提供更多的信息。遗传方差分量模型主要用于研究复杂性状的遗传和环境因素的影响, 数量性状和质
1,2〕
量性状时的遗传方差分量模型〔如果符合生物学解释, 可以进一步扩展到删失性状。删失性状的遗传方差分量模型可以基于参数模型构造, 如Weibull 回归模型, 但前提需要对生存时间分布作出假设; 也可以基于半参数模型, 如C ox 模型构造。Cox 模型在生存分析中有着重要的地位, 主要原因之一是不需对生存分布作出假设而具有更广泛的适用性。因此, 本研究在Cox 模型基础上构造生存时间资料的遗传方差分量模型。
模型构造
多个相关的生存时间数据可以用脆弱模型来模拟。假设每个家庭有一个无法测量的随机效应(也称为脆弱) ωi , (i 表示第i 个家庭) 。在脆弱条件下家庭内个体满足条件独立性假设。假设脆弱项以乘积的形式作用于基准危险函数, 则脆弱模型表示为
λβ) i (t ) =λ0(t ) ωi exp (X
(1)
量性状和质量性状的家庭相关成立, 进一步可将其推广到删失性状。
假定式(1) 中ω为对数正态分布, 令T =l n (ω) 称为对数脆弱, 则在脆弱项T ij (j 表示第i 个家庭中第
j 个个体) 条件下, 家庭内个体生存时间条件独立, 且
有相同的基准危险函数。在Cox 模型框架下, 构造删失性状的遗传方差分量模型
λβ+T ij ) i (t ) =λ0(t) exp (X
(2)
式(2) 中X 为固定效应设计矩阵, 表示影响生存时间的协变量向量; β为相应的回归系数向量。T ij =A ij +
D i j +C i j 表示随机效应, A 为遗传加性随机效应; D 为
遗传显性随机效应, 表现为同胞共享随机效应; C 为家庭共享的环境随机效应。假设T ij 服从均数为0的多变量正态分布, 方差协方差结构同数量性状和质量性状遗传方差分量模型〔1,2〕。因此, 模型(2) 可看作脆弱模型(1) 向多个脆弱的扩展, 并且假设脆弱项服从多变量对数正态分布。
类似质量性状, 为参数估计中模型指定的方便, 将模型(2) 重新参数化。对核心家系, 重新参数化后的模型
父亲:λβ+F i +G i +SP ij ) ij (t) =λ0(t) exp (X 母亲:λβ+F i -G i +SP ij ) ij (t) =λ0(t) exp (X
β+F i +H i +SC ij ) 子女:λij (t ) =λ0(t ) exp (X 式(3) 中, F i , G i , H i , S P i j , SC ij 分布假设如下:
22
F i ~N (0, 1/2σa +σc ) , 22 G i ~N (0, 1/2σa +1/2σcs(f i x) ) , 22
σ H i ~N (0, σcs +1/2M a (f i x ) ) , 2
S P ij ~N (0, 1/2σc s (f i x ) ) , 2
σ S C ij ~N (0, 1/2M a (f ix) )
222
σσ式(4) 中M 为家庭中最大子女数。a , σcs 和c 分别为
(3)
通常假设式(1) 中脆弱项ωi 服从某连续分布, 如gam 2ma 分布或对数正态分布。
对复杂的家系资料, 不同亲缘类型个体对间的家庭相关不尽相同, 所以单个脆弱仍不足以描述这种复杂的相关结构。传统的遗传方差分量模型中, 家庭相关来源可以分解为遗传加性效应, 遗传显性效应(共享同胞环境效应) 和共享环境效应。如果这个假设对数
3:国家自然科学基金资助项目(30500421)
11广东药学院公共卫生学院卫生统计学教研室(510310) 21江苏泰兴市疾病预防和控制中心(225400)
31复旦大学公共卫生学院流行病学教研室(200032)
(4)
遗传加性效应方差分量, 遗传显性效应方差分量和家庭共享环境方差分量。三种方差分量占总方差的比例分别反映遗传加性效应、显性效应和家庭共享环境效