多元回归分析logistics因变量的取值范围可以是连续变量吗?

多元回归分析中,要求所有变量须为等距尺度 (或译区间尺度,interval level of measurement),或者是“0/1”(自变量)。

如果变量的值仅属名目尺度(nominal),亦即“1,2,3,4分别代表不同选项意义”这样的变量,是不可以放进去做回归分析的。严格上说,就连“低,中,高”这样的顺序尺度(ordinal)变量也不能回归分析。

以你目前的情况,因变量是连续型的(亦即等距(区间)尺度),而自变量是“1,2,3,4分别代表不同选项意义”这样的名目尺度变量,则可以把自变量化为虚拟变项(Dummy variables),亦即“0/1”化,以便进行回归分析。

以你的例子,“1,2,3,4分别代表不同选项意义”这样的自变量,设3个虚拟变项就够。

当选答1,VAR_D1的值定为1,选答其余的(2,3,4),VAR_D1的值定为0;

当选答2,VAR_D2的值定为1,选答其余的(1,3,4),VAR_D2的值定为0;

当选答3,VAR_D3的值定为1,选答其余的(1,2,4),VAR_D3的值定为0。

亦即:

若选答1,VAR_D1=1, VAR_D2=0, VAR_D3=0;

若选答2,VAR_D1=0, VAR_D2=1, VAR_D3=0;

若选答3,VAR_D1=0, VAR_D2=0, VAR_D3=1;

若选答4,VAR_D1=0, VAR_D2=0, VAR_D3=0。

(不要搞出个VAR_D4放进回归方程,不然的话会出现共线性问题)

此外,若因变量未达等距尺度的要求(亦即不是连续型的),

只属“低,中,高”这样的顺序尺度变量,你有两种处理方法:

(1)假设它是等距的,照样做回归分析;

(2)用对数线性模型的Logit Loglinear Analysis处理 (较严紧的做法)

至於你在书上看到的logistics回归方法,不适合你用啦。它是针对因变量为“0/1”二分的。当然,你也可以把你的资料降级,区分为两组,放进去做logistics回归,但这会丧失了许多资讯,太浪费了。

多元回归分析中,要求所有变量须为等距尺度 (或译区间尺度,interval level of measurement),或者是“0/1”(自变量)。

如果变量的值仅属名目尺度(nominal),亦即“1,2,3,4分别代表不同选项意义”这样的变量,是不可以放进去做回归分析的。严格上说,就连“低,中,高”这样的顺序尺度(ordinal)变量也不能回归分析。

以你目前的情况,因变量是连续型的(亦即等距(区间)尺度),而自变量是“1,2,3,4分别代表不同选项意义”这样的名目尺度变量,则可以把自变量化为虚拟变项(Dummy variables),亦即“0/1”化,以便进行回归分析。

以你的例子,“1,2,3,4分别代表不同选项意义”这样的自变量,设3个虚拟变项就够。

当选答1,VAR_D1的值定为1,选答其余的(2,3,4),VAR_D1的值定为0;

当选答2,VAR_D2的值定为1,选答其余的(1,3,4),VAR_D2的值定为0;

当选答3,VAR_D3的值定为1,选答其余的(1,2,4),VAR_D3的值定为0。

亦即:

若选答1,VAR_D1=1, VAR_D2=0, VAR_D3=0;

若选答2,VAR_D1=0, VAR_D2=1, VAR_D3=0;

若选答3,VAR_D1=0, VAR_D2=0, VAR_D3=1;

若选答4,VAR_D1=0, VAR_D2=0, VAR_D3=0。

(不要搞出个VAR_D4放进回归方程,不然的话会出现共线性问题)

此外,若因变量未达等距尺度的要求(亦即不是连续型的),

只属“低,中,高”这样的顺序尺度变量,你有两种处理方法:

(1)假设它是等距的,照样做回归分析;

(2)用对数线性模型的Logit Loglinear Analysis处理 (较严紧的做法)

至於你在书上看到的logistics回归方法,不适合你用啦。它是针对因变量为“0/1”二分的。当然,你也可以把你的资料降级,区分为两组,放进去做logistics回归,但这会丧失了许多资讯,太浪费了。


相关文章

  • 基于Logistic回归分析的违约概率预测研究 1
  • 第30卷第9期财经研究V01.30NO.9 .2004年9月JournalofFinanceandEconomicsSep.2004 基孑Logistic回归分析硇违约 概率预测研究 于立勇1,詹捷辉2 (1.北京大学光华管理学院,北京10 ...查看


  • 基于Logistic回归分析的违约概率预测研究
  • 第30卷第9期 2004年9月财经研究 Journal of Finance and Economics Vol 130No 19 Sep 12004 基于Logistic 回归分析的违约 概率预测研究 于立勇, 詹捷辉12 (11北京大学 ...查看


  • 违约损失率模型研究
  • 违约损失率模型研究 梁世栋 <投资研究>2009年第6期 [email protected] 巴塞尔新资本协议内部评级法的三个核心参数,违约概率(Probability of Default, 简称PD).违约损失(L ...查看


  • 常用的统计方法分类
  • 常用的统计方法分类 --以变量水平为区分 因变量:连续变量 单个自变量:二分类 T检验 多分类 单因素方差分析 连续 相关分析,回归分析 多个自变量:分类变量为主 方差分析模型 连续变量为主 线性回归模型 因变量:顺序变量 单个自变量:二分 ...查看


  • 实习主要内容
  • 主要内容及时间安排: 考察方式 一.考察内容: 1.出勤 2.实习参与情况 3.实习报告 二.实习报告要求 1.自拟研究内容,进行调查,根据调查数据,采用SPSS进行分析, 在此基础上写出分析报告. 2.采用分组形式进行研究,每组给出一份报 ...查看


  • [SCI教程]因果关系的推导及一些相关的概念
  • 许多临床研究的问题,尤其是病因学研究,危险因素的研究,往往涉及到因果关系的求证.例如红斑狼疮的遗传学研究中,我们需要从多个的基因位点中筛选出哪个或那些与红斑狼疮有关:临床上,髋关节损害常常加速强直性脊椎炎致残,我们可能想要了解哪些因素与强直 ...查看


  • LOGISTIC回归模型中交互作用的分析及评价
  • �9�9 934�9�9 �9�9 基础理论与方法�9�9 logistic回归模型中交互作用的分析及评价 邱宏余德新 王晓蓉付振明 谢立亚 [导读]流行病学病因学研究常运用logistic回归模型分析影响因素的作用,并利用纳入乘积项 的方 ...查看


  • 如何用spss软件处理问卷
  • 如何用spss软件处理问卷(2007-07-02 19:30:04) 转载 标签: spss教程 spss软件 spss问卷处理 分类: 电脑/科技 当我们的调查问卷在把调查数据拿回来后,我们该做的工作就是用相关的统计软件进行处理,在此,我 ...查看


  • 应用回归分析_第9章课后习题答案
  • 第9章 含定性变量的回归模型 思考与练习参考答案 9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0-1型自变量,用SPSS 软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解.出现这种情况的原因 ...查看


热门内容