贝叶斯判别分析在违约率预测中的应用
孟庆福
谢亚鹏
尹铁岩
违约率、挽回率和违约相关性是运用现代模型度量信用风险的三个主要参数,其中违约率是这些参数的关键和出发点。本文运用Bayes判别分析对我国上市公司违约进行预测,从而实现对违约率的替代度量,这对于现代模型在我
国普遍应用无疑具有重要的现实意义。
一、模型设计
贝叶斯统计的思想是,假定对研究对象已有一定的认识,常用先验概率分布来描述这种认识,然后我们取得一组样本,用样本来修正已有的认识(先验概率分布)从而得到后验概率分布,各种统计推断都通过后验概率分布来进行。将贝叶斯统计思想用于判别分布,就得到贝叶斯判别方法。
k
设有n。个上市公司来自组仃。(d=1,2,…,后),共有儿=∑忍。个上市公司
作为研究样本,判别变量数为P,则上市公司u划分为组丌。的原则是u属于组7r。的后验概率最大,即:
P(7r。f戈。)=.max,P(7ri
概率为:
q
z。),i=1,2,…,南(1)
假设判别变量服从多元正态分布,并具有等协方差矩阵,则u属于7r。的后验
P(7r。I戈。)=1——∑—生—上
∑”xP(一11D2。;)
exp(一÷D:。)
(2)
其中,q。和qi分别是属于组7r。和组7ri的先验概率;D。。和D。i分别是u到组仃。和组7『i的广义距离。式(1)的求解等同于求式(2)中分子的最大值,或是其自然对数的最大值,即:
囡竺翌兰竺翌!兰
k=1ng。一÷D:。=lnq。一丁1(算。一面Ⅱ),∑1石。一训
=(∥。∑一1)菇。一尹1口’∑-I菇-。+lng。
此可见,贝叶斯判别方法下的判别方程是线性方程。
(3)
式(3)中第一项括号中的表达式为判别方程的系数,后面的表达式为常数项。由
二、研究样本的选取
截至2003年年底,在我国上海、深圳证券交易所上市的公司中共有123家曾被宣布为ST(以下称为ST公司),其中2003年宣布为ST的有67家。在这67家上市公司中,有51家是由于财务状况异常而被sT的,其余16家上市公司由于其他状况异常而被ST,因此,应该从样本中剔除。同时,我们另外选取了51家非ST上市公司作为参照对象(以下称为非sT公司),选取这些非ST公司的原则是:
1.满足同行业、同时期、同规模的要求。“同行业”指的是与ST公司属于同一行业;“同时期、同规模”指的是对应的非ST公司在同一时点上与ST公司在资产总额规模上相当,即选取所有非ST公司中与sT公司总资产规模最接近的公司进人样本。我们认为,这样的选取原则可以较好地满足可比性的要求,使模型更具有普遍性。
2.满足时间性的要求。为了获得足够的数据进行比较分析,同时也为了保持模型预测的可靠性,我们选取sT公司被“特别处理”前2年的财务数据作为样本,并要求样本必须具有一定的时间连续性和可比性。我们将2003年被ST的公司列为“组1”,相对应的非ST公司列为“组2”。
三、变量的选取
判别模型所使用的变量在两组样本中的均值应该具有显著的差异。经过筛选(筛选过程略),最终有10个变量纳入了本文的判别模型,这些变量的情况具体见表l。
表丑
属性
慕盘情河
变量
Z2
最终纳入模型的财务比率列表
财务比率每股净资产
属性
变量
#15
财务比率资产负债率
偿债能力
成长能力
%
a:6
每殷未分配利润净资产收益率
』2l
净资产增长率每股经营现金流量
获利能力
Jc7at"12
x22
总资产收益率总资产周转率
现金流量
并24
经营能力
Z13
营运资金总资产比
现金总债务比
兰三竺坌竺坚兰竺苎!窒I!:!I
四、参数估计和结果检验
在Bayes方法下,我们使用最终选取的10个财务比率作为变量。这样,我们就可以直接将样本数据带人上面设计的模型并运行程序,所得到的结果见表2、表3和表4。
表2
组别
】
先验概率表
先验概率
未加权
o.500o.5001.ooo
5J51
102
样本数
加权
5】.ooo51.ooo102.ooo
2
总计
表3
蛀大概率分组
样本号
判别P(G=g分组
1
1
样本综合统计表(实际分组1)
z分值非标准化典型判别函数值
—1.762一0.647—0.802—0.347—0.874一O.1280.4560.200—3.703一1.191一1.487—1.57l——0.608一O.8180.056—2.122一1.014—0.190一1.932一1.7150.113—2.338—1.020—2.858O.197—1.909
272829303l3233343536373839404l42434445464748495051
最大概率分组
样本号
判别P(C=g分组
1
11
z分值非标准化典型判别函数值
—2.0IO—0.277—4839—0.556—0.993—0.703一O26lO.013—0458—2.396一0.947—2.951—0.786—0.855一O683—1.380一1.061
l
马氏平方距离
O.5ll0.1600.0600.4910.0300.8460.349O.7197.055O.02lO.1930.274O.1930.0520.984J.】56O.00I0.7340.78204460.872
1
马氏平方距离
0.9270.59314.3800
241
D=d、0.9760.7950.8430.6740.8620.5660.7220.6031000
D=d)0.9850.64l
l
23
4
l
1l
000
l
1
0.7620.889O8130.6330.50707230.9930.87909980.8380.85708070.9470.90209410.534O.6210.9850.893O.7150.885O.857
56789101l1213141516171819202】2223242526
1
1
0.003O.1190.6181.0690.3481.820O.0lO3.6250.0680.037O.133O.11l0.0000.0740.9650.657O.8920.OOlO.37l0.005O.038
ll21
lllll
22
ll
0.9240.9570.964O.7810.8470.5290.9880.8930.5980.9830.9730,5590.99308940.9970.6020982
l
ll
1
2jll11
ll
l
2
1l
318
—0.065—0.236—1.992—1.011一0438一O.975——0.854
2
1ll
1l
ll
667
0.OOl3.2780.7230.743
21
l
囡竺至兰竺兰兰兰
表4
最大概率分组
样本号
判别分组
5253
54
2
样本综合统计表(实际分组2)
z分值非标准化典型判别函数值
2.4960.400—0.4760.686—0.657
1
最大概率分组
样本号
判别P(G=g分组
7879808l82838485868788899091929394959697989910010l102
2222
,-
z分值非标准化典型判别函数值
0.3271.5771.0500.2291.330O.8780.8343.4153.1743.0460.5291.80407240.9090.2861.5961.0441.00702820.580O.7121.316O.1330.2551.775
P(G=g『
D:d)0.9950.69807310.80807980.9810.8830.9320.97l0.51805820.9250.8340.781O6170.99907400.92509220.97907780.6780.9750.9lO0.6980.970
马氏平方距离
2.10004190.326O.13l01520.69l00070.04004061.0260.7920.0230.0760.1940.6734.59403000.024O.018O.6100.2020.48004920.00304190.373
马氏平方距离
O.519O.2810.0000.6690.0800.0290.0465.6054.5243.9940.2690.5730
104
D=d)0.6650.9650.900O.6180.9420.8630.8520.9990.9990.9980.7520.9780.82008700.6450.9660.8990.8920.643O.77lO.8160.9400.5690.6300.976
2l2
l
5556
57
2
2
8792
5859606l62636465666768697071
72
0.9661.2461.684—0.034一O.1571.1980.7720.6070.2273.19l0.5001.20l
1
22222
2
221
1
22
2
22222
2
O.0190580O.30l00000.0020.586O.2180
112
22
2
2
,
一
182222
7—
2
7—
1.8280.5980.3541749
7374757677
22
2
0.07208360.6280529
22
2
1.1030.4001.658
22
由于在SPSSl0.0中假设有效样本的先验概率是相等的,因此,在把样本分为两组的情况下,每个样本进入每个分组的先验概率都是0.5。表2给出了所有样本实际分组情况以及按Bayes判别方法得到的分组情况。P(G=g系式:
D=d)表示后验
概率,其中D表示前面提到的广义距离,d表示马氏距离。由于存在下面的关
D:(石)=d:(名)+g。+h。
其中,g。=ln
l芝2
o::萋至:,__,_至:≥}相等
o,若gl-…孤:÷
一1’…,矗
,一21nq。,若q.,…,口。不全相等
^a
2{
因此,在各组先验概率和协方差矩阵相等的情况下,D=d。第一组有6个ST
第二部分财政与金融研究网
公司被误判为非sT公司,误判率为11.8%;第二组有4个非sT公司被误判为sT公司,误判率为7.8%。这两个指标都是令人满意的。
Bayes判别方法最大的优点就是能够得出样本违约的后验概率,再加上令人满意的误判率水平,我们就可以利用这个后验概率来替代上市公司的违约率。近年来,国际上信用风险度量和管理的方法已经取得了长足的进步,开发出了很多新模型和新方法。例如,以期权理论为基础的KMV模型,以VaR方法为基础的Credit—Metrics模型,还有以保险精算为基础的死亡率模型等。在所有这些模型中,违约率都是度量信用风险不可缺少的数据。在我国,信用体系还未完全建立起来,与信用风险防范相关的数据规模很小,这些在国际上已经成熟的信用风险度量方法无法应用到我国的实证分析中,这已经成为我国信用风险度量的阶段性难题。本文中这种用后验概率替代违约率的方法虽然只是暂时性的,但却可以在现有数据不全的条件下把这些新方法应用到我国信用风险度量中来,从而推动我国信用风险管理的
发展。
参考文献
1.Daykin,Hall.1994.
Pentikainen,Pesonen.PracticalRisk
TheoryforActuaries.New
York:Chapman
and
2.石晓军、陈殿左:《信用治理:文化、流程与工具》,机械工业出版社2004年版。
贝叶斯判别分析在违约率预测中的应用
作者:作者单位:
孟庆福, 谢亚鹏, 尹铁岩
相似文献(0条)
本文链接:http://d.g.wanfangdata.com.cn/Conference_6605487.aspx
下载时间:2010年5月19日
贝叶斯判别分析在违约率预测中的应用
孟庆福
谢亚鹏
尹铁岩
违约率、挽回率和违约相关性是运用现代模型度量信用风险的三个主要参数,其中违约率是这些参数的关键和出发点。本文运用Bayes判别分析对我国上市公司违约进行预测,从而实现对违约率的替代度量,这对于现代模型在我
国普遍应用无疑具有重要的现实意义。
一、模型设计
贝叶斯统计的思想是,假定对研究对象已有一定的认识,常用先验概率分布来描述这种认识,然后我们取得一组样本,用样本来修正已有的认识(先验概率分布)从而得到后验概率分布,各种统计推断都通过后验概率分布来进行。将贝叶斯统计思想用于判别分布,就得到贝叶斯判别方法。
k
设有n。个上市公司来自组仃。(d=1,2,…,后),共有儿=∑忍。个上市公司
作为研究样本,判别变量数为P,则上市公司u划分为组丌。的原则是u属于组7r。的后验概率最大,即:
P(7r。f戈。)=.max,P(7ri
概率为:
q
z。),i=1,2,…,南(1)
假设判别变量服从多元正态分布,并具有等协方差矩阵,则u属于7r。的后验
P(7r。I戈。)=1——∑—生—上
∑”xP(一11D2。;)
exp(一÷D:。)
(2)
其中,q。和qi分别是属于组7r。和组7ri的先验概率;D。。和D。i分别是u到组仃。和组7『i的广义距离。式(1)的求解等同于求式(2)中分子的最大值,或是其自然对数的最大值,即:
囡竺翌兰竺翌!兰
k=1ng。一÷D:。=lnq。一丁1(算。一面Ⅱ),∑1石。一训
=(∥。∑一1)菇。一尹1口’∑-I菇-。+lng。
此可见,贝叶斯判别方法下的判别方程是线性方程。
(3)
式(3)中第一项括号中的表达式为判别方程的系数,后面的表达式为常数项。由
二、研究样本的选取
截至2003年年底,在我国上海、深圳证券交易所上市的公司中共有123家曾被宣布为ST(以下称为ST公司),其中2003年宣布为ST的有67家。在这67家上市公司中,有51家是由于财务状况异常而被sT的,其余16家上市公司由于其他状况异常而被ST,因此,应该从样本中剔除。同时,我们另外选取了51家非ST上市公司作为参照对象(以下称为非sT公司),选取这些非ST公司的原则是:
1.满足同行业、同时期、同规模的要求。“同行业”指的是与ST公司属于同一行业;“同时期、同规模”指的是对应的非ST公司在同一时点上与ST公司在资产总额规模上相当,即选取所有非ST公司中与sT公司总资产规模最接近的公司进人样本。我们认为,这样的选取原则可以较好地满足可比性的要求,使模型更具有普遍性。
2.满足时间性的要求。为了获得足够的数据进行比较分析,同时也为了保持模型预测的可靠性,我们选取sT公司被“特别处理”前2年的财务数据作为样本,并要求样本必须具有一定的时间连续性和可比性。我们将2003年被ST的公司列为“组1”,相对应的非ST公司列为“组2”。
三、变量的选取
判别模型所使用的变量在两组样本中的均值应该具有显著的差异。经过筛选(筛选过程略),最终有10个变量纳入了本文的判别模型,这些变量的情况具体见表l。
表丑
属性
慕盘情河
变量
Z2
最终纳入模型的财务比率列表
财务比率每股净资产
属性
变量
#15
财务比率资产负债率
偿债能力
成长能力
%
a:6
每殷未分配利润净资产收益率
』2l
净资产增长率每股经营现金流量
获利能力
Jc7at"12
x22
总资产收益率总资产周转率
现金流量
并24
经营能力
Z13
营运资金总资产比
现金总债务比
兰三竺坌竺坚兰竺苎!窒I!:!I
四、参数估计和结果检验
在Bayes方法下,我们使用最终选取的10个财务比率作为变量。这样,我们就可以直接将样本数据带人上面设计的模型并运行程序,所得到的结果见表2、表3和表4。
表2
组别
】
先验概率表
先验概率
未加权
o.500o.5001.ooo
5J51
102
样本数
加权
5】.ooo51.ooo102.ooo
2
总计
表3
蛀大概率分组
样本号
判别P(G=g分组
1
1
样本综合统计表(实际分组1)
z分值非标准化典型判别函数值
—1.762一0.647—0.802—0.347—0.874一O.1280.4560.200—3.703一1.191一1.487—1.57l——0.608一O.8180.056—2.122一1.014—0.190一1.932一1.7150.113—2.338—1.020—2.858O.197—1.909
272829303l3233343536373839404l42434445464748495051
最大概率分组
样本号
判别P(C=g分组
1
11
z分值非标准化典型判别函数值
—2.0IO—0.277—4839—0.556—0.993—0.703一O26lO.013—0458—2.396一0.947—2.951—0.786—0.855一O683—1.380一1.061
l
马氏平方距离
O.5ll0.1600.0600.4910.0300.8460.349O.7197.055O.02lO.1930.274O.1930.0520.984J.】56O.00I0.7340.78204460.872
1
马氏平方距离
0.9270.59314.3800
241
D=d、0.9760.7950.8430.6740.8620.5660.7220.6031000
D=d)0.9850.64l
l
23
4
l
1l
000
l
1
0.7620.889O8130.6330.50707230.9930.87909980.8380.85708070.9470.90209410.534O.6210.9850.893O.7150.885O.857
56789101l1213141516171819202】2223242526
1
1
0.003O.1190.6181.0690.3481.820O.0lO3.6250.0680.037O.133O.11l0.0000.0740.9650.657O.8920.OOlO.37l0.005O.038
ll21
lllll
22
ll
0.9240.9570.964O.7810.8470.5290.9880.8930.5980.9830.9730,5590.99308940.9970.6020982
l
ll
1
2jll11
ll
l
2
1l
318
—0.065—0.236—1.992—1.011一0438一O.975——0.854
2
1ll
1l
ll
667
0.OOl3.2780.7230.743
21
l
囡竺至兰竺兰兰兰
表4
最大概率分组
样本号
判别分组
5253
54
2
样本综合统计表(实际分组2)
z分值非标准化典型判别函数值
2.4960.400—0.4760.686—0.657
1
最大概率分组
样本号
判别P(G=g分组
7879808l82838485868788899091929394959697989910010l102
2222
,-
z分值非标准化典型判别函数值
0.3271.5771.0500.2291.330O.8780.8343.4153.1743.0460.5291.80407240.9090.2861.5961.0441.00702820.580O.7121.316O.1330.2551.775
P(G=g『
D:d)0.9950.69807310.80807980.9810.8830.9320.97l0.51805820.9250.8340.781O6170.99907400.92509220.97907780.6780.9750.9lO0.6980.970
马氏平方距离
2.10004190.326O.13l01520.69l00070.04004061.0260.7920.0230.0760.1940.6734.59403000.024O.018O.6100.2020.48004920.00304190.373
马氏平方距离
O.519O.2810.0000.6690.0800.0290.0465.6054.5243.9940.2690.5730
104
D=d)0.6650.9650.900O.6180.9420.8630.8520.9990.9990.9980.7520.9780.82008700.6450.9660.8990.8920.643O.77lO.8160.9400.5690.6300.976
2l2
l
5556
57
2
2
8792
5859606l62636465666768697071
72
0.9661.2461.684—0.034一O.1571.1980.7720.6070.2273.19l0.5001.20l
1
22222
2
221
1
22
2
22222
2
O.0190580O.30l00000.0020.586O.2180
112
22
2
2
,
一
182222
7—
2
7—
1.8280.5980.3541749
7374757677
22
2
0.07208360.6280529
22
2
1.1030.4001.658
22
由于在SPSSl0.0中假设有效样本的先验概率是相等的,因此,在把样本分为两组的情况下,每个样本进入每个分组的先验概率都是0.5。表2给出了所有样本实际分组情况以及按Bayes判别方法得到的分组情况。P(G=g系式:
D=d)表示后验
概率,其中D表示前面提到的广义距离,d表示马氏距离。由于存在下面的关
D:(石)=d:(名)+g。+h。
其中,g。=ln
l芝2
o::萋至:,__,_至:≥}相等
o,若gl-…孤:÷
一1’…,矗
,一21nq。,若q.,…,口。不全相等
^a
2{
因此,在各组先验概率和协方差矩阵相等的情况下,D=d。第一组有6个ST
第二部分财政与金融研究网
公司被误判为非sT公司,误判率为11.8%;第二组有4个非sT公司被误判为sT公司,误判率为7.8%。这两个指标都是令人满意的。
Bayes判别方法最大的优点就是能够得出样本违约的后验概率,再加上令人满意的误判率水平,我们就可以利用这个后验概率来替代上市公司的违约率。近年来,国际上信用风险度量和管理的方法已经取得了长足的进步,开发出了很多新模型和新方法。例如,以期权理论为基础的KMV模型,以VaR方法为基础的Credit—Metrics模型,还有以保险精算为基础的死亡率模型等。在所有这些模型中,违约率都是度量信用风险不可缺少的数据。在我国,信用体系还未完全建立起来,与信用风险防范相关的数据规模很小,这些在国际上已经成熟的信用风险度量方法无法应用到我国的实证分析中,这已经成为我国信用风险度量的阶段性难题。本文中这种用后验概率替代违约率的方法虽然只是暂时性的,但却可以在现有数据不全的条件下把这些新方法应用到我国信用风险度量中来,从而推动我国信用风险管理的
发展。
参考文献
1.Daykin,Hall.1994.
Pentikainen,Pesonen.PracticalRisk
TheoryforActuaries.New
York:Chapman
and
2.石晓军、陈殿左:《信用治理:文化、流程与工具》,机械工业出版社2004年版。
贝叶斯判别分析在违约率预测中的应用
作者:作者单位:
孟庆福, 谢亚鹏, 尹铁岩
相似文献(0条)
本文链接:http://d.g.wanfangdata.com.cn/Conference_6605487.aspx
下载时间:2010年5月19日