贝叶斯判别分析在违约率预测中的应用

孟庆福

谢亚鹏

尹铁岩

违约率、挽回率和违约相关性是运用现代模型度量信用风险的三个主要参数，其中违约率是这些参数的关键和出发点。本文运用Ｂａｙｅｓ判别分析对我国上市公司违约进行预测，从而实现对违约率的替代度量，这对于现代模型在我

国普遍应用无疑具有重要的现实意义。

一、模型设计

贝叶斯统计的思想是，假定对研究对象已有一定的认识，常用先验概率分布来描述这种认识，然后我们取得一组样本，用样本来修正已有的认识（先验概率分布）从而得到后验概率分布，各种统计推断都通过后验概率分布来进行。将贝叶斯统计思想用于判别分布，就得到贝叶斯判别方法。

ｋ

设有ｎ。个上市公司来自组仃。（ｄ＝１，２，…，后），共有儿＝∑忍。个上市公司

作为研究样本，判别变量数为Ｐ，则上市公司ｕ划分为组丌。的原则是ｕ属于组７ｒ。的后验概率最大，即：

Ｐ（７ｒ。ｆ戈。）＝．ｍａｘ，Ｐ（７ｒｉ

概率为：

ｑ

ｚ。），ｉ＝１，２，…，南（１）

假设判别变量服从多元正态分布，并具有等协方差矩阵，则ｕ属于７ｒ。的后验

Ｐ（７ｒ。Ｉ戈。）＝１——∑—生—上

∑”ｘＰ（一１１Ｄ２。；）

ｅｘｐ（一÷Ｄ：。）

（２）

其中，ｑ。和ｑｉ分别是属于组７ｒ。和组７ｒｉ的先验概率；Ｄ。。和Ｄ。ｉ分别是ｕ到组仃。和组７『ｉ的广义距离。式（１）的求解等同于求式（２）中分子的最大值，或是其自然对数的最大值，即：

囡竺翌兰竺翌！兰

ｋ＝１ｎｇ。一÷Ｄ：。＝ｌｎｑ。一丁１（算。一面Ⅱ），∑１石。一训

＝（∥。∑一１）菇。一尹１口’∑－Ｉ菇－。＋ｌｎｇ。

此可见，贝叶斯判别方法下的判别方程是线性方程。

（３）

式（３）中第一项括号中的表达式为判别方程的系数，后面的表达式为常数项。由

二、研究样本的选取

截至２００３年年底，在我国上海、深圳证券交易所上市的公司中共有１２３家曾被宣布为ＳＴ（以下称为ＳＴ公司），其中２００３年宣布为ＳＴ的有６７家。在这６７家上市公司中，有５１家是由于财务状况异常而被ｓＴ的，其余１６家上市公司由于其他状况异常而被ＳＴ，因此，应该从样本中剔除。同时，我们另外选取了５１家非ＳＴ上市公司作为参照对象（以下称为非ｓＴ公司），选取这些非ＳＴ公司的原则是：

１．满足同行业、同时期、同规模的要求。“同行业”指的是与ＳＴ公司属于同一行业；“同时期、同规模”指的是对应的非ＳＴ公司在同一时点上与ＳＴ公司在资产总额规模上相当，即选取所有非ＳＴ公司中与ｓＴ公司总资产规模最接近的公司进人样本。我们认为，这样的选取原则可以较好地满足可比性的要求，使模型更具有普遍性。

２．满足时间性的要求。为了获得足够的数据进行比较分析，同时也为了保持模型预测的可靠性，我们选取ｓＴ公司被“特别处理”前２年的财务数据作为样本，并要求样本必须具有一定的时间连续性和可比性。我们将２００３年被ＳＴ的公司列为“组１”，相对应的非ＳＴ公司列为“组２”。

三、变量的选取

判别模型所使用的变量在两组样本中的均值应该具有显著的差异。经过筛选（筛选过程略），最终有１０个变量纳入了本文的判别模型，这些变量的情况具体见表ｌ。

表丑

属性

慕盘情河

变量

Ｚ２

最终纳入模型的财务比率列表

财务比率每股净资产

属性

变量

＃１５

财务比率资产负债率

偿债能力

成长能力

％

ａ：６

每殷未分配利润净资产收益率

』２ｌ

净资产增长率每股经营现金流量

获利能力

Ｊｃ７ａｔ＂１２

ｘ２２

总资产收益率总资产周转率

现金流量

并２４

经营能力

Ｚ１３

营运资金总资产比

现金总债务比

兰三竺坌竺坚兰竺苎！窒Ｉ！：！Ｉ

四、参数估计和结果检验

在Ｂａｙｅｓ方法下，我们使用最终选取的１０个财务比率作为变量。这样，我们就可以直接将样本数据带人上面设计的模型并运行程序，所得到的结果见表２、表３和表４。

表２

组别

】

先验概率表

先验概率

未加权

ｏ．５００ｏ．５００１．ｏｏｏ

５Ｊ５１

１０２

样本数

加权

５】．ｏｏｏ５１．ｏｏｏ１０２．ｏｏｏ

２

总计

表３

蛀大概率分组

样本号

判别Ｐ（Ｇ＝ｇ分组

１

样本综合统计表（实际分组１）

ｚ分值非标准化典型判别函数值

—１．７６２一０．６４７—０．８０２—０．３４７—０．８７４一Ｏ．１２８０．４５６０．２００—３．７０３一１．１９１一１．４８７—１．５７ｌ——０．６０８一Ｏ．８１８０．０５６—２．１２２一１．０１４—０．１９０一１．９３２一１．７１５０．１１３—２．３３８—１．０２０—２．８５８Ｏ．１９７—１．９０９

２７２８２９３０３ｌ３２３３３４３５３６３７３８３９４０４ｌ４２４３４４４５４６４７４８４９５０５１

最大概率分组

样本号

判别Ｐ（Ｃ＝ｇ分组

１

１１

ｚ分值非标准化典型判别函数值

—２．０ＩＯ—０．２７７—４８３９—０．５５６—０．９９３—０．７０３一Ｏ２６ｌＯ．０１３—０４５８—２．３９６一０．９４７—２．９５１—０．７８６—０．８５５一Ｏ６８３—１．３８０一１．０６１

ｌ

马氏平方距离

Ｏ．５ｌｌ０．１６００．０６００．４９１０．０３００．８４６０．３４９Ｏ．７１９７．０５５Ｏ．０２ｌＯ．１９３０．２７４Ｏ．１９３０．０５２０．９８４Ｊ．】５６Ｏ．００Ｉ０．７３４０．７８２０４４６０．８７２

１

马氏平方距离

０．９２７０．５９３１４．３８００

２４１

Ｄ＝ｄ、０．９７６０．７９５０．８４３０．６７４０．８６２０．５６６０．７２２０．６０３１０００

Ｄ＝ｄ）０．９８５０．６４ｌ

ｌ

２３

４

ｌ

１ｌ

０００

ｌ

１

０．７６２０．８８９Ｏ８１３０．６３３０．５０７０７２３０．９９３０．８７９０９９８０．８３８０．８５７０８０７０．９４７０．９０２０９４１０．５３４Ｏ．６２１０．９８５０．８９３Ｏ．７１５０．８８５Ｏ．８５７

５６７８９１０１ｌ１２１３１４１５１６１７１８１９２０２】２２２３２４２５２６

１

０．００３Ｏ．１１９０．６１８１．０６９０．３４８１．８２０Ｏ．０ｌＯ３．６２５０．０６８０．０３７Ｏ．１３３Ｏ．１１ｌ０．００００．０７４０．９６５０．６５７Ｏ．８９２０．ＯＯｌＯ．３７ｌ０．００５Ｏ．０３８

ｌｌ２１

ｌｌｌｌｌ

２２

ｌｌ

０．９２４０．９５７０．９６４Ｏ．７８１０．８４７０．５２９０．９８８０．８９３０．５９８０．９８３０．９７３０，５５９０．９９３０８９４０．９９７０．６０２０９８２

ｌ

ｌｌ

１

２ｊｌｌ１１

ｌｌ

ｌ

２

１ｌ

３１８

—０．０６５—０．２３６—１．９９２—１．０１１一０４３８一Ｏ．９７５——０．８５４

２

１ｌｌ

１ｌ

ｌｌ

６６７

０．ＯＯｌ３．２７８０．７２３０．７４３

２１

ｌ

囡竺至兰竺兰兰兰

表４

最大概率分组

样本号

判别分组

５２５３

５４

２

样本综合统计表（实际分组２）

ｚ分值非标准化典型判别函数值

２．４９６０．４００—０．４７６０．６８６—０．６５７

１

最大概率分组

样本号

判别Ｐ（Ｇ＝ｇ分组

７８７９８０８ｌ８２８３８４８５８６８７８８８９９０９１９２９３９４９５９６９７９８９９１００１０ｌ１０２

２２２２

，－

ｚ分值非标准化典型判别函数值

０．３２７１．５７７１．０５００．２２９１．３３０Ｏ．８７８０．８３４３．４１５３．１７４３．０４６０．５２９１．８０４０７２４０．９０９０．２８６１．５９６１．０４４１．００７０２８２０．５８０Ｏ．７１２１．３１６Ｏ．１３３０．２５５１．７７５

Ｐ（Ｇ＝ｇ『

Ｄ：ｄ）０．９９５０．６９８０７３１０．８０８０７９８０．９８１０．８８３０．９３２０．９７ｌ０．５１８０５８２０．９２５０．８３４０．７８１Ｏ６１７０．９９９０７４００．９２５０９２２０．９７９０７７８０．６７８０．９７５０．９ｌＯ０．６９８０．９７０

马氏平方距离

２．１０００４１９０．３２６Ｏ．１３ｌ０１５２０．６９ｌ０００７０．０４００４０６１．０２６０．７９２０．０２３０．０７６０．１９４０．６７３４．５９４０３０００．０２４Ｏ．０１８Ｏ．６１００．２０２０．４８００４９２０．００３０４１９０．３７３

马氏平方距离

Ｏ．５１９Ｏ．２８１０．００００．６６９０．０８００．０２９０．０４６５．６０５４．５２４３．９９４０．２６９０．５７３０

１０４

Ｄ＝ｄ）０．６６５０．９６５０．９００Ｏ．６１８０．９４２０．８６３０．８５２０．９９９０．９９９０．９９８０．７５２０．９７８０．８２００８７００．６４５０．９６６０．８９９０．８９２０．６４３Ｏ．７７ｌＯ．８１６０．９４００．５６９０．６３００．９７６

２ｌ２

ｌ

５５５６

５７

２

８７９２

５８５９６０６ｌ６２６３６４６５６６６７６８６９７０７１

７２

０．９６６１．２４６１．６８４—０．０３４一Ｏ．１５７１．１９８０．７７２０．６０７０．２２７３．１９ｌ０．５００１．２０ｌ

１

２２２２２

２

２２１

１

２２

２

２２２２２

２

Ｏ．０１９０５８０Ｏ．３０ｌ０００００．００２０．５８６Ｏ．２１８０

１１２

２２

２

，

一

１８２２２２

７—

２

７—

１．８２８０．５９８０．３５４１７４９

７３７４７５７６７７

２２

２

０．０７２０８３６０．６２８０５２９

２２

２

１．１０３０．４００１．６５８

２２

由于在ＳＰＳＳｌ０．０中假设有效样本的先验概率是相等的，因此，在把样本分为两组的情况下，每个样本进入每个分组的先验概率都是０．５。表２给出了所有样本实际分组情况以及按Ｂａｙｅｓ判别方法得到的分组情况。Ｐ（Ｇ＝ｇ系式：

Ｄ＝ｄ）表示后验

概率，其中Ｄ表示前面提到的广义距离，ｄ表示马氏距离。由于存在下面的关

Ｄ：（石）＝ｄ：（名）＋ｇ。＋ｈ。

其中，ｇ。＝ｌｎ

ｌ芝２

ｏ：：萋至：，＿＿，＿至：≥｝相等

ｏ，若ｇｌ－…孤：÷

一１’…，矗

，一２１ｎｑ。，若ｑ．，…，口。不全相等

＾ａ

２｛

因此，在各组先验概率和协方差矩阵相等的情况下，Ｄ＝ｄ。第一组有６个ＳＴ

第二部分财政与金融研究网

公司被误判为非ｓＴ公司，误判率为１１．８％；第二组有４个非ｓＴ公司被误判为ｓＴ公司，误判率为７．８％。这两个指标都是令人满意的。

Ｂａｙｅｓ判别方法最大的优点就是能够得出样本违约的后验概率，再加上令人满意的误判率水平，我们就可以利用这个后验概率来替代上市公司的违约率。近年来，国际上信用风险度量和管理的方法已经取得了长足的进步，开发出了很多新模型和新方法。例如，以期权理论为基础的ＫＭＶ模型，以ＶａＲ方法为基础的Ｃｒｅｄｉｔ—Ｍｅｔｒｉｃｓ模型，还有以保险精算为基础的死亡率模型等。在所有这些模型中，违约率都是度量信用风险不可缺少的数据。在我国，信用体系还未完全建立起来，与信用风险防范相关的数据规模很小，这些在国际上已经成熟的信用风险度量方法无法应用到我国的实证分析中，这已经成为我国信用风险度量的阶段性难题。本文中这种用后验概率替代违约率的方法虽然只是暂时性的，但却可以在现有数据不全的条件下把这些新方法应用到我国信用风险度量中来，从而推动我国信用风险管理的

发展。

参考文献

１．Ｄａｙｋｉｎ，Ｈａｌｌ．１９９４．

Ｐｅｎｔｉｋａｉｎｅｎ，Ｐｅｓｏｎｅｎ．ＰｒａｃｔｉｃａｌＲｉｓｋ

ＴｈｅｏｒｙｆｏｒＡｃｔｕａｒｉｅｓ．Ｎｅｗ

Ｙｏｒｋ：Ｃｈａｐｍａｎ

ａｎｄ

２．石晓军、陈殿左：《信用治理：文化、流程与工具》，机械工业出版社２００４年版。

贝叶斯判别分析在违约率预测中的应用

作者：作者单位：

孟庆福，谢亚鹏，尹铁岩

相似文献(0条)

本文链接：http://d.g.wanfangdata.com.cn/Conference_6605487.aspx

下载时间：2010年5月19日

贝叶斯判别分析在违约率预测中的应用

孟庆福

谢亚鹏

尹铁岩

国普遍应用无疑具有重要的现实意义。

一、模型设计

ｋ

设有ｎ。个上市公司来自组仃。（ｄ＝１，２，…，后），共有儿＝∑忍。个上市公司

作为研究样本，判别变量数为Ｐ，则上市公司ｕ划分为组丌。的原则是ｕ属于组７ｒ。的后验概率最大，即：

Ｐ（７ｒ。ｆ戈。）＝．ｍａｘ，Ｐ（７ｒｉ

概率为：

ｑ

ｚ。），ｉ＝１，２，…，南（１）

假设判别变量服从多元正态分布，并具有等协方差矩阵，则ｕ属于７ｒ。的后验

Ｐ（７ｒ。Ｉ戈。）＝１——∑—生—上

∑”ｘＰ（一１１Ｄ２。；）

ｅｘｐ（一÷Ｄ：。）

（２）

囡竺翌兰竺翌！兰

ｋ＝１ｎｇ。一÷Ｄ：。＝ｌｎｑ。一丁１（算。一面Ⅱ），∑１石。一训

＝（∥。∑一１）菇。一尹１口’∑－Ｉ菇－。＋ｌｎｇ。

此可见，贝叶斯判别方法下的判别方程是线性方程。

（３）

式（３）中第一项括号中的表达式为判别方程的系数，后面的表达式为常数项。由

二、研究样本的选取

三、变量的选取

表丑

属性

慕盘情河

变量

Ｚ２

最终纳入模型的财务比率列表

财务比率每股净资产

属性

变量

＃１５

财务比率资产负债率

偿债能力

成长能力

％

ａ：６

每殷未分配利润净资产收益率

』２ｌ

净资产增长率每股经营现金流量

获利能力

Ｊｃ７ａｔ＂１２

ｘ２２

总资产收益率总资产周转率

现金流量

并２４

经营能力

Ｚ１３

营运资金总资产比

现金总债务比

兰三竺坌竺坚兰竺苎！窒Ｉ！：！Ｉ

四、参数估计和结果检验

表２

组别

】

先验概率表

先验概率

未加权

ｏ．５００ｏ．５００１．ｏｏｏ

５Ｊ５１

１０２

样本数

加权

５】．ｏｏｏ５１．ｏｏｏ１０２．ｏｏｏ

２

总计

表３

蛀大概率分组

样本号

判别Ｐ（Ｇ＝ｇ分组

１

样本综合统计表（实际分组１）

ｚ分值非标准化典型判别函数值

２７２８２９３０３ｌ３２３３３４３５３６３７３８３９４０４ｌ４２４３４４４５４６４７４８４９５０５１

最大概率分组

样本号

判别Ｐ（Ｃ＝ｇ分组

１

１１

ｚ分值非标准化典型判别函数值

ｌ

马氏平方距离

１

马氏平方距离

０．９２７０．５９３１４．３８００

２４１

Ｄ＝ｄ、０．９７６０．７９５０．８４３０．６７４０．８６２０．５６６０．７２２０．６０３１０００

Ｄ＝ｄ）０．９８５０．６４ｌ

ｌ

２３

４

ｌ

１ｌ

０００

ｌ

１

５６７８９１０１ｌ１２１３１４１５１６１７１８１９２０２】２２２３２４２５２６

１

ｌｌ２１

ｌｌｌｌｌ

２２

ｌｌ

ｌ

ｌｌ

１

２ｊｌｌ１１

ｌｌ

ｌ

２

１ｌ

３１８

—０．０６５—０．２３６—１．９９２—１．０１１一０４３８一Ｏ．９７５——０．８５４

２

１ｌｌ

１ｌ

ｌｌ

６６７

０．ＯＯｌ３．２７８０．７２３０．７４３

２１

ｌ

囡竺至兰竺兰兰兰

表４

最大概率分组

样本号

判别分组

５２５３

５４

２

样本综合统计表（实际分组２）

ｚ分值非标准化典型判别函数值

２．４９６０．４００—０．４７６０．６８６—０．６５７

１

最大概率分组

样本号

判别Ｐ（Ｇ＝ｇ分组

７８７９８０８ｌ８２８３８４８５８６８７８８８９９０９１９２９３９４９５９６９７９８９９１００１０ｌ１０２

２２２２

，－

ｚ分值非标准化典型判别函数值

Ｐ（Ｇ＝ｇ『

马氏平方距离

Ｏ．５１９Ｏ．２８１０．００００．６６９０．０８００．０２９０．０４６５．６０５４．５２４３．９９４０．２６９０．５７３０

１０４

２ｌ２

ｌ

５５５６

５７

２

８７９２

５８５９６０６ｌ６２６３６４６５６６６７６８６９７０７１

７２

０．９６６１．２４６１．６８４—０．０３４一Ｏ．１５７１．１９８０．７７２０．６０７０．２２７３．１９ｌ０．５００１．２０ｌ

１

２２２２２

２

２２１

１

２２

２

２２２２２

２

Ｏ．０１９０５８０Ｏ．３０ｌ０００００．００２０．５８６Ｏ．２１８０

１１２

２２

２

，

一

１８２２２２

７—

２

７—

１．８２８０．５９８０．３５４１７４９

７３７４７５７６７７

２２

２

０．０７２０８３６０．６２８０５２９

２２

２

１．１０３０．４００１．６５８

２２

Ｄ＝ｄ）表示后验

概率，其中Ｄ表示前面提到的广义距离，ｄ表示马氏距离。由于存在下面的关

Ｄ：（石）＝ｄ：（名）＋ｇ。＋ｈ。

其中，ｇ。＝ｌｎ

ｌ芝２

ｏ：：萋至：，＿＿，＿至：≥｝相等

ｏ，若ｇｌ－…孤：÷

一１’…，矗

，一２１ｎｑ。，若ｑ．，…，口。不全相等

＾ａ

２｛

因此，在各组先验概率和协方差矩阵相等的情况下，Ｄ＝ｄ。第一组有６个ＳＴ

第二部分财政与金融研究网

公司被误判为非ｓＴ公司，误判率为１１．８％；第二组有４个非ｓＴ公司被误判为ｓＴ公司，误判率为７．８％。这两个指标都是令人满意的。

发展。

参考文献

１．Ｄａｙｋｉｎ，Ｈａｌｌ．１９９４．

Ｐｅｎｔｉｋａｉｎｅｎ，Ｐｅｓｏｎｅｎ．ＰｒａｃｔｉｃａｌＲｉｓｋ

ＴｈｅｏｒｙｆｏｒＡｃｔｕａｒｉｅｓ．Ｎｅｗ

Ｙｏｒｋ：Ｃｈａｐｍａｎ

ａｎｄ

２．石晓军、陈殿左：《信用治理：文化、流程与工具》，机械工业出版社２００４年版。

贝叶斯判别分析在违约率预测中的应用

作者：作者单位：

孟庆福，谢亚鹏，尹铁岩

相似文献(0条)

本文链接：http://d.g.wanfangdata.com.cn/Conference_6605487.aspx

下载时间：2010年5月19日

贝叶斯判别分析在违约率预测中的应用

相关文章