基金业绩评价方法综述
鹏元资信评估有限公司 张智英
60年代以前,国外对投资基金的业绩评价,主要是评价基金单位净值和基金收益率。那时,没有人对风险这一抽象的概念给出一种具体的度量方法,自然也不可能将风险因素纳入基金业绩评价。直到1952年,Markwitz在他所开创的现代投资组合理论(Modern Portfolio Theory, MPT)中提出了“市场有效投资组合”的概念。不久以后,Sharpe和Lintner等人引入无风险资产的概念,并推导出资本市场线(CML)和证券市场线(SML),具体量化了投资风险与收益之间的对应关系。这些理论为基金业绩评价方法的发展提供了理论基础。此后,西方学者纷纷在研究基金业绩评价方法时考虑了风险因素,对基金的投资收益进行风险调整。其中比较经典的有Treynor指数,Sharpe指数和Jensen指数1。下面分别介绍各种方法的理论基础、指标含义和局限性。
1.1传统评价方法
1.1.1基金单位资产净值评价法
基金单位资产净值(NAV)表示某一时点每股基金的市场价值净值。为基金的净资产总值除以发行在外的该基金总份数,即: NAV=基金净资产总值 …………(1) 发行在外的基金总份数
其中,总资产等于计算日该基金持有的证券市价总值和持有的现金之和。而净资产则是从总资产中扣除各项费用和负债总额后的资产净值。
简评:该方法的优点在于指标的计算简单、易懂,所以在实际应用中比较受欢迎。但是这种方法所存在的局限性也是非常明显的,主要表现在以下两个方面:①该方法没有把风险作为评价基金业绩好坏的因素考虑在内,没有将收益率进行风险调整,而停留在收益率的量的衡量上,没有进一步对收益率的质进行衡量,1王学军. 基金业绩评价研究[ol].厦门大学博硕士论文数据库,2002.12.
而我们知道只有同质的量才具有较好的可比性;②该指标与基金是何时发行的有很大的关系,即与证券市场的周期相关,比如评价期n是牛市,而n-1期为熊市,而基金A是n-1期发行的它经历了一个熊市和一个牛市,但是基金B则是n期发行的它只经历了一个牛市,此时并不能以评价期末B的单位净值高于A的单位净值而得出在评价期n内基金B的业绩好于基金A 的业绩的结论。因此,基金资产净值法在不同时期发行的基金之间不具有可比性。
1.1.2收益率评价法
收益率(R)是反映投资收益与投入的关系的相对指标,表示单位净资产的变动程度。其数学公式可表示为:
Rt=NAVt+Dt−NAVt−1 …………(2) NAVt−1
其中,Rt表示评价期的收益率;NAVt表示期末单位净资产;Dt表示评价期
每股收益分配;NAVt−1表示期初单位净资产。
简评:收益率指标自其被提出以来就一直被沿用至今,而且一直是各基金管理公司必须定期公布的信息,也是投资者最为关注的指标之一,这也充分说明了该指标的科学与可取之处,它的优点就是综合地反映了基金在评价期内的业绩,但是单凭这一指标来评价基金业绩的好坏是很不够的。虽然该指标克服了单位净资产法在不同时期发行的基金之间不具有可比性的缺点,但是它依然没有考虑不同收益率背后所承担的风险,依然没有对收益率进行质的调整,而如今随着金融市场的不断创新与发展,金融市场上可交易的金融工具的风险差别也越来越大,因此,这种不考虑风险只考虑收益率的评价方法是很不不完善的,当然其评价的结果也是令人很不满意和信任的。当然,收益率是各种评价方法的基础,这是无法否认的,本文同样也以此为基础进行研究。
1.2单因素风险调整评价方法
1.2.1各种评价方法的介绍
1.Treynor指数2
Treynor指数是利用证券市场线(SML)为基准组合来评价基金的业绩,它等于基金投资组合的投资收益率与无风险收益率之差除以其系统风险测度值。其数学公式可表示如下:
Ti=i−Rf
i …………(3)
其中,Ti——基金i的Treynor指数
i——业绩评价期基金i的平均收益率
Rf——业绩评价期的无风险收益率
βi——业绩评价期基金i的β系数(根据CAPM对历史受益进行回归得到) Treynor指数可以看成是单位系统风险所带来的超额回报。通过比较单位系统风险所带来的超额回报,就可以比较不同基金的管理业绩。当然,根据Treynor指数同样可以获得所有基金的一个共同比较基准——市场的Treynor指数:
Tm=m−Rf
m …………(4)
因为βm的值等于1,所以市场的Treynor指数可表示为:
Tm=m−Rf
如果Ti>Tm,说明基金i的业绩比市场业绩好,或者说它战胜了市场;如果Ti=Tm,则说明基金i与市场获得的相同的业绩,基金的积极管理策略并不能战胜市场;如果Ti
2、Sharpe指数3 Treynor, Jack L. How to Rate Management of Investment Funds. Harvard Business Review, Jan/Feb65, Vol. 43 Issue 1, p63, 13p 2
Sharpe指数以资本市场线(CML)为标准来评价基金业绩。它是指在一定评价期内的基金投资组合的投资收益率超过无风险收益率的部分与该基金收益率的标准差之比,该指数可以看成是单位总风险所带来的超额回报。其数学公式表示如下:
Si=i−Rfi …………(5)
其中,Si——基金i的Sharpe指数
i——业绩评价期基金i的平均收益率
Rf——业绩评价期的无风险收益率
σi——业绩评价期基金i的收益率标准差
Sharpe指数不但能够反映基金经理的市场调整能力,而且由于Sharpe指数考虑了非系统风险,故该指数还能反映基金经理分散和降低非系统风险的能力。如果投资基金已完全分散了非系统风险,那么Treynor指数和Sharpe指数的评价结果是一样的。但是,现实中非系统风险未必能够全部分散掉,所以Sharpe指数在西方基金业绩评价实务界受到更多重视,著名的Morningstar基金评级公司就是将Sharpe指数作为一个基金业绩参考指标。
3、Jensen指数
Treynor指数和Sharpe指数尽管能给出不同基金业绩的排序,却无法告诉我们基金表现优于市场基准组合具体是多少,而Jensen为了解决这一问题提出了Jensen指数。首先根据CAPM理论,基金i的预期收益E(Ri)应是系统风险βi对无风险收益Rf的补偿,即E(Ri)=Rf+βi[E(Rm)−Rf]。Jensen认为基金实际的平均收益率i减去其预期收益E(Ri)所得的数值Ji就能量化基金优于市场组合
的实际水平。其数学公式可表示如下:
⎤Ji=i−E(Ri)=i−⎡⎣Rf+βi(m−Rf)⎦ …………(6)
根据Jensen(1968)Ji值可以根据以下回归方程进行估计得到:
3 Sharpe, William F. Mutual Fund Performance. Journal of Business, Jan66 Part 2 of 2, Vol. 39 Issue 1, p119, 20p
it−Rft=Ji+βimt−Rft+μit …………(7) Ji越大越好:当Ji值显著大于零时,表明基金业绩较之市场有优越表现,
说明基金i战胜了市场;反之,当Ji显著小于零时,则表明基金业绩较市场更差,
说明基金的管理效率是比较低下的。
4、创新的风险调整指数方法
自Treynor指数、Sharpe指数和Jensen指数创立以来,相当长的时期内有大量的关于基金业绩评价的研究都集中在这三个指标上,他们都试图通过对这三个指标存在的不足之处进行创新,提出更加科学、准确的评价方法。比如为克服Jensen指数未考虑基金收益率的波动率的时变性的缺点,Cochrane(1992)等人提出了条件模型,他们的研究表明条件模型能更好地解释股票收益的变化。Jagannathan, Wang(1996)也建议采用条件模型来解释股票收益,所以,Ferson, Schadt(1996)在前人研究的基础上,采用Sharpe(1964)的多因素CAPM形式来描述基金的条件期望总收益,并在模型中引入前定信息变量,将β看成前定信息变量的线性函数以考虑β的时变性4。何孝星、于宏凯(2003)也采用了条件CAPM对我国的证券投资基金业绩进行了实证研究,他们的研究表明条件CAPM框架比无条件CAPM框架对我国基金业绩的解释能力更强,解释结果更可靠。
当然对风险的度量方法的创新,除了前文提到的关于风险的时变性的度量外,也有一些学者提出了“下方风险”的度量方法。他们认为证券投资的风险是一种投资损失的可能性而不是投资收益的不确定性。这种对风险的认识与计量比较符合人们的心理感受,所以这种观点自提出来后就很受到欢迎,至今以成为风险计量的主流观点。计量“下方风险”的比较成熟的模型有Harlow(1991)等人提出的LPM(Lower Partial Moments)方法,即用收益分布的左尾部分而不是全部来作为风险的度量标准;另外,J. P. Morgan公司于1994年推出了风险矩阵系统,发展了一种新型的风险计量方法——风险价值(Value At Risk, VAR)。风险价值的含义是证券组合在一定的期限内和一定的置信水平下可能发生的最大
5损失。当然,VAR方法也不是十全十美没有缺陷的,它的主要缺点表现在:对收()益率的分布同样存在主观的选择问题,另外,对置信水平的选择也存在较大的主4
5 吴冲锋等.证券投资基金业绩评价研究述评[J].系统工程理论与实践.2002、10. John C. Hull. Options, Futures, and Other Derivatives[M]. 北京:清华大学出版社,2001.第342页
观性,不同的置信水平必然导致不一样的VAR值。为了解决Sharpe指数风险计量的缺陷,彭海伟和吴启芳(2004)提出了基于VAR的Sharpe指标和基于条件VAR的Sharpe指标。
1.2.2 对单因素风险调整评价方法的评价
诚然单因素风险调整指数评价方法很好地克服了传统评价方法没有对基金收益率进行质的调整的缺陷,而且还充分利用风险度量方法的不断发展对风险调整指数进行了合理的改进,但是,由于该方法所依赖的理论本身存在一些不足,所以该评价方法也还存在如下几个局限性:
一、罗尔对Jensen指数的批评6
1、罗尔批评的主要内容
罗尔(1978)认为由于Jensen指数的计算依靠某一市场指数的事后观察值,而这一观察值有可能是均方差无效的,因此根据Jensen指数来评价投资组合的业绩是不可靠的。罗尔关于事后证券市场线在评价基金业绩方面的局限性方面所作的评论可以用以下三个方面来概括:
①如果所选择的市场资产组合是均方差有效的,那么包括这个市场投资组合资产的所有投资组合的平均收益率和方差应该落在同一条证券市场线上,而不管这些投资组合采用的是积极管理策略还是消极管理策略。换句话说,从这些投资组合的偏离证券市场线的大小不能区分它们的业绩,然而,这正是Jensen指数度量投资组合业绩的最基本思想。
②当选取一个市场投资组合的替代组合时,如果投资组合和组合内的所有资产均落在同一条证券市场线上,则可以认为这个替代组合是均方差有效的。
③当按照一个均方差无效的替代投资组合对投资基金的业绩进行排序时,一定存在另一个均方差无效的市场投资组合的替代组合,可以得出相反的结论。
前两个方面说明,通过证券市场线无法判断投资组合的业绩,因此也就无法用来评价积极管理投资组合的业绩。如果能够发现投资组合在收益—风险特征点远离了证券市场线,那么,这种偏离必定是由于替代组合作为基准组合的均方差无效的结果。最后一个方面说明了用Jensen指数不能正确的估计单个投资组合的6孙超. 证券投资基金业绩评价的理论与实证研究[ol]. 中国学位论文全文数据库. 2003.01.01
业绩。值的注意的是,罗尔批评不但从事后的角度而且也从事前期望的角度评价了Jensen指数的无效性。
2、笔者对罗尔批评的评价
虽然罗尔只是对Jensen指数提出批评,但是他从CAPM不可验证的角度出发,来论述Jensen指数的不可行性的思想也适用于对其他单因素风险调整方法。正因为很难找到一个合理的方法来验证CAPM是否正确,所以,罗尔在他的批评中并没有否定CAPM本身的意思,他仅仅指出了将CAPM运用到基金业绩评价中来是不合适的,因为上述的原因,Jensen指数很难得出可靠的评价结果。从这个意义上说,笔者认为罗尔的批评是很有道理的,他从理论基础了指出了该方法的局限性。
二、笔者对单因素风险调整评价方法的评价
虽然罗尔1978年就从CAPM的不可验证角度指出了Jensen指数无法正确评价基金业绩,但是那只是该方法所存在的局限性之一,除此之外,单因素风险调整评价方法还存在以下几方面的不足:
第一,当评价期内基金出现“负的超额收益”时,Treynor指数、Sharpe指数和基于VAR的Sharpe指数的运用都将受到限制。比如当基金A和基金B的评价收益率为负值时,因为风险度量指标σ的值不可能为负,所以他们的Sharpe指数必定为负值,当出现这种情况时,如果根据其指标的大小来评价他们业绩的好坏就会带来错误的结论,因为当两个基金具有相等的“负的超额收益”时,如果σA>σB,根据等式(5)就有SA>SB,根据Sharpe指数的评价原则我们会认为
基金A的业绩要优于基金B,这显然是不符合实际情况的,因为基金A承担了更大的风险才换取与基金B同等的收益。
第二,采用基于CAPM的Treynor指数和Jensen指数作为基金业绩评价方法时存在一个严重的悖论问题:因为CAPM成立的一个前提条件就是证券市场必须是有效的,而如果证券市场是完全有效的,那么就不存在任何取得超额收益的可能,任何基金的事后收益——风险值与证券市场线的偏离都应该是均值为零的随机误差,也就不存在明显易于零的Treynor指数和Jensen指数,也就无法根据指数数值的大小来评价基金的业绩优劣;而如果根据CAPM进行回归得到了超额收益,得到了显著易于零的Treynor指数和Jensen指数,那么这个证券市场就必定是弱
势有效或无效的,此时就不能保证这些指数的理论基础(证券市场线的表达式)的正确性,进而Treynor指数和Jensen指数也就失去了其理论依据,从而也大大降低了其评价结果的可信度。
第三,基于风险调整的单因素评价方法虽然考虑风险因素对收益率质量的影响,但是由于该方法本身的缺陷并不能把其他的同样会影响收益率质量及综合业绩的因素考虑进来,比如本文所要探讨的经营成本、交易成本和择时能力等,而对于基金投资者来说这些因素又恰恰是很重要的,它们会间接影响投资者的收益。因此,我们说虽然风险调整指数评价方法具有一定的合理性,其在实际运用中也得到了多数人的认可,但是从理论上来分析该方法还是有它不足的地方。
1.3 多因素评价方法
多因素分析模型认为影响基金收益的因素除了市场因素之外,组合中股票的各种特征(如市盈率、市净率、股本规模、过去的业绩表现等)也直接决定了股票的投资收益,从而影响到基金的组合收益,所以,人们又用多因素模型来代替CAPM,并采用多因素模型对基金的总体业绩进行度量,从而将业绩评价从单因素扩展到多因素。其中,Lehmann& Modest(1987)的APT模型研究、Fama& French( 1993)的三因素模型及Carhart(1997)的四因素模型最具代表性。归结起来说多因素模型可以用如下形式表示:
Rit=αi+βi1∗F1t+βi2∗F2t+⋅⋅⋅+βin∗Fnt+εit …………(8)
它描述的是证券独立于任何影响因素的收益大其中α类似于Jensen指数的大小,
小。其它β值则描述各个因素对证券收益影响的灵敏度大小。
简评:尽管多因素模型能够解释单因素模型所无法圆满解决的反常现象,模型的解释能力也有所增强。但在实证中,这些模型都要求能识别所有的相关因素,而资产定价理论并没有明确地给出对风险资产定价所需要的所有因素或因素个数,也就是说在理论界、实务界对该模型各因素的选择和因素的个数的确定等观点并没有形成一致的看法,更何况因素的选取、因素个数的确定会直接影响到基金业绩的评价结果,所以说多因素模型的实质性应用前景还有待进一步确认。
1.4 基金业绩分解的评价方法
由于前文介绍的单因素模型一般都未考虑到基金组合的风险和收益的时变性,不能衡量基金经理的市场择时能力。为了克服传统基金业绩评价方法的缺陷(只能给出综合业绩的评价而不能给出具体的带来业绩好坏的原因),国外的许多学者早在1966 年就已经开展了这方面的理论研究,对基金的业绩进行分解。而且, 在随后的几十年里, 基金择时选股能力的评价理论和分析模型已经达到相当成熟和完善的程度。其基本思路一般是采用传统的CAPM为基准和出发点, 将投资基金的择时能力和选股能力明确分离和准确量化, 然后进行相关评价和能力分析。以此思路为基础也就衍生出众多的理论模型, 而应用最为广泛的有以下三个:(1)T-M模型(Treynor&Mazuy, 1966);(2)H-M模型(Henriksson&Merton,1981);(3)C-L模型(Chang&Lewellen, 1984)。
(一) T-M 模型
1966 年,美国著名财务学者Treynor和Mazuy第一次创新地对证券投资基金的择时选股能力提出独特的研究模型并进行相应的计量实证分析。他们认为,假设证券投资基金具备择时能力,将产生两种情形的特征线(如图1 所示)。
在折线情形下,基金经理能准确预测市场走势的拐折点,并同时进行相应的组合风险调整。但他们进一步研究还认为,这只是最理想的状况,不切合实际情形。而只有在弧线的状态下,即基金经理能根据市场的变化形势逐渐调整基金的证券投资组合,才是比较接近现实的状况。由此,Treynor和Mazuy进一步认为,在基金业绩评估模型中再加入一个二次项(Rm−Rf)2后,即可准确评估投资基金
的择时能力和选股能力。此时T-M 模型即为: Rf图1 T—M模型
Rit−Rft=α+β1(Rmt−Rft)+β2(Rmt−Rft)+εit …………(9) 2
其中, α为选股能力指标;β1为基金组合所承担的系统风险;β2为择时能
力指标;Rit为基金在各时期的收益率;Rmt为市场组合在各时期的收益率;Rft为各时期的无风险收益率;εit是随机误差项。Treynor和Mazuy认为,如果β2大于零,则表示基金经理具有择时能力:这是因为(Rmt−Rft)为非负数,故当证券市2
场为多头(即Rmt−Rft>0) 时,基金的风险溢酬Rit−Rft会大于根据CAPM计算的风
险溢酬;反之,当证券市场呈现空头或收益较低(即Rmt−Rft
溢酬Rit−Rft的下跌却会小于根据CAPM计算的风险溢酬下跌的幅度。
简评:T-M模型实际上是一个反映了时变β的非线性CAPM,该模型是在对投资组合系统风险直观体验的基础上产生的,是一种假说性质的模型。假说的逻辑是,如果基金经理具有时机选择能力,则投资组合系统风险的时间序列将表现出某种非线性的特征,通过对历史数据的拟和,就可以对非线性特征的具体形式进行验证。不同的非线性特征假设就产生不同的理论模型。例如,Bawa、Brown和Klein(1981)提出的非对称响应模型(Asymmetric Response Model,ARM)就对系统风险的非线性特征做出与
T-M模型不同的假设。
(二) H-M 模型
美国学者Henriksson和Merton(1981)在T-M 模型的基础上进一步展开深入的研究,提出更为简单的分析思路,他们认为:假如投资基金具备择时能力,将会产生如图2的特征线:在市场上升时, β取值较大;反之,当市场下降时,β取值较小。他们认为基金的择时能力应该定义为:基金经理通过预测市场收益与无风险收益之间的差异,来预先调整投资组合(β系数) 的能力。于是H-M 模型的数学表达式为:
Rit−Rft=α+β1(Rmt−Rft)−β2D(Rmt−Rft)+εit …………(10)
在这里,D是一个虚拟变量。当Rmt−Rft
市场呈现空头时,β=β1−β2;而在多头时,则β=β1。同样,如果回归得到显
著的正的β2值,则判定基金具备市场择时能力。
简评:Henriksson 和Merton针对时机选择的研究在时机选择乃至整个组合评价领域的发展历史中都具有跨时代的意义。H-M 模型的建立为时机选择研究提供了强有力的理论支持,从而使时机选择研究重新引起学者们的广泛关注。但是我们也注意到该模型存在着不足,该模型只判断了基金是否具有
图2 H-M模型 f
择时能力,并没有度量择时能力的大小,因为,该模型只对空头市场的情形进行了风险系数的调整而没有考察多头市场的情形,为此,Chang和Lewellen对该模型进行了进一步的研究。
(三)C-L 模型
Chang和Lewellen(1984)在H-M模型的基础上进行了进一步的变形和改进,提出了C-L模型。具体的C-L模型可表示为:
Rit−Rft=α+β1D1(Rmt−Rft)+β2D2(Rmt−Rft)+εit …………(11)
其中,β1和β2分别表示市场下降和市场上升时的基金的投资组合。当
Rmt−Rft0时,D1=0,D2= 1。因此, 通
过判断β2-β1的大小就可以判断基金经理的择时能力:如果β2-β1>0,表示基
金具备择时能力;反之, 如果β2-β1
简评:显然,C-L 模型因为综合考虑了空头和多头市场的择时能力,所以该模型克服了H-M模型的不足,可以根据β2-β1的大小来衡量基金择时能力的大小,
实现了对基金择时能力的量化,而不仅仅停留在判断有无择时能力的水平。
[1] 王学军. 基金业绩评价研究[OL].厦门大学博硕士论文数据库.2002,12.
[2] Treynor, Jack L. How to rate management of investment funds[J]. Harvard Business
Review, 1965, Vol. 43 Issue 1, p63, 13p.
[3] Sharpe, William F. Mutual fund performance [J]. Journal of Business.1966, Vol.
39 Issue 1, p119, 20p.
[4] 吴冲锋等.证券投资基金业绩评价研究述评[J].系统工程理论与实践.2002,10.
[5] John C. Hull. Options, Futures, and Other Derivatives [M]. 北京:清华大学出
版社,2001,9.
[6] 孙超. 证券投资基金业绩评价的理论与实证研究[OL]. 中国学位论文全文数据库.
深圳
鹏元资信评估有限公司:
深圳市深南大道7008号阳光高尔夫大厦(银座国际)三楼:
邮政编码:518040
总机号码:(86) 755-82872897
传真号码:(86) 755-82872090
广州
鹏元资信评估有限公司广州分公司:
广州国际海员俱乐部三楼(广州市海珠区滨江西路20号)
电话:020-61259886
联系人:徐培宁
免责条款与著作权声明:本报告中的信息均来源于已公开的资料,我公司对这些信息的准确性及完整性不作任何保证.报告中的信息或所表达的意见并不构成所述证券买卖的出价或征价.我公司及其所属关联机构可能会持有报告中的公司所发行的证券.本报告可由鹏元资信评估有限公司及其关联机构提供,本报告版权仅为我公司所有,未经书面许可任何机构和个人不得以任何
形式翻版,复制,刊登,发表或引用.
基金业绩评价方法综述
鹏元资信评估有限公司 张智英
60年代以前,国外对投资基金的业绩评价,主要是评价基金单位净值和基金收益率。那时,没有人对风险这一抽象的概念给出一种具体的度量方法,自然也不可能将风险因素纳入基金业绩评价。直到1952年,Markwitz在他所开创的现代投资组合理论(Modern Portfolio Theory, MPT)中提出了“市场有效投资组合”的概念。不久以后,Sharpe和Lintner等人引入无风险资产的概念,并推导出资本市场线(CML)和证券市场线(SML),具体量化了投资风险与收益之间的对应关系。这些理论为基金业绩评价方法的发展提供了理论基础。此后,西方学者纷纷在研究基金业绩评价方法时考虑了风险因素,对基金的投资收益进行风险调整。其中比较经典的有Treynor指数,Sharpe指数和Jensen指数1。下面分别介绍各种方法的理论基础、指标含义和局限性。
1.1传统评价方法
1.1.1基金单位资产净值评价法
基金单位资产净值(NAV)表示某一时点每股基金的市场价值净值。为基金的净资产总值除以发行在外的该基金总份数,即: NAV=基金净资产总值 …………(1) 发行在外的基金总份数
其中,总资产等于计算日该基金持有的证券市价总值和持有的现金之和。而净资产则是从总资产中扣除各项费用和负债总额后的资产净值。
简评:该方法的优点在于指标的计算简单、易懂,所以在实际应用中比较受欢迎。但是这种方法所存在的局限性也是非常明显的,主要表现在以下两个方面:①该方法没有把风险作为评价基金业绩好坏的因素考虑在内,没有将收益率进行风险调整,而停留在收益率的量的衡量上,没有进一步对收益率的质进行衡量,1王学军. 基金业绩评价研究[ol].厦门大学博硕士论文数据库,2002.12.
而我们知道只有同质的量才具有较好的可比性;②该指标与基金是何时发行的有很大的关系,即与证券市场的周期相关,比如评价期n是牛市,而n-1期为熊市,而基金A是n-1期发行的它经历了一个熊市和一个牛市,但是基金B则是n期发行的它只经历了一个牛市,此时并不能以评价期末B的单位净值高于A的单位净值而得出在评价期n内基金B的业绩好于基金A 的业绩的结论。因此,基金资产净值法在不同时期发行的基金之间不具有可比性。
1.1.2收益率评价法
收益率(R)是反映投资收益与投入的关系的相对指标,表示单位净资产的变动程度。其数学公式可表示为:
Rt=NAVt+Dt−NAVt−1 …………(2) NAVt−1
其中,Rt表示评价期的收益率;NAVt表示期末单位净资产;Dt表示评价期
每股收益分配;NAVt−1表示期初单位净资产。
简评:收益率指标自其被提出以来就一直被沿用至今,而且一直是各基金管理公司必须定期公布的信息,也是投资者最为关注的指标之一,这也充分说明了该指标的科学与可取之处,它的优点就是综合地反映了基金在评价期内的业绩,但是单凭这一指标来评价基金业绩的好坏是很不够的。虽然该指标克服了单位净资产法在不同时期发行的基金之间不具有可比性的缺点,但是它依然没有考虑不同收益率背后所承担的风险,依然没有对收益率进行质的调整,而如今随着金融市场的不断创新与发展,金融市场上可交易的金融工具的风险差别也越来越大,因此,这种不考虑风险只考虑收益率的评价方法是很不不完善的,当然其评价的结果也是令人很不满意和信任的。当然,收益率是各种评价方法的基础,这是无法否认的,本文同样也以此为基础进行研究。
1.2单因素风险调整评价方法
1.2.1各种评价方法的介绍
1.Treynor指数2
Treynor指数是利用证券市场线(SML)为基准组合来评价基金的业绩,它等于基金投资组合的投资收益率与无风险收益率之差除以其系统风险测度值。其数学公式可表示如下:
Ti=i−Rf
i …………(3)
其中,Ti——基金i的Treynor指数
i——业绩评价期基金i的平均收益率
Rf——业绩评价期的无风险收益率
βi——业绩评价期基金i的β系数(根据CAPM对历史受益进行回归得到) Treynor指数可以看成是单位系统风险所带来的超额回报。通过比较单位系统风险所带来的超额回报,就可以比较不同基金的管理业绩。当然,根据Treynor指数同样可以获得所有基金的一个共同比较基准——市场的Treynor指数:
Tm=m−Rf
m …………(4)
因为βm的值等于1,所以市场的Treynor指数可表示为:
Tm=m−Rf
如果Ti>Tm,说明基金i的业绩比市场业绩好,或者说它战胜了市场;如果Ti=Tm,则说明基金i与市场获得的相同的业绩,基金的积极管理策略并不能战胜市场;如果Ti
2、Sharpe指数3 Treynor, Jack L. How to Rate Management of Investment Funds. Harvard Business Review, Jan/Feb65, Vol. 43 Issue 1, p63, 13p 2
Sharpe指数以资本市场线(CML)为标准来评价基金业绩。它是指在一定评价期内的基金投资组合的投资收益率超过无风险收益率的部分与该基金收益率的标准差之比,该指数可以看成是单位总风险所带来的超额回报。其数学公式表示如下:
Si=i−Rfi …………(5)
其中,Si——基金i的Sharpe指数
i——业绩评价期基金i的平均收益率
Rf——业绩评价期的无风险收益率
σi——业绩评价期基金i的收益率标准差
Sharpe指数不但能够反映基金经理的市场调整能力,而且由于Sharpe指数考虑了非系统风险,故该指数还能反映基金经理分散和降低非系统风险的能力。如果投资基金已完全分散了非系统风险,那么Treynor指数和Sharpe指数的评价结果是一样的。但是,现实中非系统风险未必能够全部分散掉,所以Sharpe指数在西方基金业绩评价实务界受到更多重视,著名的Morningstar基金评级公司就是将Sharpe指数作为一个基金业绩参考指标。
3、Jensen指数
Treynor指数和Sharpe指数尽管能给出不同基金业绩的排序,却无法告诉我们基金表现优于市场基准组合具体是多少,而Jensen为了解决这一问题提出了Jensen指数。首先根据CAPM理论,基金i的预期收益E(Ri)应是系统风险βi对无风险收益Rf的补偿,即E(Ri)=Rf+βi[E(Rm)−Rf]。Jensen认为基金实际的平均收益率i减去其预期收益E(Ri)所得的数值Ji就能量化基金优于市场组合
的实际水平。其数学公式可表示如下:
⎤Ji=i−E(Ri)=i−⎡⎣Rf+βi(m−Rf)⎦ …………(6)
根据Jensen(1968)Ji值可以根据以下回归方程进行估计得到:
3 Sharpe, William F. Mutual Fund Performance. Journal of Business, Jan66 Part 2 of 2, Vol. 39 Issue 1, p119, 20p
it−Rft=Ji+βimt−Rft+μit …………(7) Ji越大越好:当Ji值显著大于零时,表明基金业绩较之市场有优越表现,
说明基金i战胜了市场;反之,当Ji显著小于零时,则表明基金业绩较市场更差,
说明基金的管理效率是比较低下的。
4、创新的风险调整指数方法
自Treynor指数、Sharpe指数和Jensen指数创立以来,相当长的时期内有大量的关于基金业绩评价的研究都集中在这三个指标上,他们都试图通过对这三个指标存在的不足之处进行创新,提出更加科学、准确的评价方法。比如为克服Jensen指数未考虑基金收益率的波动率的时变性的缺点,Cochrane(1992)等人提出了条件模型,他们的研究表明条件模型能更好地解释股票收益的变化。Jagannathan, Wang(1996)也建议采用条件模型来解释股票收益,所以,Ferson, Schadt(1996)在前人研究的基础上,采用Sharpe(1964)的多因素CAPM形式来描述基金的条件期望总收益,并在模型中引入前定信息变量,将β看成前定信息变量的线性函数以考虑β的时变性4。何孝星、于宏凯(2003)也采用了条件CAPM对我国的证券投资基金业绩进行了实证研究,他们的研究表明条件CAPM框架比无条件CAPM框架对我国基金业绩的解释能力更强,解释结果更可靠。
当然对风险的度量方法的创新,除了前文提到的关于风险的时变性的度量外,也有一些学者提出了“下方风险”的度量方法。他们认为证券投资的风险是一种投资损失的可能性而不是投资收益的不确定性。这种对风险的认识与计量比较符合人们的心理感受,所以这种观点自提出来后就很受到欢迎,至今以成为风险计量的主流观点。计量“下方风险”的比较成熟的模型有Harlow(1991)等人提出的LPM(Lower Partial Moments)方法,即用收益分布的左尾部分而不是全部来作为风险的度量标准;另外,J. P. Morgan公司于1994年推出了风险矩阵系统,发展了一种新型的风险计量方法——风险价值(Value At Risk, VAR)。风险价值的含义是证券组合在一定的期限内和一定的置信水平下可能发生的最大
5损失。当然,VAR方法也不是十全十美没有缺陷的,它的主要缺点表现在:对收()益率的分布同样存在主观的选择问题,另外,对置信水平的选择也存在较大的主4
5 吴冲锋等.证券投资基金业绩评价研究述评[J].系统工程理论与实践.2002、10. John C. Hull. Options, Futures, and Other Derivatives[M]. 北京:清华大学出版社,2001.第342页
观性,不同的置信水平必然导致不一样的VAR值。为了解决Sharpe指数风险计量的缺陷,彭海伟和吴启芳(2004)提出了基于VAR的Sharpe指标和基于条件VAR的Sharpe指标。
1.2.2 对单因素风险调整评价方法的评价
诚然单因素风险调整指数评价方法很好地克服了传统评价方法没有对基金收益率进行质的调整的缺陷,而且还充分利用风险度量方法的不断发展对风险调整指数进行了合理的改进,但是,由于该方法所依赖的理论本身存在一些不足,所以该评价方法也还存在如下几个局限性:
一、罗尔对Jensen指数的批评6
1、罗尔批评的主要内容
罗尔(1978)认为由于Jensen指数的计算依靠某一市场指数的事后观察值,而这一观察值有可能是均方差无效的,因此根据Jensen指数来评价投资组合的业绩是不可靠的。罗尔关于事后证券市场线在评价基金业绩方面的局限性方面所作的评论可以用以下三个方面来概括:
①如果所选择的市场资产组合是均方差有效的,那么包括这个市场投资组合资产的所有投资组合的平均收益率和方差应该落在同一条证券市场线上,而不管这些投资组合采用的是积极管理策略还是消极管理策略。换句话说,从这些投资组合的偏离证券市场线的大小不能区分它们的业绩,然而,这正是Jensen指数度量投资组合业绩的最基本思想。
②当选取一个市场投资组合的替代组合时,如果投资组合和组合内的所有资产均落在同一条证券市场线上,则可以认为这个替代组合是均方差有效的。
③当按照一个均方差无效的替代投资组合对投资基金的业绩进行排序时,一定存在另一个均方差无效的市场投资组合的替代组合,可以得出相反的结论。
前两个方面说明,通过证券市场线无法判断投资组合的业绩,因此也就无法用来评价积极管理投资组合的业绩。如果能够发现投资组合在收益—风险特征点远离了证券市场线,那么,这种偏离必定是由于替代组合作为基准组合的均方差无效的结果。最后一个方面说明了用Jensen指数不能正确的估计单个投资组合的6孙超. 证券投资基金业绩评价的理论与实证研究[ol]. 中国学位论文全文数据库. 2003.01.01
业绩。值的注意的是,罗尔批评不但从事后的角度而且也从事前期望的角度评价了Jensen指数的无效性。
2、笔者对罗尔批评的评价
虽然罗尔只是对Jensen指数提出批评,但是他从CAPM不可验证的角度出发,来论述Jensen指数的不可行性的思想也适用于对其他单因素风险调整方法。正因为很难找到一个合理的方法来验证CAPM是否正确,所以,罗尔在他的批评中并没有否定CAPM本身的意思,他仅仅指出了将CAPM运用到基金业绩评价中来是不合适的,因为上述的原因,Jensen指数很难得出可靠的评价结果。从这个意义上说,笔者认为罗尔的批评是很有道理的,他从理论基础了指出了该方法的局限性。
二、笔者对单因素风险调整评价方法的评价
虽然罗尔1978年就从CAPM的不可验证角度指出了Jensen指数无法正确评价基金业绩,但是那只是该方法所存在的局限性之一,除此之外,单因素风险调整评价方法还存在以下几方面的不足:
第一,当评价期内基金出现“负的超额收益”时,Treynor指数、Sharpe指数和基于VAR的Sharpe指数的运用都将受到限制。比如当基金A和基金B的评价收益率为负值时,因为风险度量指标σ的值不可能为负,所以他们的Sharpe指数必定为负值,当出现这种情况时,如果根据其指标的大小来评价他们业绩的好坏就会带来错误的结论,因为当两个基金具有相等的“负的超额收益”时,如果σA>σB,根据等式(5)就有SA>SB,根据Sharpe指数的评价原则我们会认为
基金A的业绩要优于基金B,这显然是不符合实际情况的,因为基金A承担了更大的风险才换取与基金B同等的收益。
第二,采用基于CAPM的Treynor指数和Jensen指数作为基金业绩评价方法时存在一个严重的悖论问题:因为CAPM成立的一个前提条件就是证券市场必须是有效的,而如果证券市场是完全有效的,那么就不存在任何取得超额收益的可能,任何基金的事后收益——风险值与证券市场线的偏离都应该是均值为零的随机误差,也就不存在明显易于零的Treynor指数和Jensen指数,也就无法根据指数数值的大小来评价基金的业绩优劣;而如果根据CAPM进行回归得到了超额收益,得到了显著易于零的Treynor指数和Jensen指数,那么这个证券市场就必定是弱
势有效或无效的,此时就不能保证这些指数的理论基础(证券市场线的表达式)的正确性,进而Treynor指数和Jensen指数也就失去了其理论依据,从而也大大降低了其评价结果的可信度。
第三,基于风险调整的单因素评价方法虽然考虑风险因素对收益率质量的影响,但是由于该方法本身的缺陷并不能把其他的同样会影响收益率质量及综合业绩的因素考虑进来,比如本文所要探讨的经营成本、交易成本和择时能力等,而对于基金投资者来说这些因素又恰恰是很重要的,它们会间接影响投资者的收益。因此,我们说虽然风险调整指数评价方法具有一定的合理性,其在实际运用中也得到了多数人的认可,但是从理论上来分析该方法还是有它不足的地方。
1.3 多因素评价方法
多因素分析模型认为影响基金收益的因素除了市场因素之外,组合中股票的各种特征(如市盈率、市净率、股本规模、过去的业绩表现等)也直接决定了股票的投资收益,从而影响到基金的组合收益,所以,人们又用多因素模型来代替CAPM,并采用多因素模型对基金的总体业绩进行度量,从而将业绩评价从单因素扩展到多因素。其中,Lehmann& Modest(1987)的APT模型研究、Fama& French( 1993)的三因素模型及Carhart(1997)的四因素模型最具代表性。归结起来说多因素模型可以用如下形式表示:
Rit=αi+βi1∗F1t+βi2∗F2t+⋅⋅⋅+βin∗Fnt+εit …………(8)
它描述的是证券独立于任何影响因素的收益大其中α类似于Jensen指数的大小,
小。其它β值则描述各个因素对证券收益影响的灵敏度大小。
简评:尽管多因素模型能够解释单因素模型所无法圆满解决的反常现象,模型的解释能力也有所增强。但在实证中,这些模型都要求能识别所有的相关因素,而资产定价理论并没有明确地给出对风险资产定价所需要的所有因素或因素个数,也就是说在理论界、实务界对该模型各因素的选择和因素的个数的确定等观点并没有形成一致的看法,更何况因素的选取、因素个数的确定会直接影响到基金业绩的评价结果,所以说多因素模型的实质性应用前景还有待进一步确认。
1.4 基金业绩分解的评价方法
由于前文介绍的单因素模型一般都未考虑到基金组合的风险和收益的时变性,不能衡量基金经理的市场择时能力。为了克服传统基金业绩评价方法的缺陷(只能给出综合业绩的评价而不能给出具体的带来业绩好坏的原因),国外的许多学者早在1966 年就已经开展了这方面的理论研究,对基金的业绩进行分解。而且, 在随后的几十年里, 基金择时选股能力的评价理论和分析模型已经达到相当成熟和完善的程度。其基本思路一般是采用传统的CAPM为基准和出发点, 将投资基金的择时能力和选股能力明确分离和准确量化, 然后进行相关评价和能力分析。以此思路为基础也就衍生出众多的理论模型, 而应用最为广泛的有以下三个:(1)T-M模型(Treynor&Mazuy, 1966);(2)H-M模型(Henriksson&Merton,1981);(3)C-L模型(Chang&Lewellen, 1984)。
(一) T-M 模型
1966 年,美国著名财务学者Treynor和Mazuy第一次创新地对证券投资基金的择时选股能力提出独特的研究模型并进行相应的计量实证分析。他们认为,假设证券投资基金具备择时能力,将产生两种情形的特征线(如图1 所示)。
在折线情形下,基金经理能准确预测市场走势的拐折点,并同时进行相应的组合风险调整。但他们进一步研究还认为,这只是最理想的状况,不切合实际情形。而只有在弧线的状态下,即基金经理能根据市场的变化形势逐渐调整基金的证券投资组合,才是比较接近现实的状况。由此,Treynor和Mazuy进一步认为,在基金业绩评估模型中再加入一个二次项(Rm−Rf)2后,即可准确评估投资基金
的择时能力和选股能力。此时T-M 模型即为: Rf图1 T—M模型
Rit−Rft=α+β1(Rmt−Rft)+β2(Rmt−Rft)+εit …………(9) 2
其中, α为选股能力指标;β1为基金组合所承担的系统风险;β2为择时能
力指标;Rit为基金在各时期的收益率;Rmt为市场组合在各时期的收益率;Rft为各时期的无风险收益率;εit是随机误差项。Treynor和Mazuy认为,如果β2大于零,则表示基金经理具有择时能力:这是因为(Rmt−Rft)为非负数,故当证券市2
场为多头(即Rmt−Rft>0) 时,基金的风险溢酬Rit−Rft会大于根据CAPM计算的风
险溢酬;反之,当证券市场呈现空头或收益较低(即Rmt−Rft
溢酬Rit−Rft的下跌却会小于根据CAPM计算的风险溢酬下跌的幅度。
简评:T-M模型实际上是一个反映了时变β的非线性CAPM,该模型是在对投资组合系统风险直观体验的基础上产生的,是一种假说性质的模型。假说的逻辑是,如果基金经理具有时机选择能力,则投资组合系统风险的时间序列将表现出某种非线性的特征,通过对历史数据的拟和,就可以对非线性特征的具体形式进行验证。不同的非线性特征假设就产生不同的理论模型。例如,Bawa、Brown和Klein(1981)提出的非对称响应模型(Asymmetric Response Model,ARM)就对系统风险的非线性特征做出与
T-M模型不同的假设。
(二) H-M 模型
美国学者Henriksson和Merton(1981)在T-M 模型的基础上进一步展开深入的研究,提出更为简单的分析思路,他们认为:假如投资基金具备择时能力,将会产生如图2的特征线:在市场上升时, β取值较大;反之,当市场下降时,β取值较小。他们认为基金的择时能力应该定义为:基金经理通过预测市场收益与无风险收益之间的差异,来预先调整投资组合(β系数) 的能力。于是H-M 模型的数学表达式为:
Rit−Rft=α+β1(Rmt−Rft)−β2D(Rmt−Rft)+εit …………(10)
在这里,D是一个虚拟变量。当Rmt−Rft
市场呈现空头时,β=β1−β2;而在多头时,则β=β1。同样,如果回归得到显
著的正的β2值,则判定基金具备市场择时能力。
简评:Henriksson 和Merton针对时机选择的研究在时机选择乃至整个组合评价领域的发展历史中都具有跨时代的意义。H-M 模型的建立为时机选择研究提供了强有力的理论支持,从而使时机选择研究重新引起学者们的广泛关注。但是我们也注意到该模型存在着不足,该模型只判断了基金是否具有
图2 H-M模型 f
择时能力,并没有度量择时能力的大小,因为,该模型只对空头市场的情形进行了风险系数的调整而没有考察多头市场的情形,为此,Chang和Lewellen对该模型进行了进一步的研究。
(三)C-L 模型
Chang和Lewellen(1984)在H-M模型的基础上进行了进一步的变形和改进,提出了C-L模型。具体的C-L模型可表示为:
Rit−Rft=α+β1D1(Rmt−Rft)+β2D2(Rmt−Rft)+εit …………(11)
其中,β1和β2分别表示市场下降和市场上升时的基金的投资组合。当
Rmt−Rft0时,D1=0,D2= 1。因此, 通
过判断β2-β1的大小就可以判断基金经理的择时能力:如果β2-β1>0,表示基
金具备择时能力;反之, 如果β2-β1
简评:显然,C-L 模型因为综合考虑了空头和多头市场的择时能力,所以该模型克服了H-M模型的不足,可以根据β2-β1的大小来衡量基金择时能力的大小,
实现了对基金择时能力的量化,而不仅仅停留在判断有无择时能力的水平。
[1] 王学军. 基金业绩评价研究[OL].厦门大学博硕士论文数据库.2002,12.
[2] Treynor, Jack L. How to rate management of investment funds[J]. Harvard Business
Review, 1965, Vol. 43 Issue 1, p63, 13p.
[3] Sharpe, William F. Mutual fund performance [J]. Journal of Business.1966, Vol.
39 Issue 1, p119, 20p.
[4] 吴冲锋等.证券投资基金业绩评价研究述评[J].系统工程理论与实践.2002,10.
[5] John C. Hull. Options, Futures, and Other Derivatives [M]. 北京:清华大学出
版社,2001,9.
[6] 孙超. 证券投资基金业绩评价的理论与实证研究[OL]. 中国学位论文全文数据库.
深圳
鹏元资信评估有限公司:
深圳市深南大道7008号阳光高尔夫大厦(银座国际)三楼:
邮政编码:518040
总机号码:(86) 755-82872897
传真号码:(86) 755-82872090
广州
鹏元资信评估有限公司广州分公司:
广州国际海员俱乐部三楼(广州市海珠区滨江西路20号)
电话:020-61259886
联系人:徐培宁
免责条款与著作权声明:本报告中的信息均来源于已公开的资料,我公司对这些信息的准确性及完整性不作任何保证.报告中的信息或所表达的意见并不构成所述证券买卖的出价或征价.我公司及其所属关联机构可能会持有报告中的公司所发行的证券.本报告可由鹏元资信评估有限公司及其关联机构提供,本报告版权仅为我公司所有,未经书面许可任何机构和个人不得以任何
形式翻版,复制,刊登,发表或引用.