2023年12月29日发(作者:数学试卷分析及针对性措施)

股市收益率波动性和自相关性结合效应研究

田海涛;苏阳

【摘 要】为了探究影响股票收益率高低的因子,基于股票收益率和波动率的关联,提出了将自相关性强度与波动率的结合效应用来解释收益率变化.其中波动率分别采用历史波动率和基于GARCH模型拟合的实际波动率,刻画自相关强度采用Ljung-Box检验统计量.通过对一段时期内中国A股市场月个股收益率进行分析,分别检验波动率及Ljung-Box检验统计量与收益率变化的关联,提出二者的结合效应来解释收益率变化.通过统计分析与检验,发现结合效应的解释效果优于单独使用其中一个.此外,以收益率为响应变量,以波动率和Ljung-Box检验统计量作为解释变量建立多元线性模型,也可以看出这两个因子均对收益率的变化具有十分显著的解释能力,且自相关强度并非波动率的冗余信息.

【期刊名称】《武汉理工大学学报(信息与管理工程版)》

【年(卷),期】2018(040)005

【总页数】7页(P630-635,642)

【关键词】收益率;波动率;自相关性;Ljung-Box检验

【作 者】田海涛;苏阳

【作者单位】西南交通大学 数学学院,四川 成都 611756;西南交通大学 数学学院,四川 成都 611756

【正文语种】中 文

【中图分类】F832.5

股票市场是以价格的波动为基础运行的,价格的高低会直接影响到投资人的收益。投资人进行投资,其目的就在于盈利,所以投资人就要尽可能地寻求规避风险的方法以期获得更高的收益,股票的收益率高低则成为了投资人最为关心的问题。因此,探究影响股票收益率的因素极为重要,这一研究课题也变得十分热门。

美国学者SHARPE等[1-2]曾开创性地提出资本资产定价模型(CAPM),该模型是在资产组合理论和资本市场理论的基础上发展起来的,其表达式为:E(Ri)-RF=βi{E(RM)-RF}。其中:E(Ri)表示第i个证券或资产组合的预期收益;βi表示第i个证券或资产组合的系统性风险;E(RM)表示预期市场回报率;RF表示无风险资产收益率;E(RM)-RF表示风险溢价。该模型的主要用途是用来研究证券市场中资产的预期收益率与风险资产之间的关系,以及均衡价格是如何形成的。COX等[3]提出的消费资本资产定价模型,将消费增长率作为变量引入CAPM从而用基准消费来阐述消费与投资的关系,继而研究消费对资产定价的影响。

然而,在CAPM被广泛应用一段时间之后,又有部分研究表明此模型并不能很好地解释收益率。因此,近些年来研究的重心逐步从CAPM转向了多因子资产定价模型,如FAMA等[4]提出的三因子模型,将公司资本总额(size)和账面市值比B/M(book-to-market)两个因子添加到CAPM中。之后,田利辉等[5]提出了反转因子并以此构建了一个四因子模型,发现相较于文献[4]的三因子模型,该模型解释中国股票历史表现对当前收益率的影响有着更佳的效果。此外,FAMA等[6]又在三因子模型基础上增加了盈利能力和投资数额两个因子,从而提出了五因子模型。上述文献都是研究收益率和外部因子的关系,然而收益率的内在因子也会影响收益率的高低。BAILLIE等[7]的研究结果表明,大多数资产定价模型都是假设股票投资组合的预期收益和波动率之间存在正相关关系。COX等[8-9]的研究表明收益和波动率存在着某种负相关关系。但是,GLOSTEN等[10-11]认为,在给定时间

段的前提下收益和波动率之间并不存在理论上的一致性关系,当前一段时间收益和波动率之间出现正相关和负相关都是有可能的。因此笔者将对中国股市一段时间的月收益率数据进行分析,固定市场、时间段及数据的采集频率,研究波动率与股票月均收益率之间的关系。此外,笔者还将结合历史月收益率数据的自相关性强度对月均收益率进行分析。关于股市收益率自相关性的研究,可以追溯到SENTANA等[12]的研究,使用GARCH模型对美国将近一个世纪的股指日收益进行研究,得出日收益的波动率和收益自相关性呈负相关关系的结论。然而,SENTANA等考虑的是自相关性正负效应与波动率的关系,笔者研究的区别和创新之处在于考虑一个描述前后相依性的Ljung-Box检验统计量,并结合波动率来研究股票月均收益率,用统计检验和回归模型来验证其并非是波动率的冗余信息。

1 概念及方法

1.1 收益率的波动率

收益率rt的波动率σt是指标的资产投资收益率的变化程度,有实际波动率和历史波动率之分。实际波动率又称作未来波动率,是对期权有效期内投资收益率波动程度的度量。ENGLE[13]提出自回归条件异方差模型(ARCH)用于计算波动率,由于其较为简单,得到了广泛的应用,在此之后BOLLERSLEVB[14]又提出了广义ARCH(GARCH)模型,是对ARCH模型的一些约束条件进行了扩展后得到的。

对于收益率序列rt,令at=rt-μt作为t时刻的新息,其中μt为rt的均值方程。若at满足下式:

(1)

则称at服从GARCH(m,s)模型,其中εt是均值为0、方差为1的独立同分布随机变量序列,对αi+βj的限制条件保证了at的无条件方差是有限的,同时其条件方差是随时间变化的。对于GARCH(1,1)模型而言,给定参数α0,α1,β1的值,则

条件方差可以利用式(2)进行递归计算:

(2)

其中t≥2,初始值在平稳条件下被设为平稳无条件方差σ2=ω/(1-α-β)。条件概率密度函数和联合概率密度函数分别为:

(3)

f(an,an-1,…,a1)=f(an-1,an-2,…,a1)|

f(an|an-1,an-2,…,a1)

(4)

对式(3)进行迭代并求自然对数,得到对数似然函数公式:

(5)

α0,α1和β1的极大似然估计没有显式解,但可通过数值方法极大化对数似然函数而得到解。

另外,由于历史波动率是投资收益率在过去一段时间内所表现出的波动率,也就是可以根据rt的时间序列数据,通过简单样本方差计算的方法得出相应的波动率数据,计算公式如下:

(6)

其中,是平均收益率,由此可得到历史波动率的简单估计值。

1.2 Ljung-Box检验

Ljung-Box检验是用于检验一个时间序列的一组自相关系数是否显著不为零的统计检验,不是仅考虑是否存在某一特定滞后阶数的自相关,而是基于一系列滞后阶数判断序列总体的相关性或者随机性是否存在。Ljung-Box[15]检验广泛应用于计量经济学和其他时间序列分析的应用。以下是Ljung-Box检验的定义:

H0 数据是独立分布的,即ρ1=ρ2=…=ρh,其中h是由笔者设定的,在这里仅仅给其定一个上界而不确定具体的h值。

H1 数据不是独立分布的,其存在序列相关性,即至少存在一个ρk不等于零。Ljung-Box检验统计量Q(h)为:

(7)

(8)

式中:n为样本数量;为样本k阶滞后的自相关系数的平方;为收益均值,统计量Q(h)服从自由度为h的卡方分布。给定一个显著性水平α则拒绝域为接受原假设就表明认为该序列是白噪声序列,否则认为该序列存在自相关性。因此在阶数h固定的情况下,统计量Q(h)值越大,检验的结果越倾向于拒绝原假设,也就说自相关性越显著,于是Q(h)可以被视为刻画自相关性强度的一个变量。

2 实证分析

2.1 数据预处理

在做实证分析时,所取时间段过长或者过短都可能会导致数据出现大的波动,因此在经过初步研究实验之后,笔者采用中国A股市场所有股票2001年1月至2016年3月共183个月的月个股收益率作为研究样本,数据来源于国泰安数据库,数据的分析处理及模型建立均使用R软件。又因为某些股票月收益率数据缺失,所以在处理数据时剔除含有数据量不足的股票,最终保留了830只来进行分析研究。

2.2 数据分析

2.2.1 样本标准差为波动率

在对所使用数据进行预处理之后,笔者首先采取计算标准差的方式,通过R软件运行得到每只股票月收益率的波动率,然后分别选取波动率上下30%、上下40%、上下50%分位数的3种不同组合的股票,并对每种组合中的两类股票分别求其平均收益率,再通过t检验来验证每种组合中两类股票的平均收益率是否有显著差别。实验结果如表1所示。

表1 只包含波动率的不同组合t检验结果不同组合类型均值/×10-3自由度t值P值均值差/×10-3组合一:30%和70%类一12.55类二17.12496-13.04<2×10-164.57组合二:40%和60%类一12.62类二16.50662-13.04<2×10-163.88组合三:50%和50%类一12.88类二15.99828-11.96<2×10-163.11

从表1可看出,3种不同组合分类比较的P值皆小于2×10-16,且均值差的期望都大于3×10-3,由此可知不同组合的两类股票之间的平均收益率具有显著性差异,这说明波动率是影响收益率的一个很重要的因素。接下来引入Ljung-Box检验统计量,通过初步的计算将滞后阶数h的值定为12,且12正好代表一年,这样可以把一年内的周期变化纳入相关性强度,h选择在12附近对分析结果影响不大。

分别选取自相关性上下30%、上下40%、上下50%分位数的3种组合,针对每一种组合中的两类股票的平均收益率进行t检验,检验结果如表2所示。

由表2可知,3种不同组合分类比较的P值均小于0.01,且样本量稍大的两组P值均小于0.000 1, 均值差的期望都大于1.2×10-3,由此可知根据自相关性而划分的不同组合中,两类股票之间的平均收益率的确具有显著性差异,也说明自相关性同样会对收益率的高低产生重要影响。为进一步验证将二者结合检验是否能对收益率有更好的解释效果,选取波动率及自相关性上下30%、上下40%、上下50%分位数的3种组合股票,针对每一组合中两类股票的平均收益率进行比较,将得到

的不同组合的两类股票分别求其平均收益率,并绘制箱线图和概率密度图,结果分别如图1和图2所示。

表2 只包含自相关性的不同组合t检验结果不同组合类型均值/×10-3自由度t值P值均值差/×10-3组合一:30%和70%类一13.81类二15.10486.8-3.524.67×10-31.29组合二:40%和60%类一13.77类二15.04662.0-4.065.57×10-51.27组合三:50%和50%类一13.82类二15.06811.3-4.469.42×10-61.24

图1 波动率及自相关性不同组合股票平均收益率箱线图

图1的箱线图中加粗线条表示的是两类股票的收益率均值,由图1可以看出对于不同分组内的两类股票,其收益均值的差距是随着所使用样本量的减少而增大的。而图2的概率密度图中两条曲线表示不同分组内两类股票收益率的分布情况。通过图1、图2的比较之后,可以发现不同组合中的两类股票其收益率均值的确存在差异,继而通过t检验来验证其平均收益率是否有显著差别。实验结果如表3所示。

由表3可知,3种不同组合分类比较的P值均小于10-15,并且均值差的期望都大于4.3×10-3,则由此可知不同组合的两类股票之间的平均收益率同样具有显著性差异。而且可以注意到每一种组合之间的差异相较于只单独包含一种因素的差异变得更大,如50%分位数分组中,收益率之差从3.11×10-3增至4.36×10-3,另外两组也有显著增加。 这说明在波动率基础上加入Ljung-Box检验统计量会对收益率有更好的解释效果,所以笔者认为Ljung-Box检验统计量可能包含有一部分波动率不具备但确实能够对股票收益率具有解释作用的信息。

图2 波动率及自相关性不同组合股票平均收益率概率密度图

2.2.2 GARCH(1,1)模型得到的波动率

由于GARCH模型的阶不太容易确定,因此,笔者采用最简单且最常用的GARCH(1,1)模型。对所使用数据进行预处理之后,笔者采取GARCH(1,1)模型拟

合的方式,通过R软件运行得到每只股票月收益率的波动率,然后采用和前文相同的办法得到3种不同组合的股票,对每种组合股票中的两类分别求其平均收益率,并通过t检验来验证是否有显著差别。实验结果如表4所示。

表3 加入Ljung-Box检验统计量后的不同组合结果不同组合类型均值/×10-3自由度t值P值均值差/×10-3组合一:30%和70%类一11.86类二17.78152-9.027.70×10-165.92组合二:40%和60%类一11.97类二17.14263-10.95<2×10-165.17组合三:50%和50%类一12.29类二16.65398-12.10<2×10-164.36

表4 只包含波动率的不同组合t检验结果不同组合类型均值差/×10-3自由度t值P值均值差/×10-3组合一:30%和70%类一12.47类二17.13496-13.16<2×10-164.66第二种组合:40%和60%类一12.64类二16.56662-13.28<2×10-163.92第三种组合:50%和50%类一12.80类二16.07828-12.73<2×10-163.27

由表4可知,3种不同组合分类比较的P值均小于2×10-16,而且均值差的期望均大于3×10-3,由此可知不同组合的两类股票之间的平均收益率具有显著性差异。接下来引入Ljung-Box检验统计量,选取波动率及自相关性上下30%、上下40%、上下50%分位数的3种组合,对每一种组合中两类股票的平均收益率进行比较,将得到的不同组合的两组股票分别求其平均收益率并绘制箱线图和概率密度图,结果分别如图3和图4所示。

图3 波动率及自相关性不同组合股票平均收益率箱线图

图4 波动率及自相关性不同组合股票平均收益率概率密度图

由图3和图4可得出与图1和图2类似的结论,即不同组合的两类股票之间的平均收益率具有显著性差异。接着通过t检验来验证不同组合中两类股票的平均收益率是否有显著差别,结果如表5所示。

由表5可以看出,3种不同组合分类比较的P值皆小于10-13,且均值差的期望

均大于4.5×10-3,由此可知不同组合的两类股票之间的平均收益率同样具有显著性差异,而且其平均收益率之差相较于之前变得更大,得到了与表2相类似的结论。但同时考虑到其也可能是一个冗余信息,也就是说Ljung-Box检验统计量中所包含的信息是否已经包含于波动率当中,所以接下来需要探究Ljung-Box检验统计量是不是一个冗余信息。为此,笔者构造一个由收益率为响应变量,由Ljung-Box检验统计量和收益率的波动率为解释变量的多元线性模型,并进行模型回归,回归结果如表6所示。其中,波动率分别采用历史波动率和由GARCH模型拟合得到的波动率。

由表6的回归结果可知,两个解释变量对应的P值均小于10-6,远小于0.05, 由此可以看出两个因子均具有统计显著性意义,这也就表明二者均对收益率具有十分有效的解释作用,同时也说明自相关因子在此处并不是一个冗余信息。

表5 只包含波动率的不同组合t检验结果不同组合类型均值/×10-3自由度t值P值均值/×10-3组合一:30%和70%类一11.74类二17.96144.0-9.174.54×10-146.22组合二:40%和60%类一11.98类二17.02261.0-10.55<2×10-165.04组合三:50%和50%类一12.18类二16.78390.6-12.78<2×10-164.60

表6 模型回归结果估计值标准误差t值P值方法一截距项1.44×10-21.21×10-4118.86<2×10-16β15.80×10-41.21×10-44.782.12×10-6β21.97×10-31.21×10-416.19<2×10-16方法二截距项1.44×10-21.21×10-4119.03<2×10-16β16.31×10-41.21×10-45.202.57×10-7β21.98×10-31.21×10-416.28<2×10-16

3 结论

笔者基于中国A股市场830只股票2001年1月至2016年3月共183个月的月个股收益率数据,对影响中国股市收益率高低的内在因子进行探索分析。研究发现,股票月收益率与波动率和自相关性强度均存在显著关联,波动率越高的股票月均收

益率越高,且自相关性越强的股票月均收益率也越高。进一步建立的多元线性模型还成功检验了自相关强度并不是波动率的冗余信息。因此,在通常认识的波动率越高收益率越高的基础上,笔者提出股票收益率越是服从白噪声过程,则收益率越低,其在时间序列上表现出来的前后相依强度能显著区分收益率高低,这为后续探索收益率影响因素给予了一定的启示和帮助。另外对于长线持股人或者机构,笔者得出的结论也可使其对资产组合收益率和波动之间关系的认识有进一步提升,如关于确保资产组合预期收益率且最小化波动的策略,就可以考虑引进笔者定义的自相关强度,从而变成确保资产组合预期收益率、最小化波动、最大化自相关强度的策略。

参考文献:

【相关文献】

[1] SHARPE W F. Capital asset prices: a theory of market equilibrium under conditions of

risk[J]. Journal of Finance, 1964,19(3):425-442.

[2] LINTNER J. The valuation of risk assets and the selection of risky investments in stock

portfolios and capital budgets[J]. Review of Economics and Statistics,1965,47(1):13-37.

[3] COX J C,ROSS S A, RUBINSTEIN M. Option pricing: a simplified approach[J].Journal of

Financial Economics,1979,7(3):229-263.

[4] FAMA E F, FRENCH K R. Common risk factors in the returns on stocks and bonds[J].

Journal of Financial Economics, 1993,33(1):3-56.

[5] 田利辉,王冠英,谭德凯.反转效应与资产定价:历史收益率如何影响现在[J].金融研究,2014(10):177-192.

[6] FAMA E F, FRENCH K R. A five-factor asset pricing model[J].Journal of Financial

Economics, 2013,116(1):1-22.

[7] BAILLIE R T, DEGENNARO R P. Stock returns and volatility[J].Journal of Financial &

Quantitative Analysis, 1990,25(2):203-214.

[8] COX J C, ROSS S A. The valuation of options for alternative stochastic processes

[J].Journal of Financial Economics, 1976,3(1):145-166.

[9] BEKAERT G , WU G. Asymmetric volatility and risk in equity markets[J].Review of

Financial Studies, 1997,13(1):1-42.

[10] GLOSTEN L R, JAGANNATHAN R, RUNKLE D E. On the relation between the expected

value and the volatility of the nominal excess return on stocks[J].Journal of Finance,

1993,48(5):1779-1801.

[11] NELSON D B. Conditional heteroskedasticity in asset returns: a new approach[J].

Modelling Stock Market Volatility, 1996,59(2):37-64.

[12] SENTANA E, WADHWANI S. Feedback traders and stock return autocorrelations:

evidence from a century of daily data[J]. Economic Journal, 1992,102(411):415-425.

[13] ENGLE R F. Autoregressive conditional heteroscedasticity with estimates of the

variance of united kingdom inflation[J]. Econometrica,1982,50(4):987-1007.

[14] BOLLERSLEVB T. Generalized autoregressive conditional heteroskedasticity. Journal of

Econometrics[J], 1986,31(3):307-327.

[15] TSAY R S.金融时间序列分析[M].王远林,王辉,潘家柱,译.北京:人民邮电出版社,2012:26-30.


更多推荐

收益率,波动,股票,组合,模型,检验