摘要:
目前投资经理人更多地依靠科学的分析、程序及结构化的方式获取市场投资的机遇和价值。这其中重要的是获取较高股票收益率的同时,减低投资组合收益的不确定,即实际收益率与期望收益率偏离的幅度。本文使用股票历史收益率数据建立一个二元的贝叶斯模型分类器,结合主动投资管理和被动投资管理,使用四种方法比较夏普比率和收益率,来衡量最终股票投资的效果。
(一)数据来源与模型假设
股票的数量选择可以是任意的,但是要尽量选择不同的行业,降低系统性风险事件过于集中暴露的可能性。本文选择10只分别来自地产行业、制造业、零售产业、信息科技等美国股市指数标普500成分股票,选择这10只股票的目的是希望行业之间的相关性较弱。行业分散有助于股价相关性的分散,也有利于某个行业出现系统性风险时避免投资集中于一个行业导致亏损较大。股票历史数据选取来自于2009年4月1日到2018年8月1日的雅虎金融数据。贝叶斯模型的主要假设是股票每日回报率是相等且独立的,即股价每日变化的可能性是互补相关的。本文测试了每只股票每日回报率的自相关性以论证这一基础假设。实验结果表明,每只股票的独立性检验均在95%的置信区间内,股票的回报率是独立的。因此,可以...
目前投资经理人更多地依靠科学的分析、程序及结构化的方式获取市场投资的机遇和价值。这其中重要的是获取较高股票收益率的同时,减低投资组合收益的不确定,即实际收益率与期望收益率偏离的幅度。本文使用股票历史收益率数据建立一个二元的贝叶斯模型分类器,结合主动投资管理和被动投资管理,使用四种方法比较夏普比率和收益率,来衡量最终股票投资的效果。
(一)数据来源与模型假设
股票的数量选择可以是任意的,但是要尽量选择不同的行业,降低系统性风险事件过于集中暴露的可能性。本文选择10只分别来自地产行业、制造业、零售产业、信息科技等美国股市指数标普500成分股票,选择这10只股票的目的是希望行业之间的相关性较弱。行业分散有助于股价相关性的分散,也有利于某个行业出现系统性风险时避免投资集中于一个行业导致亏损较大。股票历史数据选取来自于2009年4月1日到2018年8月1日的雅虎金融数据。贝叶斯模型的主要假设是股票每日回报率是相等且独立的,即股价每日变化的可能性是互补相关的。本文测试了每只股票每日回报率的自相关性以论证这一基础假设。实验结果表明,每只股票的独立性检验均在95%的置信区间内,股票的回报率是独立的。因此,可以认为条件独立假设对于股票的每日回报率是正确的,满足了使用贝叶斯理论的基础条件。
通常在考虑股票价格每日回报率的概率分布时,会使用高斯分布。本文对股票的每日回报率高斯分布图形检验时发现,主要的分布点近乎在一条直线上,可以大致认为股价的每日回报率服从高斯分布。
(二)模型的理论和构建
选择10天而非其他交易日数量,原因是来自模型不断从少数几天到连续几十天多次尝试后得出10天的预测效果最好。过少的交易日数量可能无法得到足够的价格驱动信息,过多的交易日数量可能存在较多干扰信息影响下一交易日的价格趋势的判断。交易日数量作为贝叶斯理论模型的重要参数,数值的确定需要从实际历史回测结果出发,更好的历史真实回测结果在概率上会提高未来进一步预测的准确率。二元贝叶斯分类模型预测股价走势的核心方程式如下描述,在已经得知以往10天的股价后需要预测第11天的股价,利用历史数据中,每个第11日股价涨跌的概率,乘以基于第11天股价涨跌的前10天的每日股价涨跌的条件概率的累乘。
一部分数据用来训练每只股票的贝叶斯模型分类器,另一部分用于模型的交叉验证。在模型交叉验证中,发现分界值为0.55,可以得到最大的关于预测股价的真阳率。如果模型预测股价在下一个交易日会涨,模型会给出数字1,反之模型预测股价下跌,会给出数字0,可以利用预测矩阵显示。通过历史实际的价格走势和模型预测的价格走势,比较模型的预测表现。和历史真实实验数据对比后,10只股票模型给出的预测准确率为53%,这意味着在股票交易市场实践中,模型可以获得概率上53:47的盈利预测。对于一位投资组合管理者,当选择投资的股票标的确定时,只需要投资这些当日预测上涨的股票,把更多的资产配置在认为股价可以上升的股票,进而再次谋求资产配置最优化的方法以便获得利润回报的最大化。
关于如何进行资产配置,本文基于现代投资组合原理,比较了四种不同的投资组合管理方法,分别是被动投资管理与相等权重的资产组合、被动投资管理与不等权重的资产组合、主动投资管理与相等权重的资产组合、主动投资管理与不等权重的资产组合。结合贝叶斯模型对股价涨跌的分类结果,加上历史上真实的股价走势,可以回测到模型的收益效果。
主动投资管理与相等权重的资产组合取得了最大的回报率和年化的夏普率,是这四种方法中最好的投资变现;而被动投资管理与不等权重的资产组合收益最差。
真实的金融市场是存在风险的,因此考虑风险的管理是非常重要的。本文比较了相同时间区域内的每只股票独自的风险测度值VaR和预期亏损ES,使用了95%的置信区间来研究5%的极端事件。风险测度值VaR是在市场正常波动下,某一金融资产或证券组合的最大可能损失。更为确切的是指在一定概率水平(置信度)下,某一金融资产或证券组合价值在未来特定时期内的最大可能损失。文中使用策略的风险测度值和预期亏损明显小于其他十只单独的股票。因此,该策略风险较每只股票单独投资来说风险更小,遇到极端事件发生后的损失也更小。同样由于股票之间的分散性和单独的股票风险可控,当标普500指数出现系统波动时,该投资组合策略的影响也较低。
责任编辑 武献杰