人工智能系列之十:宏观周期指标应用于随机森林选股

类别:投资策略 机构:华泰证券股份有限公司 研究员:林晓明 日期:2018-03-21

将周期三因子引入随机森林模型中构建带有因子择时效应的选股策略。

    本报告中,我们将多因子截面数据和华泰周期三因子进行合并,构建了因子择时+选股一体化的随机森林模型。周期三因子在随机森林模型中起到了状态切换的作用,不同状态下对应不同的截面因子选股逻辑。加入周期三因子的随机森林模型能获得更好的回测结果,本质上利用了周期因子的两个效应:

    (1)在周期因子取值单调的训练期内,模型侧重于遵循离当前更近的截面期样本的投资逻辑。

    (2)在周期因子取值非单调的训练期内(即拐点处),模型能够利用到周期因子在拐点处所带来的增量信息。

    加入周期三因子的随机森林模型选股表现有稳定的提升。

    加入了周期三因子的随机森林模型,样本外的平均预测正确率从53.61%提升至53.72%,平均AUC 从0.5491提升至0.5503。同时,我们构建了全A 选股策略(回测期:20110201~20180131,中证500行业中性),回测结果显示,加入周期三因子后,随机森林模型构建的选股组合年化超额收益率平均提升了2.6%,超额收益最大回撤平均下降了3.7%,信息比率平均提升了0.55,Calmar 比率平均提升了0.82,选股表现有稳定的提升。

    本报告中我们选用的训练集数据长度为6个月。

    综合考虑前期人工智能选股系列报告的结论和周期因子的特性,我们选用的训练集数据长度为6个月,具体原因如下:

    (1)过长的训练期长度在投资风格发生转变时(2017年)面临较大回撤,2011年至2016年的投资风格已经不适合于当下。而较短的训练期长度(10个月以内)使得模型能够及时扭转投资风格,大幅减少回撤。2. 较短的训练期长度下,周期因子能够更加精细地切分市场状态,并且模型能更加及时地利用到周期因子位于拐点时的信息。

    随机森林比XGBoost 更适合结合宏观周期因子。

    随机森林和XGBoost 同为决策树集成模型,其集成方式存在一定区别。随机森林模型中每棵决策树都可以得出独立的拟合结果,最后通过平均投票的方式提高预测精度,因此单棵树深度基本都在20层以上;而XGBoost模型的迭代过程中每棵决策树都在学习上一棵决策树拟合的残差,为了防止过拟合,单棵树深度基本都在5层以下。宏观周期因子相比传统的截面因子能提供的信息增益较少,因此,深度更大、分支节点更多的随机森林模型相比XGBoost 模型有更大概率能够选中周期因子成为决策树的分支节点,从而利用到更多的时间序列信息,提升预测能力。

    风险提示:加入周期三因子的随机森林选股模型是对历史投资规律的挖掘,若未来市场投资环境发生变化,则模型存在失效的可能。

数据推荐

投资评级

更多>>
股票名称最新评级目标价研报

盈利预测

评级选股>>
股票名称11年EPS12年EPS研报
新城控股 0 0 研报
光大嘉宝 0.60 0 研报
世联行 0.84 0.62 研报
大悦城 0.30 0.27 研报
蓝光发展 0.24 0 研报
荣盛发展 0.75 1.04 研报
绿地控股 0.55 0.30 研报
中南建设 0.80 0.99 研报
金融街 0.64 0.72 研报
新湖中宝 0.38 0.32 研报
金地集团 0.67 0.71 研报

股票关注度

更多>>
股票名称关注度平均评级最新评级
海康威视 6 持有 买入
华夏幸福 4 买入 买入
恒逸石化 4 买入 买入
南极电商 4 买入 买入
洽洽食品 4 持有 买入
贵州茅台 3 持有 买入
普洛药业 3 买入 买入
旗滨集团 3 买入 买入
喜临门 3 买入 买入
中南建设 3 买入 买入
比音勒芬 2 买入 持有
吉比特 2 持有 买入
完美世界 2 持有 买入
万科A 2 买入 买入
大悦城 2 买入 买入
美的集团 2 买入 买入
新经典 2 持有 中性

行业关注度

更多>>
行业名称关注度关注股票数买入评级数