机器学习实战系列之三:截面融合模型选股框架初探

类别:投资策略 机构:长江证券股份有限公司 研究员:覃川桃 日期:2018-03-13

截面融合模型选股框架设计。

    截面融合模型包括三个部分:选择合适的特征空间,选取特定的模型簇,确定融合规则。目前常见的机器学习模型选股多将全部因子作为输入,以单个训练的模型作为预测结果,而截面模型框架通过在特征空间和函数空间进行选择,将多个特征空间下的多个函数簇在特定目标确定的规则下进行融合,达到更加逼近预测关系的结果。

    筛选的多个子空间比全空间表现更好,且可以很好捕捉非线性关系。

    本文从特征子空间和多个解释空间这两个角度出发验证筛选因子空间的有效性,从超额收益、夏普比、信息比、多空夏普比和Calmar比上进行对比,多个大类行业的子空间的策略表现显著优于全空间策略。筛选的有效子空间中包含很多线性模型中非显著的因子,捕捉数据中存在的非线性关系。

    分组标准的融合结果优于传统R方标准的融合结果。

    以样本内第一组选股组合的收益情况为标准(分组标准)的融合结果相比于传统R方为标准的融合结果,在超额收益、超额最大回撤、夏普比、信息比、多空夏普比、Calmar比上均得到了显著的提高。

    截面融合模型的表现优于单个机器学习模型、线性回归模型。

    本文以提升树、ExtraTrees、随机森林、Ridge回归和Lasso回归为基模型,以线性加权的形式对模型进行融合,得到截面融合模型,在全A市场的选股中,超额收益为20.03%,超额最大回撤为7.27%,信息比为2.93,相比于单个机器学习模型和线性回归模型,其超额收益、夏普比、多空夏普比和Calmar比均有显著提高。

    截面融合模型可以更好的捕捉因子的非线性关系。

    我们将截面融合模型与线性模型预测结果回归的残差定义为非线性效应因子,以该因子在全A股中进行选股分组显著,呈现较为明显的线性,长期看来并无明显失效的时期,其中第1组的年化超额收益为6.56%,夏普比为0.72,信息比为1.14,Calmar比为0.36,表明截面融合模型可以捕捉一定的因子非线性关系。

    风险提示:

    1.模型在使用中存在失效的风险;

    2.本文举例均是基于历史数据不保证其未来收益。

数据推荐

投资评级

更多>>
股票名称最新评级目标价研报

盈利预测

评级选股>>
股票名称11年EPS12年EPS研报
荣盛发展 0.75 1.04 研报
绿地控股 0.55 0.30 研报
新城控股 0 0 研报
光大嘉宝 0.60 0 研报
世联行 0.84 0.62 研报
大悦城 0.30 0.27 研报
蓝光发展 0.24 0 研报
阳光城 0.98 0.90 研报
金科股份 1.15 1.24 研报
中南建设 0.80 0.99 研报
金融街 0.64 0.72 研报

股票关注度

更多>>
股票名称关注度平均评级最新评级
海康威视 6 持有 买入
华夏幸福 4 买入 买入
恒逸石化 4 买入 买入
南极电商 4 买入 买入
洽洽食品 4 持有 买入
贵州茅台 3 持有 买入
普洛药业 3 买入 买入
旗滨集团 3 买入 买入
喜临门 3 买入 买入
中南建设 3 买入 买入
比音勒芬 2 买入 持有
吉比特 2 持有 买入
完美世界 2 持有 买入
万科A 2 买入 买入
大悦城 2 买入 买入
美的集团 2 买入 买入
新经典 2 持有 中性

行业关注度

更多>>
行业名称关注度关注股票数买入评级数