人工智能行业系列之七:人工智能选股之Python实战

类别:行业研究 机构:华泰证券股份有限公司 研究员:林晓明 日期:2017-09-26

介绍Python安装方法、与机器学习相关的包以及常用命令

    Python语言是目前机器学习领域使用最广泛的编程语言之一,拥有众多优秀的包和模块,并且相对简单易学。我们将简单介绍Python语言的特性,常用命令,以及和机器学习相关的包,例如NumPy,pandas,scikit-learn等,希望帮助有一定编程基础的读者迅速上手Python语言。

    机器学习选股框架与多因子选股框架类似,具有一定优越性。

    机器学习中最为主流的方法监督学习,其核心思想是挖掘自变量和因变量之间的规律。我们将经典多因子模型稍加改造,以机器学习的语言描述。在训练阶段,根据历史的因子值X和收益r,训练监督学习模型r=g(X, f),得到模型自由参数的估计量f。在测试阶段:根据最新的因子值X、参数估计量f和监督学习模型g,预测下期收益r。机器学习方法相较于线性回归的优越之处在于:首先,机器学习可以挖掘数据中的非线性规律;其次,正则化的引入能够筛选出最有效的自变量;再次,参数优化的过程能够遴选出预测力最强的模型。

    将机器学习选股代码拆分成十二个子模块进行详尽讲解。

    我们将机器学习选股代码拆分成十二个子模块,包括:模块导入、参数设置、数据读入、数据标记、数据预处理、模型设置、模型训练、模型预测、模型评价、策略构建、策略评价和结果保存。每个子模块我们将展示代码并且逐句进行讲解。报告中展示的代码是完备且成体系的,可以根据需要进行整合,构建一套完整的机器学习选股模型。

    风险提示:通过Python编写人工智能选股算法受到数据库架构、网络环境、计算机硬件条件限制,报告中代码经移植后可能不能正常运行;通过人工智能算法构建选股策略是历史经验的总结,存在失效的可能。

数据推荐

投资评级

更多>>
股票名称最新评级目标价研报

盈利预测

评级选股>>
股票名称11年EPS12年EPS研报
蓝光发展 0.24 0 研报
荣盛发展 0.75 1.04 研报
绿地控股 0.55 0.30 研报
新城控股 0 0 研报
光大嘉宝 0.60 0 研报
世联行 0.84 0.62 研报
大悦城 0.30 0.27 研报
滨江集团 0.80 0.93 研报
阳光城 0.98 0.90 研报
金科股份 1.15 1.24 研报
中南建设 0.80 0.99 研报

股票关注度

更多>>
股票名称关注度平均评级最新评级
海康威视 6 持有 买入
华夏幸福 4 买入 买入
恒逸石化 4 买入 买入
南极电商 4 买入 买入
洽洽食品 4 持有 买入
贵州茅台 3 持有 买入
普洛药业 3 买入 买入
旗滨集团 3 买入 买入
喜临门 3 买入 买入
中南建设 3 买入 买入
比音勒芬 2 买入 持有
吉比特 2 持有 买入
完美世界 2 持有 买入
万科A 2 买入 买入
大悦城 2 买入 买入
美的集团 2 买入 买入
新经典 2 持有 中性

行业关注度

更多>>
行业名称关注度关注股票数买入评级数