关键要点
-
遗传规划是一种基于遗传算法的人工智能算法。
-
遗传规划可用于多因子选股中的因子合成方面。
-
遗传规划可生成历史经验总结的选股因子。
-
遗传规划选股因子的测试流程包括数据获取和特征提取、公式进化和筛选等步骤。
-
遗传规划选股因子可能存在失效的风险。
基于遗传规划的选股因子挖掘及应用
这一章节主要介绍了一篇关于基于遗传规划的选股因子挖掘的研究报告。该报告通过对遗传规划的应用,利用计算机强大的算力和遗传进化的思想,从有限的量价数据中挖掘出具有增量信息的因子,为选股因子研究提供了一种新的思路。文章还介绍了遗传规划在选股因子挖掘中的完整流程,并对遗传规划程序包 gplearn进行了深度定制改进。经过测试,遗传规划能从有限的量价数据中挖掘出具有增量信息的因子,在遗传规划框架中,作者设定预测目标为个股20个交易日后的收益率,初步挖掘出了6个选股因子。最后,文章提醒读者遗传规划所得因子可能存在失效的风险,使用需谨慎。
华泰证券基因规划选股因子挖掘的研究报告
这一章节是关于遗传规划的研究报告,主要介绍了遗传规划的总体流程、公式表示方式、适应度以及进化方法等内容。其中,交叉、子树变异、点变异和Hoist变异等都是遗传规划中的进化方法。此外,该报告还介绍了gplearn的简介和改进,并给出了遗传规划选股因子挖掘的测试流程和主要参数设置。最后,该报告对遗传规划所得因子进行了单因子测试和回归测试,并给出了Alpha1至Alpha6因子的详细测试结果。
以进化的方式挖掘有效因子
这一章节介绍了如何使用遗传规划算法进行选股因子挖掘,并探讨了该算法的基本原理、重要参数以及定制化改进等方面的问题。遗传规划算法是一种适合进行特征工程的算法,可以从随机生成的公式群体中逐步生成契合特定目标的公式群体。在量化多因子选股领域中,选股因子的挖掘是一个关注度经久不衰的主题。以往的因子研究中,人们一般从市场可见的规律和投资经验入手,进行因子挖掘和改进,即“先有逻辑、後有公式”的方法。而遗传规划算法则更多运用于特征挖掘(特征工程),可以通过“进化”的方式得出一些经过检验有效的选股因子,再试图去解释这些因子的内涵,即“先有公式、後有逻辑”的方法。
遗传规划:自动进化公式以逼近数据分布
这一章节介绍了遗传规划的总体流程,包括随机生成初始公式、计算适应度并选择合适的父代、进化产生新的后代公式等步骤。在遗传规划中,公式通常使用二叉树形式表示,其中包括变量、函数和常数。公式的输出值可以通过递归的方式求解。遗传规划可以帮助我们逼近数据分布的真相,是一种有效的机器学习算法之一。
遗传规划中的适应度与进化方法
这一章节主要介绍了遗传规划中的适应度和公式进化方法。适应度是指公式运算结果与给定目标的相符程度,是公式进化的重要参考指标。公式进化方法包括交叉、变异等,其中交叉是最常用也最有效的进化方式。交叉需要通过两次选取找到父代和捐赠者,生成后代。对于使用遗传规划生成的选股因子来说,可以使用因子在回测区间内的平均RankIC或因子收益率来作为适应度。