【国联金工】基于遗传规划的对传统量价因子的优化思路

admin4个月前研报372

基于遗传规划的对传统量价因子的优化思路


国联金工 | 陆豪、康作宁



根据《证券期货投资者适当性管理办法》,本微信平台所载内容仅供国联证券客户中专业投资者参考使用。若您非国联证券客户中的专业投资者,为控制投资风险,请勿订阅、接受、转载或使用本平台中的任何信息。


报告摘要

Ø  遗传规划简介:本文首先介绍了遗传规划的基本概念,包括公式树、适应度评估、选择、交叉和变异等核心环节,以及其在金融市场分析中的应用场景。

 

Ø  传统量价因子与遗传规划因子挖掘的比较:对比了传统量价因子(如MACD)与遗传规划因子挖掘方法的优缺点,揭示了遗传规划在处理金融市场复杂、非线性问题方面的优势。

 

Ø  遗传规划模型构建:研究采用了中证500指数的历史数据,对传统量价因子和遗传规划优化后的因子进行了回测和效果评估。结果表明,遗传规划方法在复杂市场条件下能够挖掘出更为有效的预测因子。

 

Ø  多因子策略构建与测试:文章提出了基于遗传规划的多因子策略,并对其进行了实证检验。结果表明,相较于原始因子,优化后的因子在预测股票价格走势方面具有更好的表现。

 

Ø  改进空间:本文指出了遗传规划在金融市场分析中仍需改进的方面,如数据中性化处理、降低新因子共线性等。

 

Ø  总结:遗传规划因子挖掘技术采用了一种不同寻常的方法来识别潜在有益的交易信号。该方法通过模拟自然选择的进化过程,随机组合不同的市场数据、数学函数和逻辑操作符来创建复杂的公式。通过多代的选择、交叉和变异,最终筛选出预测能力最强的因子。将遗传规划因子结合传统技术指标应用于量化选股策略,可以对传统的技术指标有效的改进并提升其预测能力,在中证500基准实测可以获得6%的年化超额收益。


Ø  风险提示:尽管传统量价因子和遗传规划因子挖掘在技术分析领域都有其应用价值,但它们适用于不同的市场状况和投资策略。投资者应根据自己的需求和能力,选择合适的工具,同时注意风险管理和多元化投资的重要性。



报告目录


报告正文

1. 遗传规划简介

1.1 传统量价因子与遗传规划因子挖掘的比较

      在现代金融市场中,投资者和分析师利用各种技术因子来预测股票价格走势。技术分析方法可分为两大类:传统量价因子以及较新的遗传规划因子。


1.1.1 传统量价因子(以MACD为例)

      构建逻辑:传统量价因子通常基于一系列假设的市场行为建立,例如趋势跟随或均值回归。以MACD(移动平均收敛发散指标)为例,其基于短期(如12天)和长期(如26天)的指数移动平均线(EMA)之间的关系来预测价格变化。当短期EMA上升至长期EMA之上时,可能表示一个买入信号;反之,可能是一个卖出信号。

优点:
    • 简单易懂,易于实施;

    • 基于长期市场数据的经验统计,有一定的可靠性;

    • 在特定市场状况下能提供有效的交易信号。

缺点:
    • 可能会产生滞后的信号,尤其在市场快速变化时;

    • 在高波动或无趋势市场中的效果可能较差;

    • 依赖于历史数据,无法准确预测所有未来事件。


1.1.2 遗传规划因子挖掘

      构建过程:遗传规划因子挖掘技术采用了一种不同寻常的方法来识别潜在有益的交易信号。该方法通过模拟自然选择的进化过程,随机组合不同的市场数据、数学函数和逻辑操作符来创建复杂的公式。通过多代的选择、交叉和变异,最终筛选出预测能力最强的因子。

优点:
    • 能够发现并利用市场数据中更深层次的模式和关系;

    • 构建的因子通常比传统方法更加复杂,潜在地涵盖更多信息;

    • 提高了预测性能,尤其是在复杂的市场条件下。

缺点:
    • 过度拟合风险,特别是在数据量不足或者市场环境频繁变化的情况下;

    • 结果解释性较差,因为生成的公式往往缺乏直观的逻辑支持。


1.2 遗传规划(Genetic Programming)

      遗传规划是一种基于自然选择和遗传学原理的强大算法,属于演化算法(Evolutionary Algorithm)的一个分支,遗传规划具有处理高维数据和全局搜索的能力,利用计算机的算力,能挖掘出人脑难以构建的因子。这一技术特别适合处理金融市场中的复杂、非线性问题,能够挖掘出传统分析方法难以识别的模式。


1.2.1 公式树:遗传规划的核心

      在遗传规划中,每一个个体都是以树状结构表示的公式或程序,其中树的节点表示运算符(如加、减、乘、除等),叶子节点表示操作数或变量(如价格、成交量等)。

      在进化过程中,通过对公式树的各个节点进行随机的交叉和变异等操作来实现父代到子代的进化。

      公式树的深度和复杂性决定了其表达能力,能够构造出从简单的数学公式到复杂的多变量模型。



1.2.2 基本流程:遗传规划的工作机制

      遗传规划的基本工作流程如下:

    • 初始种群的生成:从数百到数千个随机生成的公式树开始,这构成了算法的初始种群。

    • 适应度评估:计算每棵公式树的适应度,通常是根据其预测市场数据的准确性或产生利润的能力。

    • 选择(Selection):根据公式树的适应度,选择表现较好的个体作为繁衍后代的父代。

    • 交叉(Crossover):从选定的父代公式树中随机选择两个,并交换它们的部分结构,产生子代。

    • 变异(Mutation):对某些公式树进行随机的修改,例如改变一个节点的运算符,以增加种群的多样性。

    • 新一代的形成:用产生的子代替换掉适应度较低的个体,形成新的种群。

    • 终止条件:如果满足预设的终止条件(如达到特定的迭代次数或适应度阈值),则停止迭代。

      通过这个不断迭代的过程,遗传规划能够发现和优化复杂的交易规则和预测模型,最终挑选出最佳的公式用于实际的市场分析。


2. 优化思路

    • 现存问题:传统量价因子能够分析市场趋势,判断市场情绪,但存在预测能力弱,回测收益率差等问题。

    • 优化思路:对原有量价因子根据公式进行拆解,在通过遗传规划算法重新组合、进化,从而生成更优的因子。

    • 验证流程

      1、 数据获取:

      • 股票池:中证500(000905.SH)

      • 回测区间:2016年1月1日-2023年10月31日

      • 回测频率:日频、周频

      2、 遗传规划因子挖掘:

      • 将选定的量价因子根据公式拆解,选取出相关性低的因子

      • 使用这些因子和自定义的函数集,生成公式,并按照流程进行公式的进化和筛选

      3、 单因子测试(日频、周频)

      4、 对比测试结果

      5、 构建多因子策略


3. 遗传规划模型

3.1 基于遗传规划的量价因子挖掘与优化模型

      1、 获取基础因子:

      • 选取四个因子作为研究对象,分别是相对强弱指标、成交量比、20日波动率、长短均线比值

      • 将这些因子根据各自对应的计算公式拆解成基础的因子(如下图所示)

      • 进行中位数去极值、标准化处理,在进行共线性测试,选取相关性较低的因子

      2、 构建日频和周频两个模型

      3、 设置超参数和自定义函数集

      4、 选取2016年1月1日-2020年12月31日的数据作为训练集,训练模型

      5、 选取2021年1月1日-2023年10月31日的数据作为测试集,和训练集一起,进行单因子测试。


3.2 获取基础因子

      上图为基础因子表达式及含义,经过中位数去极值、标准化处理和共线测试,从中选取U,D,ave_U,ave_D,vol_ratio,std_20,L_S_ratio这些相关性较低的因子进入后续的模型中。


3.3 挖掘结果

      下图为日频和周频的因子挖掘结果


4. 单因子测试

4.1 策略构建方法

      本部分研究采用Rank IC值分析和分层回测法对新优化的因子进行有效性测试。测试方法主要分为以下几步:

      1、 对于日频模型,设定1‰的手续费

      • 回测区间:

        • 训练集:2016年1月1日-2020年12月31日

        • 测试集:2021年1月1日-2023年10月31日

      • 第一组:对新因子在训练集中进行单因子测试

      • 第二组:对新因子在测试集中进行单因子测试

      • 第三组:对原始因子在测试集中进行单因子测试      

      2、 通过对比第一组和第二组的结果,验证新因子在样本外的表现是否一致

      3、 通过对比第二组和第三组的结果,验证新因子相较于原始因子是否更优

      4、 对于周频模型,设定1‰和3‰的手续费,分别进行上述所有测试,验证不同频率下结果是否发生改变


4.2 测试结果

      下图为日频,1‰手续费下单因子策略测试结果

      下图为周频,1‰手续费下单因子策略测试结果

      下图为周频,3‰手续费下单因子策略测试结果


5. 多因子策略

5.1 策略构建方法

  • 将得到的5个新因子基于夏普率加权合成1个因子,用这个因子对中证500的成分股进行打分

  • 根据申万一级行业分类,从每个行业分类的成分股中选出前10%的股票(不满10只的因子等权相加合成一只)

  • 将相对强弱指标作为对比因子,进行同样的选股策略

  • 构建投资组合计算在不同调仓频率和手续费下的年化收益和绩效


5.2 策略绩效统计

      下图为日频,1‰手续费下多因子策略测试结果

      下图为周频,1‰手续费下多因子策略测试结果

      下图为周频,3‰手续费下多因子策略测试结果


6. 改进空间

      在本项研究接下来的改进优化过程中,我们将特别关注以下几个方面。

      • 数据中性化处理

      • 降低新因子共线性

      • 扩大数据范围

      • 调整适应度函数

      • 提高算力

      这些改进策略的集成不仅可以增强模型的性能,同时也可以为本文的研究增添可信度。


7. 总结

      遗传规划因子挖掘技术采用了一种不同寻常的方法来识别潜在有益的交易信号。该方法通过模拟自然选择的进化过程,随机组合不同的市场数据、数学函数和逻辑操作符来创建复杂的公式。通过多代的选择、交叉和变异,最终筛选出预测能力最强的因子。

      将遗传规划因子结合传统技术指标应用于量化选股策略,可以对传统的技术指标有效的改进并提升其预测能力,在中证500基准实测可以获得6%的年化超额收益。

风险提示

尽管传统量价因子和遗传规划因子挖掘在技术分析领域都有其应用价值,但它们适用于不同的市场状况和投资策略。投资者应根据自己的需求和能力,选择合适的工具,同时注意风险管理和多元化投资的重要性。


文中报告选自国联证券研究所已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。

证券研究报告信息

报告标题:基于遗传规划的对传统量价因子的优化思路 

发布时间:2024年01月28日

发布机构:国联证券研究所

作者:

分析师:陆豪

执业证书编号:S0590523070001

邮箱:[email protected]


联系人:康作宁

邮箱:[email protected]



相关报告

1、《雪球敲入对市场影响研究》2024.01.22

2、《中美养老 FOF 产品对比研究》2024.01.19 



评级说明及声明

评级说明

投资建议的评级标准:报告中投资建议所涉及的评级分为股票评级和行业评级(另有说明的除外)。评级标准为报告发布日后6到12个月内的相对市场表现,也即:以报告发布日后的6到12个月内的公司股价(或行业指数)相对同期相关证券市场代表性指数的涨跌幅作为基准。其中:A股市场以沪深300指数为基准,新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为基准;香港市场以摩根士丹利中国指数为基准;美国市场以纳斯达克综合指数或标普500指数为基准;韩国市场以柯斯达克指数或韩国综合股价指数为基准。

股票评级:买入:相对同期相关证券市场代表指数涨幅20%以上;增持:相对同期相关证券市场代表指数涨幅介于5%~20%之间;持有:相对同期相关证券市场代表指数涨幅介于-10%~5%之间;卖出:相对同期相关证券市场代表指数跌幅10%以上。

行业评级:强于大市:相对同期相关证券市场代表指数涨幅10%以上;中性:相对同期相关证券市场代表指数涨幅介于-10%~10%之间;弱于大市:相对同期相关证券市场代表指数跌幅10%以上。


免责声明

国联证券股份有限公司(下称“国联证券”)已获中国证监会许可的证券投资咨询业务资格,本平台推送观点和信息仅供国联证券研究服务客户参考,完整的投资观点应以国联证券研究所发布的完整报告为准。若您非国联证券研究服务客户,为控制投资风险,请勿订阅、接受、转载或使用本平台中的任何信息,若给您造成不便,敬请谅解。国联证券不会因订阅本平台的行为或者收到、阅读本公众号推送内容而视相关人员为客户。任何未经国联证券同意或授权而对本平台内容进行复制、转发或其他类似不当行为均被严格禁止。对于使用本平台包含信息所引起的后果,国联证券概不承担任何责任。

本平台及国联证券研究报告所载资料的来源及观点的出处皆被国联证券认为可靠,但国联证券不对其可靠性、准确性、时效性或完整性做出任何保证。本公众号推送内容仅反映国联证券研究人员于发出完整报告当日的判断,本公众号所载的资料、意见及推测有可能因发布日后的各种因素变化而不再准确或失效,国联证券不承担更新不准确或过时的资料、意见及推测的义务,在对相关信息进行更新时亦不会另行通知。

在任何情况下,本公众号所载信息、意见不构成对任何人的投资建议,所述证券或金融工具买卖的出价或征价,评级、目标价、估值、盈利预测等分析判断亦不构成对具体证券或金融工具在具体价位、具体时点、具体市场表现的投资建议。对任何直接或间接使用本公众号所载信息和内容或者据此进行投资所造成的任何一切后果或损失,国联证券及/或其关联人员均不承担任何形式的法律责任。


法律声明

根据《证券期货投资者适当性管理办法》,本微信平台所载内容仅供国联证券客户中专业投资者参考使用。若您非国联证券客户中的专业投资者,为控制投资风险,请勿订阅、接受、转载或使用本平台中的任何信息。国联证券不会因接收人收到本内容而视其为客户,且由于仅为研究观点的简要表述,客户仍需以国联证券研究所发布的完整报告为准。

市场有风险,投资需谨慎。在任何情况下,本微信平台所载信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本微信平台中的任何内容所引致的任何损失负任何责任。

本微信号及其推送内容的版权归国联证券所有,国联证券对本微信号及其推送内容保留一切法律权利。未经国联证券事先书面许可,任何机构或个人不得以任何形式转载、翻版、复制、刊登、发表、修改、仿制或引用本订阅号中的内容。任何订阅人如欲引用或转载本平台所载内容,务必注明出处为国联证券研究所,且转载应保持完整性,不得对内容进行有悖原意的引用和删改。转载者需严格依据法律法规使用该文章,转载者单方非法违规行为与我司无关,由此给我司造成的损失,我司保留法律追究权利。


本篇文章来源于微信公众号: 投资者的未来

相关文章

盈利、分析师因子表现较好

盈利、分析师因子表现较好

摘要 因子IC跟踪IC方面,最近一周,季度roe、季度roa、季度ep等因子表现较好,小市值、Beta、一年动量等因子表现较差;最近一月,1个月换手率波动、1个月日均换手率、季度roa等因子...

【逢低关注低位高弹性品种】安信金工定量复盘20230903

【逢低关注低位高弹性品种】安信金工定量复盘20230903

点击上方公众号可以关注哦!主要结论:逢低关注低位高弹性品种在上周末的重磅政策出台之前,我们曾从温度计指标角度提出,当下或类似于2022年10月中旬。理由如下:这两次都出现了北向资金的大幅流出;都是一轮...

公募基金2023年二季报全扫描【国信金工】

公募基金2023年二季报全扫描【国信金工】

  报 告 摘 要  一、基金仓位监控普通股票型基金仓位中位数为90.71%,偏股混合型基金仓位中位数为89.63%,普通股票型基金仓位处在...

市场出现反弹,等待确定性信号出现

市场出现反弹,等待确定性信号出现

观点速览导读综合结论:本期(2023/12/25-2023/12/29)市场整体走势以上涨为主。展望后市,技术面指标的信号暂时以谨慎乐观为主,但多指数上涨概率维持高位。以沪深300指数为例,经过本期的...

华商基金张永志:穿越牛熊的固收+名将——基金产品分析系列之十三

华商基金张永志:穿越牛熊的固收+名将——基金产品分析系列之十三

报告摘要►主要观点·固收+实力老将,屡获权威殊荣张永志先生拥有超17年证券从业经历,其中超12年证券投资经历,管理一级债基、二级债券、可转债、偏债混合等多类型公募产品,截至2023年3季末,合计管理规...

中证1000增强本年超额基准0.59%

中证1000增强本年超额基准0.59%

摘要 中证500增强      中证500增强以中证500为基准指数,精选基本面因子进行组合优化。    &n...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。