• 热点研报
  • 精选研报
  • 知名分析师
  • 经济数据库
  • 个人中心
  • 用户管理
  • 我的收藏
  • 我要上传
  • 云文档管理
  • 我的云笔记
  • 国金证券-Alpha掘金系列之十:机器学习全流程重构~细节对比与测试-240328

    日期:2024-03-28 23:18:36 研报出处:国金证券
    研报栏目:金融工程 高智威,王小康  (PDF) 22 页 1,152 KB 分享者:bil****86
    请阅读并同意免责条款

    【免责条款】

    1. 用户直接或通过各类方式间接使用慧博投研资讯所提供的服务和数据的行为,都将被视作已无条件接受本声明所涉全部内容;若用户对本声明的任何条款有异议,请停止使用慧博投研资讯所提供的全部服务。

    2. 用户需知,研报资料由网友上传,所有权归上传网友所有,慧博投研资讯仅提供存放服务,慧博投研资讯不保证资料内容的合法性、正确性、完整性、真实性或品质;

    3. 任何单位或个人若认为慧博投研资讯所提供内容可能存在侵犯第三人著作权的情形,应该及时向慧博投研资讯提出书面权利通知,并提供身份证明、权属证明及详细侵权情况证明。慧博投研资讯将遵循"版权保护投诉指引"处理该信息内容;

    4.本条款是本站免责条款的附则,其他更多内容详见本站底部《免责声明》

    研究报告内容
    分享至:      

      模型训练的若干细节测试

      机器学习模型通过其复杂的非线性方式往往能得到较好的截面选股能力,但由于其“黑箱”的特性使投资者在进行模型训练的过程中对于很多细节问题没有明确的定论。http://www.hibor.com.cn【慧博投研资讯】本篇报告尝试探索了以下几个细节问题:包括特征和标签的数据预处理方式,使用全A股票训练还是成分股训练,使用一次性训练、滚动或是扩展训练的效果区别,分类模型和回归模型的差异,损失函数改为IC后是否有进一步提升,不同的树集成方法优劣对比共六个方面。http://www.hibor.com.cn(慧博投研资讯)

      发现对于截面模型和时序模型而言,其最优数据预处理的方式有所不同。截面模型更适合使用整个训练集进行ZScore标准化,从而保留数据不同日期间的相对大小关系,而时序模型则应对特征和标签分别使用不同的方式处理。在训练方式上,我们也针对一次性、滚动或扩展训练进行对比,发现选取合适的样本区间能使模型更能适应不同的市场环境。

      在训练所用样本上,我们发现使用全A训练还是成分股训练既与所使用基准有关,同时也与模型本身特性相关,需要分情况使用最合适的样本。而在分类和回归模型的选择上,我们经过对比发现,回归模型所得因子在各指标上都能超过分类模型的效果,保留更有颗粒度的标签数据有助于提升模型的学习效果。而对于损失函数是否有必要直接修改为IC指标,我们经过多种测试,发现并没有带来显著的改善效果,使用MSE作为损失函数较为合适。最终,对于不同的决策树集成算法,我们经过对比发现引入了Drop out思想的DART模型超过了GBDT算法,能有效缓解模型可能存在的过拟合问题。

      改进后因子与策略效果

      最终,我们保持与原框架一致,使用GBDT和NN两大类模型分别在不同成分股上训练,得到了在样本外效果突出的因子。在沪深300上,因子IC均值10.98%,多头年化超额收益19.66%,多头超额最大回撤6.40%。在中证500上,因子IC均值与沪深300近似,为10.87%,多头年化超额收益率为12.93%。而在中证1000成分股上,因子表现尤其突出,IC均值15.14%,多头年化超额收益率23.48%,多头超额最大回撤3.12%。最终,我们结合交易实际,构建了基于各宽基指数的指数增强策略。其中,沪深300指数增强策略年化超额收益达到15.43%,超额最大回撤为2.87%。中证500指增策略年化超额收益20.50%,超额最大回撤8.39%。中证1000指增策略年化超额收益32.25%,超额最大回撤4.33%。

      风险提示

      1、以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在时效的风险。

      2、策略通过一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出现亏损。

      

    我要报错
    点击浏览报告原文
    数据加工,数据接口
    我要给此报告打分: (带*号为必填)
    相关阅读
    2024-04-23 金融工程 作者:高智威 15 页 分享者:扛**子
    2024-04-16 金融工程 作者:高智威,王小康 16 页 分享者:han****ng
    2024-04-16 金融工程 作者:高智威 12 页 分享者:dad****63
    2024-04-15 金融工程 作者:高智威 16 页 分享者:zhm****00
    关闭
    如果觉得报告不错,扫描二维码可分享给好友哦!
     将此篇报告分享给好友阅读(微信朋友圈,微信好友)
    小提示:分享到朋友圈可获赠积分哦!
    操作方法:打开微信,点击底部“发现”,使用“扫一扫”即可分享到微信朋友圈或发送给微信好友。
    *我要评分:

    为了完善报告评分体系,请在看完报告后理性打个分,以便我们以后为您展示更优质的报告。

    您也可以对自己点评与评分的报告在“我的云笔记”里进行复盘管理,方便您的研究与思考,培养良好的思维习惯。

    当前终端的在线人数: 79440
    温馨提示
    扫一扫,慧博手机终端下载!

    正在加载,请稍候...