• 顶部广告
当前位置: 主页 > 详细介绍 >
资讯信息

基于强化学习算法的期指间长期均衡策略研究

2025.07.15点击:

摘要:本文基于沪深300、上证50和中证500指数对应的股指期货5分钟高频数据,研究其长期均衡策略。在部分可观测马尔可夫决策过程框架下,改进近端策略优化(PPO)算法。通过构建包含价格、波动率与流动性因子的24维状态空间,建立市场微观结构与强化学习决策的映射关系。引入波动率自适应的动态裁剪机制,以提升策略的稳定性,并构建融合条件风险价值约束的混合奖励函数,从而为金融交易中的强化学习应用提供新的算法框架。

关键词: 强化学习;动态风险控制;跨品种套利;状态空间;动作空间;

DOI: 10.13768/j.cnki.cn11-3793/f.2025.0596

专辑: 经济与管理科学;信息科技

专题: 自动化技术;金融;证券;投资

分类号: TP181;F832.5

企业改革与管理 | 往期杂志 | 收录文章 | 投稿须知 | 联系我们 | 网站地图
主管单位:首钢集团有限公司 主办单位:首钢集团有限公司 国际标准刊号ISSN:1007-1210 国内统一刊号 CN:11-3793/F
企业改革与管理杂志社版权所有@||本站仅作组稿宣传非社网