强化学习在金融领域的应用的相关整理

0
回复
5552
查看
[复制链接]

34

主题

1

回帖

901

积分

超级版主

积分
901
来源: 2020-4-1 21:41:49 显示全部楼层 |阅读模式
本文整理了一些关于强化学习在金融领域的应用的中外文献、相关课程和网站以及github上的一些代码实现,希望对大家研究有所帮助。后期强化学习相关模块会在平台上线,敬请期待!

英文文献
  • 《用于日常股票交易的多代理Q-Learning方法》
    摘要:本文提出了一个新的股票交易框架,试图进一步提高基于强化学习的系统的绩效。所提出的方法包含多代理Q-Learning,允许他们通过定义合作执行股票定价和选择决策的必要角色来有效地划分和克服股票交易问题。此外,为了解决在考虑大量数据以获得股票价格之间的长期依赖性时的复杂性问题,本文提出了一种能够简洁地总结价格变化历史的表示方案。韩国股票市场的实验结果表明,拟议的交易框架在利润和风险管理方面优于其他替代方法培训的交易框架。
  • 《基于强化学习的股票价格预测》
    摘要:本文提出了一种应用强化学习的方法,适用于实际情境中各种交互的建模和学习,以及股票价格预测问题。TD(0)是一种仅从经验中学习的强化学习算法,并且通过人工神经网络进行函数逼近以学习状态值,每个状态值对应于给定时间的股票价格趋势。本文给出了基于韩国股票市场的实验结果,以评估该方法的性能。
  • 《用于股票交易的实用强化学习方法》
    摘要:本文使用强化学习的方法优化股票交易策略,从而最大化投资回报。 本文选择30只股票作为交易股票,将每日价格用于训练和交易市场环境,训练深度强化学习代理并获得适应性交易策略, 评估代理的业绩并与道琼斯工业平均指数和传统的最小方差投资组合分配策略进行比较,提出的深度强化学习方法在夏普比率和累积回报方面均优于两个基线。
  • 《用于金融信号表示和交易的深度直接强化学习》
    摘要: 本文尝试通过引入经常性深度神经网络(NN)来实现实时金融信号表示和交易。 本文的模型受到深度学习(DL)和强化学习(RL)两个与生物学相关的学习概念的启发。 在该框架中,DL部分自动感知信息特征学习的动态市场条件。 然后,RL模块与深层表示交互并做出交易决策以在未知环境中积累最终奖励。
  • 《用多代理强化学习优化做市商策略》
    摘要:本文将强化学习应用于优化做市的问题。 多代理强化学习框架用于最佳地放置导致成功交易的限价订单。 该框架由两个代理组成。 宏代理优化决定购买,出售或持有资产。 微代理优化限价订单中的限价订单。 本文的目的是表明强化学习是一种可行的策略,可以应用于金融市场这样复杂的环境,如做市。
  • 《用于金融市场的强化学习的Lipschitz扩展》
    摘要: 本文开发了一种新的拓扑结构,用于在金融市场框架下构建强化学习模型。 它基于公制空间中定义的奖励函数的Lipschitz类型扩展, 利用代表金融市场演变的动态系统的一些已知状态来模拟新的状态。这些新状态用于训练改善投资策略的学习模型。
  • 《基于新闻的交易策略》
    摘要: 本文设计了利用文本新闻的交易策略,用于在进入市场的新信息的基础上获得利润。本文提出了基于监督和强化学习的自动决策方法,展示了如何将基于新闻的数据纳入投资系统。
  • 《金融市场上的深度强化学习》
    摘要:本文了一种新的马尔可夫决策过程模型来捕捉金融交易市场,并且继续使用深度强化学习,使代理能够学习如何在任何市场中进行有利可图的交易,同时建议各种方法变化,并利用FMDP的独特表现来解决类似作品面临的主要挑战。
  • 《将金融交易作为游戏:一种深度强化学习方法》
    摘要:本文提出了一种适用于金融交易任务的马尔可夫决策过程(MDP)模型,并使用深度循环Q网络(DRQN)算法对其进行求解,并对现有的深度强化学习算法提出了两点修改:1.开发了一种动作增强技术,通过为代理提供所有动作的额外反馈信号来减少随机探索的需要。这使我们能够在学习过程中使用贪婪的政策。2.为递归神经网络训练采样了一个更长的序列,大大的缩短了训练时间。
  • 《修正用于Vasicek模型的Q-Learning》
    摘要:本文为Vasicek模型提出了修正Q-Learner,这是一种新的强化学习方法,可以限制QLBS中观察到的Q值过高估计,并将模拟扩展到恢复随机扩散过程。此外,这种方法使用数字函数来估计事件的未来概率,从而将财务应用的范围扩大到涉及时间序列的任何其他领域。
  • 《金融投资组合的无模型强化学习:简要概述》
    摘要:本文通过检查基于价值和基于政策的无模型强化学习的现有方法来解决投资组合优化问题。本文认识到了一些还未解决的关键问题,以及当今投资组合经理将无模型强化学习应用于其投资组合所面临的困难。
  • 《投资组合管理中的对抗性深层强化学习》
    摘要:本文在项目组合管理中实施了三种最先进的连续强化学习算法,深度确定性政策梯度(DDPG),近端政策优化(PPO)和政策梯度(PG)。本文在不同的设置下展示它们的性能,并在中国股票市场进行了密集的实验,实验结果表明PG在金融市场上比DDPG和PPO更受欢迎。本文还提出了一种所谓的对抗训练方法,它可以大大提高训练效率。基于这一修改,本文实验结果表明,基于Policy Gradient的代理可以胜过UCRP。
  • 《用于倒卖交易策略的多代理合作强化学习框架》
    摘要:本文提出了像金融领域的Open AI gym的环境和代理。本人还引入了基于混合算法的新强化学习框架,该算法利用监督学习和强化学习算法之间的关系,并使用有意义的观察结果,例如来自观察倒卖交易的经验的订单和结算数据。

中文文献
  • 摘要:近年来,金融交易问题已经成为强化学习领域的研究热点,特别是股票、外汇和期货等方面具有广泛的应用需求和学术研究意义。本文以金融领域常用的强化学习模型的发展为脉络,对交易系统、自适应算法、交易策略等方面的诸多研究成果进行了综述。最后讨论了强化学习在金融领域应用中存在的困难和挑战,并对今后强化学习交易系统发展趋势进行展望。
  • 摘要:本文构建了以深度强化学习为理论基础的股市投资策略模型,并通过实证数据验证了该模型的有效性,揭示了深度强化学习在股市投资策略构建的内在逻辑。这对投资者自动化投资模型构建、股市投资策略的构建、人工智能在金融投资领域的应用和提高投资者策略收益率都做出了有益的借鉴。
  • 摘要:本文选择使用强化学习的方法来改进BP神经网络的股票预测方法,提高系统的稳定性和精确度,使系统的泛化能力和自学习能力得到了提高,并且在其中结合了神经网络集成的算法,达到了较好的效果。
  • 摘要:本文将深度强化学习技术应用于投资组合管理,采用深度强化学习中的深度确定性策略梯度DDPG(Deep Deterministic Policy Gradient)算法,通过限制单只股票的投资权重,分散风险,并采用丢弃算法(Dropout),即在训练模型时随机丢弃节点,解决过拟合问题。以中国股市为例,选取16只中证100指数成分股作为风险资产进行实验。结果表明,本文基于深度强化学习方法构建的投资组合,在实验期间的价值增幅显著高于对照组(等权重组合),表明了本文方法的有效性。
  • 地球.jpg



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 免费注册
关注微信