股票交易已成为当今金融市场的主要内容,大多数交易现在已完全自动化。深度强化学习 (DRL) 智能体被证明是许多复杂游戏(如国际象棋和围棋)中不可忽视的力量。我们可以将股票市场的历史价格序列和变动视为一个复杂的不完善信息环境,在这个环境中我们试图最大化回报 - 利润并最小化风险。本文回顾了迄今为止在金融人工智能子领域深度强化学习方面取得的进展,更准确地说,是自动化低频量化股票交易。许多审查的研究只有在不切实际的环境中进行的实验和没有实时交易应用程序的概念验证理想。对于大多数工作,尽管与既定的基线策略相比,所有工作都显示出统计上的显着改善,但没有获得可观的盈利水平。此外,缺乏实时在线交易平台的实验测试,也缺乏建立在不同类型 DRL 或人类交易者上的代理之间的有意义的比较。我们得出结论,股票交易中的 DRL 在强大的假设下显示出与专业交易者相媲美的巨大适用潜力,但该研究仍处于发展的早期阶段。
Arxiv地址:https://arxiv.org/pdf/2106.00123.pdf