alphagen

alphagen

强化学习驱动的自动化 Alpha 因子生成框架

AlphaGen 是一个基于强化学习的自动化 Alpha 因子生成框架。该项目提供内置 Alpha 计算管道和外部接口,支持 PPO 算法训练。AlphaGen 还实现了基于遗传规划和深度符号回归的基准方法,以及实验性交易策略。这一工具旨在为量化投资研究和实践提供 Alpha 因子自动生成和优化的解决方案。

AlphaGen强化学习因子生成量化投资机器学习Github开源项目

AlphaGen

<p align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/add3e9fd-ffc8-4968-b7f7-4505221598ed.jpg" width=275 /> </p>

使用强化学习自动生成公式化alpha。

论文《通过强化学习生成协同公式化Alpha集合》已被KDD 2023接收,应用数据科学(ADS)方向。

论文可在ACM数字图书馆arXiv上获取。

如何复现?

请注意,您可以选择使用我们内置的alpha计算流程(见选项1),或实现适配器以连接您自己的流程(见选项2)。

选项1:股票数据准备

内置流程需要Qlib库和本地存储的股票数据。

  • 请务必阅读!我们需要Qlib提供的部分元数据(但不包括实际的股票价格/交易量数据),因此请先按照Qlib的数据准备流程进行操作。
  • 我们使用的实际股票数据来自baostock,这是出于对Qlib使用的数据源的时效性和真实性的考虑。
  • 可以通过运行脚本data_collection/fetch_baostock_data.py来下载数据。默认情况下,新下载的数据保存在~/.qlib/qlib_data/cn_data_baostock_fwdadj中。可以根据具体需求自定义此路径,但请确保在加载数据时使用正确的路径(在alphagen_qlib/stock_data.py中,函数StockData._init_qlib中,应将路径传递给qlib,使用qlib.init(provider_uri=path))。

选项2:适配外部流程

如果您有更好的alpha计算实现,可以实现alphagen.data.calculator.AlphaCalculator的适配器。接口定义如下:

class AlphaCalculator(metaclass=ABCMeta): @abstractmethod def calc_single_IC_ret(self, expr: Expression) -> float: '计算单个alpha与预定义目标之间的IC。' @abstractmethod def calc_single_rIC_ret(self, expr: Expression) -> float: '计算单个alpha与预定义目标之间的Rank IC。' @abstractmethod def calc_single_all_ret(self, expr: Expression) -> Tuple[float, float]: '计算单个alpha与预定义目标之间的IC和Rank IC。' @abstractmethod def calc_mutual_IC(self, expr1: Expression, expr2: Expression) -> float: '计算两个alpha之间的IC。' @abstractmethod def calc_pool_IC_ret(self, exprs: List[Expression], weights: List[float]) -> float: '首先线性组合alpha,' '然后计算该线性组合与预定义目标之间的IC。' @abstractmethod def calc_pool_rIC_ret(self, exprs: List[Expression], weights: List[float]) -> float: '首先线性组合alpha,' '然后计算该线性组合与预定义目标之间的Rank IC。' @abstractmethod def calc_pool_all_ret(self, exprs: List[Expression], weights: List[float]) -> Tuple[float, float]: '首先线性组合alpha,' '然后计算该线性组合与预定义目标之间的IC和Rank IC。'

提醒:不同alpha评估的值可能有显著不同的尺度,我们建议在组合前对它们进行归一化。

运行前

我们实验的所有主要组件都位于train_maskable_ppo.py中。

以下参数可能有助于您构建AlphaCalculator

  • instruments(股票代码集合)
  • start_time和end_time(每个数据集的数据范围)
  • target(目标股票趋势,例如20天收益率)

以下参数将定义一次强化学习运行:

  • batch_size(PPO批量大小)
  • features_extractor_kwargs(LSTM共享网络的参数)
  • device(PyTorch设备)
  • save_path(检查点保存路径)
  • tensorboard_log(TensorBoard日志路径)

运行!

python train_maskable_ppo.py --seed=种子 --pool=池容量 --code=股票代码 --step=步数

其中,种子是随机种子,例如11,2池容量是组合模型的大小,步数是强化学习步骤的限制。

运行后

  • 模型检查点和alpha池位于save_path
  • Tensorboard日志位于tensorboard_log

基准方法

基于GP的方法

gplearn实现了遗传规划,这是符号回归常用的方法。我们维护了gplearn的修改版本,使其与我们的任务兼容。相应的实验脚本是gp.py

深度符号回归

DSO是一个成熟的深度学习框架,用于符号优化任务。我们维护了DSO的最小版本,使其与我们的任务兼容。相应的实验脚本是dso.py

仓库结构

  • /alphagen包含了启动alpha挖掘流程的基本数据结构和核心模块;
  • /alphagen_qlib包含了用于数据准备的qlib特定API;
  • /alphagen_generic包含了为我们的基准方法设计的数据结构和工具,基本上遵循gplearn的API,但针对量化流程进行了修改;
  • /gplearn/dso包含了我们基准方法的修改版本。

交易(实验性)

我们基于Qlib实现了一些交易策略。请参阅backtest.pytrade_decision.py获取演示。

引用我们的工作

@inproceedings{alphagen, author = {Yu, Shuo and Xue, Hongyan and Ao, Xiang and Pan, Feiyang and He, Jia and Tu, Dandan and He, Qing}, title = {Generating Synergistic Formulaic Alpha Collections via Reinforcement Learning}, year = {2023}, doi = {10.1145/3580305.3599831}, booktitle = {Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining}, }

贡献

欢迎提交问题或拉取请求。

贡献者

本工作由中国科学院计算技术研究所智能信息处理实验室的MLDM研究组维护。

维护者包括:

感谢以下贡献者:

感谢以下对我们项目进行深入研究的人:

  • 因子选股系列之九十五:DFQ强化学习因子组合挖掘系统

编辑推荐精选

商汤小浣熊

商汤小浣熊

最强AI数据分析助手

小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。

imini AI

imini AI

像人一样思考的AI智能体

imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。

Keevx

Keevx

AI数字人视频创作平台

Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。

即梦AI

即梦AI

一站式AI创作平台

提供 AI 驱动的图片、视频生成及数字人等功能,助力创意创作

扣子-AI办公

扣子-AI办公

AI办公助手,复杂任务高效处理

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
蛙蛙写作

蛙蛙写作

AI小说写作助手,一站式润色、改写、扩写

蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。

AI辅助写作AI工具蛙蛙写作AI写作工具学术助手办公助手营销助手AI助手
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
下拉加载更多