使用强化学习自动生成公式化alpha。
论文《通过强化学习生成协同公式化Alpha集合》已被KDD 2023接收,应用数据科学(ADS)方向。
请注意,您可以选择使用我们内置的alpha计算流程(见选项1),或实现适配器以连接您自己的流程(见选项2)。
内置流程需要Qlib库和本地存储的股票数据。
data_collection/fetch_baostock_data.py来下载数据。默认情况下,新下载的数据保存在~/.qlib/qlib_data/cn_data_baostock_fwdadj中。可以根据具体需求自定义此路径,但请确保在加载数据时使用正确的路径(在alphagen_qlib/stock_data.py中,函数StockData._init_qlib中,应将路径传递给qlib,使用qlib.init(provider_uri=path))。如果您有更好的alpha计算实现,可以实现alphagen.data.calculator.AlphaCalculator的适配器。接口定义如下:
class AlphaCalculator(metaclass=ABCMeta): @abstractmethod def calc_single_IC_ret(self, expr: Expression) -> float: '计算单个alpha与预定义目标之间的IC。' @abstractmethod def calc_single_rIC_ret(self, expr: Expression) -> float: '计算单个alpha与预定义目标之间的Rank IC。' @abstractmethod def calc_single_all_ret(self, expr: Expression) -> Tuple[float, float]: '计算单个alpha与预定义目标之间的IC和Rank IC。' @abstractmethod def calc_mutual_IC(self, expr1: Expression, expr2: Expression) -> float: '计算两个alpha之间的IC。' @abstractmethod def calc_pool_IC_ret(self, exprs: List[Expression], weights: List[float]) -> float: '首先线性组合alpha,' '然后计算该线性组合与预定义目标之间的IC。' @abstractmethod def calc_pool_rIC_ret(self, exprs: List[Expression], weights: List[float]) -> float: '首先线性组合alpha,' '然后计算该线性组合与预定义目标之间的Rank IC。' @abstractmethod def calc_pool_all_ret(self, exprs: List[Expression], weights: List[float]) -> Tuple[float, float]: '首先线性组合alpha,' '然后计算该线性组合与预定义目标之间的IC和Rank IC。'
提醒:不同alpha评估的值可能有显著不同的尺度,我们建议在组合前对它们进行归一化。
我们实验的所有主要组件都位于train_maskable_ppo.py中。
以下参数可能有助于您构建AlphaCalculator:
以下参数将定义一次强化学习运行:
python train_maskable_ppo.py --seed=种子 --pool=池容量 --code=股票代码 --step=步数
其中,种子是随机种子,例如1或1,2,池容量是组合模型的大小,步数是强化学习步骤的限制。
save_path;
tensorboard_log。gplearn实现了遗传规划,这是符号回归常用的方法。我们维护了gplearn的修改版本,使其与我们的任务兼容。相应的实验 脚本是gp.py
DSO是一个成熟的深度学习框架,用于符号优化任务。我们维护了DSO的最小版本,使其与我们的任务兼容。相应的实验脚本是dso.py
/alphagen包含了启动alpha挖掘流程的基本数据结构和核心模块;/alphagen_qlib包含了用于数据准备的qlib特定API;/alphagen_generic包含了为我们的基准方法设计的数据结构和工具,基本上遵循gplearn的API,但针对量化流程进行了修改;/gplearn和/dso包含了我们基准方法的修改版本。我们基于Qlib实现了一些交易策略。请参阅backtest.py和trade_decision.py获取演示。
@inproceedings{alphagen, author = {Yu, Shuo and Xue, Hongyan and Ao, Xiang and Pan, Feiyang and He, Jia and Tu, Dandan and He, Qing}, title = {Generating Synergistic Formulaic Alpha Collections via Reinforcement Learning}, year = {2023}, doi = {10.1145/3580305.3599831}, booktitle = {Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining}, }
欢迎提交问题或拉取请求。
本工作由中国科学院计算技术研究所智能信息处理实验室的MLDM研究组维护。
维护者包括:
感谢以下贡献者:
感谢以下对我们项目进行深入研究的人:


全球首个AI音乐社区
音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。


阿里Qoder团队推出的桌面端AI智能体
QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。


一站式搞定所有学习需求
不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。


为AI短剧协作而生
专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。


能听懂你表达的视频模型
Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。


国内直接访问,限时3折
输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动


职场AI,就用扣子
AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!


多风格AI绘画神器
堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。


零代码AI应用开发平台
零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号