使用强化学习自动生成公式化alpha。
论文《通过强化学习生成协同公式化Alpha集合》已被KDD 2023接收,应用数据科学(ADS)方向。
请注意,您可以选择使用我们内置的alpha计算流程(见选项1),或实现适配器以连接您自己的流程(见选项2)。
内置流程需要Qlib库和本地存储的股票数据。
data_collection/fetch_baostock_data.py来下载数据。默认情况下,新下载的数据保存在~/.qlib/qlib_data/cn_data_baostock_fwdadj中。可以根据具体需求自定义此路径,但请确保在加载数据时使用正确的路径(在alphagen_qlib/stock_data.py中,函数StockData._init_qlib中,应将路径传递给qlib,使用qlib.init(provider_uri=path))。如果您有更好的alpha计算实现,可以实现alphagen.data.calculator.AlphaCalculator的适配器。接口定义如下:
class AlphaCalculator(metaclass=ABCMeta): @abstractmethod def calc_single_IC_ret(self, expr: Expression) -> float: '计算单个alpha与预定义目标之间的IC。' @abstractmethod def calc_single_rIC_ret(self, expr: Expression) -> float: '计算单个alpha与预定义目标之间的Rank IC。' @abstractmethod def calc_single_all_ret(self, expr: Expression) -> Tuple[float, float]: '计算单个alpha与预定义目标之间的IC和Rank IC。' @abstractmethod def calc_mutual_IC(self, expr1: Expression, expr2: Expression) -> float: '计算两个alpha之间的IC。' @abstractmethod def calc_pool_IC_ret(self, exprs: List[Expression], weights: List[float]) -> float: '首先线性组合alpha,' '然后计算该线性组合与预定义目标之间的IC。' @abstractmethod def calc_pool_rIC_ret(self, exprs: List[Expression], weights: List[float]) -> float: '首先线性组合alpha,' '然后计算该线性组合与预定义目标之间的Rank IC。' @abstractmethod def calc_pool_all_ret(self, exprs: List[Expression], weights: List[float]) -> Tuple[float, float]: '首先线性组合alpha,' '然后计算该线性组合与预定义目标之间的IC和Rank IC。'
提醒:不同alpha评估的值可能有显著不同的尺度,我们建议在组合前对它们进行归一化。
我们实验的所有主要组件都位于train_maskable_ppo.py中。
以下参数可能有助于您构建AlphaCalculator:
以下参数将定义一次强化学习运行:
python train_maskable_ppo.py --seed=种子 --pool=池容量 --code=股票代码 --step=步数
其中,种子是随机种子,例如1或1,2,池容量是组合模型的大小,步数是强化学习步骤的限制。
save_path;
tensorboard_log。gplearn实现了遗传规划,这是符号回归常用的方法。我们维护了gplearn的修改版本,使其与我们的任务兼容。相应的实验 脚本是gp.py
DSO是一个成熟的深度学习框架,用于符号优化任务。我们维护了DSO的最小版本,使其与我们的任务兼容。相应的实验脚本是dso.py
/alphagen包含了启动alpha挖掘流程的基本数据结构和核心模块;/alphagen_qlib包含了用于数据准备的qlib特定API;/alphagen_generic包含了为我们的基准方法设计的数据结构和工具,基本上遵循gplearn的API,但针对量化流程进行了修改;/gplearn和/dso包含了我们基准方法的修改版本。我们基于Qlib实现了一些交易策略。请参阅backtest.py和trade_decision.py获取演示。
@inproceedings{alphagen, author = {Yu, Shuo and Xue, Hongyan and Ao, Xiang and Pan, Feiyang and He, Jia and Tu, Dandan and He, Qing}, title = {Generating Synergistic Formulaic Alpha Collections via Reinforcement Learning}, year = {2023}, doi = {10.1145/3580305.3599831}, booktitle = {Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining}, }
欢迎提交问题或拉取请求。
本工作由中国科学院计算技术研究所智能信息处理实验室的MLDM研究组维护。
维护者包括:
感谢以下贡献者:
感谢以下对我们项目进行深入研究的人:


AI赋能电商视觉革命,一站式智能商拍平台
潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。


企业专属的AI法律顾问
iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。


稳定高效的流量提升解决方案,助力品牌曝光
稳定高效的流量提升解决方案,助力品牌曝光


最新版Sora2模型免费使用,一键生成无水印视频
最新版Sora2模型免费使用,一键生成无水印视频


实时语音翻译/同声传译工具
Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。


选题、配图、成文,一站式创作,让内容运营更高效
讯飞绘文,一个AI集 成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。


AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

