Orion

Orion

开源无监督时间序列异常检测库

Orion是MIT数据到AI实验室开发的开源库,专注于无监督时间序列异常检测。该项目提供多个验证过的机器学习管道,能够识别时间序列数据中的异常模式。Orion集成了自动机器学习工具,支持AER、TadGAN等算法,并提供完善的文档、教程和基准测试。兼容Python 3.8-3.11版本,可通过pip轻松安装。适用于需要进行时间序列分析的研究人员和开发者。

Orion时间序列异常检测机器学习库无监督学习AI实验室Github开源项目
<p align="left"> <img width=15% src="https://dai.lids.mit.edu/wp-content/uploads/2018/06/Logo_DAI_highres.png" alt="DAI-Lab" /> <i>麻省理工学院数据与人工智能实验室的开源项目。</i> </p> <p align="left"> <img width=20% src="https://dai.lids.mit.edu/wp-content/uploads/2018/08/orion.png" alt="Orion" /> </p>

开发状态 Python PyPi Shield 测试 下载量 Binder

Orion

一个用于无监督时间序列异常检测的机器学习库。

重要链接
:computer: 网站查看Sintel网站以获取有关该项目的更多信息。
:book: 文档快速入门、用户和开发指南以及API参考。
:star: 教程查看我们的notebooks
:octocat: 代码库该库的Github仓库链接。
:scroll: 许可证该仓库以MIT许可证发布。
社区加入我们的Slack工作空间,获取公告和参与讨论。

概述

Orion是一个为无监督时间序列异常检测而构建的机器学习库。对于给定的时间序列数据,我们提供了多个"经过验证的"ML管道(即Orion管道),用于识别罕见模式并将其标记以供专家审查。

该库使用了麻省理工学院数据与人工智能实验室开发的多种自动机器学习工具。

阅读一个博客系列,了解如何在纽约出租车数据集上使用Orion管道:

第1部分:了解无监督时间序列异常检测第2部分:了解我们如何使用GANs解决问题?第3部分:如何评估异常检测管道?

Notebooks: 通过启动我们的notebooks在colab中探索Orion

快速入门

使用pip安装

安装Orion最简单和推荐的方法是使用pip

pip install orion-ml

这将从PyPi获取并安装最新的稳定版本。

在以下示例中,我们将展示如何使用Orion管道之一。

拟合Orion管道

我们将为此示例加载演示数据:

from orion.data import load_signal train_data = load_signal('S-1-train') train_data.head()

这应该显示一个包含timestampvalue的信号。

    timestamp     value
0  1222819200 -0.366359
1  1222840800 -0.394108
2  1222862400  0.403625
3  1222884000 -0.362759
4  1222905600 -0.370746

在这个例子中,我们使用aer管道并设置一些超参数(在这种情况下,训练epochs为5)。

from orion import Orion hyperparameters = { 'orion.primitives.aer.AER#1': { 'epochs': 5, 'verbose': True } } orion = Orion( pipeline='aer', hyperparameters=hyperparameters ) orion.fit(train_data)

使用拟合的管道检测异常

一旦拟合完成,我们就可以使用它来检测传入时间序列中的异常:

new_data = load_signal('S-1-new') anomalies = orion.detect(new_data)

:warning: 根据你的系统和可能安装的确切版本,可能会打印一些警告。这些可以安全地忽略,因为它们不会干扰管道的正常行为。

上述命令的输出将是一个包含检测到的异常表格的pandas.DataFrame

        start         end  severity
0  1402012800  1403870400  0.122539

排行榜

在每个版本中,我们都会运行Orion基准测试。我们维护一个最新的排行榜,根据基准测试程序显示经过验证的管道的当前评分。

我们在12个已知真实情况的数据集上运行基准测试。我们记录每个管道在每个数据集上的得分。为了计算排行榜表格,我们展示了每个管道相对于ARIMA管道的胜利次数。

管道优于ARIMA
AER11
TadGAN7
LSTM动态阈值8
LSTM自编码器7
密集自编码器7
VAE6
LNN7
矩阵剖面5
GANF5
Azure0

您可以在详细Google表格文档中找到每个管道在每个信号上的得分记录。总结结果也可以在以下摘要Google表格文档中浏览。

资源

可能感兴趣的其他资源:

引用

如果您在研究中使用AER,请考虑引用以下论文:

Lawrence Wong, Dongyu Liu, Laure Berti-Equille, Sarah Alnegheimish, Kalyan Veeramachaneni. AER: 用于时间序列异常检测的回归自编码器

@inproceedings{wong2022aer,
  title={AER: 用于时间序列异常检测的回归自编码器},
  author={Wong, Lawrence and Liu, Dongyu and Berti-Equille, Laure and Alnegheimish, Sarah and Veeramachaneni, Kalyan},
  booktitle={2022 IEEE国际大数据会议(IEEE BigData)},
  pages={1152-1161},
  doi={10.1109/BigData55660.2022.10020857},
  organization={IEEE},
  year={2022}
}

如果您在研究中使用TadGAN,请考虑引用以下论文:

Alexander Geiger, Dongyu Liu, Sarah Alnegheimish, Alfredo Cuesta-Infante, Kalyan Veeramachaneni. TadGAN - 使用生成对抗网络的时间序列异常检测

@inproceedings{geiger2020tadgan,
  title={TadGAN: 使用生成对抗网络的时间序列异常检测},
  author={Geiger, Alexander and Liu, Dongyu and Alnegheimish, Sarah and Cuesta-Infante, Alfredo and Veeramachaneni, Kalyan},
  booktitle={2020 IEEE国际大数据会议(IEEE BigData)},
  pages={33-43},
  doi={10.1109/BigData50022.2020.9378139},
  organization={IEEE},
  year={2020}
}

如果您在研究中使用作为Sintel生态系统一部分的Orion,请考虑引用以下论文:

Sarah Alnegheimish, Dongyu Liu, Carles Sala, Laure Berti-Equille, Kalyan Veeramachaneni. Sintel:从信号中提取洞察的机器学习框架

@inproceedings{alnegheimish2022sintel,
  title={Sintel:从信号中提取洞察的机器学习框架},
  author={Alnegheimish, Sarah and Liu, Dongyu and Sala, Carles and Berti-Equille, Laure and Veeramachaneni, Kalyan},  
  booktitle={2022年数据管理国际会议论文集},
  pages={1855–1865},
  numpages={11},
  publisher={计算机协会},
  doi={10.1145/3514221.3517910},
  series={SIGMOD '22},
  year={2022}
}

编辑推荐精选

TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
蛙蛙写作

蛙蛙写作

AI小说写作助手,一站式润色、改写、扩写

蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。

AI辅助写作AI工具蛙蛙写作AI写作工具学术助手办公助手营销助手AI助手
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

下拉加载更多