Orion

Orion

开源无监督时间序列异常检测库

Orion是MIT数据到AI实验室开发的开源库,专注于无监督时间序列异常检测。该项目提供多个验证过的机器学习管道,能够识别时间序列数据中的异常模式。Orion集成了自动机器学习工具,支持AER、TadGAN等算法,并提供完善的文档、教程和基准测试。兼容Python 3.8-3.11版本,可通过pip轻松安装。适用于需要进行时间序列分析的研究人员和开发者。

Orion时间序列异常检测机器学习库无监督学习AI实验室Github开源项目
<p align="left"> <img width=15% src="https://dai.lids.mit.edu/wp-content/uploads/2018/06/Logo_DAI_highres.png" alt="DAI-Lab" /> <i>麻省理工学院数据与人工智能实验室的开源项目。</i> </p> <p align="left"> <img width=20% src="https://dai.lids.mit.edu/wp-content/uploads/2018/08/orion.png" alt="Orion" /> </p>

开发状态 Python PyPi Shield 测试 下载量 Binder

Orion

一个用于无监督时间序列异常检测的机器学习库。

重要链接
:computer: 网站查看Sintel网站以获取有关该项目的更多信息。
:book: 文档快速入门、用户和开发指南以及API参考。
:star: 教程查看我们的notebooks
:octocat: 代码库该库的Github仓库链接。
:scroll: 许可证该仓库以MIT许可证发布。
社区加入我们的Slack工作空间,获取公告和参与讨论。

概述

Orion是一个为无监督时间序列异常检测而构建的机器学习库。对于给定的时间序列数据,我们提供了多个"经过验证的"ML管道(即Orion管道),用于识别罕见模式并将其标记以供专家审查。

该库使用了麻省理工学院数据与人工智能实验室开发的多种自动机器学习工具。

阅读一个博客系列,了解如何在纽约出租车数据集上使用Orion管道:

第1部分:了解无监督时间序列异常检测第2部分:了解我们如何使用GANs解决问题?第3部分:如何评估异常检测管道?

Notebooks: 通过启动我们的notebooks在colab中探索Orion

快速入门

使用pip安装

安装Orion最简单和推荐的方法是使用pip

pip install orion-ml

这将从PyPi获取并安装最新的稳定版本。

在以下示例中,我们将展示如何使用Orion管道之一。

拟合Orion管道

我们将为此示例加载演示数据:

from orion.data import load_signal train_data = load_signal('S-1-train') train_data.head()

这应该显示一个包含timestampvalue的信号。

    timestamp     value
0  1222819200 -0.366359
1  1222840800 -0.394108
2  1222862400  0.403625
3  1222884000 -0.362759
4  1222905600 -0.370746

在这个例子中,我们使用aer管道并设置一些超参数(在这种情况下,训练epochs为5)。

from orion import Orion hyperparameters = { 'orion.primitives.aer.AER#1': { 'epochs': 5, 'verbose': True } } orion = Orion( pipeline='aer', hyperparameters=hyperparameters ) orion.fit(train_data)

使用拟合的管道检测异常

一旦拟合完成,我们就可以使用它来检测传入时间序列中的异常:

new_data = load_signal('S-1-new') anomalies = orion.detect(new_data)

:warning: 根据你的系统和可能安装的确切版本,可能会打印一些警告。这些可以安全地忽略,因为它们不会干扰管道的正常行为。

上述命令的输出将是一个包含检测到的异常表格的pandas.DataFrame

        start         end  severity
0  1402012800  1403870400  0.122539

排行榜

在每个版本中,我们都会运行Orion基准测试。我们维护一个最新的排行榜,根据基准测试程序显示经过验证的管道的当前评分。

我们在12个已知真实情况的数据集上运行基准测试。我们记录每个管道在每个数据集上的得分。为了计算排行榜表格,我们展示了每个管道相对于ARIMA管道的胜利次数。

管道优于ARIMA
AER11
TadGAN7
LSTM动态阈值8
LSTM自编码器7
密集自编码器7
VAE6
LNN7
矩阵剖面5
GANF5
Azure0

您可以在详细Google表格文档中找到每个管道在每个信号上的得分记录。总结结果也可以在以下摘要Google表格文档中浏览。

资源

可能感兴趣的其他资源:

引用

如果您在研究中使用AER,请考虑引用以下论文:

Lawrence Wong, Dongyu Liu, Laure Berti-Equille, Sarah Alnegheimish, Kalyan Veeramachaneni. AER: 用于时间序列异常检测的回归自编码器

@inproceedings{wong2022aer,
  title={AER: 用于时间序列异常检测的回归自编码器},
  author={Wong, Lawrence and Liu, Dongyu and Berti-Equille, Laure and Alnegheimish, Sarah and Veeramachaneni, Kalyan},
  booktitle={2022 IEEE国际大数据会议(IEEE BigData)},
  pages={1152-1161},
  doi={10.1109/BigData55660.2022.10020857},
  organization={IEEE},
  year={2022}
}

如果您在研究中使用TadGAN,请考虑引用以下论文:

Alexander Geiger, Dongyu Liu, Sarah Alnegheimish, Alfredo Cuesta-Infante, Kalyan Veeramachaneni. TadGAN - 使用生成对抗网络的时间序列异常检测

@inproceedings{geiger2020tadgan,
  title={TadGAN: 使用生成对抗网络的时间序列异常检测},
  author={Geiger, Alexander and Liu, Dongyu and Alnegheimish, Sarah and Cuesta-Infante, Alfredo and Veeramachaneni, Kalyan},
  booktitle={2020 IEEE国际大数据会议(IEEE BigData)},
  pages={33-43},
  doi={10.1109/BigData50022.2020.9378139},
  organization={IEEE},
  year={2020}
}

如果您在研究中使用作为Sintel生态系统一部分的Orion,请考虑引用以下论文:

Sarah Alnegheimish, Dongyu Liu, Carles Sala, Laure Berti-Equille, Kalyan Veeramachaneni. Sintel:从信号中提取洞察的机器学习框架

@inproceedings{alnegheimish2022sintel,
  title={Sintel:从信号中提取洞察的机器学习框架},
  author={Alnegheimish, Sarah and Liu, Dongyu and Sala, Carles and Berti-Equille, Laure and Veeramachaneni, Kalyan},  
  booktitle={2022年数据管理国际会议论文集},
  pages={1855–1865},
  numpages={11},
  publisher={计算机协会},
  doi={10.1145/3514221.3517910},
  series={SIGMOD '22},
  year={2022}
}

编辑推荐精选

商汤小浣熊

商汤小浣熊

最强AI数据分析助手

小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。

imini AI

imini AI

像人一样思考的AI智能体

imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。

Keevx

Keevx

AI数字人视频创作平台

Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。

即梦AI

即梦AI

一站式AI创作平台

提供 AI 驱动的图片、视频生成及数字人等功能,助力创意创作

扣子-AI办公

扣子-AI办公

AI办公助手,复杂任务高效处理

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
蛙蛙写作

蛙蛙写作

AI小说写作助手,一站式润色、改写、扩写

蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。

AI辅助写作AI工具蛙蛙写作AI写作工具学术助手办公助手营销助手AI助手
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
下拉加载更多