Orbit: 一款强大的贝叶斯时间序列预测Python库

Orbit:用于贝叶斯时间序列预测的Python库

在当今数据驱动的世界中,准确的时间序列预测对于各行各业的决策制定都至关重要。无论是预测销售额、估计需求还是分析趋势,时间序列分析都是一个强大的工具。然而,传统的时间序列方法往往缺乏不确定性量化的能力。这就是Orbit库的用武之地。

Orbit简介

Orbit是由Uber开发的一个开源Python库,专门用于贝叶斯时间序列预测和推断。它的目标是为数据科学家和分析师提供一个强大而灵活的工具,用于处理复杂的时间序列问题。Orbit结合了贝叶斯方法的稳健性和现代机器学习技术的可扩展性,为用户提供了一个全面的时间序列分析解决方案。

Orbit banner

Orbit的核心特性

直观的接口: Orbit提供了一个熟悉的初始化-拟合-预测接口,使得即使是贝叶斯方法的新手也能轻松上手。
多种模型支持: 目前,Orbit支持以下几种具体模型实现:
- 指数平滑(ETS)
- 局部全局趋势(LGT)
- 阻尼局部趋势(DLT)
- 基于内核的时间回归(KTR)
灵活的估计方法: Orbit支持多种采样和优化方法用于模型估计和推断:
- 马尔可夫链蒙特卡罗(MCMC)作为完全采样方法
- 最大后验概率(MAP)作为点估计方法
- 变分推断(VI)作为近似分布上的混合采样方法
概率编程后端: Orbit在底层利用概率编程语言(如PyMC3和Stan)来实现贝叶斯推断,为用户提供了强大的统计能力。
可视化工具: Orbit提供了丰富的诊断和可视化工具,帮助用户理解模型性能和预测结果。

安装Orbit

Orbit可以通过多种方式安装:

使用pip从PyPI安装稳定版本:

pip install orbit-ml

从源代码安装:

git clone https://github.com/uber/orbit.git
cd orbit
pip install -r requirements.txt
pip install .

使用conda从conda-forge通道安装:

conda install -c conda-forge orbit-ml

快速开始:使用阻尼局部趋势(DLT)模型

让我们通过一个简单的例子来展示Orbit的使用方法。我们将使用阻尼局部趋势(DLT)模型来预测失业保险申请数据。

from orbit.utils.dataset import load_iclaims
from orbit.models import DLT
from orbit.diagnostics.plot import plot_predicted_data

# 加载对数转换后的数据
df = load_iclaims()

# 训练测试集分割
test_size = 52
train_df = df[:-test_size]
test_df = df[-test_size:]

# 初始化和拟合模型
dlt = DLT(
  response_col='claims', date_col='week',
  regressor_col=['trend.unemploy', 'trend.filling', 'trend.job'],
  seasonality=52,
)
dlt.fit(df=train_df)

# 预测
predicted_df = dlt.predict(df=test_df)

# 可视化结果
plot_predicted_data(
  training_actual_df=train_df, predicted_df=predicted_df,
  date_col=dlt.date_col, actual_col=dlt.response_col,
  test_actual_df=test_df
)