在当今数据驱动的商业环境中,准确的预测对于决策制定至关重要。然而,许多企业和组织面临的是具有层次结构的复杂时间序列数据,如产品类别、品牌或地理分组等。这就需要一种能够在不同层次之间保持一致性的预测方法。HierarchicalForecast应运而生,为解决这一挑战提供了强大的工具。
HierarchicalForecast是一个开源的Python库,专门用于分层时间序列预测。它提供了一系列reconciliation(协调)方法,可以确保不同层次的预测结果之间保持一致性。这个库的核心目标是为机器学习和统计建模领域提供可靠的基准和工具,促进分层预测研究的发展。

HierarchicalForecast提供了多种经典和创新的reconciliation方法:
经典方法:
替代方法:
概率一致性方法:
HierarchicalForecast旨在将统计和计量经济学方法与 机器学习技术结合起来。它为研究人员和实践者提供了一个平台,可以比较不同方法的性能,并开发新的算法。
该库集成了经过处理的公开数据集和各种评估指标,使得研究人员可以更容易地进行实验和比较不同方法的效果。
HierarchicalForecast提供了简洁的API,使用户可以轻松地应用各种reconciliation方法。同时,它的设计也考虑到了可扩展性,允许用户添加自定义的方法。
作为一个开源项目,HierarchicalForecast得到了活跃社区的支持。开发团队承诺持续维护和更新库,以适应不断发展的需求。
以下是一个简单的使用示例,展示了如何使用HierarchicalForecast进行预测和协调:
import numpy as np import pandas as pd from datasetsforecast.hierarchical import HierarchicalData from statsforecast.core import StatsForecast from statsforecast.models import AutoARIMA, Naive from hierarchicalforecast.core import HierarchicalReconciliation from hierarchicalforecast.methods import BottomUp, TopDown, MiddleOut # 加载数据 Y_df, S, tags = HierarchicalData.load('./data', 'TourismSmall') Y_df['ds'] = pd.to_datetime(Y_df['ds']) # 分割训练集和测试集 Y_test_df = Y_df.groupby('unique_id').tail(4) Y_train_df = Y_df.drop(Y_test_df.index) # 使用AutoARIMA进行基础预测 fcst = StatsForecast(df=Y_train_df, models=[AutoARIMA(season_length=4), Naive()], freq='Q', n_jobs=-1) Y_hat_df = fcst.forecast(h=4) # 使用不同的reconciliation方法 reconcilers = [ BottomUp(), TopDown(method='forecast_proportions'), MiddleOut(middle_level='Country/Purpose/State', top_down_method='forecast_proportions') ] hrec = HierarchicalReconciliation(reconcilers=reconcilers) Y_rec_df = hrec.reconcile(Y_hat_df=Y_hat_df, Y_df=Y_train_df, S=S, tags=tags)
这个例子展示了如何加载数据、进行基础预测,然后使用不同的reconciliation方法来协调预测结果。
HierarchicalForecast可以通过pip或conda安装:
pip install hierarchicalforecast
或
conda install -c conda-forge hierarchicalforecast
详细的文档和更多示例可以在HierarchicalForecast官方文档中找到。
HierarchicalForecast为分层时间序列预测提供了一个强大而灵活的解决方案。无论是研究人员还是实践者,都可以利用这个库来改进预测模型,确保不同层次的预测结果保持一致性。随着机器学习在时间序列预测领域的不断发展,HierarchicalForecast将继续发挥重要作用,推动这一领域的进步。
如果您正在处理复杂的分层时间序列数据,不妨尝试使用HierarchicalForecast。它可能会为您的预测任务带来新的洞察和改进。记得查看GitHub仓库以获取最新更新和贡献指南。让我们一起推动分层预测技术的发展,为更准确、更一致的决策提供支持。