rexmex

rexmex

推荐系统评估指标和报告工具库

rexmex是一个用于推荐系统评估的Python库,提供了全面的评估指标集合,涵盖排名、评分、分类和覆盖率等方面。该库集成了经典指标和最新数据挖掘研究成果,并提供报告生成和性能可视化功能。rexmex操作简便,适用于多种推荐系统场景,可帮助研究人员和开发者全面评估系统性能。

rexmex推荐系统评估指标机器学习开源库Github开源项目

版本 许可证 仓库大小 构建标志 代码覆盖率

<p align="center"> <img width="90%" src="https://yellow-cdn.veclightyear.com/0a4dffa0/31e3f37f-7471-4a48-a196-1ef781471051.jpg?raw=true?sanitize=true" /> </p>

reXmeX是一个推荐系统评估指标库。

请查看**文档外部资源**。

reXmeX包含了推荐系统评估的实用工具。首先,它提供了一个全面的推荐系统评估指标集合。其次,它包含了多种报告和绘制性能结果的方法。实现的指标涵盖了一系列知名指标和来自数据挖掘会议(ICDMCIKMKDD)及重要期刊的新提出指标。

引用

如果您在研究中发现RexMex有用,请考虑添加以下引用:

@inproceedings{rexmex, title = {{rexmex: A General Purpose Recommender Metrics Library for Fair Evaluation.}}, author = {Benedek Rozemberczki and Sebastian Nilsson and Piotr Grabowski and Charles Tapley Hoyt and Gavin Edwards}, year = {2021}, }

入门示例

以下示例加载了一个包含必需的y_truey_score键的合成数据集。该数据集有二元标签和预测概率分数。我们读取数据集并定义一个默认的ClassificationMetric实例来评估预测。使用这个指标集,我们创建一个评分卡并获取预测性能指标。

from rexmex import ClassificationMetricSet, DatasetReader, ScoreCard reader = DatasetReader() scores = reader.read_dataset() metric_set = ClassificationMetricSet() score_card = ScoreCard(metric_set) report = score_card.get_performance_metrics(scores["y_true"], scores["y_score"])

进阶示例

以下更高级的示例加载了相同的合成数据集,除了必需的y_truey_score外,还包含source_idtarget_idsource_grouptarget group键。使用source_group键,我们对预测进行分组并返回性能指标报告。

from rexmex import ClassificationMetricSet, DatasetReader, ScoreCard reader = DatasetReader() scores = reader.read_dataset() metric_set = ClassificationMetricSet() score_card = ScoreCard(metric_set) report = score_card.generate_report(scores, grouping=["source_group"])

评分卡

rexmex评分卡允许报告推荐系统性能指标,绘制性能指标图表并保存这些结果。我们的框架提供了7个评分、38个分类、18个排序和2个覆盖率指标。

指标集

指标集允许用户为标签-预测标签对计算一系列评估指标。我们提供了一个通用的MetricSet类和带有预设指标的专门指标集,具有以下一般类别:

  • 排序
  • 评分
  • 分类
  • 覆盖率

排序指标集

<details> <summary><b>展开查看指标集中的所有排序指标。</b></summary> </details>

评分指标集

这些指标假设项目被明确评分,并且评分由回归模型预测。

<details> <summary><b>展开查看指标集中的所有评分指标。</b></summary> </details>

分类指标集

这些指标假设项目使用原始概率进行评分(可以二值化)。

<details> <summary><b>展开查看指标集中的所有分类指标。</b></summary> </details>

覆盖率指标集

这些指标衡量推荐系统对目录中可用项目和可能用户的覆盖程度。换句话说,衡量预测的多样性。


文档和报告问题

访问我们的文档,了解更多关于安装和数据处理、已实现方法的完整列表以及数据集的信息。

如果您发现任何异常情况,请开启一个问题并告诉我们。如果您需要某个特定方法,请随时开启一个功能请求。 我们致力于不断改进RexMex。


通过命令行安装

克隆仓库后,可以使用以下命令安装RexMex。

$ pip install .

开发时使用 -e/--editable 选项。

通过pip安装

可以使用以下pip命令安装RexMex。

$ pip install rexmex

由于我们经常创建新版本,偶尔升级包可能会有所帮助。

$ pip install rexmex --upgrade

运行测试

可以使用 tox 运行测试,如下所示:

$ pip install tox $ tox -e py

引用

如果您在科学出版物中使用RexMex,我们将感谢您的引用。请参阅GitHub的内置引用工具。


许可证

编辑推荐精选

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

堆友

堆友

多风格AI绘画神器

堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

图像生成热门AI工具AI图像AI反应堆AI工具箱AI绘画GOAI艺术字堆友相机
码上飞

码上飞

零代码AI应用开发平台

零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具使用教程AI营销产品酷表ChatExcelAI智能客服
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

数据安全AI助手热门AI工具AI辅助写作AI论文工具论文写作智能生成大纲
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

热门AI工具AI办公办公工具智能排版AI生成PPT博思AIPPT海量精品模板AI创作
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

下拉加载更多