LLM4RS

LLM4RS

将ChatGPT应用于推荐系统的实证研究

LLM4RS项目从信息检索角度评估了ChatGPT在推荐系统中的表现。研究对比了点式、配对式和列表式排序方法,发现ChatGPT在多个领域数据集上表现突出,其中列表式排序在成本和性能间达到最佳平衡。项目还探讨了ChatGPT解决冷启动问题和提供可解释推荐的潜力。LLM4RS提供了全面的评估框架、数据集和实验结果,为研究大语言模型在推荐系统中的应用提供了重要参考。

ChatGPT推荐系统排序策略大语言模型实验分析Github开源项目

概述

这是RecSys2023论文"揭示ChatGPT在推荐系统中的能力"的官方实现。[arXiv]

摘要: ChatGPT的首次亮相最近引起了自然语言处理界及其他领域的关注。现有研究表明,ChatGPT在一系列下游NLP任务中显示出显著改进,但ChatGPT在推荐方面的能力和局限性仍不清楚。在本研究中,我们旨在从信息检索(IR)的角度对ChatGPT的推荐能力进行实证分析,包括逐点、成对和列表式排序。为实现这一目标,我们将上述三种推荐策略重新制定为特定领域的提示格式。通过在来自不同领域的四个数据集上进行广泛实验,我们证明ChatGPT在所有三种排序策略中均优于其他大型语言模型。基于单位成本改进的分析,我们发现与逐点和成对排序相比,采用列表式排序的ChatGPT在成本和性能之间达到了最佳平衡。此外,ChatGPT还显示出缓解冷启动问题和可解释推荐的潜力。

LLM用于推荐任务的整体评估框架如下图所示:

<div align=center> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/e9d2c6be-8bce-422b-b87c-40730ed8a91d.jpg" height="300"/> </div>

不同LLM在四个不同领域数据集上的主要结果如下所示:

<div align=center> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/58ccf123-06db-4297-8d8e-73c0c505c00d.png" height="300"/> </div> <div align=center> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/482d4362-2bc8-4253-8980-eee46b2da1d1.jpg" height="140"/> </div>

快速开始

  • 有关数据集的详细信息,请查看文件data/readme.md

  • 有关相关工作和更多实验结果的详细信息,请查看文件assets/Supplemental_Material.pdf

  • 有关提示的详细信息,请查看文件assets/prompts.pdf

  • 有关原始结果的详细信息,请从此处下载

文件结构

. ├── data # * 数据路径 │ ├── Book │ ├── Movie │ ├── Music │ ├── News │ └── preprocess # * 用于预处理原始数据集的Jupyter笔记本文件夹 ├── result # * 用于保存请求、响应、结果和日志的文件夹 ├── script # * 用于保存脚本的文件夹 └── src # * 源代码 ├── api # * 访问API的代码 ├── postprocess # * 数据后处理的代码 └── preprocess # * 数据预处理的代码

使用方法

  1. 克隆此仓库。

    git clone https://github.com/rainym00d/LLM4RS.git
    
  2. 这里下载预处理好的数据。然后将它们放入data文件夹。(如果你想使用自己的数据,可以查看data/readme.md中的原始数据集链接,并参考我们在data/preprocess中的预处理代码。)

  3. 根据你自己的需求编辑script/run.py中的参数。(此代码可以批量执行,只需将参数写入一个列表即可。)

  4. 在项目的根目录下运行python script/run.py

  5. 检查result目录中的相应文件夹并记录实验结果。

示例

git clone https://github.com/rainym00d/LLM4RS.git cd LLM4RS # * 在运行此命令之前,你应该在script/run.py中填写自己的api-key。 python script/run.py
<details> <summary>run.py中的参数</summary>
- model - LLM的模型名称。 - 默认值:"text-davinci-003" - 选项:["text-davinci-002", "text-davinci-003", "gpt-3.5-turbo"] - domain - 领域名称。 - 默认值:"Movie" - 选项:["Movie", "Book", "Music", "News"] - task - 任务名称。 - 默认值:"list" - 选项:["point", "pair", "list"] - no_instruction - 是否使用指令。 - 默认值:False - 选项:[True, False] - example_num - 给模型的示例数量。 - 默认值:1 - 选项:[1, 2, 3, 4, 5] - begin_index - 数据的起始索引。 - 默认值:5 - 选项:大于4但小于数据大小的整数 - end_index - 数据的结束索引。 - 默认值:505 - 选项:大于`begin_index`但小于数据大小的整数 - api_key - 取决于你自己的openai账户的openai api-key。 - max_requests_per_minute - 每分钟最大请求数。 - 默认值:2000 - 选项:最大值取决于你自己的openai账户。 - max_tokens_per_minute - 每分钟最大令牌数。 - 默认值:10000 - 选项:最大值取决于你自己的openai账户。 - max_attempts - 每个请求的最大尝试次数。 - 默认值:10 - proxy - 你自己的代理。 - 默认值:None
</details>

依赖

本仓库有以下依赖要求。

python==3.9
aiohttp==3.8.4
pandas==1.5.3
tiktoken==0.3.0
xpflow==0.8

可以通过pip install -r requirements.txt安装所需的包。

引用

如果你发现我们的代码或工作对你的研究有用,请引用我们的工作。

@inproceedings{dai2023uncovering,
  title={揭示ChatGPT在推荐系统中的能力},
  author={戴孙浩 and 邵宁路 and 赵海源 and 于伟杰 and 司子华 and 徐晨 and 孙钟祥 and 张晓 and 徐军},
  booktitle={第17届ACM推荐系统会议论文集},
  year={2023}
}

联系方式

如果您有任何问题,请随时通过Github issues与我们联系。谢谢!

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

AI辅助写作AI工具AI论文工具论文写作智能生成大纲数据安全AI助手热门
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

AI办公办公工具AI工具博思AIPPTAI生成PPT智能排版海量精品模板AI创作热门
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多