生成式推荐系统的革新:基于HSTU架构的万亿参数顺序转换器

RayRay
推荐系统深度学习HSTU序列模型性能基准Github开源项目

generative-recommenders

生成式推荐系统的新纪元

随着人工智能技术的不断进步,推荐系统正在经历一场革命性的变革。传统的推荐算法主要依赖用户-物品交互历史,而新兴的生成式模型则为推荐系统带来了全新的可能性。近日,Facebook Research团队提出的"Actions Speak Louder than Words: Trillion-Parameter Sequential Transducers for Generative Recommendations"(以下简称HSTU)项目,展示了生成式模型在推荐系统领域的巨大潜力。

HSTU架构:万亿参数的顺序转换器

HSTU是一种基于顺序转换器的生成式推荐模型,其核心特征是采用了万亿级参数规模。与传统的双编码器模型不同,HSTU采用单阶段范式,通过自回归方式直接解码目标候选项的标识符。这种创新性的设计使得HSTU能够更有效地捕捉用户行为序列中的复杂模式,从而生成更精准的推荐结果。

HSTU架构图

实验结果:显著超越现有方法

HSTU在多个公开数据集上的实验结果令人瞩目。以下是在MovieLens-1M、MovieLens-20M和亚马逊图书评论数据集上的部分实验结果:

MovieLens-1M (ML-1M):

方法HR@10NDCG@10HR@50NDCG@50HR@200NDCG@200
SASRec0.28530.16030.54740.21850.75280.2498
HSTU0.3097 (+8.6%)0.1720 (+7.3%)0.5754 (+5.1%)0.2307 (+5.6%)0.7716 (+2.5%)0.2606 (+4.3%)
HSTU-large0.3294 (+15.5%)0.1893 (+18.1%)0.5935 (+8.4%)0.2481 (+13.5%)0.7839 (+4.1%)0.2771 (+10.9%)

从表中可以看出,HSTU-large在所有评估指标上都显著优于基准模型SASRec,HR@10和NDCG@10分别提升了15.5%和18.1%。这一结果充分证明了HSTU在捕捉用户兴趣和生成精准推荐方面的卓越能力。

技术创新:语义ID和自回归生成

HSTU的核心创新之一是引入了"语义ID"概念。不同于传统方法使用随机生成的原子ID,HSTU为每个物品分配一个语义上有意义的代码词元组作为其唯一标识符。这种设计使得模型能够更好地理解物品之间的语义关系,从而生成更加个性化和相关的推荐。

另一个重要创新是采用自回归方式直接预测下一个物品的语义ID。这种端到端的生成式方法避免了传统两阶段检索过程中的信息损失,能够更准确地捕捉用户兴趣的动态变化。

开源与可复现性

为了促进学术交流和技术进步,Facebook Research团队已将HSTU项目的核心代码开源。研究者可以通过GitHub仓库获取代码,并按照详细的说明复现论文中的实验结果。这种开放的态度不仅有助于验证研究成果的可靠性,也为整个推荐系统社区提供了宝贵的学习资源。

GitHub仓库截图

未来展望:生成式推荐的广阔前景

HSTU的成功为生成式推荐系统开辟了新的研究方向。未来,我们可以期待在以下几个方面看到更多创新:

  1. 多模态融合:将文本、图像、视频等多种形式的信息整合到生成式推荐模型中。

  2. 可解释性增强:开发能够生成推荐理由的模型,提高用户对推荐结果的理解和信任。

  3. 个性化对话推荐:结合大型语言模型的强大对话能力,实现更自然、更个性化的推荐交互。

  4. 隐私保护:探索如何在保护用户隐私的前提下,充分利用生成式模型的优势。

  5. 计算效率优化:研究如何在保持模型性能的同时,降低计算资源需求,使生成式推荐更加适用于工业场景。

结语

HSTU项目的成功标志着生成式推荐系统研究进入了一个新的阶段。通过将深度学习、自然语言处理和推荐系统的最新进展相结合,HSTU为个性化推荐提供了更强大、更灵活的解决方案。随着这一领域的不断发展,我们有理由相信,生成式推荐系统将在未来彻底改变用户的在线体验,为信息获取和决策提供更智能、更人性化的支持。

编辑推荐精选

Pixmax

Pixmax

一站式AI短剧创作平台

Pixmax专注打造下一代“ AI 视觉创作引擎”,整合行业顶尖 AI 大模型、工工业级精准控制及企业级协同管理功能,是全方位的 AI 内容创作平台。

豆包

豆包

字节跳动旗下 AI 智能助手

字节跳动旗下 AI 智能助手

GPT Plus|Pro充值

GPT Plus|Pro充值

GPT充值

支持 ChatGPT Plus / Pro 充值服务,支付便捷,自动发货,售后可查。

GPT Image 2中文站

GPT Image 2中文站

AI 图片生成平台

GPT Image 2 是面向用户的 AI 图片生成平台,支持文生图、图生图及多模型创意工作流。

Vecbase

Vecbase

你的AI Agent团队

Vecbase 是专为 AI 团队打造的智能工作空间,将数据管理、模型协作与知识沉淀整合于一处。算法、产品与业务在同一平台无缝协同,让从数据到 AI 应用的落地更快一步。

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

下拉加载更多