list_of_recommender_systems

list_of_recommender_systems

推荐系统全面对比,开源、商业和学术解决方案

该文章全面梳理了各领域推荐系统,包括SaaS、开源、商业和学术解决方案。详细分析了Peerius、Universal Recommender等系统的特点和应用场景,并介绍了基准测试工具和媒体推荐应用。内容涵盖广泛,为研究和选择推荐系统提供了客观参考。

推荐系统机器学习开源软件SaaS算法Github开源项目

推荐系统列表

推荐系统(或推荐引擎)是有用且有趣的软件。我想比较不同的推荐系统,但找不到一个合适的列表,所以我创建了这个列表。请帮助我通过提交修正和补充来保持这篇文章的更新,可以提交拉取请求,或在Twitter上联系我 @grahamjenson

软件即服务(SaaS)推荐系统

SaaS推荐系统在开发过程中面临许多挑战,包括处理多租户、存储和处理海量数据,以及保护客户敏感数据等更软性的考虑。

使用SaaS推荐系统的好处是,你可以用较低的前期投入获得价值,它们通常有明确的集成路径供你使用,并且在你使用过程中提供持续的开发和改进。

SaaS推荐系统包括:

  1. Peerius 封闭的、面向产品和电子商务的实时和电子邮件推荐系统。活跃且看起来很有趣,但关于实际产品及其工作方式的信息很少。

  2. Strands 是一个封闭的、面向产品和电子商务的系统。我认为它通过在网站上包含跟踪脚本(类似Google Analytics)和推荐小部件来工作。我真正喜欢Strands的是他们发布的案例研究,例如Wireless Emporium和白皮书,如推荐系统的巨大前景。虽然这些不讨论具体的解决方案,但它们很好地概述了他们提供推荐的愿景和目标。

  3. SLI Systems Recommender 一个专注于电子商务、搜索和移动的封闭推荐系统。

  4. 在Google Cloud上使用Hadoop 使用Google云的一个示例,包含来自推荐系统的基准测试。

  5. ParallelDots 关联已发布内容的工具

  6. Amazon Machine Learning 用于建模数据和创建预测的机器学习平台

  7. Azure ML 用于建模数据和创建预测的机器学习平台

  8. Gravity R&D 是由2009年Netflix大奖的一些获奖者创立的公司。他们提供一个解决方案,为网站用户提供有针对性的、定制的推荐。他们有一些相当大的客户,包括DailyMotion,还有一个技术页面描述了他们的架构、算法和出版物列表。(由Marton Vetes提议)

  9. Dressipi Style Adviser 是一个特定于服装的推荐服务。它结合了专家领域知识和机器学习,为不同场合或心情找到合适的服装。

  10. Sajari 是一个搜索、推荐和匹配(例如约会网站)服务。在他们的网站上,他们还汇总了一堆有用的数据集

  11. IBM Watson 可通过Watson Developer Cloud获得,该云提供REST API(Watson APIs on Bluemix)和SDK,使用认知计算来解决复杂问题。

  12. Recombee 提供REST API、多种语言的SDK和用于评估结果的图形用户界面。主要特点是实时模型更新,易于使用的查询语言用于根据复杂的业务规则进行过滤和提升,以及获取多样化或轮换推荐等高级功能。Recombee提供即时账户,每月有10万次免费推荐请求。

  13. Segmentify 推荐引擎、个性化和实时分析工具。

  14. Mr. DLib 一个面向学术组织(如数字图书馆和参考文献管理器)的推荐系统即服务。Mr. DLib提供"相关文章"推荐,是开源的,并发布了大部分数据

  15. Rumo 是一个灵活的SaaS推荐系统,可适应所有娱乐行业(电影、音乐、播客、视频游戏、体育等),基于内容元数据和用户行为。Rumo的算法是透明和可解释的,提供对推荐过程的完全控制。

  16. Froomle 是一个模块化推荐平台,主要服务于新闻和电子商务公司。他们提供各种模块,针对其用例(例如发现或相关)、业务目标(例如CTR或转化)和集成类型(网络、邮件或推送通知)进行了优化。他们的模块在后台使用最先进的机器学习技术。

  17. Recommendations AI 大规模提供高度个性化的产品推荐。它是Google Cloud's Discovery Solutions for Retail的一部分,提供个性化搜索和推荐。

开源推荐系统

大多数非SaaS推荐系统都是开源的。这可能是因为推荐系统更多地是根据客户定制的,所以不容易做成产品。

开源推荐系统包括:

  1. The Universal Recommender 基于现代相关交叉发生算法构建,使用许多用户品味指标,因此可以针对大多数用例。源代码在github上,内置于Harness ML服务器中,或作为较旧的PredictionIO服务器的模板(评分最高的模板)。活跃且有商业支持。

  2. PredictionIO 建立在Apache SparkApache HBaseSpray技术之上。它是一个机器学习服务器,可用于创建推荐系统。源代码位于github。主要仓库已被废弃

  3. Raccoon Recommendation Engine 是一个开源的基于Node.js的协同过滤引擎,使用Redis作为存储。它实际上已被废弃。

  4. HapiGER 是一个开源的Node.js协同过滤引擎,可以使用内存、PostgreSQLrethinkdb。开发相当活跃(当我有时间时:)

  5. EasyRec 基于Java和Rest的推荐。已废弃

  6. Mahout 基于Hadoop/线性代数的数据挖掘

  7. Seldon 是一个基于Apache Spark等技术的Java预测引擎。它在这里提供了一个电影推荐演示应用。

  8. Oryx v2 一个用于机器学习和预测的大规模架构(由Lorand建议)

  9. RecDB 是PostgreSQL的一个扩展,可以直接在数据库中添加协同过滤等推荐算法。

  10. Crab 一个基于流行包NumPy、SciPy、matplotlib的python推荐器。主要仓库似乎已被废弃

  11. predictor 是一个ruby推荐gem。它使用Jaccard或Sorenson-Dice系数来提供以项目为中心的推荐(例如"阅读这本书的用户还阅读了...")和以用户为中心的推荐(例如"你读了这10本书,所以你可能还喜欢读...")。看起来有点被忽视。

  12. Surprise 一个用于构建和分析(协同过滤)推荐系统的Python scikit。内置了各种算法,重点是评分预测。

  13. LightFM 是一个积极开发的Python实现,包含多种基于协同和内容的学习排序推荐算法。使用Cython,它可以轻松扩展到多核机器上的非常大的数据集,并在LystCatalant等多家公司的生产中使用。

  14. Rexy 是一个基于通用用户-产品-标签概念的开源推荐系统,具有灵活的结构,设计为可适应不同的数据模式。Rexy用Python-3.5编写,采用高度优化、Pythonic和全面的方式,使其对变化非常灵活。它还使用Aerospike作为数据库引擎,这是一个高速、可扩展和可靠的NoSQL数据库。

  15. QMF 是一个快速且可扩展的C++库,用于隐式反馈矩阵分解模型。

  16. tensorrec 是一个Python中的TensorFlow推荐算法和框架。

  17. hermes 是PySpark中用于协同过滤和基于内容算法的推荐框架。主要仓库已被废弃

  18. Spotlight 在后端利用因子分解模型和序列模型来构建基本的推荐系统。这是一个实现良好的Python框架。

  19. Implicit 是一个用于隐式数据集的快速Python协同过滤工具。该项目为隐式反馈数据集提供了几种不同流行推荐算法的快速Python实现。

  20. recommenderlab 提供了一个研究基础设施来测试和开发推荐算法,包括UBCF、IBCF、FunkSVD和基于关联规则的算法。

  21. CaseRecommender 是多种流行推荐算法的Python实现。该框架旨在提供丰富的组件集,您可以从一组算法中构建定制的推荐系统。

  22. ProbQA 是一个C++/CUDA推荐系统,使用贝叶斯方法学习其问题的答案如何映射到正在搜索的目标的最佳推荐。在GitHub上,它提供了一个学习二分搜索算法的示例。它在互联网上作为引擎演示的视频游戏推荐系统应用可用。

  23. Microsoft Recommenders 包含用于构建推荐系统的示例、实用程序和最佳实践。提供了几种最先进算法的实现,用于自学和在自己的应用程序中定制。

  24. Gorse 是一个基于协同过滤的离线推荐系统后端,用Go编写。它实现了多种基于评分或排名的推荐器,以及从导入/导出工具到RESTful推荐服务器的多种工具。

  25. Nvidia Merlin 是一个端到端的基于GPU的推荐生态系统,由许多工具组成,如用于快速预处理/特征工程的[NVTabular](https://github.com/

  26. Yeah, Nah 基于GER的电影推荐应用

  27. Jinni 电影推荐网站

  28. Gyde 流媒体推荐

  29. TasteKid 电影、书籍、音乐推荐。thelinuxlich发送给我

  30. Gnoosic 基于乐队的音乐推荐。thelinuxlich发送给我

  31. Pandora 基于喜欢和不喜欢或歌曲的音乐推荐

  32. Criticker 游戏和电影协同推荐。ran88dom99建议

  33. movielens.org 由lenskit团队提供的终端用户电影和书籍推荐。ran88dom99建议

  34. 基于MAL仅相似用户推荐推荐 ran88dom99建议

  35. NewsPortalUserInteractions globo.com提供的用于新闻推荐的大型数据集 guedes-joaofelipe建议

  36. ContentWise 数字媒体娱乐的用户体验管理解决方案。GiovanniPaoloGibilisco建议

书籍

  1. 实用推荐系统 作者:Kim Falk (Manning出版社)。第1章
  2. 推荐系统手册 作者:Ricci, F.等人

最佳实践

  1. 推荐系统 微软提供的构建推荐系统的示例和最佳实践。

    常用数据集

名称场景任务信息链接
Amazon评论商务序列推荐/协同过滤推荐这是从Amazon爬取的大量产品评论。评分:8283万,用户:2098万,商品:935万,时间跨度:1996年5月 - 2014年7月链接
Amazon-M2商务序列推荐/协同过滤推荐从Amazon多语言来源收集的大型匿名用户会话数据集,包含用户与产品的交互。包括3,606,249个训练会话,361,659个测试会话和1,410,675个产品。链接 链接-2
Steam游戏序列推荐/协同过滤推荐评论代表了分析游戏满意度和不满意度因素的绝佳机会。评论:7,793,069,用户:2,567,538,商品:15,474,捆绑包:615链接
MovieLens电影通用该数据集由4个子数据集组成,描述了用户对MovieLens(一个电影推荐服务)的电影评分和自由文本标记活动。链接
Yelp商务通用包含6,990,280条评论,150,346家企业,200,100张图片,11个大都市地区,1,987,897名用户的908,915条提示。超过120万条商业属性,如营业时间、停车、可用性等。链接
豆瓣电影、音乐、图书序列推荐/协同过滤推荐该数据集包括三个领域,即电影、音乐和图书,以及不同类型的原始信息,即评分、评论、商品详情、用户资料、标签(标签)和日期。链接
MIND新闻通用MIND包含约16万篇英文新闻文章和超过1500万条由100万用户生成的浏览日志。每条新闻都包含标题、摘要、正文、类别和实体等文本内容。链接
U-NEED商务对话式推荐U-NEED包含7,698个细粒度注释的售前对话,333,879个用户行为和332,148个产品知识元组。链接
PixelRec短视频序列推荐/协同过滤推荐PixelRec是从短视频推荐系统收集的大型封面图像数据集,包含约2亿用户图像交互,3000万用户和40万视频封面图像。还包括视频的文本和其他聚合属性。链接
KuaiSAR视频搜索和推荐KuaiSAR包含快手应用上19天内25,877名用户、6,890,707个项目、453,667个查询和19,664,885个操作的真实搜索和推荐行为链接
Tenrec视频、文章通用Tenrec是一个大规模的推荐系统基准数据集。它包含约500万用户和1.4亿次交互。链接

这个链接包含了所有与推荐系统相关的数据集 - 链接

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多