Awesome-System-for-Machine-Learning

Awesome-System-for-Machine-Learning

机器学习系统研究资源汇总

此项目汇集了机器学习系统研究的丰富资源,包括数据处理、训练系统和推理系统的开源代码与论文。项目由专门团队维护并定期更新,提供书籍、视频、课程和博客等学习材料,还推荐多篇系统设计的必读白皮书和研究论文,适合各个学习阶段。

Machine LearningAI系统分布式计算大数据自动化机器学习Github开源项目

S维护 S提交活动 S最后提交 S问我任何问题! S太棒了 SGitHub许可证 SGitHub星星

极棒的机器学习/LLM系统

💫💫💫 更新:我们正在为这个仓库准备一个新网站 Let's Go AI!💫💫💫

通往AI系统的路径 [必读白皮书]

一个精挑细选的机器学习系统研究列表。如果有代码链接也会提供。现在我们有一个团队来维护这个项目。非常欢迎您使用我们的模板提交请求

AI系统

AI系统 (按类别排序)

LLM基础设施

ML / DL基础设施

特定领域的基础设施

ML/LLM系统会议

会议

  • OSDI
  • SOSP
  • SIGCOMM
  • NSDI
  • MLSys
  • ATC
  • Eurosys
  • Middleware
  • SoCC
  • TinyML

通用资源

调查

  • 高可用智能云和机器学习系统 [幻灯片]
  • 一个精挑细选的极棒系统设计文章、视频和分布式计算资源列表,亦称大数据。 [GitHub]
  • awesome-production-machine-learning: 一个精挑细选的开放源码库列表,用于部署、监控、版本管理和扩展机器学习 [GitHub]
  • 生产环境中机器学习加速器的机会和挑战 [论文]
    • Ananthanarayanan, Rajagopal, 等。"
    • 2019 {USENIX} 运营机器学习会议 (OpML 19)。2019年。
  • 如何(以及如何不)撰写一篇好的系统论文 [建议]
  • 在Facebook应用机器学习:数据中心基础设施视角 [论文]
    • Hazelwood, Kim, 等。(HPCA 2018)
  • 可用机器学习的基础设施:斯坦福DAWN项目
    • Bailis, Peter, Kunle Olukotun, Christopher Ré, 和 Matei Zaharia。(2017年初稿)
  • 机器学习系统中的隐藏技术债务 [论文]
    • Sculley, David, 等。(NIPS 2015)
  • 系统设计中的端到端论点 [论文]
    • Saltzer, Jerome H., David P. Reed, 和 David D. Clark。
  • 大规模机器学习系统的设计 [论文]
  • Facebook数据中心中的深度学习推理:特征、性能优化和硬件影响 [论文]
    • Park, Jongsoo, Maxim Naumov, Protonu Basu 等。arXiv 2018
    • 摘要:本文介绍了DL模型的特征,然后展示了DL硬件的新设计原则。
  • 伯克利对AI系统挑战的看法 [论文]

书籍

视频

  • ScalaDML2020:向机器学习社区的最佳头脑学习。 [视频]
  • Jeff Dean: "快速响应时间在大型在线服务中的实现" 主题演讲 - Velocity 2014 [YouTube]
  • 从研究到生产使用PyTorch [视频]
  • 微服务、Docker和Kubernetes介绍 [YouTube]
  • ICML主题演讲:帮助20万非ML专家使用ML的经验教训 [视频]
  • 自适应和多任务学习系统 [网站]
  • 系统思维。 TED演讲。 [YouTube]
  • 灵活的系统是机器学习的下一个前沿。Jeff Dean [YouTube]
  • 是时候用Rust重写操作系统了吗?[YouTube]
  • InfoQ: AI, ML和数据工程 [YouTube]
    • 开始观看。
  • Netflix: 以人为本的机器学习基础设施 [InfoQ]
  • SysML 2019: [YouTube]
  • ScaledML 2019: David Patterson, Ion Stoica, Dawn Song 等 [YouTube]
  • ScaledML 2018: Jeff Dean, Ion Stoica, Yangqing Jia 等 [YouTube] [幻灯片]
  • 计算机架构的新黄金时代:历史、挑战和机会。David Patterson [YouTube]
  • 如何拥有糟糕的职业生涯。David Patterson (我是他的大粉丝) [YouTube]
  • SysML 18: 视角与挑战。Michael Jordan [YouTube]
  • SysML 18: 系统与机器学习的共生关系。Jeff Dean [YouTube]
  • AutoML基础: 自动化机器学习实战。Qingquan Song, Haifeng Jin, Xia Hu [YouTube]

课程

博客

  • 并行使用多个CPU/GPU加速边缘设备上的深度学习推理 [亚马逊博客]
  • 在几分钟内构建稳健的生产级深度学习视觉模型 [博客]
  • 使用Keras,FastAPI,Redis和Docker部署机器学习模型 [博客]
  • 如何部署机器学习模型 - 使用FastAPI + Uvicorn创建生产级API [博客] [GitHub]
  • 将机器学习模型部署为REST API [博客]
  • 机器学习的持续交付 [博客]
  • Kubernetes速查表 [GitHub]
  • Kubernetes简介 [博客]
  • 使用Web界面训练和部署机器学习模型 - Docker, PyTorch & Flask [GitHub]
  • 学习Kubernetes,中国道教方式 [GitHub]
  • 数据管道,Luigi, Airflow: 你需要知道的一切 [博客]
  • 深度学习工具集概述 [博客]
  • CSE 599W:机器学习系统总结 [中文博客]
  • 在Kubernetes中使用Polyaxon, Argo和Seldon进行模型训练,打包和部署 [博客]
  • 把机器学习(ML)模型投入生产的不同方法概述 [博客]
  • 成为数据科学家并不意味着你是一名软件工程师 [第一部分] 构建机器学习流水线 [第二部分]
  • 在PyTorch中进行模型服务 [博客]
  • Netflix中的机器学习 [Medium]
  • SciPy会议材料(幻灯片,仓库) [GitHub]
  • 继Spark之后,UC Berkeley推出新一代AI计算引擎——Ray [博客]
  • 了解/从事机器学习/深度学习系统相关的研究需要什么样的知识结构? [知乎]
  • 在3小时内学习Kubernetes:编排容器的详细指南 [博客] [GitHub]
  • 数据工程师路线图:从硅谷多家公司学习。Netflix, Facebook, Google, Startups [GitHub]
  • 使用TensorFlow Serving + Docker + Tornado进行机器学习模型生产级快速部署 [博客]
  • 将机器学习模型部署为REST API [博客]
  • Colossal-AI:大模型时代的统一深度学习系统 [博客] [GitHub]
  • 数据工程师路线图 [Scaler Blogs]

编辑推荐精选

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

下拉加载更多