volcano

volcano

基于Kubernetes的高性能批处理调度系统

Volcano是基于Kubernetes构建的批处理系统,为机器学习、深度学习和生物信息学等高性能计算工作负载提供通用机制。它集成TensorFlow、Spark等主流框架,融合了大规模运行高性能工作负载的丰富经验。Volcano支持高效调度和资源管理,适用于大数据分析、人工智能训练等场景,能显著提升集群资源利用率和作业处理效率。Volcano在多个行业广泛应用,获得开源社区积极贡献。作为CNCF孵化项目,Volcano为云原生生态系统提供强大的批处理能力。

VolcanoKubernetes批处理系统云原生工作负载调度Github开源项目
<a href="https://volcano.sh/"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/5d988544-f191-41f4-ab09-e7d4bea4b244.png"/> </a>

构建状态 Go 报告卡 仓库大小 发布 许可证 CII 最佳实践 OpenSSF 记分卡

Volcano 是一个基于 Kubernetes 构建的批处理系统。它提供了一套机制,满足了许多类型的批处理和弹性工作负载的常见需求,包括机器学习/深度学习、生物信息学/基因组学和其他"大数据"应用。这些类型的应用通常在通用领域框架上运行,如 TensorFlow、Spark、Ray、PyTorch、MPI 等,Volcano 与这些框架进行了集成。

Volcano 建立在十五年来使用多个系统和平台大规模运行各种高性能工作负载的经验之上,结合了开源社区的最佳创意和实践。

截至 2021 年 6 月,Volcano 已在全球各行各业广泛使用,如互联网/云计算/金融/制造/医疗等。超过 20 家公司或机构不仅是最终用户,还是活跃的贡献者。数百名贡献者积极参与代码提交/PR 审查/问题讨论/文档更新和设计提供。我们期待您的参与。

注意:调度器基于 kube-batch 构建; 更多详情请参考 #241#288

cncf_logo

Volcano 是 云原生计算基金会(CNCF)的孵化项目。如果您是一个希望在支持云原生生态系统的增长和发展中发挥积极作用的组织,请考虑加入 CNCF。

总体架构

volcano

演讲

生态系统

快速入门指南

先决条件

  • Kubernetes 1.12+ 并支持 CRD

您可以通过以下两种方式之一尝试 Volcano。

注意:

  • 对于 Kubernetes v1.17+ 版本,使用 config/crd/bases 下的 CRD(推荐)
  • 对于 Kubernetes v1.16 以下版本,使用 config/crd/v1beta1 下的 CRD(已弃用)

使用 YAML 文件安装

在现有的 Kubernetes 集群上安装 Volcano。这种方式适用于 x86_64 和 arm64 架构。

kubectl apply -f https://raw.githubusercontent.com/volcano-sh/volcano/master/installer/volcano-development.yaml

尽情享用!Volcano 将在 volcano-system 命名空间中创建以下资源。

NAME                                       READY   STATUS      RESTARTS   AGE
pod/volcano-admission-5bd5756f79-dnr4l     1/1     Running     0          96s
pod/volcano-admission-init-4hjpx           0/1     Completed   0          96s
pod/volcano-controllers-687948d9c8-nw4b4   1/1     Running     0          96s
pod/volcano-scheduler-94998fc64-4z8kh      1/1     Running     0          96s

NAME                                TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)   AGE
service/volcano-admission-service   ClusterIP   10.98.152.108   <none>        443/TCP   96s

NAME                                  READY   UP-TO-DATE   AVAILABLE   AGE
deployment.apps/volcano-admission     1/1     1            1           96s
deployment.apps/volcano-controllers   1/1     1            1           96s
deployment.apps/volcano-scheduler     1/1     1            1           96s

NAME                                             DESIRED   CURRENT   READY   AGE
replicaset.apps/volcano-admission-5bd5756f79     1         1         1       96s
replicaset.apps/volcano-controllers-687948d9c8   1         1         1       96s
replicaset.apps/volcano-scheduler-94998fc64      1         1         1       96s

NAME                               COMPLETIONS   DURATION   AGE
job.batch/volcano-admission-init   1/1           48s        96s

通过 helm 安装

要安装官方发布版本,请访问 helm-charts 获取详细信息。

helm repo add volcano-sh https://volcano-sh.github.io/helm-charts helm install volcano volcano-sh/volcano -n volcano-system --create-namespace

从源代码安装(适用于开发者):

helm install volcano installer/helm/chart/volcano --namespace volcano-system --create-namespace # 列出 helm 发布 helm list -n volcano-system

从代码安装

如果您没有 Kubernetes 集群,可以尝试从代码库一键安装:

./hack/local-up-volcano.sh

此方法暂时仅适用于 x86_64 架构。

安装监控系统

如果您希望在安装 Volcano 后获得 Prometheus 和 Grafana Volcano 仪表板,请尝试以下命令:

make TAG=latest generate-yaml kubectl create -f _output/release/volcano-monitoring-latest.yaml

Kubernetes 兼容性

Kubernetes 1.17Kubernetes 1.18Kubernetes 1.19Kubernetes 1.20Kubernetes 1.21Kubernetes 1.22Kubernetes 1.23Kubernetes 1.24Kubernetes 1.25Kubernetes 1.26Kubernetes 1.27Kubernetes 1.28Kubernetes 1.29Kubernetes 1.30
Volcano v1.6-------
Volcano v1.7---_
Volcano v1.8----
Volcano v1.9-----
Volcano HEAD (master)----

图例:

  • Volcano 与该 Kubernetes 版本完全兼容。
  • + Volcano 具有可能不存在于该 Kubernetes 版本中的功能或 API 对象。
  • - 该 Kubernetes 版本具有 Volcano 无法使用的功能或 API 对象。

会议

亚洲社区每周会议:星期五 15:00 - 16:00(UTC+8)。(转换为您的时区。

美洲社区两周一次会议:星期四 08:30 - 09:30(UTC-8)。(转换为您的时区。

欧洲社区会议目前按需进行。如果您有想法或话题要讨论,请在 Slack 中留言。维护者将与您联系并安排一次公开会议。

资源:

联系方式

如果您有任何问题,欢迎通过以下方式与我们联系:

Volcano Slack 频道 | 加入

邮件列表

微信:添加微信账号 k8s2222(华为云小助手2号),让她将您拉入群组。

编辑推荐精选

蛙蛙写作

蛙蛙写作

AI小说写作助手,一站式润色、改写、扩写

蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。

AI辅助写作AI工具蛙蛙写作AI写作工具学术助手办公助手营销助手AI助手
Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

下拉加载更多