CodeFuse-DevOps-Model

CodeFuse-DevOps-Model

中文DevOps大模型助力开发运维全生命周期

CodeFuse-DevOps-Model作为首个开源中文开发运维大模型,专注于DevOps全生命周期问题解决。基于Qwen系列并经高质量中文DevOps语料训练,模型在同规模对比中表现卓越。项目囊括7B和14B基座及对齐模型,并配备在线试用和评测基准。在多个DevOps评测数据集中,模型均取得优异成绩,为开发者提供了可靠的DevOps智能支持。

DevOps-Model中文开发运维大模型模型评测模型训练模型量化Github开源项目
<div align="center"> <h1> DevOps模型 </h1> </div> <p align="center"> 🤗 <a href="https://huggingface.co/codefuse-ai" target="_blank">Hugging Face</a> • 🤖 <a href="https://modelscope.cn/organization/codefuse-ai" target="_blank">ModelScope</a> </p> <div align="center"> <h4 align="center"> <p> <b>中文</b> | <a href="https://github.com/codefuse-ai/CodeFuse-DevOps-Model/blob/main/README_EN.md">English</a> <p> </h4> </div>

DevOps-Model是业界首个开源的中文开发运维大模型系列,主要致力于在DevOps领域发挥实际价值。目前,DevOps-Model能够帮助工程师回答在DevOps生命周期中遇到的问题。

我们基于Qwen系列模型,经过高质量中文DevOps语料加训后产出Base模型,然后经过DevOps问答数据对齐后产出Chat模型。我们的Base模型和Chat模型在开源和DevOps领域相关的评测数据上可以取得同规模模型中的最佳效果。欢迎来我们部署的在线试用地址体验模型效果:https://modelscope.cn/studios/codefuse-ai/DevOps-Model-Demo/summary <br> <br> 同时我们也在搭建DevOps领域专属的评测基准DevOpsEval,用来更好地评测DevOps领域模型的效果。 <br> <br>

最新消息

模型下载

开源模型和下载链接见下表: 🤗 Huggingface地址

基座模型对齐模型对齐模型Int4量化
7BDevOps-Model-7B-BaseDevOps-Model-7B-Chat即将推出
14BDevOps-Model-14B-BaseDevOps-Model-14B-Chat即将推出

🤖 ModelScope地址

基座模型对齐模型对齐模型Int4量化
7BDevOps-Model-7B-BaseDevOps-Model-7B-Chat即将推出
14BDevOps-Model-14B-BaseDevOps-Model-14B-Chat即将推出

模型评测

我们先选取了CMMLU和CEval两个评测数据集中与DevOps相关的一共六项考试。总计一共574道选择题,具体信息如下:

评测数据集考试科目题数
CMMLU计算机科学204
CMMLU计算机安全171
CMMLU机器学习122
CEval大学编程37
CEval计算机体系结构21
CEval计算机网络19

我们分别测试了零样本和五样本的结果,我们的7B和14B系列模型可以在测试的模型中取得最好的成绩,更多的测试结果后续也会发布。

基础模型零样本得分五样本得分
DevOps-Model-14B-Base70.7373.00
Qwen-14B-Base69.1671.25
Baichuan2-13B-Base55.7561.15
DevOps-Model-7B-Base62.7262.02
Qwen-7B-Base55.7556.00
Baichuan2-7B-Base49.3055.4
Internlm-7B-Base47.5652.6
<br>
对话模型零样本得分五样本得分
DevOps-Model-14B-Chat74.0475.96
Qwen-14B-Chat69.1670.03
Baichuan2-13B-Chat52.7955.23
DevOps-Model-7B-Chat62.2064.11
Qwen-7B-Chat46.0052.44
Baichuan2-7B-Chat52.5655.75
Internlm-7B-Chat52.6155.75
<br> <br>

快速使用

我们提供简单的示例来说明如何利用 🤗 Transformers 快速使用 Devops-Model-Chat 模型。

安装依赖

pip install -r requirements.txt

Chat 模型推理示例

from transformers import AutoModelForCausalLM, AutoTokenizer from transformers.generation import GenerationConfig tokenizer = AutoTokenizer.from_pretrained("path_to_DevOps-Model-Chat", trust_remote_code=True) model = AutoModelForCausalLM.from_pretrained("path_to_DevOps-Model-Chat", device_map="auto", trust_remote_code=True, bf16=True).eval() # 指定 generation_config model.generation_config = GenerationConfig.from_pretrained("path_to_DevOps-Model-Chat", trust_remote_code=True) # 第一轮对话 resp, hist = model.chat(query='你是谁', tokenizer=tokenizer, history=None) print(resp) # 我是 DevOps-Model,一个由蚂蚁集团平台技术事业群风险智能团队和北京大学联合研发的人工智能机器人,可以与用户进行自然语言交互,并协助解答 DevOps 全生命周期中的各种问题。如果您有任何需要协助的问题或者想要进行闲聊,都可以和我交流哦。 # 第二轮对话 resp2, hist2 = model.chat(query='Java 中 HashMap 和 Hashtable 有什么区别', tokenizer=tokenizer, history=hist) print(resp2) # HashMap 和 Hashtable 都是 Java 中常用的哈希表实现,它们的主要区别在于: # 1. Hashtable 是线程安全的,而 HashMap 不是线程安全的,因此在多线程环境下,Hashtable 的性能更稳定。 # 2. Hashtable 中的方法都是同步的,而 HashMap 的方法不是同步的,因此在多线程环境下,Hashtable 的性能更好。 # 3. Hashtable 中的 key 和 value 都必须实现 Serializable 接口,而 HashMap 中的 key 和 value 可以是任何对象,包括基本数据类型。 # 4. Hashtable 的初始容量是 11,而 HashMap 的初始容量是 16。 # 总之,如果需要在多线程环境下使用哈希表,并且需要保证线程安全,那么应该使用 Hashtable;如果不需要考虑线程安全,或者需要快速地进行哈希表操作,那么应该使用 HashMap。 # 第三轮对话 resp3, hist3 = model.chat(query='线程安全代表什么', tokenizer=tokenizer, history=hist2) print(resp3) # 线程安全是指在多线程环境下,程序能够正确地处理并发访问,并且不会出现数据竞争、死锁、饥饿等异常情况。线程安全的程序可以保证在不同的线程之间共享同一个数据结构时,数据的正确性和一致性。线程安全的实现通常需要使用同步机制,如锁、原子操作等,来保证对共享数据的访问是线程安全的。在 Java 中,可以通过 synchronized 关键字、Lock 接口等机制来实现线程安全。

模型训练

数据准备

代码内部通过调用 datasets.load_dataset 读取数据,支持 load_dataset 所支持的数据读取方式,比如 json,csv,自定义读取脚本等方式(但推荐数据准备为 jsonl 格式的文件)。然后还需要更新 data/dataset_info.json 文件,具体可以参考 data/README.md

预训练

如果收集了一批文档之类的语料(比如公司内部产品的文档)想要在 devopspal 模型上加训,可以执行 scripts/devops-model-pt.sh 来发起一次加训来让模型学习到这批文档的知识,具体代码如下:

set -v torchrun --nproc_per_node=8 --nnodes=$WORLD_SIZE --master_port=$MASTER_PORT --master_addr=$MASTER_ADDR --node_rank=$RANK src/train_bash.py \ --deepspeed conf/deepspeed_config.json \ # deepspeed配置文件路径 --stage pt \ # 表示执行预训练 --model_name_or_path path_to_model \ # 从huggingface下载的devopspal模型路径 --do_train \ --report_to 'tensorboard' \ --dataset your_corpus \ # 数据集名称,需与dataset_info.json中定义的一致 --template default \ # 模板,预训练就使用default --finetuning_type full \ # 全量微调或lora微调 --output_dir path_to_output_checkpoint_path \ # 模型checkpoint保存路径 --overwrite_cache \ --per_device_train_batch_size 8 \ --per_device_eval_batch_size 8 \ --gradient_accumulation_steps 1 \ --lr_scheduler_type cosine \ --warmup_ratio 0.05 \ --evaluation_strategy steps \ --logging_steps 10 \ --max_steps 1000 \ --save_steps 1000 \ --eval_steps 1000 \ --learning_rate 5e-6 \ --plot_loss \ --max_source_length=2048 \ --dataloader_num_workers 8 \ --val_size 0.01 \ --bf16 \ --overwrite_output_dir

用户可以在此基础上进行调整以启动自己的训练。建议通过 python src/train_bash.py -h 获取完整的参数列表,以了解更详细的配置选项。

指令微调

如果收集了一批QA数据想要对devopspal进行进一步对齐,可以执行 scripts/devops-model-sft.sh 来启动一次微调,使模型在收集到的数据上进行对齐。具体代码如下:

set -v torchrun --nproc_per_node=8 --nnodes=$WORLD_SIZE --master_port=$MASTER_PORT --master_addr=$MASTER_ADDR --node_rank=$RANK src/train_bash.py \ --deepspeed conf/deepspeed_config.json \ # deepspeed配置文件路径 --stage sft \ # 表示执行微调 --model_name_or_path path_to_model \ # 从huggingface下载的模型路径 --do_train \ --report_to 'tensorboard' \ --dataset your_corpus \ # 数据集名称,需与dataset_info.json中定义的一致 --template chatml \ # qwen模型的模板固定为chatml --finetuning_type full \ # 全量微调或lora微调 --output_dir /mnt/llm/devopspal/model/trained \ # 模型checkpoint保存路径 --overwrite_cache \ --per_device_train_batch_size 8 \ --per_device_eval_batch_size 8 \ --gradient_accumulation_steps 1 \ --lr_scheduler_type cosine \ --warmup_ratio 0.05 \ --evaluation_strategy steps \ --logging_steps 10 \ --max_steps 1000 \ --save_steps 100 \ --eval_steps 100 \ --learning_rate 5e-5 \ --plot_loss \ --max_source_length=2048 \ --dataloader_num_workers 8 \ --val_size 0.01 \ --bf16 \ --overwrite_output_dir

用户可以在此基础上进行调整以启动自己的SFT训练。建议通过 python src/train_bash.py -h 获取完整的参数列表,以了解更详细的配置选项。

量化

我们将提供DevOps-Model-Chat系列的量化模型,当然也可以通过以下代码来量化自己微调过的模型:

from transformers import AutoModelForCausalLM, AutoTokenizer from optimum.gptq import GPTQQuantizer, load_quantized_model import torch # 加载模型 model_name = "path_of_your_model" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16) # 加载数据 # todo # 开始量化 quantizer = GPTQQuantizer(bits=4, dataset="c4", block_name_to_quantize = "model.decoder.layers", model_seqlen = 2048) quantized_model = quantizer.quantize_model(model, tokenizer) # 保存量化后的模型 out_dir = 'save_path_of_your_quantized_model' quantized_model.save_quantized(out_dir)

联系我们

免责声明

由于语言模型的特性,模型生成的内容可能包含幻觉或歧视性言论。请谨慎使用DevOps-Model系列模型生成的内容。 如果要公开使用或商用该模型服务,请注意服务方需承担由此产生的不良影响或有害言论的责任,本项目开发者不承担任何由使用本项目(包括但不限于数据、模型、代码等)导致的危害或损失。

引用

如果使用本项目的代码或模型,请引用本项目论文:

链接:DevOps-Model

@article{devopspal2023,
  title={},
  author={},
  journal={arXiv preprint arXiv},
  year={2023}
}

Acknowledgements

This project references the following open-source projects. We would like to express our gratitude to the projects and their research and development teams.

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

AI辅助写作AI工具AI论文工具论文写作智能生成大纲数据安全AI助手热门
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

AI办公办公工具AI工具博思AIPPTAI生成PPT智能排版海量精品模板AI创作热门
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多