stable-code-3b

stable-code-3b

支持多编程语言的FIM功能语言模型

这款2.7B参数的语言模型具备Fill in Middle功能,可支持18种编程语言及长上下文处理,适合广泛的应用场景。

模型训练transformer开源项目模型GithubHuggingfacestabilityai/stable-code-3b文本生成编程语言

项目介绍:stable-code-3b

模型概述

stable-code-3b是一款由Stability AI开发的语言模型,包含27亿个参数,专门用于代码生成。这款模型经过各种文本和代码数据集的训练,总共使用了1.3万亿个词的训练数据。它支持多种编程语言,包括Python、C++、Javascript、Java和PHP等。

该模型在多编程语言的衡量标准上表现出色,与类似规模的模型相比,展现了先进的性能。使用BigCode's 评估工具进行测试,stable-code-3b在Python语言下的通过率为32.4%。

主要功能

  • 中间插入能力(FIM):允许在代码的中间插入代码,这对于自动补全代码和代码重构十分有用。
  • 长文本支持:支持长达16,384个字符的序列进行训练,有助于处理较长的代码片段。

使用示例

开发者可以使用如下代码片段,在Python中体验stable-code-3b的文本生成功能:

import torch from transformers import AutoModelForCausalLM, AutoTokenizer tokenizer = AutoTokenizer.from_pretrained("stabilityai/stable-code-3b") model = AutoModelForCausalLM.from_pretrained( "stabilityai/stable-code-3b", torch_dtype="auto", ) model.cuda() inputs = tokenizer("import torch\nimport torch.nn as nn", return_tensors="pt").to(model.device) tokens = model.generate( **inputs, max_new_tokens=48, temperature=0.2, do_sample=True, ) print(tokenizer.decode(tokens[0], skip_special_tokens=True))

模型细节

  • 开发者:Stability AI
  • 模型类型:基于transformer解码器架构的自回归语言模型
  • 支持语言:英语和多种编程语言
  • 许可证:Stability AI社区许可证。商业使用请参考Stability AI的许可证

模型架构

该模型是一个仅限解码的transformer,类似于LLaMA架构,并进行了如下改进:

  • 参数数量:27亿
  • 隐藏层大小:2560
  • 层数:32
  • 头数:32
  • 序列长度:16384
  • 位置嵌入:采用旋转位置嵌入技术,提高吞吐量。
  • 分词器:使用修改后的GPTNeoX分词器,支持中间插入(FIM)等功能。

训练细节

  • 训练数据集:结合了多个大规模开源数据集,包括Falcon RefinedWeb、CommitPackFT和GitHub Issues等。
  • 支持语言:模型支持18种编程语言,包括Python、C++、Java、Go、Rust等。
  • 训练过程:模型在bfloat16精度下进行预训练,使用AdamW优化算法。
  • 基础设施:训练使用了Stability AI集群中的256块NVIDIA A100 40GB GPU。

使用及限制

该模型适用于作为基础模型进行特定应用的微调。但在实际应用中,开发者需要仔细评估和调整模型性能以确保安全。由于训练数据集中可能包含不当内容,建议在生产环境中谨慎使用。

如何引用

@misc{stable-code-3b, url={https://huggingface.co/stabilityai/stable-code-3b}, title={Stable Code 3B}, author={Pinnaparaju, Nikhil and Adithyan, Reshinth and Phung, Duy and Tow, Jonathan and Baicoianu, James and Cooper, Nathan} }

stable-code-3b是一个功能强大的语言模型,旨在为开发者提供高效的代码生成和改进工具。通过结合丰富的训练数据和先进的技术,它为多语言编程环境中的代码处理提供了坚实的基础。

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

AI辅助写作AI工具AI论文工具论文写作智能生成大纲数据安全AI助手热门
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

AI办公办公工具AI工具博思AIPPTAI生成PPT智能排版海量精品模板AI创作热门
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多