
BitNet-Transformers是一个开源项目,旨在实现论文《BitNet: Scaling 1-bit Transformers for Large Language Models》中提出的1比特Transformer架构。该项目基于Hugging Face的Transformers库,使用PyTorch实现,并采用了Llama(2)的模型架构。
git clone https://github.com/beomi/bitnet-transformers cd bitnet-transformers
pip install -r clm_requirements.txt
git clone https://github.com/huggingface/transformers pip install -e transformers
rm ./transformers/src/transformers/models/llama/modeling_llama.py ln -s $(pwd)/bitnet_llama/modeling_llama.py ./transformers/src/transformers/models/llama/modeling_llama.py
项目提供了在Wikitext-103数据集上训练BitLLAMA模型的脚本:
./train_wikitext.sh
您可以通过Weights & Biases追踪训练指标。
在相同配置下(批次大小1,序列长度2048),不同精度的BitLLAMA模型内存占用如下:
BitNet-Transformers为大型语言模型的高效训练和部署提供了新的可能性。我们鼓励感兴趣的开发者深入探索该项目,为其发展做出贡献。
如需更多信息或讨论,欢迎访问项目GitHub页面并参与讨论。

一站式AI短剧创作平台
Pixmax专注打造下一代“ AI 视觉创作引擎”,整合行业顶尖 AI 大模型、工工 业级精准控制及企业级协同管理功能,是全方位的 AI 内容创作平台。


字节跳动旗下 AI 智能助手
字节跳动旗下 AI 智能助手


GPT充值
支持 ChatGPT Plus / Pro 充值服务,支付便捷,自动发货,售后可查。


AI 图片生成平台
GPT Image 2 是面向用户的 AI 图片生成平台,支持文生图、图生图及多模型创意工作流。


你的AI Agent团队
Vecbase 是专为 AI 团队打造的智能工作空间,将数据管理、模型协作与知识沉淀整合于一处。算法、产品与业务在同一平台无缝协同,让从数据到 AI 应用的落地更快一步。


全球首个AI音乐社区
音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

