MobiLlama是由阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)开发的一个小型语言模型(SLM),主要面向资源受限的边缘计算设备。与大型语言模型(LLM)不同,MobiLlama采用"小而美"的设计理念,在保持良好性能的同时,大幅降低了计算资源需求,非常适合在移动设备、可穿戴设备等边缘设备上运行。
MobiLlama的主要特点包括:

MobiLlama提供了多个版本的预训练模型供下载使用:
| 模型名称 | 下载链接 |
|---|---|
| MobiLlama-05B | HuggingFace |
| MobiLlama-08B | HuggingFace |
| MobiLlama-1B | HuggingFace |
| MobiLlama-05B-Chat | HuggingFace |
| MobiLlama-1B-Chat | HuggingFace |
以下是使用MobiLlama进行文本生成的示例代码:
from transformers import AutoModelForCausalLM, AutoTokenizer model = AutoModelForCausalLM.from_pretrained("MBZUAI/MobiLlama-05B", trust_remote_code=True) tokenizer = AutoTokenizer.from_pretrained("MBZUAI/MobiLlama-05B", trust_remote_code=True) model.to('cuda') text = "I was walking towards the river when " input_ids = tokenizer(text, return_tensors="pt").to('cuda').input_ids outputs = model.generate(input_ids, max_length=1000, repetition_penalty=1.2, pad_token_id=tokenizer.eos_token_id) print(tokenizer.batch_decode(outputs[:, input_ids.shape[1]:-1])[0].strip())
MobiLlama的训练数据来自Amber数据集,包含约1.2万亿个token。完整的训练数据共360个chunk,总大小约8TB。
数据集组成:
| 子集 | Token数量(十亿) |
|---|---|
| Arxiv | 30.00 |
| Book | 28.86 |
| C4 | 197.67 |
| Refined-Web | 665.01 |
| StarCoder | 291.92 |
| StackExchange | 21.75 |
| Wikipedia | 23.90 |
| 总计 | 1259.13 |
MobiLlama在多项基准测试中展现出优异的性能,特别是在0.5B和0.8B参数规模下,超越了许多同等规模的模型。
详细的评测结果可以在GitHub仓库中查看。
MobiLlama已支持在Android设备上运行。如需体验,可以下载并安装APK。
MobiLlama作为一个开源的小型语言模型,为边缘计算和资源受限场景下的AI应用开辟了新的可能。我们期待看到更多基 于MobiLlama的创新应用出现。如果您对MobiLlama有任何问题或建议,欢迎在GitHub仓库中提出issue或贡献代码。


职场AI,就用扣子
AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!


多风格AI绘画神器
堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。


零代码AI应用开发平台
零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具


最适合小白的AI自动化工作流平台