
多语言大模型展现卓越编码与数学能力
DeepSeek LLM是一个包含67亿参数的先进语言模型,经过2万亿英文和中文token的训练。该模型在推理、编码、数学和中文理解等方面表现优异,超越多个同类模型。其67B Chat版本在编码和数学方面尤为出色,在HumanEval和GSM8K等基准测试中名列前茅。项目开源了7B和67B的base与chat版本,可用于学术和商业研究。

7B参数中英双语模型,开放源代码以支持研究

创新MoE架构打造高效大规模语言模型

兼顾效率与经济性的大规模混合专家语言模型

高性能开源视觉语言模型 多模态理解与复杂场景应用

创新架构驱动的高效混合专家语言模型

单卡40G部署的轻量级混合专家语言模型

集成通用与编程能力的先进语言模型

强大开源语言模型,支持代码与数学任务

东南亚多语言大模型的新选择

开源代码语言模型
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号