多语言大模型展现卓越编码与数学能力
DeepSeek LLM是一个包含67亿参数的先进语言模型,经过2万亿英文和中文token的训练。该模型在推理、编码、数学和中文理解等方面表现优异,超越多个同类模型。其67B Chat版本在编码和数学方面尤为出色,在HumanEval和GSM8K等基准测试中名列前茅。项目开源了7B和67B的base与chat版本,可用于学术和商业研究。
7B参数中英双语模型,开放源代码以支持研究
创新MoE架构打造高效大规模语言模型
兼顾效率与经济性的大规模混合专家语言模型
高性能开源视觉语言模型 多模态理解与复杂场景应用
创新架构驱动的高效混合专家语言模型
单卡40G部署的轻量级混合专家语言模型
集成通用与编程能力的先进语言模型
强大开源语言模型,支持代码与数学任务
东南亚多语言大模型的新选择
开源代码语言模型
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号