第一个基于Mamba2的模型!!7B模型竟然超过22B模型!Transformer岌岌可危

RayRay
MistralMathstralCodestralMamba2AI热门

Mistral再次震惊了AI界!再次放出大招!

第一个基于Mamba2💥结构的模型,7B模型在某些指标上竟然超过22B模型!

近日来自法国的初创公司Mistral一口气发布了两款7B的开源模型!

数学推理模型——Mathstral

Mathstral

基于Mamba2架构的代码生成模型——Codestral

Codestral

令人眼前一亮的无疑是Mamba2架构的应用,一直以来都是Transformer架构独占鳌头,看来AI领域又要掀起一场惊涛骇浪~🌊

Mamba2

**

项目简介

Codestral Mamba

与Transformer架构的模型不同,Mamba架构的模型具有线性时间推理的优势,并且理论上能够对无限长度的序列进行建模。

同时允许用户广泛地与模型互动,并且响应迅速,而不受输入长度的限制。这种效率对于代码生产力用例尤其重要。

因此Codestral Mamba专为处理较长的输入文本而设计,非常适合复杂的编码任务。

Codestral Mamba也是由Mamba架构的创造者共同设计实现的。

Codestral一经发布引来网友们的强烈反应,对此网友们纷纷表示Mamba架构即将迎来新的世界。

网友反应

Codestral在HumanEval基准测试中远超其他开源模型。

同时Codestral Mamba 7B 在多项指标上竟然超越了基于 Transformer 架构的 Codestral 22B 模型,太不可思议了!😲

基准测试

同时团队测试了 Codestral Mamba 的上下文检索功能,最高可达 256k 个tokens!

Mathstral

为了纪念阿基米德诞辰2311周年,Mistral发布了Mathstral模型,这是一个专为数学推理和科学发现而设计的特定7B模型。

Mathstral可以通过更多的推理时间计算取得更好的结果。

Mathstral 7B在 64 名候选人中以多数投票在MATH上获得68.37%的分数,以强奖励模型获得74.59%的分数。

可以说Mathstral力压 Llama3 和 Qwen2。

Mathstral

目前,两款模型在Hugging Face上均可下载,感兴趣的小伙伴可以去尝试一下。

Hugging Face

🔗项目链接

https://mistral.ai/news/codestral-mamba/

https://mistral.ai/news/mathstral/

关注「向量光年」公众号

加速全行业向AI的改变

关注「开源AI项目落地」公众号

与AI时代更靠近一点

关注「AGI光年」公众号

获取每日最新咨询

编辑推荐精选

OpenManus

OpenManus

一个具备多种工具和代理功能,可用于解决复杂任务规划、网络搜索、浏览器操作等的项目。

OpenManus 是一个功能强大的开源项目,提供了丰富的工具和代理机制。包含规划工具、多种搜索引擎、浏览器操作工具等,能帮助开发者高效解决复杂任务的规划、网络信息搜索以及浏览器自动化操作等问题。支持多种语言,拥有清晰的文档和代码结构,易于集成和扩展,适用于各类需要自动化任务处理的场景。

MarkItDown

MarkItDown

一个支持多种格式转换的工具库

MarkItDown 是一个强大的 Python 工具库,专注于文档格式转换。它能够处理多种类型的文件,如 HTML、Wikipedia 页面以及 Bing 搜索结果页等,将其转换为 Markdown 格式。该项目支持插件扩展,提供了清晰的接口和丰富的功能,为开发者和文档处理人员提供了便捷、高效的文档转换解决方案,能有效提升文档处理效率,是文档转换领域的优秀选择。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
OmniParser

OmniParser

帮助AI理解电脑屏幕 纯视觉GUI元素的自动化解析方案

开源工具通过计算机视觉技术实现图形界面元素的智能识别与结构化处理,支持自动化测试脚本生成和辅助功能开发。项目采用模块化设计,提供API接口与多种输出格式,适用于跨平台应用场景。核心算法优化了元素定位精度,在动态界面和复杂布局场景下保持稳定解析能力。

OmniParser界面解析交互区域检测Github开源项目
Grok3

Grok3

埃隆·马斯克旗下的人工智能公司 xAI 推出的第三代大规模语言模型

Grok3 是由埃隆·马斯克旗下的人工智能公司 xAI 推出的第三代大规模语言模型,常被马斯克称为“地球上最聪明的 AI”。它不仅是在前代产品 Grok 1 和 Grok 2 基础上的一次飞跃,还在多个关键技术上实现了创新突破。

腾讯元宝

腾讯元宝

腾讯自研的混元大模型AI助手

腾讯元宝是腾讯基于自研的混元大模型推出的一款多功能AI应用,旨在通过人工智能技术提升用户在写作、绘画、翻译、编程、搜索、阅读总结等多个领域的工作与生活效率。

AI助手AI对话AI工具腾讯元宝智能体热门 AI 办公助手
Windsurf Wave 3

Windsurf Wave 3

Windsurf Editor推出第三次重大更新Wave 3

新增模型上下文协议支持与智能编辑功能。本次更新包含五项核心改进:支持接入MCP协议扩展工具生态,Tab键智能跳转提升编码效率,Turbo模式实现自动化终端操作,图片拖拽功能优化多模态交互,以及面向付费用户的个性化图标定制。系统同步集成DeepSeek、Gemini等新模型,并通过信用点数机制实现差异化的资源调配。

AI IDE
Cursor

Cursor

增强编程效率的AI代码编辑器

Cursor作为AI驱动的代码编辑工具,助力开发者效率大幅度提升。该工具简化了扩展、主题和键位配置的导入,可靠的隐私保护措施保证代码安全,深受全球开发者信赖。此外,Cursor持续推出更新,不断优化功能和用户体验。

AI开发辅助编程AI工具CursorAI代码编辑器
Manus

Manus

全面超越基准的 AI Agent助手

Manus 是一款通用人工智能代理平台,能够将您的创意和想法迅速转化为实际成果。无论是定制旅行规划、深入的数据分析,还是教育支持与商业决策,Manus 都能高效整合信息,提供精准解决方案。它以直观的交互体验和领先的技术,为用户开启了一个智慧驱动、轻松高效的新时代,让每个灵感都能得到完美落地。

飞书知识问答

飞书知识问答

飞书官方推出的AI知识库 上传word pdf即可部署AI私有知识库

基于DeepSeek R1大模型构建的知识管理系统,支持PDF、Word、PPT等常见文档格式解析,实现云端与本地数据的双向同步。系统具备实时网络检索能力,可自动关联外部信息源,通过语义理解技术处理结构化与非结构化数据。免费版本提供基础知识库搭建功能,适用于企业文档管理和个人学习资料整理场景。

下拉加载更多