GPT4和Kimi竟然说13.11大于13.8，还有理有据！

Ray

2024年8月3日 08:04

AI助手ChatGPT4Kimi元宝文心一言热门

《歌手》大开播以来可谓是备受关注，而前些日子《歌手》的排名又是上了热搜。

小小的两个数字炸出了一大批九年义务教育的漏网之鱼，竟说 13.8要比13.11小。

面对这样的逆天言论我只有三个字想说：“转人工！”

但是我转念一想，“ 人机 ”的回答真的就比人回答的差吗，于是我开启了我的探索之旅，想看看 AI助手 的回答。

嚯，这不问不知道，一问吓一跳。

扫码加入AI交流群

获得更多技术支持和交流

测评

在回答这个问题的时候 各个AI助手也是各显神通。参与体验的有ChatGPT4、文心一言、元宝、Kimi、通义和豆包。让我们看看他们的表现。

首先是 GPT4和Kimi ，给出的答案和某些逆天的网友一样，认为 13.11比13.8 大，还有理有据。

ChatGPT4

Kimi

他们的比较方法没有任何问题，但是都认为小数点后是11大于8，所以认为 13.11大于13.8 。

但令我感到惊讶的是，除了 GPT4和Kimi 之外，其他的国产大模型竟然都能得出正确的答案。

豆包

元宝

文心一言

通义

接下来我又在“胜者组”中进行再次尝试，这次我换了两个数字， 9.11和9.9。

只有 元宝和文心一言 能够维持住胜利者的地位，而 豆包和通义 都给出了错误答案。

豆包

可以看到，豆包给出的答案中出现了混乱，前后的分析并不相符。

通义

而通义则是从头到尾都在坚持自己的逻辑，出现了和GPT4和Kimi一样的错误。

这样看来，说那些有逆天言论的网友是“人机”其实也委屈了部分人工智能。

怪不得人工智能在做高考题时数学成绩都很低，原来是对数字不太感冒。

这也揭示了人工智能目前还面临的难题，如果能解决我相信未来会给我们带来更多的帮助。

关注「向量光年」公众号

加速全行业向AI的改变

关注「开源AI项目落地」公众号

与AI时代更靠近一点

编辑推荐精选

Pixmax

Pixmax

一站式AI短剧创作平台

Pixmax专注打造下一代“ AI 视觉创作引擎”，整合行业顶尖 AI 大模型、工工业级精准控制及企业级协同管理功能，是全方位的 AI 内容创作平台。

豆包

字节跳动旗下 AI 智能助手

字节跳动旗下 AI 智能助手

GPT Plus｜Pro充值

GPT Plus｜Pro充值

GPT充值

支持 ChatGPT Plus / Pro 充值服务，支付便捷，自动发货，售后可查。

GPT Image 2中文站

GPT Image 2中文站

AI 图片生成平台

GPT Image 2 是面向用户的 AI 图片生成平台，支持文生图、图生图及多模型创意工作流。

Vecbase

Vecbase

你的AI Agent团队

Vecbase 是专为 AI 团队打造的智能工作空间，将数据管理、模型协作与知识沉淀整合于一处。算法、产品与业务在同一平台无缝协同，让从数据到 AI 应用的落地更快一步。

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区，致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具，独创GETI法则帮助用户精准定义音乐风格，AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化，支持国风融合、C-pop等本土音乐标签，让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体，适配 macOS14+/Windows10+，以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务，自主拆解执行复杂工作流，数据本地运行零上传，技能市场可无限扩展，是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没，开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记，检测 AI 内容并下载资料，将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布，深度重构AI短剧全流程生产模式，整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能，独创无限画布、双轨并行工业化工作流与Ani智能体助手，集成多款主流AI大模型，破解素材零散、版本混乱、沟通低效等行业痛点，助力3人团队效率提升800%，打造标准化、可追溯的AI短剧量产体系，是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型，支持图像、视频、音频、文本四种模态输入，表达方式更丰富，生成也更可控。

下拉加载更多

探索AI的无限可能

访问

AI工具导航精选AI信息

推荐工具精选

TRAE编程

TRAE编程

AI辅助编程，代码自动修复

扣子-AI办公

扣子-AI办公

职场AI，就用扣子

Vecbase

Vecbase

你的AI Agent团队

码上飞

码上飞

零代码AI应用开发平台

商汤小浣熊

商汤小浣熊

最强AI数据分析助手

讯飞绘文

讯飞绘文

选题、配图、成文，一站式创作，让内容运营更高效

讯飞绘镜

讯飞绘镜

描述即创作，短视频轻松生成

AI云服务特惠

懂AI专属折扣

关注微信公众号

最新AI工具、AI资讯
独家AI资源、AI项目落地

微信公众号二维码

微信扫一扫关注公众号

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号