如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-21 08:10:10
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-28 23:00:12为什么m4max可以轻松堆128g显存,nvidia消费端显卡却长期被限制在24g?
- 2025-06-28 22:40:11互联网研发运维都必用的Nginx到底是什么呢?
- 2025-06-28 23:35:11活在底层的人是什么样子?
- 2025-06-28 23:40:11想买个鱼缸,听说里面坑很多,哪个大神给讲解一下呀?
- 2025-06-28 23:50:11能分享一下你写过的rust项目吗?
- 2025-06-28 22:20:11怎么向老婆简单解释nas的用途?
- 2025-06-28 22:35:11陌生人晕倒了,帮他拨打120后,病人不支付120出车费,这个费用谁来承担?
- 2025-06-28 22:50:11postgresql能取代mongodb吗?
- 2025-06-28 23:00:12折叠屏手机有哪些有用或好玩的功能,你过去不理解,现在离不开?
- 2025-06-28 22:40:11为什么只有Linux内核中有KVM?
推荐产品
-
求大神解答,为什么大家都不喜欢用docker?
有些人说因为给docker的不给原本部署的内容, 至少我看到 -
如何看待 Mac mini M4 支持可更换 SSD?
更换了个寂寞…… Mac mini M4上的可更换SSD是『 -
现在个人博客不能备案了吗?
个人博客是不必要备案的。 很多人由于认知局限,以为只能使用国 -
如何评价《一人之下》722(765)话?
参考一下李慕玄之死,围观群众一句多余的话都没有,夏柳青几个人
最新资讯
- Django、Flask、FastAPI,Python 后端哪个更好?
- Prototype.js 这个库和 J***aScript 的原型链 prototype 有什么关系吗?
- 可以讲讲你们的遗憾吗?
- 导师给了1.4W要我给工作室买个主机,是整机还是自己配?
- 怎么向老婆简单解释nas的用途?
- 如何评价董宇辉讲述“各地厅长甚至更大的领导来我们这,站在门口等,站一个多小时。”?
- 为什么Go仅仅160MB的安装包就可以编译程序,而Rust却还需要几个GB的VC++才能编译?
- 一名女子在杭州万象城遭挟持被捅 20 多刀,隆胸***体救了一命,这反映出哪些公安系统的问题?
- postgresql能取代mongodb吗?

