如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-18 22:25:11
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-25 19:25:11在韩国生活有什么体验?
- 2025-06-25 18:50:11笨、傻、蠢有什么区别?
- 2025-06-25 18:30:12如何看待基层年轻公务员抓住一切机会想要逃离基层的现象?
- 2025-06-25 18:15:11现在ai编程达到了什么样的水平,是否能独立用来编写游戏?
- 2025-06-25 18:40:11大街上看到大白腿,忍不住瞄了两眼,算不算不尊重女性?
- 2025-06-25 18:10:12室友因为身体原因要用冰箱,但是电费却由我们平摊,合理嘛?
- 2025-06-25 17:50:12美国B2轰炸机从关岛轰炸伊朗是走的什么路线?
- 2025-06-25 18:10:12请问群晖的docker还能装些什么?
- 2025-06-25 18:55:12女生什么状态才体现出她已经爱上你了?
- 2025-06-25 18:10:12刘亦菲为什么不结婚?
推荐产品
-
程序员明明是技术积累岗位,为什么年龄越大反而可替代性变高了?
因为门槛和试错成本过低。 我大学从EE转CS的时候,就发现 -
为什么 mac mini 的 m4 版本价格这么低呢?
就是卖不动了,只好一轮一轮的降价。 和现在的房子一样,当然它 -
前端如何设计网页?
作为前端开发,AI 已经深度的影响了前端的开发方式,有UI的 -
什么是 AI Agent(智能体)?
最近陆陆续续的发布了很多的智能体,有拿Agent做唯一产品的
新闻动态
最新资讯

