如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-25 02:10:10
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-26 17:45:11为什么说迷你主机不好用?
- 2025-06-26 17:10:13实体店为什么生意越来越难做了?
- 2025-06-26 16:45:14我家拍了一套法拍房,原房主不肯搬离怎么办?
- 2025-06-26 18:00:13微信服务器会保留聊天记录吗,会保存多久?
- 2025-06-26 17:15:14现在个人开发ios还有机会吗?
- 2025-06-26 17:15:14有哪些支持.Net系语言的开源中间件?
- 2025-06-26 18:00:13为什么我身边的女同学生活那么好还成了恨国党?
- 2025-06-26 17:35:13你身边身材最好的女生是什么样?
- 2025-06-26 17:15:14程序员的时间管理真的是写代码1小时,调试8小时吗?
- 2025-06-26 16:25:14为什么是9月3日阅兵而不是10月1日国庆阅兵?
推荐产品
-
为什么国内的黄***站不被查封?是难发现吗?
大概是 18 19年的时候 高三每周去网吧,打发时间,就感到 -
为什么华为价值2.3W的鸿蒙电脑用的是美国西数的SN740固态硬盘?
你问出这种问题除了表现得你完全不懂,或者说有意带节奏外,不能 -
数据库不就是增删改查一些数据吗?研发一个数据库到底难在哪了?
开发数据库可太容易,不就 CURD 么,10 行不到就解决了 -
和女生合租,都会发生什么事情?
19年在悉尼上学的时候和一个海王哥们以及一个挺好看的女生合租
最新资讯

