如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-19 21:25:11
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-21 15:30:11为什么微软会允许中国有那么多盗版?
- 2025-06-21 16:30:11中国人口正经历前所未有大转折,如何看待中国人口负增长?应该怎样应对?
- 2025-06-21 15:05:12自己组一个E5服务器才几百块钱,为什么去阿里云租这么贵?
- 2025-06-21 16:30:11Python+rust会是一个强大的组合吗?
- 2025-06-21 15:15:11海贼王为什么现在被全网黑?
- 2025-06-21 15:15:11现在网上把清朝说得一无是处,但是为什么能统治268年?
- 2025-06-21 15:25:11上海公交站名为什么都是两条路?是什么意思?
- 2025-06-21 16:40:11四盘家用nas,装了一块3T,一块4T,一块8T,一块16T机械硬盘,不再买新盘,该怎样组RAID?
- 2025-06-21 15:35:11中国海军是如何崛起的?
- 2025-06-21 15:15:11一名女子在杭州万象城遭挟持被捅 20 多刀,隆胸***体救了一命,这反映出哪些公安系统的问题?
推荐产品
-
在武汉,你们的找对象标准是怎样的?
89年女,未婚未育,本科学历,皮肤白皙。 已在武汉购房购车 -
为什么国内连 Docker 镜像源都要封禁?
禁掉镜像, 这是对全国IT从业者的一次精神洗礼、意志考验、信 -
只是突然很好奇,已经造出了三艘航母,为何不能按照这样的模板,批量建造航母呢?
大家有没有发现一个非常诡异的事情,你看055都下了两大锅饺子 -
Golang和J***a到底怎么选?
就不想用rust吗?局面打开,j***a写一堆class太臃
新闻动态
最新资讯

