如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-19 13:50:12
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-29 12:15:12吵架后,老公快一个星期不联系,是要离婚的节奏吗?
- 2026-01-12 00:05:03竞速未来,2023 DEMO WORLD助力出海“加速度” - *
- 2026-01-23 10:15:02首批20余位太空游客已预定,穿越者首艘商业载人飞船拟2028年首飞_载人航天_飞行_轨道
- 2026-01-19 15:55:02阿里巴巴,要把所有业务塞进千问_用户_系统性风险_数据
- 2026-01-22 16:25:02马斯克“大战”奥尔特曼,扯下了西方AI神话的遮羞布?_特斯拉_决策问题_ChatGPT
- 2026-01-23 10:40:03董宇辉的尽头是山姆_信任_产品_同行
- 2026-01-21 10:10:02150万年薪!俞敏洪给陈行甲开出天价薪酬,是精明还是任性?_新东方_公益_基金会
- 2025-06-29 11:45:12「香港四大才子」之一蔡澜去世,你对他有哪些了解?如何评价他的成就?
- 2026-01-22 16:45:04荣耀最强旗舰!荣耀Magic8 RSR保时捷设计明天首销:7999元起_支持_专业_影像
- 2026-01-12 08:55:01从SEO到KOC:老站长转型自媒体的3个认知大关 - *
推荐产品
-
俄罗斯没想到,美国更没想到,中国几乎所有“关键”技术遥遥领先_全球_量子_中方
2025年6G提案多,国际标准制定中声音大;俄罗斯机床精密制造弱,2025年订单从中方翻倍;美国通过芯片法案投530亿,但供应链仍依赖中国。 教育和投入是根基,中国理工博士毕业人数是美国两倍半,研发经费占GD… -
从炫技到量产,具身智能要突破哪些瓶颈?_LingBot-VLA_机器人_数据
比指标更重要的,是多家本体厂商在真实硬件上完成了对LingBot-VLA的验证,这意味着行业终于有一个不吹牛、能落地的模型了。 Physical Intelligence的Pi0.5一直是具身智能领域的性能标… -
Meta千人大裁员!扎克伯格继续挥刀元宇宙,VR严冬已至?_Labs_Reality_公司
在资本与业绩压力下,Meta显然开始做出取舍,2025年秋季的Meta Connect大会上,公司并未像往年那样推出重磅VR硬件更新,而是把焦点放在了一款售价799美元(约合人民币5559.4元)、内置显示… -
iPhone 18 Pro外观重大变化,网友:怎么越来越像安卓了?_系列_芯片_内存
iPhone 18 Pro外观重大变化,网友:怎么越来越像安卓了?_系列_芯片_内存
新闻动态
最新资讯

