当前位置:当前位置: 首页 >
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
文章出处:网络 浏览次数:发表时间:2025-06-21 17:15:11
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
同类文章排行
- 阿里发布首个企业级AI原生工作平台,把“龙虾”关进笼子_悟空_Token_应用
- 大厂“养虾”,各怀心事_OpenClaw_产品_龙虾
- 传统行业的生死符:人工智能的商业化正席卷而来_工作_人类_应用
- “龙虾”爆火启示录:AI越能干,我的工作越不保?_Block_小敏_美国
- 中国AI算力暗战:字节阿里押注英伟达,讯飞全国产,百度走双轨_模型_芯片_进口
- 刚刚,黄仁勋又让整个硅谷睡不着了_Vera_Rubin_芯片
- 大疆硬刚:被美制裁近10年,反诉FCC胜算大吗?_美国_企业_Textron
- 狂砸200亿!京东百亿超市意欲何为?_配送_商品_补贴
- “AI龙虾”火到全国两会!是什么来头?_OpenClaw_智能_政务
- 林俊旸可别拿阿里的钱_Qwen_人才_技术
最新资讯文章
- 美国拟将AI芯片出口管制扩展至全球,英伟达、AMD出口均需获许可_投资_国家_草案
- 苹果想通了,你用iPhone充的钱到手能变多了。_Epic_渠道_游戏
- 全面涨价!再见了,千元手机!_利润_元机_消费品
- 高校毕业人数再破记录,当就业大军撞上AI,最担心的事情还是来了_岗位_需求冲击_工作
- 对标苹果华为,小米2000亿押注芯片、AI、系统:雷军要买下未来十年的船票_车家_手机_组装厂
- 头号Anthropic黑马斯克,决定把xAI变成Anthropic_Grok_公司_项目
- 全球网友掀起OpenAI抵制潮!Claude被封背后上亿政治献金惹众怒_美国战争_亿美元_云端
- 宇树科技创始人王兴兴:预计今年机器人应该会跑的比人还快,比飞人博尔特更快
- AI开始倒反天罡了_人类_平台_ai
- 阿里已批准林俊旸辞职,成立基础模型支持小组;马云称AI迭代必须全速前进_技术_qwen_团队
- 刚刚,图灵奖颁给量子密码学之父!40年前泳池闲聊,催生数十亿美元产业_Bennett_物理_科学史
- 腾讯AI变形记_Lab_张潼_俞栋
- Soul四次递表背后:一个羊头与狗肉的故事_用户_陌陌_平台
- 拉里贾尼的血,终究没白流。波斯猫这回是不加掩饰的掀桌子了。_伊朗_导弹_什么
- 贾跃亭宣战恶意做空:FF称全员和投资人打响做空阻击战_公司_非法_华其心
- 工信部专家:审慎使用“龙虾”等智能体_用户_技能_权限
- 爱因斯坦晚年为何研究神学,他发现了什么让他恐惧了30年?_宇宙_上帝_常数
- 就在元宵夜!“头号天象”要来了!_月亮_月全食_我国
- 黄仁勋:300亿美元投资OpenAI「可能是最后一次」_推理_公司_***
- 世界头号通缉犯被击毙,他留下的AI却正围猎未成年_犯罪_哈利斯科州_美国国务院





