首页 > 新车性能 > 新车性能 > 谷歌新版Gemini马甲被扒! LMArena实测:唯一能看懂表的AI, GPT-5乱答

谷歌新版Gemini马甲被扒! LMArena实测:唯一能看懂表的AI, GPT-5乱答

发布时间:2025-10-21 10:48:34
谷歌的Gemini 3.0疑似上线LMArena!众多实测提前曝光,但效果嘛,很难评。
 
Gemini 3.0传了这么久,终于还是露出「马脚」了。
 
依然还是LMAreana竞技场,Gemini 3.0的两个「马甲」被扒了出来。
 
Gemini 3.0 Pro的马甲:lithiumflow
 
Gemini 3.0 Flash的马甲:orionmist
 
 
 
这已经是「传统艺能」了,每次新模型上线,都要去LMArena上去造势一番。
 
 
 
不过看了竞技场的实测结果,Gemini 3确实是真的有点东西,希望谷歌这次别再跟着OpenAI跑了,硬气一把!
 
 
 
此前Gemini 3的一些前端案例就曾流出,网友爆料称,谷歌下一代旗舰模型将在10月22日发布。
 
 
 
一些拿到内测资格的开发者,放出了部分demo。
 
 
 
不过这次是直接上线在LMArena竞技场里了。
 
「幸运」碰到Gemini 3马甲的用户分享了他们的例子,如果你也运气好,可以分享一下Gemini 3的表现是否有大幅度的提升。
 
AI第一次看懂钟表
 
实测「看表」一直是AI的大难题,这里面涉及多种因素,钟表样式、指针长短、指向、分钟间隔的判断等等。
 
不过Gemini 3 Pro(lithiumflow)的实测看出,这个模型已经可以精确到小时(6)、分钟(02)和秒(30)。
 
 
 
同样的问题,GPT-5 Thinking就有点「发癫」,直接识别成了12:30,有点时针、分针不分了。
 
 
 
用Gemini 2.5 Pro实测也是同样发癫,模型真的很难分辨时钟时间。
 
 
 
作为对比,LMArena中其他非顶级模型,「发癫」程度要更甚。
 
另外,在LMArena中实测了N次,一直没有碰到过Gemini 3的马甲。
 
 
 
如果竞技场里Gemini 3的马甲能力是真的,那确实Gemini 3还是非常值得期待!
 
SVG实测传统艺能,骑自行车的鹈鹕
 
新模型每次一出来,SVG测试是躲不开的。
 
Gemini 3 Pro的SVG测试效果,初看还是很不错的。
 
 
 
画面表现能力比之前测试的提升了不止一点,能看出甚至具有一点「抽象派」的风格。
 
 
 

新车性能更多>>

铭凡MS-S1 MAX桌面AI超算中心测评 国补叠加限时直降,这篇华为平板上车攻略不容错过 苹果M系列芯片只用五年便逼近AMD在笔记本市场的占有率 2025年度国内旗舰销量排名出炉,苹果才是真正赢家 一加Nord 6手机跑分曝光:骁龙8s Gen 4芯片、12GB内存 荣耀Magic8 Pro Air评测:Pro在前 Air在后 淘宝天猫将上线售后AI假图识别模型,治理AI造假骗退款 天猫超市联手菜鸟年货节再提速,杭州成为全国首个全城闪购4小时达城市 谷歌前CEO:欧洲不投钱,就用中国的喽 Meta新模型要来了,Llama 4锅谁来接?1300多位作者联合报告来了 249元起的工业级风扇,有多强? 苹果在iOS 26.3测试新的App Store广告样式,用户更难以分辨 荣耀方飞透露Magic8 Pro Air青海湖电池有黑科技 用户猛增、估值暴涨,一款App爆火又消失的120小时 马斯克点火全球最大超算,首个1GW狂飙奇点!6万亿Grok 5在训 来伊份年度预亏1.7亿元,拟用不超10亿元买理财 专家称零食品牌业绩分化明显 马斯克称特斯拉基本完成AI5芯片设计 已开始开发下一代AI6 迟到了16年,利比亚商人收到2010年订购的一批诺基亚手机 2025年Q4中国手机市场出货量苹果第一 全年海外手机市场荣耀增速第一 苹果连续三年稳居全球第一!iPhone 17系列创下历史记录 矩阵营销是什么?为什么越来越多品牌选择矩阵营销? 仅用10天?Anthropic最新智能体Cowork的代码竟然都是Claude写的 一加Turbo 6搭载9000mAh巨量电池 2699元起!荣耀Power2登场:超强防水、两天续航、电梯信号满格 摩托罗拉新设备曝光:AI感知伴侣造型亮眼,手机赛道要变了? 苹果2026年首款新品!AirPods Pro 3马年特别款发布 1899元 一周手机畅销榜更新:华为Nova15排名第九,第一名继续遥遥领先 2019-2025年埃安维修手册埃安UT 埃安V 埃安RT 埃安S MAX 埃安Y 埃安S 噪音大油耗高,为何我还推荐领克01? 2026款雷克萨斯LX美哭!白色车身太绝,气场全开谁能拒绝?