谷歌的Gemini 3.0疑似上线LMArena!众多实测提前曝光,但效果嘛,很难评。
Gemini 3.0传了这么久,终于还是露出「马脚」了。
依然还是LMAreana竞技场,Gemini 3.0的两个「马甲」被扒了出来。
Gemini 3.0 Pro的马甲:lithiumflow
Gemini 3.0 Flash的马甲:orionmist
这已经是「传统艺能」了,每次新模型上线,都要去LMArena上去造势一番。
不过看了竞技场的实测结果,Gemini 3确实是真的有点东西,希望谷歌这次别再跟着OpenAI跑了,硬气一把!
此前Gemini 3的一些前端案例就曾流出,网友爆料称,谷歌下一代旗舰模型将在10月22日发布。
一些拿到内测资格的开发者,放出了部分demo。
不过这次是直接上线在LMArena竞技场里了。
「幸运」碰到Gemini 3马甲的用户分享了他们的例子,如果你也运气好,可以分享一下Gemini 3的表现是否有大幅度的提升。
AI第一次看懂钟表
实测「看表」一直是AI的大难题,这里面涉及多种因素,钟表样式、指针长短、指向、分钟间隔的判断等等。
不过Gemini 3 Pro(lithiumflow)的实测看出,这个模型已经可以精确到小时(6)、分钟(02)和秒(30)。
同样的问题,GPT-5 Thinking就有点「发癫」,直接识别成了12:30,有点时针、分针不分了。
用Gemini 2.5 Pro实测也是同样发癫,模型真的很难分辨时钟时间。
作为对比,LMArena中其他非顶级模型,「发癫」程度要更甚。
另外,在LMArena中实测了N次,一直没有碰到过Gemini 3的马甲。
如果竞技场里Gemini 3的马甲能力是真的,那确实Gemini 3还是非常值得期待!
SVG实测传统艺能,骑自行车的鹈鹕
新模型每次一出来,SVG测试是躲不开的。
Gemini 3 Pro的SVG测试效果,初看还是很不错的。
画面表现能力比之前测试的提升了不止一点,能看出甚至具有一点「抽象派」的风格。