谷歌推出了全新的ai 模型gemini 3.1 flash-lite

谷歌推出了全新的AI模型Gemini 3.1 Flash-Lite,这回真的把速度和价格都给拿捏住了。这个模型一出来,首字响应时间直接飙升2.5倍,整体输出速度也跟着提高了45%。为了让更多开发者能用得起,谷歌给它定了一个很划算的价格:每百万输入Tokens只收0.25美元。 这个模型的厉害之处在于,它不仅快,逻辑推理和多模态理解能力也很强。咱们可以通过Gemini API在Google AI Studio里用预览版,企业用户也可以直接在Vertex AI平台上体验。在权威评测平台Artificial Analysis的数据里,这个新模型把前代的2.5 Flash给甩在了身后。 在Arena.ai的排行榜上,它拿到了1432分的Elo得分。特别是在GPQA Diamond和MMMU Pro的测试里表现亮眼,GPQA Diamond的得分率高达86.9%,MMMU Pro更是达到了76.8%。连体积更大的上一代Gemini 2.5 Flash都被它在好多指标上给超越了。 除了性能强悍,它还在AI Studio和Vertex AI里面搞了个叫“思考层级”的功能。这就好比给模型装上了一个调节器,咱们想让它怎么干活儿就怎么调。比如做翻译或者审核这种量大又费钱的活儿,就把思考深度调低点追求速度;要是做界面生成或者复杂逻辑模拟这种难活儿,就把思考层级调高一点。 Latitude、Cartwheel还有Whering这些公司已经抢先用上了这个模型。他们反馈说这玩意儿既快又准,处理起复杂指令来根本不比那些大块头的模型差。所以说这次谷歌发布的Gemini 3.1 Flash-Lite绝对是个重量级选手,既经济又好用。