谷歌推出了全新的ai 模型gemini 3.1 flash-lite

谷歌推出了全新的AI模型Gemini 3.1 Flash-Lite，这回真的把速度和价格都给拿捏住了。这个模型一出来，首字响应时间直接飙升2.5倍，整体输出速度也跟着提高了45%。为了让更多开发者能用得起，谷歌给它定了一个很划算的价格：每百万输入Tokens只收0.25美元。这个模型的厉害之处在于，它不仅快，逻辑推理和多模态理解能力也很强。咱们可以通过Gemini API在Google AI Studio里用预览版，企业用户也可以直接在Vertex AI平台上体验。在权威评测平台Artificial Analysis的数据里，这个新模型把前代的2.5 Flash给甩在了身后。在Arena.ai的排行榜上，它拿到了1432分的Elo得分。特别是在GPQA Diamond和MMMU Pro的测试里表现亮眼，GPQA Diamond的得分率高达86.9%，MMMU Pro更是达到了76.8%。连体积更大的上一代Gemini 2.5 Flash都被它在好多指标上给超越了。除了性能强悍，它还在AI Studio和Vertex AI里面搞了个叫“思考层级”的功能。这就好比给模型装上了一个调节器，咱们想让它怎么干活儿就怎么调。比如做翻译或者审核这种量大又费钱的活儿，就把思考深度调低点追求速度；要是做界面生成或者复杂逻辑模拟这种难活儿，就把思考层级调高一点。 Latitude、Cartwheel还有Whering这些公司已经抢先用上了这个模型。他们反馈说这玩意儿既快又准，处理起复杂指令来根本不比那些大块头的模型差。所以说这次谷歌发布的Gemini 3.1 Flash-Lite绝对是个重量级选手，既经济又好用。