Anthropic 新发布了一个叫 Sonnet 4.6 的中等规模 AI 模型,跟之前不同的是这次把上下文窗口给翻了倍,最大能支持 100 万 token。这就意味着用户给它输入完整的代码库或者很长的学术论文都能一下子处理掉。Annunziato 在 ARC-AGI-2 这个专门测类人智能的考试里表现不错,分数到了 60.4%,虽然离 Opus 4.6、Gemini 3 Deep Think 还有那个精细调校的 GPT 5.2 这些大魔王还有点差距,但在同级别的一众竞争对手里算是名列前茅了。 IT之家那边也给出了测试数据,Sonnet 4.6 在评估计算机操作的 OS World 基准和搞软件工程的 SWE‑Bench 上面也都拿到了新的高分。这也就是发布这个 Sonnet 4.6 才两周多一点的事儿,那个 Opus 4.6 刚出没多久,紧接着 Haiku 的新版本估计也会在这几周内跟进发布。另外值得一提的是这个新版本会变成免费版和 Pro 版用户的默认模型。Anthropic 自己解释说这次上下文窗口翻番主要是为了让“单次请求”就能装下一个完整的代码库、好几份长合同或者是好几篇研究论文进去。他们还是那个每个月都会更新一次的节奏。