AI 模型与技术

Claude Sonnet 4.6 发布：Sonnet 终于摸到了 Opus 的天花板

Anthropic 发布 Claude Sonnet 4.6，在编程、计算机操作、长上下文推理等核心能力上全面升级，用户偏好度反超上一代 Opus 4.5，价格不变。Sonnet 正在成为大多数人的最优选择。

腾讯混元团队推出 CL-bench 测试，发现即使是 GPT-5.1 也只能解决 23.7% 的上下文学习任务，揭示了 AI 在「现学现用」方面的巨大短板。