SMOL AI NEWS··重点
Anthropic恢复Fable 5访问,新增网络安全分类器,提高API速率限制并向Pro/Max计划开放Claude Code artifacts;Fable将在容量允许后回归订阅。开源模型GLM-5.2在软件工程能力上达到Sonnet 5约80%,成本约20%,可通过Hugging Face Inference Providers在Claude Code中使用。Elliot Arledge用Fable 5生成首个单次完成的megakernel,针对Kimi-Linear解码负载实现18.7倍加速,超越此前多内核方案。SWE-rebench排行榜更新:Claude Opus 4.8 xhigh解决率56.5%,GLM-5.2 51.1%,小型开源模型如Qwen3.6-27B达36.5%。编码代理基础设施日趋完善,全栈评估(Code Arena Fullstack)和代理原生解析模式出现;协调、记忆和可观测性成为当前瓶颈。
SMOL AI NEWS··重点
Anthropic 在美国出口限制解除后重新启用 Claude Fable 5,新增的网络安全防护会将敏感请求路由至 Opus 4.8,且生物/化学分类器仍然过于宽泛;计划内访问仅持续到7月7日,之后转为使用额度计费,引发用户对成本的担忧。Claude Sonnet 5 作为更自主的模型发布,但基准图表被无声修改且用户反映高 effort 下延迟高、性价比差,损害了信任度。开源领域,Z.ai 为 GLM‑5.2 发布了 ZCode IDE,该模型成为首个在 SWE‑bench 集成类别领先的开源模型(Pass@1 55.3%),同时 NVIDIA 推出 NVFP4 量化的 Qwen3.6‑27B,华为开源了 OpenPangu‑2.0‑Flash MoE。智能体基础设施方面,LangChain OpenWiki 实现了 Wiki 结构化记忆,Cognition 的 Devin Security Swarm 使用 Agentic MapReduce 进行漏洞分类,SkillComposer 实现了联合技能选择。推理优化上,NVIDIA TwoTower 实现 2.42 倍生成加速且保持 98.7% 质量,vLLM 为 DeepSeek 模型增加了原生推测解码。
SMOL AI NEWS··重点
Anthropic 发布新默认中端模型 Claude Sonnet 5,支持 100 万 tokens 上下文,编码基准成绩提升(CursorBench 57% vs Sonnet 4.6 的 49%),并提供限时促销价格(输入 $2/百万 tokens,输出 $10/百万 tokens,截至八月)。ASIC 创业公司 Etched 公开了 $8 亿美元融资、$10 亿以上客户合同,并将在今夏交付首批推理机架。开源方面,美团发布 1.6 万亿参数 MoE 开放权重模型,训练基于国产 AI 加速器;华为开源 OpenPangu‑2.0‑Flash(92B 总参数,6B 活跃参数)。