SMOL AI NEWS··重点
Anthropic恢复Fable 5访问,新增网络安全分类器,提高API速率限制并向Pro/Max计划开放Claude Code artifacts;Fable将在容量允许后回归订阅。开源模型GLM-5.2在软件工程能力上达到Sonnet 5约80%,成本约20%,可通过Hugging Face Inference Providers在Claude Code中使用。Elliot Arledge用Fable 5生成首个单次完成的megakernel,针对Kimi-Linear解码负载实现18.7倍加速,超越此前多内核方案。SWE-rebench排行榜更新:Claude Opus 4.8 xhigh解决率56.5%,GLM-5.2 51.1%,小型开源模型如Qwen3.6-27B达36.5%。编码代理基础设施日趋完善,全栈评估(Code Arena Fullstack)和代理原生解析模式出现;协调、记忆和可观测性成为当前瓶颈。
SMOL AI NEWS··重点
Anthropic 在美国出口限制解除后重新启用 Claude Fable 5,新增的网络安全防护会将敏感请求路由至 Opus 4.8,且生物/化学分类器仍然过于宽泛;计划内访问仅持续到7月7日,之后转为使用额度计费,引发用户对成本的担忧。Claude Sonnet 5 作为更自主的模型发布,但基准图表被无声修改且用户反映高 effort 下延迟高、性价比差,损害了信任度。开源领域,Z.ai 为 GLM‑5.2 发布了 ZCode IDE,该模型成为首个在 SWE‑bench 集成类别领先的开源模型(Pass@1 55.3%),同时 NVIDIA 推出 NVFP4 量化的 Qwen3.6‑27B,华为开源了 OpenPangu‑2.0‑Flash MoE。智能体基础设施方面,LangChain OpenWiki 实现了 Wiki 结构化记忆,Cognition 的 Devin Security Swarm 使用 Agentic MapReduce 进行漏洞分类,SkillComposer 实现了联合技能选择。推理优化上,NVIDIA TwoTower 实现 2.42 倍生成加速且保持 98.7% 质量,vLLM 为 DeepSeek 模型增加了原生推测解码。
SMOL AI NEWS··重点
Meta发布了Brain2Qwerty v2,一种非侵入式脑到文本解码器,在最佳受试者上达到78%的单词准确率,九名志愿者平均61%,同时公开了训练代码和v1数据集。Cursor推出iOS应用,支持常驻云端代理、远程控制桌面代理及应用内PR差异审查。开源模型访问被产品化:cline推出9.99美元/月的订阅,捆绑GLM 5.2、DeepSeek、Kimi、MiniMax和Qwen;Cognition的Devin Fusion混合模型框架声称通过编排降低了35%的编码成本。DeepSeek V4支持和DFlash投机解码已合并到llama.cpp,社区展示GLM-5.2 753B在两台Mac间通过llama.cpp RPC达到16 tok/s。Arena年经常性收入突破1亿美元,对话超7亿次,正在转向部署后代理评估;一起Claude Code安全事件引发了对AI代理沙箱化的呼吁。