AI 信息流

SMOL AI NEWS2026年7月2日重点

Anthropic Fable 5 携防护回归，GLM-5.2 编码能力比肩，Fable 首次单次生成 Megakernel

Anthropic恢复Fable 5访问，新增网络安全分类器，提高API速率限制并向Pro/Max计划开放Claude Code artifacts；Fable将在容量允许后回归订阅。开源模型GLM-5.2在软件工程能力上达到Sonnet 5约80%，成本约20%，可通过Hugging Face Inference Providers在Claude Code中使用。Elliot Arledge用Fable 5生成首个单次完成的megakernel，针对Kimi-Linear解码负载实现18.7倍加速，超越此前多内核方案。SWE-rebench排行榜更新：Claude Opus 4.8 xhigh解决率56.5%，GLM-5.2 51.1%，小型开源模型如Qwen3.6-27B达36.5%。编码代理基础设施日趋完善，全栈评估（Code Arena Fullstack）和代理原生解析模式出现；协调、记忆和可观测性成为当前瓶颈。

SMOL AI NEWS2026年7月1日重点

Claude Fable 5 重新上线并附带安全防护，Sonnet 5 基准测试引发透明度争议，开源模型生态加速扩展

Anthropic 在美国出口限制解除后重新启用 Claude Fable 5，新增的网络安全防护会将敏感请求路由至 Opus 4.8，且生物/化学分类器仍然过于宽泛；计划内访问仅持续到7月7日，之后转为使用额度计费，引发用户对成本的担忧。Claude Sonnet 5 作为更自主的模型发布，但基准图表被无声修改且用户反映高 effort 下延迟高、性价比差，损害了信任度。开源领域，Z.ai 为 GLM‑5.2 发布了 ZCode IDE，该模型成为首个在 SWE‑bench 集成类别领先的开源模型（Pass@1 55.3%），同时 NVIDIA 推出 NVFP4 量化的 Qwen3.6‑27B，华为开源了 OpenPangu‑2.0‑Flash MoE。智能体基础设施方面，LangChain OpenWiki 实现了 Wiki 结构化记忆，Cognition 的 Devin Security Swarm 使用 Agentic MapReduce 进行漏洞分类，SkillComposer 实现了联合技能选择。推理优化上，NVIDIA TwoTower 实现 2.42 倍生成加速且保持 98.7% 质量，vLLM 为 DeepSeek 模型增加了原生推测解码。

SMOL AI NEWS2026年6月29日重点

AI新闻综述：Meta非侵入式脑机解码Brain2Qwerty v2发布，Cursor推出iOS远程代理，DeepSeek V4登陆llama.cpp

Meta发布了Brain2Qwerty v2，一种非侵入式脑到文本解码器，在最佳受试者上达到78%的单词准确率，九名志愿者平均61%，同时公开了训练代码和v1数据集。Cursor推出iOS应用，支持常驻云端代理、远程控制桌面代理及应用内PR差异审查。开源模型访问被产品化：cline推出9.99美元/月的订阅，捆绑GLM 5.2、DeepSeek、Kimi、MiniMax和Qwen；Cognition的Devin Fusion混合模型框架声称通过编排降低了35%的编码成本。DeepSeek V4支持和DFlash投机解码已合并到llama.cpp，社区展示GLM-5.2 753B在两台Mac间通过llama.cpp RPC达到16 tok/s。Arena年经常性收入突破1亿美元，对话超7亿次，正在转向部署后代理评估；一起Claude Code安全事件引发了对AI代理沙箱化的呼吁。

过滤噪音，保留 AI 信号。

Anthropic Fable 5 携防护回归，GLM-5.2 编码能力比肩，Fable 首次单次生成 Megakernel

Claude Fable 5 重新上线并附带安全防护，Sonnet 5 基准测试引发透明度争议，开源模型生态加速扩展

AI新闻综述：Meta非侵入式脑机解码Brain2Qwerty v2发布，Cursor推出iOS远程代理，DeepSeek V4登陆llama.cpp