AI 信息流

SMOL AI NEWS2026年7月2日重点

Anthropic Fable 5 携防护回归，GLM-5.2 编码能力比肩，Fable 首次单次生成 Megakernel

Anthropic恢复Fable 5访问，新增网络安全分类器，提高API速率限制并向Pro/Max计划开放Claude Code artifacts；Fable将在容量允许后回归订阅。开源模型GLM-5.2在软件工程能力上达到Sonnet 5约80%，成本约20%，可通过Hugging Face Inference Providers在Claude Code中使用。Elliot Arledge用Fable 5生成首个单次完成的megakernel，针对Kimi-Linear解码负载实现18.7倍加速，超越此前多内核方案。SWE-rebench排行榜更新：Claude Opus 4.8 xhigh解决率56.5%，GLM-5.2 51.1%，小型开源模型如Qwen3.6-27B达36.5%。编码代理基础设施日趋完善，全栈评估（Code Arena Fullstack）和代理原生解析模式出现；协调、记忆和可观测性成为当前瓶颈。

SMOL AI NEWS2026年7月1日重点

Claude Fable 5 重新上线并附带安全防护，Sonnet 5 基准测试引发透明度争议，开源模型生态加速扩展

Anthropic 在美国出口限制解除后重新启用 Claude Fable 5，新增的网络安全防护会将敏感请求路由至 Opus 4.8，且生物/化学分类器仍然过于宽泛；计划内访问仅持续到7月7日，之后转为使用额度计费，引发用户对成本的担忧。Claude Sonnet 5 作为更自主的模型发布，但基准图表被无声修改且用户反映高 effort 下延迟高、性价比差，损害了信任度。开源领域，Z.ai 为 GLM‑5.2 发布了 ZCode IDE，该模型成为首个在 SWE‑bench 集成类别领先的开源模型（Pass@1 55.3%），同时 NVIDIA 推出 NVFP4 量化的 Qwen3.6‑27B，华为开源了 OpenPangu‑2.0‑Flash MoE。智能体基础设施方面，LangChain OpenWiki 实现了 Wiki 结构化记忆，Cognition 的 Devin Security Swarm 使用 Agentic MapReduce 进行漏洞分类，SkillComposer 实现了联合技能选择。推理优化上，NVIDIA TwoTower 实现 2.42 倍生成加速且保持 98.7% 质量，vLLM 为 DeepSeek 模型增加了原生推测解码。

SMOL AI NEWS2026年6月30日重点

Anthropic 发布 Claude Sonnet 5，Etched 公布秘密 ASIC 进展，美团开源 1.6 万亿参数模型

Anthropic 发布新默认中端模型 Claude Sonnet 5，支持 100 万 tokens 上下文，编码基准成绩提升（CursorBench 57% vs Sonnet 4.6 的 49%），并提供限时促销价格（输入 $2/百万 tokens，输出 $10/百万 tokens，截至八月）。ASIC 创业公司 Etched 公开了 $8 亿美元融资、$10 亿以上客户合同，并将在今夏交付首批推理机架。开源方面，美团发布 1.6 万亿参数 MoE 开放权重模型，训练基于国产 AI 加速器；华为开源 OpenPangu‑2.0‑Flash（92B 总参数，6B 活跃参数）。

过滤噪音，保留 AI 信号。

Anthropic Fable 5 携防护回归，GLM-5.2 编码能力比肩，Fable 首次单次生成 Megakernel

Claude Fable 5 重新上线并附带安全防护，Sonnet 5 基准测试引发透明度争议，开源模型生态加速扩展

Anthropic 发布 Claude Sonnet 5，Etched 公布秘密 ASIC 进展，美团开源 1.6 万亿参数模型