LATENT SPACE··重点
在AI工程师世界博览会上,支持方认为自主编码循环已不可避免且早已被使用,怀疑方则警告工程规范和经济效益落后于炒作。Anthropic的Mike Krieger详细介绍了内部Claude Tag模型,称其具有委派、异步和主动性,改变了团队工作方式但导致审查瓶颈。Amplify调查显示95%的受访者已使用智能体,89%表示智能体能写入数据,但59%担心AI生成代码会带来长期负债。Y Combinator总裁Garry Tan敦促创始人将AI视为劳动力并打造AI原生公司。
MARKTECHPOST··重点
Interfaze 开源了 diffusion-gemma-asr-small,这是首个多语言扩散语音识别模型。该系统仅在冻结的 Whisper-small 编码器和 Google 的 26B DiffusionGemma 骨干上微调了 42M 参数的适配器,使用并行去噪解码器替代自回归生成。通过 CTC 辅助训练突破收敛难题,单个适配器支持英语、德语、法语、西班牙语、印地语和普通话的转录。在 16 个去噪步骤下,LibriSpeech test-clean 上的词错误率(WER)为 6.6%,领先其他扩散 ASR 模型,但落后于自回归 Whisper。转录成本取决于去噪步骤数而非音频长度,约 8 个并行轮次即可收敛。
SIMON WILLISON··重点
Simon Willison 发布了 llm-coding-agent 0.1a0,这是一个早期 alpha 版 Python 库,提供了类似 Claude Code 风格的编程代理。该代理内置文件读取/编辑/写入、正则搜索、文件列表和 Shell 命令执行等工具,全部构建在其 llm alpha 工具使用框架之上。它已发布到 PyPI,可通过 `uvx --prerelease=allow --with llm-coding-agent llm code` 调用,并提供 `--yolo` 自动批准标志。同时底层的 Python API 暴露了 `CodingAgent(model, root, approve).run(prompt)` 类。演示中它生成了一个能打印 ASCII 艺术时钟的 SwiftUI 命令行应用。
MIT TR AI··重点
伍德赛德能源公司已在生产环境中部署约50个AI智能体,用于支持其液化天然气工厂和企业工作流程。该公司多年来在运营数据和预测分析上持续投入,推出了启动顾问(一种AI副驾驶,通过分析历史数据和提供实时见解来指导操作员完成复杂的LNG工厂启动)和维护智能(推荐最佳维护时机,在一项试点资产上五年内实现了15%的维护工时减少)等解决方案。伍德赛德遵循“大处着眼、小处原型、快速扩展”的方法,并通过结构化AI评估流程和AI委员会保持严格治理。该公司与Infosys合作作为管理服务提供商,以支持规模化,最终目标是实现自主化企业,让智能体系统深度融入核心工作流程。
LATENT SPACE··重点
Anthropic 重新上线 Claude Fable 5,增设安全后备措施,部分请求转至 Opus 4.8,促使开发者采用多模型编排,仅在高价值推理时使用 Fable。GLM-5.2 凭借官方 IDE ZCode、APEX-SWE Integration 55.3% Pass@1 以及在 vLLM 中通过 DSpark 实现更快的推理而获得关注。智能体基础设施转向 wiki 结构化记忆,如 LangChain OpenWiki 和 Weaviate Engram;Cognition 的 Devin Security Swarm 将 Agentic MapReduce 应用于漏洞检测。英伟达 TwoTower 架构实现 2.42 倍生成加速,质量保留 98.7%。
LATENT SPACE··重点
在AIEWF上,Introspection联合创始人Roland Gavrilescu将自动研究定义为由代理维持系统的外部循环。Anthropic的Thariq Shihipar说Claude Code是“长出来的,不是开发出来的”,通过持续的用户驱动发现成长。Addy Osmani认为内部执行循环交给代理(能力),但目标设定和判断的外部循环必须由人类保留(能动性)。Paul Bakaus推出了设计工具Impeccable,拒绝一键解决方案,要求人类参与最后的20%以注入品味和所有权。关于生成媒体和代理网站的讨论均强调,即使模型不断进步,仍需人类的敏感性、创意方向和品牌管理。