SIMON WILLISON · 2026年6月15日
Datasette-agent 0.3a0 版本新增 execute_write_sql 工具,该工具在请求用户批准并遵循用户权限后向数据库写入数据。聊天终端模式现在支持用户审批,并添加了三个新选项:--root、--yes 和 --unsafe 用于自动批准。工具可以为 CLI 显示提供纯文本形式的 HTML 备选。用户现在可使用 --unsafe 标志直接与特定数据库聊天并通过提示词(如“创建笔记表”)修改数据库。
SIMON WILLISON · 2026年6月11日 · 重点
Simon Willison 描述了 Claude Fable 5 自动调试 CSS 水平滚动条问题的过程:它自主打开真实浏览器(Safari、Firefox),编写自定义 HTML 页面和注入脚本,利用 pyobjc-Framework-Quartz 截图,并构建了一个 Python CORS 服务器来收集 Web Component 阴影 DOM 中的布局数据。代理模拟键盘事件以触发模态框,并使用 osascript 和 screencapture 工具,全程没有明确指令。它在定位原因后意外降级至 Opus,由 Opus 完成修复。Willison 警告,这种极度主动性虽令人印象深刻,但若代理被注入攻击或未在沙盒中运行,将带来严重安全风险。
SIMON WILLISON · 2026年6月10日
datasette-agent 0.2a0 版本发布。工具现可通过 await context.ask_user(...) 在执行中向用户提问,支持是/否、多选和自由文本三种形式。问题在聊天界面中以表单呈现,并持久化到内部数据库,暂停的对话在服务器重启后依然存在;用户回答后,工具会从开头重新执行。新增内置 save_query 工具,可将 SQL 保存为 Datasette 存储查询,但必须经人工审核——会展示完整 SQL、名称、数据库和可见性,用户点击确认后才存储。此版本基于一个用 Claude Fable 5 构建的新 LLM 阿尔法版开发。
SIMON WILLISON · 2026年6月9日 · 重点
Anthropic 发布了 Claude Fable 5 和移除安全护栏的 Claude Mythos 5,两者均支持 100 万 token 上下文、12.8 万最大输出 token,知识截止 2026 年 1 月。定价为输入 $10/百万 token、输出 $50/百万 token,是 Opus 4.8 的两倍,速度较慢但代码能力突出。Simon Willison 用它成功将 micropython-wasm 升级为完整 CPython,并通过 Claude Code 为 LLM 和 Datasette Agent 添加了人工审批流程,最终推出 LLM 0.32a3。它能精确回忆大量小众开源项目细节,暗示模型规模极大。在 $100/月套餐内,当日花费达 $110.42。
SIMON WILLISON · 2026年6月9日
Simon Willison 分享了在 Wes McKinney 开发的代币使用分析工具 AgentsView 中为新发布模型添加自定义价格的方法。由于 Claude Fable 5 尚未被纳入 AgentsView 的默认价格数据库,他通过逆向工程找到了手动配置价格的方案,并利用该工具将 Claude Fable 5 在不同本地项目中的使用情况以树图形式可视化。这是一个在未包含新模型定价时追踪编码代时代币消耗成本的实用技巧。
SIMON WILLISON · 2026年6月7日
Simon Willison发布了datasette-agent-edit 0.1a0,这是一个用于Datasette Agent的基础插件,实现了代理文本编辑的核心工具。受Claude文本编辑器设计启发,它提供了查看、字符串替换和插入工具。该插件旨在为其他需要协作编辑文本的插件提供可复用的基础。