SIMON WILLISON·
llama.cpp 创建者、ggml-org 负责人 Georgi Gerganov 表示,在过去一个半月里几乎每天使用 Qwen3.6-27B 模型处理编码任务。他在 M2 Ultra Mac 和 RTX 5090 机器上本地运行该模型,并搭配一个精简版的 pi 代理工具(使用 -nc --offline 参数和短系统提示)。他认为该模型对小的维护性任务很有帮助,并证实其在现实世界的本地 AI 辅助编程中能力出色。这段评价来自 Hacker News 上对 Boykis 文章《现在运行本地模型很好》的评论。
SIMON WILLISON·
Anthropic的Claude Fable 5模型因研究人员在包含已知和人为植入漏洞的代码上使用“修复此代码”提示,并展示其可生成漏洞利用脚本,而被美国出口管制禁止。监管者将此视为越狱,但安全专家Kate Moussouris确认这些提示是防御性的代码审查、修补和测试脚本需求。模型最初拒绝了直接的安全审查,但接受了修复工作流,这正是AI对防御性安全最有价值的贡献:执行发现、修复和测试循环。该禁令剥夺了防御者的关键工具,源于非技术决策者将合法的防御性使用误解为攻击能力。
SIMON WILLISON·
Luta Security CEO Katie Moussouris在审阅白宫关于Fable越狱的报告后指出,该模型拒绝了“检查代码安全问题”的提示,但在要求“修复此代码”并经过手动操作后遵从了指令。她评估此行为是模型在网络安全防御任务中“按预期工作”。Moussouris未因此收取Anthropic报酬。通过《大西洋月刊》记者Matteo Wong的报道,该观点反驳了白宫将此事件定性为安全故障的结论。
SIMON WILLISON·
Datasette-agent 0.3a0 版本新增 execute_write_sql 工具,该工具在请求用户批准并遵循用户权限后向数据库写入数据。聊天终端模式现在支持用户审批,并添加了三个新选项:--root、--yes 和 --unsafe 用于自动批准。工具可以为 CLI 显示提供纯文本形式的 HTML 备选。用户现在可使用 --unsafe 标志直接与特定数据库聊天并通过提示词(如“创建笔记表”)修改数据库。
SIMON WILLISON··重点
Axios披露,Anthropic与美国官员间的个性冲突导致出口管制,Claude Mythos(Fable)模型被下线。Anthropic安全负责人Logan Graham、Dave Orr和Nicholas Carlini今日与商务部会面。Anthropic称尚未发现针对Claude Mythos的“通用越狱”,将触发事件定性为“潜在狭窄非通用越狱”,并引用了其宪法分类器研究。政府消息人士暗示,解决僵局可能更需“态度修复”,让各方感到安全满意,而非实现完美越狱防御。报道对Fable短期恢复不乐观。
SIMON WILLISON·
内容加工暂时不可用。请通过原文链接查看该条目的完整信息。此降级结果用于保持加工契约兼容。