Claude Code 80%的提示词说删就删,Anthropic用Fable 5打了个样:AI行业的“降本”才刚刚开始
文章声称Anthropic通过Fable 5删除了Claude Code中80%的提示词,以降低提示成本,体现AI行业降本趋势。但本摘要中未提供任何具体细节、数据或佐证,完整文章仅可通过外部链接访问。
文章声称Anthropic通过Fable 5删除了Claude Code中80%的提示词,以降低提示成本,体现AI行业降本趋势。但本摘要中未提供任何具体细节、数据或佐证,完整文章仅可通过外部链接访问。
llama.cpp 的 b9864 版本修补了服务器 SSE 流处理逻辑:现在每隔 1 秒发送一次心跳,仅在 3 秒无活动后才断开连接,从而防止在长预填充期间丢弃健康的 WebUI 连接。请求模式新增了按请求可设的 `sse_ping_interval` 字段;全局默认值保持 30 秒,确保 API 客户端行为不变,而内置 WebUI 发送值 1 以实现其自身的 3 秒可见性约定。该字段现为带硬限制的类型化参数,从 CLI 默认值继承,并享有模式自动进行的类型与范围校验。发布包含面向 macOS、Linux、Windows、Android 与 iOS 的预编译二进制文件。
德意志银行表示,Meta可能通过出售旧算力和模型访问权来变现AI基础设施,预计2027年可新增收入90至300亿美元。苹果发布了iOS 27测试版,内含Apple智能功能和新的AI开发框架。GitHub Copilot首次接入开源模型,来自月之暗面的Kimi K2.7。阿里云宣布其AI原生数据库服务Databridge Agent将于2026年8月1日起正式商业化计费。韩华集团计划到2040年在航空航天和AI领域投资55万亿韩元。xTool发布了O1 UV打印机并整合AI工具。
Anthropic已进入定制AI推理芯片的早期研发阶段,旨在为Claude打造专用芯片,摆脱对AWS Trainium和谷歌TPU的依赖。公司正与三星洽谈制造合作,评估其2纳米GAA工艺和先进封装,同时也在与微软Maia和英国初创公司Fractile探索合作。此前,Anthropic挖走原OpenAI Jalapeño芯片项目核心工程师Clive Chan,并通过65亿美元融资将估值推至9650亿美元。Anthropic希望定义仅用于推理的芯片,砍掉无用部件以降低成本、提升效率。此举标志着其在AI硬件领域从参与者向主导者的战略转变,以应对超出全球芯片产能的算力需求。
美团发布了LongCat-2.0,一个1.6万亿参数的混合专家(MoE)模型,激活参数约480亿,最高支持100万token上下文。模型完全使用电信5万张国产AI加速卡集群训练,采用自有分布式通信协议,未依赖NVIDIA NCCL。在SWE-bench Pro上得分为59.5,略高于GPT-5.5的58.6。模型在Hugging Face上贴有MIT许可证,但权重标注为“即将推出”,目前仅开源了推理框架和基础架构代码。LongCat曾以“Owl Alpha”匿名在OpenRouter平台运行,凭借每百万token 0.30美元的定价和大量免费额度,月调用量冲至全球前三。该模型垂直优化于美团本地生活场景(如外卖调度、到店运营)。尽管工程上验证了国产算力的大规模训练可行性,但芯片厂商、训练总成本、实际训练耗时及训练数据均未公开,导致独立复现与验证困难。
中国AI行业正从免费扩张转向商业化变现。DeepSeek完成创纪录的500亿元(约74亿美元)融资,创始人梁文锋个人出资200亿元,腾讯(100亿元)、宁德时代(50亿元)等参投,外部资金注入由梁文锋控制的有限合伙企业,无投票权且锁定期五年,投后估值突破500亿美元。字节跳动旗下豆包基于最新豆包2.1模型推出付费订阅:标准版68元/月,加强版200元/月(年付2048元),专业版500元/月(年付5088元),覆盖深度文档处理、数据分析和企API等专业场景。月之暗面Kimi此前已推出49元/99元月费会员,半年内累计融资近60亿美元,估值从43亿美元飙升至300亿美元。投资逻辑已从参数规模和用户增速转向月度营收、算力摊薄和付费转化率,大模型企业必须拿出清晰的商业化路径。