PyTorch Inductor CI 流水线(ciflow/inductor/184166)的 GitHub 发布标签仅包含状态 '[ghstack-poisoned]',表示该 CI 工作流因 ghstack 中毒状态而失败。没有报告任何代码更改、新功能或性能结果。
Loading / 加载中
AI 论文、发布、工具与金融信号
Loading / 加载中
Infogap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
第 1 / 12 页
PyTorch Inductor CI 流水线(ciflow/inductor/184166)的 GitHub 发布标签仅包含状态 '[ghstack-poisoned]',表示该 CI 工作流因 ghstack 中毒状态而失败。没有报告任何代码更改、新功能或性能结果。
llama.cpp 发布 b9637 版本,为 Cohere2MoE 模型架构(North Code)引入了专用对话解析器。解析器通过 PR #24615 实现,确保 Cohere 混合专家模型的对话格式正确。该版本提供适用于 macOS、Linux、Windows 和 Android 的预编译二进制文件,支持 CPU、CUDA、Vulkan、ROCm、SYCL 等多种后端。发布说明中除该解析器和一些内部重命名外,无其他功能性变更。
llama.cpp 的 b9631 版本修复了一个命令行界面 Bug,该 Bug 导致保留的令牌(preserved tokens)未能正确复制(对应问题 #24258)。该版本同时提供了针对 macOS(Apple Silicon 和 Intel)、Linux(x64、arm64、s390x、Vulkan、ROCm、OpenVINO、SYCL)、Android(arm64)、Windows(CPU、CUDA、Vulkan、SYCL、HIP)以及 openEuler 等多个平台的预编译二进制文件。此次发布是一次常规修补更新,主要聚焦于一个 CLI 修复。
本次 llama.cpp 发布将 cohere2moe 分词器添加到 llama-vocab 中,从而支持 TINY_AYA 模型的推理。该变动通过 PR #24601 贡献,同时提供了面向 macOS、Linux、Windows 和 Android 多个计算后端的构建产物。
llama.cpp 的 b9628 版本将 SYCL 后端的验证纳入持续集成和发布测试流程。新增的 check-release 工作流现覆盖 Ubuntu x64 上的 SYCL FP32 与 FP16 构建以及 Windows x64 上的 SYCL,确保英特尔 GPU 加速获得定期测试。该版本同时保留了针对 macOS、Linux(CPU、Vulkan、ROCm、OpenVINO)、Android 及 Windows(CUDA、Vulkan、HIP)的现有测试矩阵。
llama.cpp 的 b9626 版本新增了对 Cohere2 混合专家(MoE)架构的支持,架构名称为“cohere2moe”。该版本修复了滑动窗口注意力模式问题,通过改用 iSWA 解决了 MTP 失败问题,并将共享专家的组合方式调整为 (routed+shared)*0.5。同时移除了冗余的门控函数检查、lm_head 张量检查及 tokenizer 类型定义,tokenizer 保持为 tiny_aya。构建版本覆盖 macOS(Apple Silicon/Intel)、Linux(x64/arm64,支持 Vulkan、ROCm、OpenVINO、SYCL)、Android 以及 Windows(CPU/CUDA/Vulkan/SYCL/HIP),并提供 UI 支持。