Ollama 发布 v0.30.9-rc1:llama.cpp 更新至 b9637 提交
Ollama 候选发布版 v0.30.9-rc1 将底层 llama.cpp 库更新至提交 b9637。此变更由 @jmorganca 在 PR #16609 中完成。该版本相较于 v0.30.8 仅是一次次要的依赖项升级。
Thinkgap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
80 条内容
Ollama 候选发布版 v0.30.9-rc1 将底层 llama.cpp 库更新至提交 b9637。此变更由 @jmorganca 在 PR #16609 中完成。该版本相较于 v0.30.8 仅是一次次要的依赖项升级。
llama.cpp b9660 版本针对LFM2工具调用解析中的双重转义问题发布了修复(issue #24667),并添加了相应的转义测试用例。该版本在macOS Apple Silicon、Linux、Windows、Android等多个平台上提供了预编译二进制文件,支持多种GPU后端。无其他功能变更。
llama.cpp 发布标签 b9659,包含对 mtmd 组件中 n_tokens 计数错误的修复(PR #24656)。该版本同时提供了面向多平台的预编译二进制文件,涵盖 macOS(ARM64、Intel)、Linux(x64、ARM64、s390x,支持 Vulkan、ROCm、OpenVINO、SYCL)、Android(ARM64)和 Windows(x64、ARM64,支持 CUDA 12/13、Vulkan、SYCL、HIP)。其中,启用 KleidiAI 的 macOS Apple Silicon 构建被标记为禁用,而 iOS XCFramework 产物可用。
llama.cpp 项目发布了 build b9658。一项重要改进是增强了聊天调试功能:当发生解析错误时,调试信息现在会包含完整的未解析提示。该版本仍提供面向多个平台的预编译二进制文件,包括 macOS(Apple Silicon 和 Intel)、Linux(CPU、Vulkan、ROCm、OpenVINO、SYCL)、Android(arm64 CPU)以及 Windows(CPU、CUDA、Vulkan、SYCL、HIP)。目前,启用 KleidiAI 的 macOS Apple Silicon 版本被暂时禁用。
llama.cpp b9656 版本强化了 PEG 原生工具调用解析。现在可接受可选的 "type":"function" 字段,以兼容 OpenAI 风格的工具调用序列化。最终解析失败时,解析器返回清晰的错误并记录未解析的片段,而非抛出原始内部状态。当 raw arguments 不是合法 JSON 时会保留原始字符串,避免中断提示渲染。解析失败会以更清晰的错误消息呈现,消除静默的空 assistant 回合。对 "type":"function" 字段的宽松解析受分析标志控制。
llama.cpp 项目发布标签 b9655,修复了聊天功能中因近期代码变动而暴露的一个“古老但经典的”语法生成器 bug(PR #24653),并更新了 PEG 解析器测试中的一个错误用例。该版本提供了面向广泛平台的预编译二进制文件,包括 macOS(Apple Silicon、Intel、KleidiAI)、Linux(x64、arm64、s390x、Vulkan、ROCm、OpenVINO、SYCL)、Android(arm64)以及 Windows(x64、arm64、CUDA 12/13、Vulkan、SYCL、HIP),同时也包含了 openEuler 构建版本和 UI 组件。