Thinkgap 信息流

过滤噪音，保留 AI 信号。

页面仅读取已加工的 items 表，并以中英双语呈现。

80 条内容

清除筛选

GITHUB2026年6月15日

Ollama 发布 v0.30.9-rc1：llama.cpp 更新至 b9637 提交

Ollama 候选发布版 v0.30.9-rc1 将底层 llama.cpp 库更新至提交 b9637。此变更由 @jmorganca 在 PR #16609 中完成。该版本相较于 v0.30.8 仅是一次次要的依赖项升级。

GITHUB2026年6月15日

llama.cpp b9660: 修复LFM2工具调用解析双重转义问题

llama.cpp b9660 版本针对LFM2工具调用解析中的双重转义问题发布了修复（issue #24667），并添加了相应的转义测试用例。该版本在macOS Apple Silicon、Linux、Windows、Android等多个平台上提供了预编译二进制文件，支持多种GPU后端。无其他功能变更。

GITHUB2026年6月15日

llama.cpp 发布 b9659 修复 mtmd 中 n_tokens 计数错误 (#24656)

llama.cpp 发布标签 b9659，包含对 mtmd 组件中 n_tokens 计数错误的修复（PR #24656）。该版本同时提供了面向多平台的预编译二进制文件，涵盖 macOS（ARM64、Intel）、Linux（x64、ARM64、s390x，支持 Vulkan、ROCm、OpenVINO、SYCL）、Android（ARM64）和 Windows（x64、ARM64，支持 CUDA 12/13、Vulkan、SYCL、HIP）。其中，启用 KleidiAI 的 macOS Apple Silicon 构建被标记为禁用，而 iOS XCFramework 产物可用。

GITHUB2026年6月15日

llama.cpp b9658 版本在聊天解析错误时输出完整未解析提示

llama.cpp 项目发布了 build b9658。一项重要改进是增强了聊天调试功能：当发生解析错误时，调试信息现在会包含完整的未解析提示。该版本仍提供面向多个平台的预编译二进制文件，包括 macOS（Apple Silicon 和 Intel）、Linux（CPU、Vulkan、ROCm、OpenVINO、SYCL）、Android（arm64 CPU）以及 Windows（CPU、CUDA、Vulkan、SYCL、HIP）。目前，启用 KleidiAI 的 macOS Apple Silicon 版本被暂时禁用。

GITHUB2026年6月15日

llama.cpp 发布 b9656 强化 PEG 工具调用解析与错误处理

llama.cpp b9656 版本强化了 PEG 原生工具调用解析。现在可接受可选的 "type":"function" 字段，以兼容 OpenAI 风格的工具调用序列化。最终解析失败时，解析器返回清晰的错误并记录未解析的片段，而非抛出原始内部状态。当 raw arguments 不是合法 JSON 时会保留原始字符串，避免中断提示渲染。解析失败会以更清晰的错误消息呈现，消除静默的空 assistant 回合。对 "type":"function" 字段的宽松解析受分析标志控制。

GITHUB2026年6月15日

llama.cpp 发布 b9655 版本，修复聊天中存留已久的语法生成器 bug

llama.cpp 项目发布标签 b9655，修复了聊天功能中因近期代码变动而暴露的一个“古老但经典的”语法生成器 bug（PR #24653），并更新了 PEG 解析器测试中的一个错误用例。该版本提供了面向广泛平台的预编译二进制文件，包括 macOS（Apple Silicon、Intel、KleidiAI）、Linux（x64、arm64、s390x、Vulkan、ROCm、OpenVINO、SYCL）、Android（arm64）以及 Windows（x64、arm64、CUDA 12/13、Vulkan、SYCL、HIP），同时也包含了 openEuler 构建版本和 UI 组件。