Trycua:面向计算机使用AI代理的开源基础设施
Trycua是一个面向计算机使用AI代理的开源基础设施项目。它提供沙箱环境,用于安全训练和评估能控制macOS、Linux、Windows全桌面环境的代理。项目包含用于代理开发的SDK,以及衡量代理桌面任务表现的基准测试。
Thinkgap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
26 条内容
Trycua是一个面向计算机使用AI代理的开源基础设施项目。它提供沙箱环境,用于安全训练和评估能控制macOS、Linux、Windows全桌面环境的代理。项目包含用于代理开发的SDK,以及衡量代理桌面任务表现的基准测试。
langchain-openai==1.3.1 版本主要规范化了 v1 流式工具调用以确保输出一致,并在追踪元数据中添加了包版本跟踪。同时收紧了结构化输出模型回退逻辑,更新了显式反序列化白名单测试并刷新了文档。此版本还合并了核心库 v1.4.7 和 v1.4.6 的更新。
langchain-anthropic 1.4.6 版本发布。主要修复了文件搜索结果限制并收紧了 `allowed_prefixes` 在 Anthropic MCP 工具中的使用。该版本还包含了 monorepo 范围的更新,如追踪元数据中加入了包版本追踪、类型检查配置升级至 mypy 2.1,以及新增流式工具调用块验证测试。
英伟达开源了 SkillSpector,这是一款专门用于检测 AI 代理技能中漏洞、恶意模式和安全风险的安全扫描器。该工具旨在帮助开发者和安全团队自动发现代理人工智能实现中的威胁。它已在 GitHub 上发布,回应了自主 AI 系统日益增长的安全保障需求。
hexo-ai/sia 仓库发布了 SIA 自我改进 AI 框架。该框架旨在自动提升任意 AI 模型或智能体在指定基准任务上的表现,无需人工调参或重新训练。项目已开源,但简介未透露具体实现细节。
agentsview 是一个开源工具,为编程代理提供本地优先的会话智能与分析功能。它支持 Claude Code、OpenAI Codex 以及超过 20 种其他代理,所有使用数据均在用户设备上处理。该项目号称是 ccusage(Claude Code 会话追踪工具的常用替代)的 100 倍速度替代品。由于数据保留在本地,隐私得到保障且无需外部依赖。代码库托管在 GitHub 上的 kenn-io 账号下。