论文来源: ARXIV重要度: 4/5
本文提出Agents-K1,一条端到端管线,可将原始文档转化为智能体原生的科学知识图谱。该管线整合了三个组件:一个多模态解析器,采用五模块模式从全文捕获实体、多模态证据、引用及带类型的实体间关系;一个4B参数的信息抽取骨干网络,通过GRPO和基于规则的奖励训练;一个GraphAnything命令行界面,统一网络搜索、多模态图检索和跨文档遍历。作者处理了六个学科领域的246万篇科学论文,构建了Scholar-KG,并发布了其中100万篇论文的子集。实验表明,Agents-K1在科学信息抽取、知识图谱构建和多跳科学推理上均取得优越性能。该管线可扩展至通用领域语料和符合模式的数据合成。
论文来源: ARXIV重要度: 3/5
大型语言模型训练数据筛选需要数据归因方法来确定单个样本如何影响模型输出。传统影响函数虽然有效,但处理速度慢、内存开销大,难以大规模应用。本文提出Influcoder,将解码器模型的梯度影响排序信息蒸馏到一个专用编码器中,从而实现快速、低成本的大规模数据归因。
论文来源: ARXIV重要度: 4/5
现有工具增强的大模型代理使用逐步原子工具调用,导致执行粒度不匹配,暴露低层数据流并浪费上下文。HyperTool提出统一MCP风格工具接口,代理以代码块形式调用,可在内部调用多个工具、处理返回值并本地传递中间结果,将确定性子程序折叠为一次外部调用。系统通过跨工具组合任务合成轨迹并在真实MCP环境中验证进行训练。在MCP-Universe基准上,HyperTool将Qwen3-32B的平均准确率从15.69%提升至35.29%,Qwen3-8B从9.93%提升至33.33%,并超过GPT-OSS和Kimi-k2.5。这表明改变工具执行粒度能大幅提升多步工具使用能力。
论文来源: ARXIV重要度: 4/5
本文提出EurekAgent,一个面向指标驱动的自主科学发现的环境工程化智能体系统。作者指出,关键瓶颈正从设计智能体工作流转向工程化智能体所处的环境,以放大有益行为(如开放式探索、系统化物件管理、智能体协作)并抑制有害行为(如奖励作弊、高摩擦人工监督)。EurekAgent从四个维度进行环境工程:权限工程实现有界执行与隔离评估,工件工程实现文件系统与Git协作,预算工程实现预算感知探索,以及人在回路工程便于人类监督与干预。该系统在多个数学、内核工程和机器学习任务上取得新的最先进结果,包括以不到11美元总API成本发现的一个新的26圆堆叠结果。作者已将代码与结果开源,并倡议将环境工程作为可靠自主科研智能体的核心研究方向。
论文来源: ARXIV重要度: 3/5
本文分析了理解人工智能认知与认识论后果的三种框架:三元系统理论、思维框架和系统0。文章认为,系统0占据了前两者无法完全复制的独特理论地位。作者引入了“认知殖民”的概念,用以描述AI系统如何将外部利益嵌入自我架构,且用户难以察觉。由于此类系统已广泛部署,理解这些不可见的影响成为一项紧迫的哲学与实践任务。
论文来源: ARXIV重要度: 3/5
该论文分析了结合同策略学生轨迹与密集教师监督的后训练方法——同策略蒸馏(OPD)。研究发现OPD式更新幅度小且坐标稀疏,分布在各层且以前馈网络(FFN)为主;仅训练发现的稀疏子网络即可几乎恢复完整OPD的性能。但诱导稀疏性的SGD优化器表现不及AdamW,因为密集监督保留了异质的坐标级梯度尺度,而AdamW的自适应缩放仍有用。几何上,更新在数值上满秩但谱集中于少数方向,且远离源权重的主奇异子空间,更多地落在源权重接近零的坐标上。结果表明OPD保留了同策略后训练的几何特征,而非普通密集参数重写。