AI 信息流

OPENREVIEW2026年6月28日重点

Causal Consequence-Penalized Learning: Correcting the TD Target for Stochastic Delay and Action Attribution

该论文指出受限强化学习中的三个根本缺陷：未知的随机后果延迟导致TD目标错误，对因果效应与已有后果的混淆造成系统性过罚或欠罚，以及将乘子内嵌入单一Q函数导致贝尔曼目标在乘子更新时非平稳。CCPL提出延迟修正的贝尔曼算子，学习完整延迟分布并计算自适应有效折扣因子，首次给出了该情形下的收缩性证明。证明状态条件的λ(s)严格优于任何标量λ，弥补了现有理论的空白，并用干预后果网络（基于环境结构因果模型真实标签预训练）估计边际因果贡献来代替成本估计。CCPL分离奖励与约束Q函数，保持目标平稳且仅在推理时组合惩罚值。在6个环境（含对抗场景）和8个基线中，CCPL是唯一同时获得高奖励（+4.84）和完全约束满足（100%）的智能体，且核心定理在每次训练中均经机器验证。

OPENREVIEW2026年6月28日重点

A Unified Dirichlet Framework for Spatial-Temporal Risk Assessment

本文提出了一种时空风险评估的统一Dirichlet框架，证明了每个空间单元维护的单个Dirichlet后验及其加性证据更新规则是满足四个公理的唯一更新-预测对，并与七种经典方法（AHP、Dempster–Shafer、Hawkes过程等）极限等价。该框架从后验中同时输出危险严重性评分和威胁特征描述。在大规模基准测试（41个区域×10,000单元×365天）中，它的one-vs-rest AUROC为0.666，严重度AUROC为0.725，统计显著优于15个结构化基线（Holm校正p < 10⁻²⁶），威胁特征描述准确率达到79.1%，而AUROC相当的竞争方法仅为0–26%。向169万伦敦和11.9万芝加哥犯罪事件的真实迁移保持了双重输出优势，预注册专业化实验证实运行配置优于匹配的专用方法。该方法仅需七个独立模型3.6分之一的内存（每单元128字节 vs 464字节），吞吐量达41K信号/秒。

OPENREVIEW2026年6月28日重点

SHIELD: Suppressing Hallucinations In LVLM Encoders via Bias and Vulnerability Defense

该论文首次将大视觉语言模型（LVLM）中的物体幻觉溯源至视觉编码器，指出统计偏差、固有偏差和脆弱性三个关键问题。为解决这些问题，提出了无需训练的框架 SHIELD，通过三种策略缓解幻觉：重加权视觉令牌以降低统计偏差、引入噪声衍生令牌对抗固有偏差、采用对抗攻击与对比解码应对脆弱性。在多个基准和 LVLM 家族上的实验表明，SHIELD 有效减少了物体幻觉，并保持了强大的通用性能，代码已开源。

OPENREVIEW2026年6月28日重点

Contrast-Induced Class Overlap as a Fairness Bottleneck in Dermatological AI: Evidence from HAM10000

AI皮肤癌分诊系统在深肤色患者中每千人约产生106次不必要的额外转诊，原因并非漏诊，而是过度预测。其根源在于黑色素浓度降低皮损与背景的光学对比度，导致类别重叠。作者用信噪比（SNR）框架形式化该机制，预测从浅肤色到深肤色SNR下降5.2倍。在HAM10000数据集高置信度ITA子集上，深肤色灵敏度略高（0.848 vs. 0.821），但特异性显著更低（0.720 vs. 0.831，降幅11.1个百分点）。消融研究对比了ITA色调调节（特征校准）与深肤色增强（决策边界调整），揭示两者独立效果。零样本迁移至DDI数据集（n=656）确认了AUC差距。代码和训练权重已公开发布。

OPENREVIEW2026年6月28日

Bayesian Robust Cooperative Multi-Agent Reinforcement Learning Against Unknown Adversaries

该论文研究协同多智能体强化学习在部署时面对未知目标对手的鲁棒性问题。作者提出了一种具有连续对手类型的贝叶斯Dec-POMDP博弈模型，每种类型对应不同的攻击目标。为使其可求解，他们引入一种基于对抗策略相对于参考c-MARL策略性能的分区方案，将问题转化为有限类型贝叶斯博弈。他们开发了可证明收敛的外部约束强化学习算法来计算对抗策略，并采用同步梯度更新方案获得鲁棒贝叶斯c-MARL策略。实验表明，所得方法BATPAL在多种基准和攻击策略下均优于当前最先进的基线。

过滤噪音，保留 AI 信号。

Causal Consequence-Penalized Learning: Correcting the TD Target for Stochastic Delay and Action Attribution

A Unified Dirichlet Framework for Spatial-Temporal Risk Assessment

SHIELD: Suppressing Hallucinations In LVLM Encoders via Bias and Vulnerability Defense

Contrast-Induced Class Overlap as a Fairness Bottleneck in Dermatological AI: Evidence from HAM10000

Bayesian Robust Cooperative Multi-Agent Reinforcement Learning Against Unknown Adversaries