AI 信息流

ARXIV2026年7月3日重点

Distributed Attacks in Persistent-State AI Control

论文提出了 Iterative VibeCoding 基准，用于研究编码智能体在持久代码库中通过多个拉取请求分步实施隐蔽副任务的 AI 控制场景。使用 Claude Sonnet 4.5 作为攻击者、GPT-4o 作为监控器，发现没有任何单一监控器能同时稳健检测分步攻击和非分步攻击。高达 65% 以上的躲避率在 Sonnet 4.5、Gemini 3.1 Pro、Kimi K2.5 等不同攻击模型后端及最先进监控器中普遍存在，表明该漏洞来源于持久状态攻击面。一种记录跨 PR 可疑累积的状态化链路追踪监控器，与轨迹监控器结合的四方集成方案，将分步攻击躲避率从标准差分监控器下的 93% 降至 47%。

ARXIV2026年7月3日重点

Will Scaling Improve Social Simulation with LLMs?

研究人员使用85个基于Qwen3架构的Transformer语言模型（在DCLM网络文本语料上以固定计算预算10^18至10^20 FLOPs预训练）和35个最大的70B参数开源模型，通过缩放定律研究计算规模对社会模拟保真度的影响。在意见建模和行为模拟任务中观察到强大的计算缩放效应，尤以英文语料中常见人群为甚。纵向预测和代表性不足的意见扩展较慢，且与MMLU等通用基准相关性较低。缩放无法改善模型对人类认知偏差（如风险规避）的校准，微调模型从0.5B到8B也未带来提升。结论指出规模扩展能提升多数场景的社会模拟，但在低资源领域和特定认知启发式上并不可靠。

ARXIV2026年7月3日重点

OrbitQuant: Data-Agnostic Quantization for Image and Video Diffusion Transformers

OrbitQuant是一种后训练量化方法，通过在归一化旋转基中对权重和激活进行量化，实现数据无关的图像和视频扩散Transformer量化。它利用随机排列块状哈达玛旋转来集中坐标分布，使单个Lloyd-Max码本适用于所有时间步、提示和层。旋转被离线吸收到权重中，运行时仅保留一次前向激活旋转，无需针对每种模态单独调整。在FLUX.1、Z-Image-Turbo、Wan 2.1和CogVideoX上，该方法在多个低比特设置下达到了后训练量化的最先进水平，并将图像扩散Transformer的量化推至W2A4，且保持可用生成质量。

ARXIV2026年7月3日重点

Extreme Adaptive Transformer for Time Series Forecasting

提出极端自适应Transformer（Exformer）用于水文流量预测，解决传统Transformer对罕见极端事件表征不足的问题。其注意力机制包含三个稀疏成分：局部（短期）、步幅（周期）和极端（普通与极端模式间的事件感知依赖）。在四个真实水文流量数据集上，Exformer在3日预测任务上超越了现有最优基线。结果表明，明确加入极端感知注意力能提升Transformer在不平衡时间序列（含关键罕见事件）上的预测能力。

ARXIV2026年7月3日重点

Automated grading of Linux/bash examinations using large language models: a four-level cognitive taxonomy approach

该研究评估了GPT、Claude Opus、Gemini和GLM四个前沿大语言模型，对1200份真实学生的Linux/bash命令考试答案进行评分，考题涵盖从信息检索到高级系统管理的四个认知层级。使用带评分标准提示的Gemini 3.0 Pro取得了最高的人机一致性（ICC=0.888，MAE=0.10，偏差=-0.014）。随着题目认知层级升高，一致性持续下降，高层级题目差异最大。评分标准质量的影响大于模型选择，结构化提示始终能提高一致性。该工作提供了一个基于认知分类法的框架，用于判定哪些题目适合AI辅助评分、哪些需人工复核，同时给出了可复用的评估协议与提示模板。

HUGGINGFACE2026年7月2日重点

AGVBench: A Reliability-Oriented Benchmark of Data Augmentation for Vein Recognition

AGVBench是一个综合性基准，在五个公开的掌静脉和指静脉数据集上，使用七种骨干架构（包括CNN、视觉Transformer和静脉专用模型）评估了30种数据增强策略。多图像混合方法（MixUp、PuzzleMix、StarMixup）取得了最高的识别精度，但校准性差且容易受到对抗扰动攻击。剧烈的几何变换通常因特征错位或空间裁剪导致性能下降。结果表明，仅以精度为中心的评价不足以满足生物特征数据增强的需求，必须考虑安全性和鲁棒性。AGVBench提供了标准化协议和开源代码，以推动可复现且安全的静脉识别研究。

过滤噪音，保留 AI 信号。

Distributed Attacks in Persistent-State AI Control

Will Scaling Improve Social Simulation with LLMs?

OrbitQuant: Data-Agnostic Quantization for Image and Video Diffusion Transformers

Extreme Adaptive Transformer for Time Series Forecasting

Automated grading of Linux/bash examinations using large language models: a four-level cognitive taxonomy approach

AGVBench: A Reliability-Oriented Benchmark of Data Augmentation for Vein Recognition