AI 信息流

HUGGINGFACE2026年7月2日

微软发布安全对齐模型 HARC-Qwen2.5-7B-Instruct

微软发布了 HARC-Qwen2.5-7B-Instruct，这是基于 Qwen2.5-7B-Instruct 进行安全对齐微调的对话模型。该模型为基于 Transformer 的文本生成模型，以 Apache 2.0 许可证在 Hugging Face 上开放，采用 safetensors 格式，支持 text-generation-inference 和 Hugging Face 端点。此发布与论文 arXiv:2607.00572 相关。

HUGGINGFACE2026年7月2日

微软发布HARC-Llama-3.1-8B-Instruct安全对齐模型

微软在Hugging Face上发布了HARC-Llama-3.1-8B-Instruct。该模型是基于Meta的Llama 3.1 8B Instruct构建的文本生成模型。仓库标签显示其专注安全、对齐和对话应用。模型卡片未提供基准测试、训练细节或具体能力声明。该模型以Llama 3.1许可证分发。

HUGGINGFACE2026年7月2日重点

AGVBench: A Reliability-Oriented Benchmark of Data Augmentation for Vein Recognition

AGVBench是一个综合性基准，在五个公开的掌静脉和指静脉数据集上，使用七种骨干架构（包括CNN、视觉Transformer和静脉专用模型）评估了30种数据增强策略。多图像混合方法（MixUp、PuzzleMix、StarMixup）取得了最高的识别精度，但校准性差且容易受到对抗扰动攻击。剧烈的几何变换通常因特征错位或空间裁剪导致性能下降。结果表明，仅以精度为中心的评价不足以满足生物特征数据增强的需求，必须考虑安全性和鲁棒性。AGVBench提供了标准化协议和开源代码，以推动可复现且安全的静脉识别研究。

HUGGINGFACE2026年7月1日重点

Discrete Diffusion Language Models for Interactive Radiology Report Drafting

该论文将混合专家离散扩散语言模型DiffusionGemma-26B适配到医学领域，并以相同的LoRA微调方案在医学视觉问答基准上对比了自回归模型Gemma-4-26B。经冗长鲁棒的LLM法官评分，扩散模型匹配或超越了自回归性能，且解码速度加快3.5-4.4倍。微调后的模型（激活参数3.8B）与前沿视觉语言模型竞争激烈。更重要的是，扩散范式支持任意顺序的文本填充：放射科医生可修正报告片段，模型能生成夹在中间的文字，这一能力是自回归模型难以提供的，适合风格与完整度不一致的真实放射学报告。

HUGGINGFACE2026年7月1日重点

Nvidia 发布基于 NVFP4 量化的 Mistral-Medium-3.5-128B 模型

Nvidia 在 Hugging Face 上发布了 Mistral-Medium-3.5-128B 大语言模型的量化版本。该模型采用 NVFP4 4 位浮点精度格式，旨在减小内存占用并可能加速推理。它被标注为适用于对话和文本生成任务，并以 safetensors 格式提供。仓库信息表明此模型基于 Mistral AI 的原始 Mistral-Medium-3.5-128B，并以自定义许可证发布。

HUGGINGFACE2026年6月30日重点

微软发布GELab-Zero-4B预览版：基于Qwen3-VL微调的4B视觉语言GUI智能体

微软发布了GELab-Zero-4B-preview-Sico-Evolution，这是一个40亿参数的视觉语言模型，专精于GUI代理任务。该模型基于Qwen3-VL并采用LoRA进行微调，面向移动端和通用GUI代理场景。它支持中英双语文本输入，处理图像-文本至文本的流水线。模型以Apache 2.0开源许可发布，标注为早期预览版本。