HUGGINGFACE·
微软发布了 HARC-Qwen2.5-7B-Instruct,这是基于 Qwen2.5-7B-Instruct 进行安全对齐微调的对话模型。该模型为基于 Transformer 的文本生成模型,以 Apache 2.0 许可证在 Hugging Face 上开放,采用 safetensors 格式,支持 text-generation-inference 和 Hugging Face 端点。此发布与论文 arXiv:2607.00572 相关。
HUGGINGFACE·
微软在Hugging Face上发布了HARC-Llama-3.1-8B-Instruct。该模型是基于Meta的Llama 3.1 8B Instruct构建的文本生成模型。仓库标签显示其专注安全、对齐和对话应用。模型卡片未提供基准测试、训练细节或具体能力声明。该模型以Llama 3.1许可证分发。
HUGGINGFACE··重点
AGVBench是一个综合性基准,在五个公开的掌静脉和指静脉数据集上,使用七种骨干架构(包括CNN、视觉Transformer和静脉专用模型)评估了30种数据增强策略。多图像混合方法(MixUp、PuzzleMix、StarMixup)取得了最高的识别精度,但校准性差且容易受到对抗扰动攻击。剧烈的几何变换通常因特征错位或空间裁剪导致性能下降。结果表明,仅以精度为中心的评价不足以满足生物特征数据增强的需求,必须考虑安全性和鲁棒性。AGVBench提供了标准化协议和开源代码,以推动可复现且安全的静脉识别研究。
HUGGINGFACE··重点
该论文将混合专家离散扩散语言模型DiffusionGemma-26B适配到医学领域,并以相同的LoRA微调方案在医学视觉问答基准上对比了自回归模型Gemma-4-26B。经冗长鲁棒的LLM法官评分,扩散模型匹配或超越了自回归性能,且解码速度加快3.5-4.4倍。微调后的模型(激活参数3.8B)与前沿视觉语言模型竞争激烈。更重要的是,扩散范式支持任意顺序的文本填充:放射科医生可修正报告片段,模型能生成夹在中间的文字,这一能力是自回归模型难以提供的,适合风格与完整度不一致的真实放射学报告。
HUGGINGFACE··重点
Nvidia 在 Hugging Face 上发布了 Mistral-Medium-3.5-128B 大语言模型的量化版本。该模型采用 NVFP4 4 位浮点精度格式,旨在减小内存占用并可能加速推理。它被标注为适用于对话和文本生成任务,并以 safetensors 格式提供。仓库信息表明此模型基于 Mistral AI 的原始 Mistral-Medium-3.5-128B,并以自定义许可证发布。
HUGGINGFACE··重点
微软发布了GELab-Zero-4B-preview-Sico-Evolution,这是一个40亿参数的视觉语言模型,专精于GUI代理任务。该模型基于Qwen3-VL并采用LoRA进行微调,面向移动端和通用GUI代理场景。它支持中英双语文本输入,处理图像-文本至文本的流水线。模型以Apache 2.0开源许可发布,标注为早期预览版本。