Thinkgap 信息流

过滤噪音，保留 AI 信号。

页面仅读取已加工的 items 表，并以中英双语呈现。

8 条内容

X2026年6月14日

里约热内卢市发布基于Qwen的397B开源语言模型“Rio 3.5 Open”

里约热内卢市发布了一个名为Rio 3.5 Open的大语言模型，参数规模达397B。该模型基于Qwen（具体为Qwen 7/2变体）进行后训练，并集成了SwiGLU激活和旋转位置嵌入。模型以开放形式提供，是公共部门贡献大规模开源LLM的罕见案例。

X2026年6月13日

领域专用医疗AI刷屏研究被误解：微调后的前沿模型可超越通用模型

刷屏研究测试了医疗AI产品UpToDate和OpenEvidence（非底层模型），在MedQA、HealthBench等有限基准上表现不如前沿通用模型。作者指出这并不证明领域专用模型天生劣势；其自有综合基准显示将前沿模型针对医学微调可获得显著提升。当前领域专用模型常因基于较旧或较弱的开源模型而落后，并非专精失效。例如百川智能的Baichuan-M4声称医疗专用模型性能超越前沿模型。关键结论是：若能快速将强大的前沿模型适配为医学工具，将诞生更优的领域专用系统，但开源基座模型进步和适配速度仍是瓶颈。

X2026年6月11日

过滤噪音，保留 AI 信号。

里约热内卢市发布基于Qwen的397B开源语言模型“Rio 3.5 Open”

领域专用医疗AI刷屏研究被误解：微调后的前沿模型可超越通用模型

轨迹实验室使用开放模型在24小时内完成前沿性能后训练，由Together Compute与NVIDIA提供算力

Mistral CTO Timothée Lacroix 在 NVIDIA AI 播客中讨论开放模型理念、Forge 框架与 Nemotron 联盟

关于PEFT的扩展：迈向百万级个性化模型与万亿参数

用户赞扬Hugging Face Hub上模型后续训练与分享的便捷性