Ethan Mollick 分享了一条方法学讨论串,剖析一篇新论文的争议。该论文提出通用AI模型在医疗任务上优于专用医疗AI。讨论串还概述了医学AI基准测试面临的挑战。未提供论文、模型或基准的具体细节。
Loading / 加载中
AI 论文、发布、工具与金融信号
Loading / 加载中
Infogap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
第 1 / 42 页
Ethan Mollick 分享了一条方法学讨论串,剖析一篇新论文的争议。该论文提出通用AI模型在医疗任务上优于专用医疗AI。讨论串还概述了医学AI基准测试面临的挑战。未提供论文、模型或基准的具体细节。
一位Google DeepMind研究员发现,当一个AI模型被用来帮助训练下一个模型时,新模型可能会无意中继承旧模型的奇怪行为习惯。这些习得的怪癖在训练过程中很难被过滤掉。这一现象或许可以解释为何同一家族的AI模型往往表现出相似的风格或行为特征,因为它们共享了会延续此类模式的训练谱系。
独立研究员发现,连贯的上下文可在大语言模型中引发隐状态迁移,在最终输出产生前进入不同的内部处理模式,使安全规则被重新解释而现有基于输出的过滤器无法察觉。研究主要通过分析开源模型(Gemma-3-12B-IT)的隐状态几何、残差流轨迹、稀疏自编码器读数及因果干预,证实了该现象。RLHF和输出分类器等现有对齐方法仅检查输出表面,对此类内部偏移视而不见。相关代码与数据已公开于GitHub和Zenodo。
Ethan Mollick 在 X 上发文称,在某个未指明的事件发生两天后,情况仍然令人困惑。推文未提供该事件的任何细节、性质或与人工智能相关的背景。
该帖文回顾了余承东近期提及盘古后机器之心对盘古NLP模型的报道。盘古由华为云和杨植麟前公司循环智能联合研发,报道中已出现“NLP Moonshot”团队称谓。帖文指出,在盘古之前,美团、阿里、搜狗以及悟道项目下的GLM、CPM等中文大模型竞赛早已展开。报道引用了唐杰与杨植麟对AI时代的预言:AI生产效率将提升两到三个数量级,AI应用场景将指数级增长。帖文最后提示,若想体验原盘古团队的新成果,可尝试Kimi Moonshot产品。
2026年6月,清华大学研发的K1人形机器人在香港一家购物中心公开展示,表演了模仿迈克尔·杰克逊的舞蹈动作,并与儿童踢足球。这次演示突显了机器人的敏捷性、平衡能力和在公共环境中与人类自然互动的能力,引起了公众对人形机器人进展的关注。