作者审计了500次代码提交,发现无需水印即可识别AI生成的代码。检测方法利用提交图、差异解析器,并需处理不规则的边缘情况。该方法表明,AI作者的痕迹会体现在代码变更和提交历史的结构模式中。文章将此描述为一套实用的代码审查流水线,用于标记版本控制中的AI编写贡献。
Loading / 加载中
AI 论文、发布、工具与金融信号
Loading / 加载中
Infogap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
第 2 / 82 页
作者审计了500次代码提交,发现无需水印即可识别AI生成的代码。检测方法利用提交图、差异解析器,并需处理不规则的边缘情况。该方法表明,AI作者的痕迹会体现在代码变更和提交历史的结构模式中。文章将此描述为一套实用的代码审查流水线,用于标记版本控制中的AI编写贡献。
Ethan Mollick 在 X 上发文称,在某个未指明的事件发生两天后,情况仍然令人困惑。推文未提供该事件的任何细节、性质或与人工智能相关的背景。
该帖文回顾了余承东近期提及盘古后机器之心对盘古NLP模型的报道。盘古由华为云和杨植麟前公司循环智能联合研发,报道中已出现“NLP Moonshot”团队称谓。帖文指出,在盘古之前,美团、阿里、搜狗以及悟道项目下的GLM、CPM等中文大模型竞赛早已展开。报道引用了唐杰与杨植麟对AI时代的预言:AI生产效率将提升两到三个数量级,AI应用场景将指数级增长。帖文最后提示,若想体验原盘古团队的新成果,可尝试Kimi Moonshot产品。
2026年6月,清华大学研发的K1人形机器人在香港一家购物中心公开展示,表演了模仿迈克尔·杰克逊的舞蹈动作,并与儿童踢足球。这次演示突显了机器人的敏捷性、平衡能力和在公共环境中与人类自然互动的能力,引起了公众对人形机器人进展的关注。
该论文于ACM CAIS 2026发表,研究了工具使用LLM智能体的安全评估问题。文中将结果划分为安全成功、不安全成功和失败三类,并提出两级验证架构:先进行确定性策略/工具检查,再采用基于LLM的验证器处理上下文安全。使用τ-bench工具使用场景进行评估,发现验证能减少不安全成功,但随着任务步长增加,任务完成率也会下降。作者将这一现象称为“验证器税”,揭示了一种依赖任务时长的安全与成功完成之间的权衡。研究强调不安全完成应作为独立类别,与安全成功区分开来。
李飞飞和杨立昆各自筹集了10亿美元,用于支持面向物理AI的世界模型,标志着从以语言为中心的方法转向。文章详细介绍了世界模型如何决定物理AI系统何时能有效与现实世界互动。这笔资金突显了对仅靠大语言模型通往通用智能的重大赌注。