Thinkgap 信息流

过滤噪音，保留 AI 信号。

26 条内容9 个来源每日持续更新

V2EX2026年7月31日

Markup Relay：面向AI编程智能体的开源视觉标注工具发布

SUB&SUB 工作室发布了开源工具 Markup Relay，可通过浏览器对图像和视频进行标注，帮助 AI 编程智能体理解视觉上下文。用户可拖入文件，用框选工具标记关注区域，未框选部分自动模糊；视频则提取关键帧描述动态变化。处理后文件上传至 Cloudflare R2 并在设定时间内自动删除，团队正通过 ProductHunt 收集反馈。

X2026年7月31日

Google DeepMind首次展示在FR3 Duo上运行的Gemini Robotics 2：20分钟不间断实时工具操作

Google DeepMind首次公开了Gemini Robotics 2模型在FR3 Duo机器人上的演示视频。该演示展示了20分钟不间断的实时工具操作。帖子中未提供具体任务、模型架构或发布计划的更多细节。

TMTPOST2026年7月31日

AI短剧女主角方桃子粉丝逼近40万，引发AI取代真人演员讨论

抖音AI短剧《被裁掉的女孩》播放量突破2.2亿，其AI女主角方桃子个人账号运营不到一个月粉丝逼近40万，每条视频点赞均过万。她不同于此前过于完美的AI面容，脸上保留痣、毛孔和脱妆等真实瑕疵，突破了恐怖谷效应，引发观众强烈共情和自发模仿。这个小镇女孩闯时尚圈的平凡故事正好填补了市场空缺，证明观众需要的是不完美和真实性，真人演员仍可争取优势。

V2EX2026年7月31日

个人开发者将多个蹭词AI站点整合为全能视频与图片生成平台

该独立开发者此前曾针对Nano Banana Pro、GPT Image 2、Gemini Omni Flash等多个热门AI模型关键词分别搭建独立站点，虽获得订单但遭遇流量快速下滑、维护成本高、免费额度被滥用等问题。现已将所有经验整合，推出一个全能型AI视频与图片生成平台，支持文生视频、图生视频、首尾帧补间、动作/角色/风格参考生成及AI图片生成功能。平台已上线并提供限时注册积分。

X2026年7月31日

minchoi 为 AI 智能体接入 ElevenLabs 语音引擎实现语音交互

minchoi 将 ElevenLabs 语音引擎集成到其 AI 智能体中，使其具备语音交互能力。该智能体现在可以倾听、说话、流式回复并处理打断，展示了为智能体添加语音功能的个人应用实例。

X2026年7月31日

阿里通义千问发布Qwen-Audio-3.0-ASR-Flash语音识别模型，医疗术语召回率达95.36%

阿里通义千问团队发布Qwen-Audio-3.0-ASR-Flash语音识别模型，包含Streaming、Filetrans和基础版三种变体。新模型支持上下文一致性、领域词识别、自定义热词以及将语音润色为结构化文本。内部测试显示医疗术语召回率95.36%，工业术语召回率93.24%。