R STABLEDIFFUSION·
有用户利用 Blender 和 ComfyUI 搭建了一个 AI 辅助动画流程,将 LTX 2.3 作为替代渲染引擎。他们对官方 IC-LoRA 工作流做了修改,加入首帧和尾帧条件,并用 Blender 生成了结合深度和 AO 通道的自定义控制视频。仅使用蒸馏 LoRA 时,运动与构图稳定,但远离引导帧时纹理逐渐褪色;加入 IC-LoRA 后纹理得以保持,却导致构图漂移、角色错位和整体不稳定。用户希望从技术层面理解 IC-LoRA 与蒸馏模型、引导帧的交互,以解释这一权衡。
R STABLEDIFFUSION·
一位 Reddit 用户分享了一张逼真的舒适游戏房室内图像。该研究侧重于实现逼真的光照、自然的杂物和平衡的 RGB 点缀。作者表示可应要求提供提示词和工作流程。未公开具体模型、基准测试或新技术。该帖子体现了社区驱动的提示词工程探索,而非正式发布或突破。
R STABLEDIFFUSION··重点
商汤预览了下一代多模态模型SenseNova-U1 Pro,宣称支持原生8K分辨率输出(对比GPT-Image-2的原生4K)。该模型采用统一的“理解-生成-行动”架构,瞄准专业设计工作流。直接对比显示U1 Pro在信息图、长卷画布局、杂志跨页、学术海报和高分辨率分镜故事板共5个场景中优于GPT-Image-2。该模型还端到端生成了整场股东会20余页的PPT。邀约测试将于2026年7月启动。
R STABLEDIFFUSION··重点
一位用户发现一种方法,通过让语言模型从零开始重建每一帧的完整语义状态,而非依赖IPAdapter或角色LoRAs等图像记忆,生成几乎无限张高分辨率且角色一致性的图像。该工作流将整个故事写成单条提示,包含详细的角色设定和场景描述;一个Qwen VLM节点拆分故事,为每个面板完全重写每个角色的描述,再送入Krea 2。结果出人意料地保持了一致性,无需任何参考图像或参考图技巧。该方法在Krea 2上效果良好,可能也适用于其他强模型,完整的ComfyUI工作流已公开,供他人在Flux、HiDream或Seedream上尝试。
R STABLEDIFFUSION·
一项后续对比测试了Krea2 Turbo模型在未加及加上三种不同去审查LoRA时的表现。两个微型LoRA(约200字节,仅改变2-3个权重)仅禁用审查过滤器,不引入新风格或概念。结果表明,内置过滤器显著削弱了模型在面部表情、瘀伤、体型、情绪等SFW内容上的生成质量。去审查LoRA释放了模型已有但被过滤限制的概念,恢复了这些能力。训练型SNOFS LoRA虽也能去除过滤,但会额外引入风格,非公平比较。测试使用固定提示词和标准参数确保公平。
R STABLEDIFFUSION·
一位 Reddit 用户发布了用 Krea2 制作的表情包,称该工具让做表情包变得很容易。该用户对目前还没出现大量表情包潮表示惊讶,并邀请社区成员分享自己的作品。