R STABLEDIFFUSION·
有用户利用 Blender 和 ComfyUI 搭建了一个 AI 辅助动画流程,将 LTX 2.3 作为替代渲染引擎。他们对官方 IC-LoRA 工作流做了修改,加入首帧和尾帧条件,并用 Blender 生成了结合深度和 AO 通道的自定义控制视频。仅使用蒸馏 LoRA 时,运动与构图稳定,但远离引导帧时纹理逐渐褪色;加入 IC-LoRA 后纹理得以保持,却导致构图漂移、角色错位和整体不稳定。用户希望从技术层面理解 IC-LoRA 与蒸馏模型、引导帧的交互,以解释这一权衡。
R STABLEDIFFUSION··重点
商汤预览了下一代多模态模型SenseNova-U1 Pro,宣称支持原生8K分辨率输出(对比GPT-Image-2的原生4K)。该模型采用统一的“理解-生成-行动”架构,瞄准专业设计工作流。直接对比显示U1 Pro在信息图、长卷画布局、杂志跨页、学术海报和高分辨率分镜故事板共5个场景中优于GPT-Image-2。该模型还端到端生成了整场股东会20余页的PPT。邀约测试将于2026年7月启动。
R STABLEDIFFUSION·
一项后续对比测试了Krea2 Turbo模型在未加及加上三种不同去审查LoRA时的表现。两个微型LoRA(约200字节,仅改变2-3个权重)仅禁用审查过滤器,不引入新风格或概念。结果表明,内置过滤器显著削弱了模型在面部表情、瘀伤、体型、情绪等SFW内容上的生成质量。去审查LoRA释放了模型已有但被过滤限制的概念,恢复了这些能力。训练型SNOFS LoRA虽也能去除过滤,但会额外引入风格,非公平比较。测试使用固定提示词和标准参数确保公平。
R STABLEDIFFUSION·
(Deno) Local LLM Loader 是一款新的 ComfyUI 节点,可将本地大语言模型(Ollama、LM Studio、llama.cpp、vLLM 或任何 OpenAI 兼容的本地服务)直接接入图像生成工作流。它支持将简短想法扩展为详细提示词、借助视觉模型从图像生成或审查提示词,以及串联多个 LLM 步骤(如草稿→审阅→最终整理)。配套的 (Deno) Local LLM Reviewer 节点能根据审阅文本通过或阻断图像输出,从而在 ComfyUI 内实现迭代优化。该节点以本地优先为设计理念,无需远程 API 密钥,并在提示链运行时保持模型加载。节点可通过 ComfyUI Manager 搜索“Deno Custom Nodes”安装,代码托管在 GitHub。
R STABLEDIFFUSION·
一位Reddit用户重新分享了生成2x2(四格)电影故事板的工作流,该工作流使用Krea2 Turbo生成图像,并用Gemma 4 12B进行提示词工程。工作流包含一个LM Studio节点,通过精心设计的系统提示让Gemma为Krea2生成高度详细的提示词。Krea2 Turbo目前难以处理较大网格,常产生不对称的面板,因此用户正在开发自定义节点来解决此问题,但尚未包含在内。生成故事板只需提供简单场景描述,帖中给出了奇幻儿童电影和黑客场景等示例。工作流文件通过Google Drive提供。
R STABLEDIFFUSION·
一位Reddit用户报告称使用Krea 2 Turbo三小时后感到极为惊艳。所有图像均在WanGP中以1440p分辨率生成,未使用任何遮罩、图层或LoRA技术。该用户分享了源图像和提示词的链接,但未提供更多技术细节。