商汤预览SenseNova-U1 Pro:原生8K输出,跨5种场景直接对标GPT-Image-2
商汤预览了下一代多模态模型SenseNova-U1 Pro,宣称支持原生8K分辨率输出(对比GPT-Image-2的原生4K)。该模型采用统一的“理解-生成-行动”架构,瞄准专业设计工作流。直接对比显示U1 Pro在信息图、长卷画布局、杂志跨页、学术海报和高分辨率分镜故事板共5个场景中优于GPT-Image-2。该模型还端到端生成了整场股东会20余页的PPT。邀约测试将于2026年7月启动。
商汤预览了下一代多模态模型SenseNova-U1 Pro,宣称支持原生8K分辨率输出(对比GPT-Image-2的原生4K)。该模型采用统一的“理解-生成-行动”架构,瞄准专业设计工作流。直接对比显示U1 Pro在信息图、长卷画布局、杂志跨页、学术海报和高分辨率分镜故事板共5个场景中优于GPT-Image-2。该模型还端到端生成了整场股东会20余页的PPT。邀约测试将于2026年7月启动。
一位 Reddit 用户发布了用 Krea2 制作的表情包,称该工具让做表情包变得很容易。该用户对目前还没出现大量表情包潮表示惊讶,并邀请社区成员分享自己的作品。
(Deno) Local LLM Loader 是一款新的 ComfyUI 节点,可将本地大语言模型(Ollama、LM Studio、llama.cpp、vLLM 或任何 OpenAI 兼容的本地服务)直接接入图像生成工作流。它支持将简短想法扩展为详细提示词、借助视觉模型从图像生成或审查提示词,以及串联多个 LLM 步骤(如草稿→审阅→最终整理)。配套的 (Deno) Local LLM Reviewer 节点能根据审阅文本通过或阻断图像输出,从而在 ComfyUI 内实现迭代优化。该节点以本地优先为设计理念,无需远程 API 密钥,并在提示链运行时保持模型加载。节点可通过 ComfyUI Manager 搜索“Deno Custom Nodes”安装,代码托管在 GitHub。
一位Reddit用户报告称使用Krea 2 Turbo三小时后感到极为惊艳。所有图像均在WanGP中以1440p分辨率生成,未使用任何遮罩、图层或LoRA技术。该用户分享了源图像和提示词的链接,但未提供更多技术细节。
一位Reddit用户使用相同的JSON提示词生成图像,对比了Ideogram 4.0和Krea 2的输出效果(分辨率4MP和2MP)。在三次对比中,两次用户更青睐Ideogram 4.0的结果,而Krea 2因其快速生成概念草图的能力受到好评。用户后来提到使用LoRA绕过Krea的过滤机制,这降低了对比的有效性。
一位 Reddit 用户分享了一组无需 LoRA 即可在 Krea2 上生成写实图像的提示技巧。他们通过使用“shot on old iphone camera”和“image on iphone5/7”等描述词获得业余感照片效果,而“old nikon 35mm camera 21.3MEGA PIXEL”则生成更高质量。对于光照,推荐使用“harsh sunlight, contrast”。用户还将生成步数调整为 -9、11 或 14 附近的值,并以 704x1152 或 544x896 分辨率生成图像。