openai 的图像生成能力确实惊艳，这样下去 comfyui 还有优势吗

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

试用了一下，openai 的图像生成能力确实挺不错的，感受上比我之前使用过的其他免费图像生成工具的效果好太多了。最重要的是使用方便并且具有上下文能力，还不需要像 comfyui 那样有一定的上手门槛、学习成本。

openai

图像生成

comfyui

3 条回复 • 2025-04-02 15:33:30 +08:00

foolishcrab

8 天前 via iPhone

comfy 做的是工作流编排，大规模应用上这个模式在短期内都是主流，4o 强给它接进去就完事了。
comfy 背后的主流 stable diffusion 才是注定要被淘汰的，这一点是没有什么争议的。

kokerkov

8 天前

做图像的不应该是 Adobe 的 Firefly 吗？

LaTero

8 天前 via Android

文生图的限制在于文字本身。很多时候 control net 之类的技术比文字省事太多了。现在的图形输入+文字指令编辑还是太不稳定了，风格也不好把握。吉卜力特别出名它就模仿得好，小众一点的就表现很差。像没微调的 stable diffusion 和 flux ，基本只能生成写实照片，让它画二次元看得我起鸡皮疙瘩。距离指令编辑成熟，我猜测应该和 GPT2 到 GPT3.5 之间的差距差不多。现在高度客制化的 comfy ui 很难云端托管，一般只能租虚拟机按小时收费，很不经济。假如指令编辑能成熟而且能快速学习各种风格（比如用文字告诉模型一张样图作风格参考，另一个视频作姿势参考）说不定能迎来独立动画大爆发？