试用了一下,openai 的图像生成能力确实挺不错的,感受上比我之前使用过的其他免费图像生成工具的效果好太多了。最重要的是使用方便并且具有上下文能力,还不需要像 comfyui 那样有一定的上手门槛、学习成本。
1
foolishcrab 8 天前 via iPhone
comfy 做的是工作流编排,大规模应用上这个模式在短期内都是主流,4o 强给它接进去就完事了。
comfy 背后的主流 stable diffusion 才是注定要被淘汰的,这一点是没有什么争议的。 |
2
kokerkov 8 天前
做图像的不应该是 Adobe 的 Firefly 吗?
|
3
LaTero 8 天前 via Android
文生图的限制在于文字本身。很多时候 control net 之类的技术比文字省事太多了。现在的图形输入+文字指令编辑还是太不稳定了,风格也不好把握。吉卜力特别出名它就模仿得好,小众一点的就表现很差。像没微调的 stable diffusion 和 flux ,基本只能生成写实照片,让它画二次元看得我起鸡皮疙瘩。距离指令编辑成熟,我猜测应该和 GPT2 到 GPT3.5 之间的差距差不多。现在高度客制化的 comfy ui 很难云端托管,一般只能租虚拟机按小时收费,很不经济。假如指令编辑能成熟而且能快速学习各种风格(比如用文字告诉模型一张样图作风格参考,另一个视频作姿势参考)说不定能迎来独立动画大爆发?
|