在开源的文生图模型领域,Stable Diffusion模型一直处于领先地位,哪怕公司经历过一段动荡,也还是开源了Stable Diffusion 3模型,虽然效果一般,但还是未来可期的,不过随着FLUX.1模型的发布,这个最强开源文生图模型的头衔,可能要易主了。
FLUX.1模型,是由Stable Diffusion原班人马成立的新工作室——黑森林工作室推出,也就是从Stable Diffusion公司Stability离职的成员组成,可以说FLUX模型就是对Stable Diffusion模型发起的挑战,给前东家狠狠的来上两巴掌。
那么FLUX.1模型有什么特点呢,首先第一个,图像质量增强,拉近了和最强文生图软件Midjourney的距离,但这款是闭源软件,和开源模型还是有点不公平的。第二个特点呢,是手部细节的优化与增强,比起Stable Diffusion模型的畸形手指,FLUX.1模型要正常得多。
然后还有关键词语义理解准确性的增强,也就是能理解一段话的内容,更能准确的生成出文字描述的图片,不需要单个单个的提示词。其次就是生图速度变得更快了,但是由于配置需求最低的模型都需要16GB的显存起步,只是消费级显卡的话,很难体验到生图速度变快。