Stability AI 在生成式 AI 领域逐渐失去影响力,本周他们发布了 Stable Diffusion 3 Medium(简称 SD3M)。尽管 Stability AI 称其为“最复杂的图像生成模型”,但用户发现它经常生成恐怖的洛夫克拉夫特(Lovecraftian)怪物图像。
然而,Stable Diffusion 3 Medium 一经发布,就引来众多嘲笑。其生成的人类图像被嘲笑为比 Midjourney 或 DALL-E 3 退步了一大步,容易生成不正确的人体畸形图像。Reddit 上的一个帖子详细描述了 SD3 Medium 在渲染人类手脚和身体时的巨大失败,由于早期训练数据集中缺乏好的例子,手部一直是 AI 图像生成器的一个挑战,但这次事件这对于图像合成爱好者来说是个巨大的灾难。
AI 图像爱好者认为,Stable Diffusion 3 身体却缺陷图像是由于过滤成人内容(NSFW)导致的。模型训练数据中过多的审查会删除人体解剖学信息,导致图像生成不准确。类似问题在 SD 2.0 中也出现过,Stability AI 后来在 SD 2.1 和 SD XL 中恢复了一些能力。NSFW 过滤器过于严格也可能意外删除无害图像,影响模型描绘人类。
在 Hugging Face 上的 Stable Diffusion 3 Medium 使用运行提示,结果也显示出类似问题。以下是在 Hugging Face 上尝试制作的图片:(仅可在非商业许可下免费下载和使用)
不过,虽然 Stable Diffusion 3 Medium 生成的有些图像结果很糟糕,但 Reddit 和 X 上的用户都指出,SD3M 在处理文本方面表现相当出色。
SD3 模型的发布延迟引发了技术问题或管理不善的谣言。并且 Stability AI 公司最近也陷入了困境,创始人兼 CEO Emad Mostaque 于 3 月辞职,随后他们公司又进行了裁员,3 位核心工程师离职,Stability AI 公司财务状况不佳的消息自 2023 年以来一直存在。小编觉得 SD3 Medium 的失败可能归咎于公司管理不善,这也是 Stability AI 公司开始崩溃的迹象。虽然 Stability AI 公司尚未申请破产,但有一些用户开玩笑说:“我猜他们现在可以以安全且道德的方式破产了。”
评论前必须登录!
立即登录 注册