Stability AI 发布 Stable Diffusion 3.5,开源 AI 文生图模型迎来重大升级

新版本发布：Stable Diffusion 3.5 闪亮登场

10 月 23 日消息,Stability AI 公司昨日（10 月 22 日）发布博文,宣布推出 Stable Diffusion 3.5,这标志着开源 AI 文生图模型的重大进步。新版本包括 Medium（10 月 29 日发布）、Large 和 Large Turbo 三种规模版本,旨在满足科学研究人员、爱好者、初创公司和企业的不同需求。

多种版本：满足不同需求

Stable Diffusion 3.5 Large：拥有 80 亿个参数,具有卓越的质量和快速响应,是 Stable Diffusion 家族中最强大的模型,非常适合 100 万像素分辨率的专业应用场景。
Stable Diffusion 3.5 Large Turbo：是 Large 的精简版,在出色地遵循提示词上,仅需 4 个步骤内生成高质量图像,且生成速度明显快于 Large。
Stable Diffusion 3.5 Medium（将于 10 月 29 日发布）：该模型拥有 25 亿个参数,采用改进的 MMDiT-X 架构和训练方法,旨在能够在消费级硬件上 “开箱即用”,平衡质量和易于定制,能够生成分辨率在 25 万到 200 万像素之间的照片。

质量与性能：持续改进

Stability AI 表示,本次发布没有完全达到公司的标准或社区的期望,后续将继续打磨开发更稳健的解决方案。这表明,尽管当前版本已经取得了显著进展,但公司仍在不断努力提升模型的质量和性能,以满足更高的用户需求。

宽松许可：支持非商业用途

Stability AI 为此次发布实施了一项相当宽松的社区许可。这些模型可供非商业用途免费使用,并且对年收入低于 100 万美元的企业开放,超过此门槛的企业必须获得单独的许可安排。这一策略不仅鼓励了广泛的使用和创新,也确保了公平的商业应用。

总结

Stability AI 推出的 Stable Diffusion 3.5,通过提供三种规模版本,满足了不同用户的需求。无论是追求卓越质量的专业应用,还是需要快速生成高质量图像的场景,亦或是在消费级硬件上 “开箱即用” 的便捷性,Stable Diffusion 3.5 都提供了相应的解决方案。尽管当前版本未完全达到预期,Stability AI 表示将继续优化模型,以提供更稳健的解决方案。

此外,宽松的社区许可政策,使得更多的非商业用户和小型企业能够免费使用这些模型,推动了开源 AI 文生图技术的普及和创新。随着后续版本的不断改进,Stable Diffusion 3.5 有望在更多领域展现其强大的应用潜力。