Stability AI 发布 Stable Diffusion 3.5,开源 AI 文生图模型迎来重大升级
新版本发布:Stable Diffusion 3.5 闪亮登场
10 月 23 日消息,Stability AI 公司昨日(10 月 22 日)发布博文,宣布推出 Stable Diffusion 3.5,这标志着开源 AI 文生图模型的重大进步。新版本包括 Medium(10 月 29 日发布)、Large 和 Large Turbo 三种规模版本,旨在满足科学研究人员、爱好者、初创公司和企业的不同需求。
多种版本:满足不同需求
-
Stable Diffusion 3.5 Large:拥有 80 亿个参数,具有卓越的质量和快速响应,是 Stable Diffusion 家族中最强大的模型,非常适合 100 万像素分辨率的专业应用场景。
-
Stable Diffusion 3.5 Large Turbo:是 Large 的精简版,在出色地遵循提示词上,仅需 4 个步骤内生成高质量图像,且生成速度明显快于 Large。
-
Stable Diffusion 3.5 Medium(将于 10 月 29 日发布):该模型拥有 25 亿个参数,采用改进的 MMDiT-X 架构和训练方法,旨在能够在消费级硬件上 “开箱即用”,平衡质量和易于定制,能够生成分辨率在 25 万到 200 万像素之间的照片。
质量与性能:持续改进
Stability AI 表示,本次发布没有完全达到公司的标准或社区的期望,后续将继续打磨开发更稳健的解决方案。这表明,尽管当前版本已经取得了显著进展,但公司仍在不断努力提升模型的质量和性能,以满足更高的用户需求。
宽松许可:支持非商业用途
Stability AI 为此次发布实施了一项相当宽松的社区许可。这些模型可供非商业用途免费使用,并且对年收入低于 100 万美元的企业开放,超过此门槛的企业必须获得单独的许可安排。这一策略不仅鼓励了广泛的使用和创新,也确保了公平的商业应用。
总结
Stability AI 推出的 Stable Diffusion 3.5,通过提供三种规模版本,满足了不同用户的需求。无论是追求卓越质量的专业应用,还是需要快速生成高质量图像的场景,亦或是在消费级硬件上 “开箱即用” 的便捷性,Stable Diffusion 3.5 都提供了相应的解决方案。尽管当前版本未完全达到预期,Stability AI 表示将继续优化模型,以提供更稳健的解决方案。
此外,宽松的社区许可政策,使得更多的非商业用户和小型企业能够免费使用这些模型,推动了开源 AI 文生图技术的普及和创新。随着后续版本的不断改进,Stable Diffusion 3.5 有望在更多领域展现其强大的应用潜力。