稳定人工智能发布SDXL 09文字生成图片模型图像质量大幅提升
6月25日消息,稳定人工智能(Stability AI)近日正式发布了他们旗下的文字生成图片模型SDXL 0.9。这一版本在图像内容和构图细节方面经过了重大改进,并且可以在消费级GPU上高效运行。
据悉,SDXL 0.9在所有开源图像模型中具备最多的参数数量,其中包括一个基础模型和一个附加模型,分别拥有35亿参数和66亿参数。稳定人工智能团队采用了渐进式的工作过程,首先使用基础模型生成初步细节,然后通过附加模型对图像进行精细化处理。如果读者曾经使用过稳定扩散(Stable Diffusion)技术,可能会对这种渐进式的工作过程感到熟悉。
稳定人工智能表示,SDXL 0.9采用了两个CLIP模型,其中包括了目前体积最大的OpenCLIP模型之一,名为vitg/14。借助这个模型,稳定扩散能够生成更深、分辨率更高的逼真图像。
据了解,稳定人工智能团队计划在接下来发布一篇研究博客,详细介绍SDXL 0.9的模型规格和更多参数细节。预计该模型将于7月发布1.0正式版本,并在GitHub上开源。这将进一步推动人工智能技术的发展和应用。
稳定人工智能的SDXL 0.9文字生成图片模型的发布,标志着他们在图像生成领域取得了重要的进展。这一版本的改进将使用户能够更加轻松地创建逼真的图像,并为消费级GPU用户提供了更好的性能。随着SDXL 0.9的进一步发展和1.0版本的发布,我们可以期待更多创新和应用场景的出现,这将极大地推动图像生成技术的发展。