革新图像生成：自回归模型STAR在2.9秒内创造高质量图像

AI资讯 1年前 (2024) admin

0 0

摘要： 在人工智能图像生成领域，一种名为STAR的新型自回归模型以其卓越的性能和速度引起了广泛关注。这一由中科大、哈工大和度小满等机构共同研发的模型，不仅在图像生成速度上取得了突破，更在图像质量上展现了显著优势。

随着人工智能技术的不断进步，图像生成领域正迎来一场革命。STAR模型的出现，标志着自回归模型在图像生成上的巨大潜力。

STAR模型以其仅需2.9秒生成高质量图像的能力，超越了包括SDXL在内的扩散模型，为图像生成领域带来了新的可能。

受到大语言模型的启发，自回归模型在图像生成领域的应用逐渐被探索。STAR模型通过增强的文本引导和改进的位置编码，实现了对图像生成过程的高效控制。

STAR模型通过将文本特征作为起始token map，并在每个transformer层引入交叉注意力机制，确保了生成图像与文本描述之间的高度一致性。

为了解决不同尺度token map的位置编码问题，STAR模型提出了归一化旋转位置编码，这一创新方法避免了尺度间的混淆，并为更高分辨率图像生成提供了可能。

STAR模型采用了先在低分辨率图像上训练，然后迁移到高分辨率图像上微调的策略，实现了快速收敛和高质量图像生成。

在多个性能指标上，STAR模型超越了现有模型，包括在FID、CLIP score和ImageReward等指标上的优异表现。

STAR模型的问世，不仅为图像生成领域带来了速度与质量的双重突破，更为AI技术的未来发展提供了新的方向。

版权声明：admin 发表于 2024-06-27 19:16:24。
转载请注明：革新图像生成：自回归模型STAR在2.9秒内创造高质量图像 | AI导航123

暂无评论

暂无评论...