Understand Before You Generate: Self-Guided Training for Autoregressive Image Generation
一、背景 1. 自回归模型原用于自然语言处理,现被用于图像生成,但在视觉理解方面存在局限。 2. 当前图像生成方法如GAN、扩散模型虽表现