TransDiff最简洁自回归+扩散图像生成方法

3个月前发布

TransDiff最简洁自回归+扩散图像生成方法

大家好，很高兴为大家介绍我们的新工作–Marrying Autoregressive Transformer and Diffusion with Multi-Reference Autoregression，后面我们简称TransDiff。
Paper: https://arxiv.org/pdf/250

Soul居然也有科研部门啊

文章版权归作者所有，未经允许请勿转载。

没有相关内容!

16 条评论

洪帮主创业论读者

才发现还有这篇。从benchmark来看，我们应该还是有不小的优势。

3个月前无记录

回复
星光下的追梦人201512 投稿者

[g=haobang] 这个架构和iclr 2025的NOVA视频生成好像啊

3个月前无记录

回复
王宇辉和马奕屹读者

请问和orthus区别是？

3个月前无记录

回复
灵曦读者

觉得soul不好用可以去github下面留言吗

3个月前无记录

回复
陆爷读者

[g=wozuimei] 1-step AR里面的diffusion也是单步的吗，这个是怎么做到的

3个月前无记录

回复
幻影读者

是的。训练中，ar的输入是同类别其他图片。推理中是之前生成的图片。

3个月前无记录

回复
木子少儿艺术课堂读者

我也刚看到这篇论文。Orthus应该还是Mar的衍生方法:在语言模型上嫁接个diffloss的头，做的是t2i任务。然后Mar和我们方法的具体区别，可以参考第4张图哈

3个月前无记录

回复
程亮读者

这个soul是我想的那个嘛

3个月前无记录

回复
sianyoo 投稿者

你猜对了

3个月前无记录

回复
打不死的甄嬛读者

和transfusion比主要进步在哪呢？

3个月前无记录

回复
混沌小读者

也有的。今年还有一篇cvpr，不过体量和声量都刚开始起步不过7月可以关注我们语音和视频全双工工作，效果也是比较领先哈哈预告下

3个月前无记录

回复
蔡柳青读者

回复不能超过300字，我图片回复哈有问题随时交流

3个月前无记录

回复
楊冰读者

[g=zhuakuang] 这个ar的unit是什么呀是reference image吗

3个月前无记录

回复
岚岚岚岚岚漪投稿者

和acdit对比怎么样呢

3个月前无记录

回复
龙行天下读者

哦哦你说的是的，但是可能不全对哈。我解释下，智源的NOVA是完整参考了MAR，所以Diffusion也是和MAR一样的n层MLP。这种结构就会带来一个问题：不仅Diffusion需要N步解码，Transformer也需要多次迭代（MAR是256，NOVA是128）。而我们的结构，由于使用了更复杂（但参数量增加不多的Dit结构）的Diffusion Decoder，可以一次生成的，当然也可以参考第4图的第二个问题哈。不知道是不是解释清楚哈

3个月前无记录

回复
痞帅仔投稿者

没，1Step AR指的是 ar transformer, diffusion还是多步，但是diffusion相对较小。

3个月前无记录

回复

TransDiff最简洁自回归+扩散图像生成方法

没有更多了...

没有更多了...

相关文章

16 条评论

热门网站

小苹果网页助手

Poki (宝玩)

Windsurf

奔图，专注做好打印机【官网】

卡农社区官网·中介办卡贷款技术·网贷口子·卡农论坛app

地图窝

热门文章

欧美经典《Hotel du Desir / 旅馆秘密》未删减高清全集无广告免费在线看，《Hotel du Desir / 旅馆秘密》啄木鸟系列中文版网盘观看资源，《Hotel du Desir …

新简历造假的悬崖：这三条红线，千万不能踩

为什么越来越多国家抛弃Windows，选择Linux系统，究竟怎么回事？

2025 台湾省热剧《垂涎》全集免费大放送_双男主BL《垂涎》高清完整版在线畅览 – 清风影院_双男主《垂涎》无广告纯净在线看 – 逸云影视-风流S级Alpha竟被当众咬腺体？

易懂案例：用班费记账来理解区块链Paxos算法、Basic Paxos算法、Cheap Paxos算法、Egalitarian Paxos算法、Fast Paxos算法、Multi-Paxos算法、B

TensorFlow、PyTorch与MindSpore深度对比：谁才是AI框架的王者？

TransDiff最简洁自回归+扩散图像生成方法

没有更多了...

没有更多了...

相关文章

16 条评论

热门网站

小苹果网页助手

Poki (宝玩)

Windsurf

奔图，专注做好打印机【官网】

卡农社区官网·中介办卡贷款技术·网贷口子·卡农论坛app

地图窝

热门文章

欧美经典《Hotel du Desir / 旅馆秘密》未删减高清全集无广告免费在线看，《Hotel du Desir / 旅馆秘密》啄木鸟系列中文版网盘观看资源，《Hotel du Desir …

新简历造假的悬崖：这三条红线，千万不能踩

为什么越来越多国家抛弃Windows，选择Linux系统，究竟怎么回事？

2025 台湾省热剧《垂涎》全集免费大放送_双男主BL《垂涎》高清完整版在线畅览 – 清风影院_双男主《垂涎》无广告纯净在线看 – 逸云影视-风流S级Alpha竟被当众咬腺体？

易懂案例：用班费记账来理解区块链Paxos算法、Basic Paxos算法、Cheap Paxos算法、Egalitarian Paxos算法、Fast Paxos算法、Multi-Paxos算法、B

TensorFlow、PyTorch与MindSpore深度对比：谁才是AI框架的王者？

标签云