扫码阅读

手机扫码阅读

只需一步！One-Step图像转换来了！亲测效果惊艳！（卡内基梅隆&Adobe）

317 2024-10-22

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：只需一步！One-Step图像转换来了！亲测效果惊艳！（卡内基梅隆&Adobe）

文章来源：

AI生成未来

扫码关注公众号

摘要：One-Step Image Translation with Text-to-Image Models

主要内容

本文提出了一种基于对抗性学习目标的通用方法，以克服现有条件扩散模型在推理速度和成对数据依赖性上的局限性。新方法通过整合单步扩散模型的模块到一个端到端的生成器网络，减少了推理步骤并增强了对输入图像结构的保持。该方法被应用于各种场景转换任务，并证明了其在无配对和配对设置下的有效性。

介绍

条件扩散模型虽成功，但推理速度慢且训练需要大量配对数据。本项工作通过对抗性学习目标调整预训练的文本条件one-step扩散模型，以实现快速的、无需图像对的训练。

方法

本文介绍了一种新的生成器架构，通过直接将条件信息馈送到UNet中并整合独立模块，同时使用LoRA技术调整网络权重，减少过拟合。此外，还引入了跳跃连接以保留输入的高频细节。

实验

通过广泛实验，本文展示了CycleGAN-Turbo在无配对转换任务上超越现有方法，并保持了输入结构。同时，模型pix2pix-Turbo在配对设置下生成了与现有条件扩散模型相媲美的结果。

扩展

本文还展示了将其方法扩展到学习其他类型的GAN目标和生成多样化输出的能力。

结论

本文证明了one-step预训练模型可以作为多种图像合成任务的骨干，并通过多种GAN目标适应新任务和领域，而无需多步扩散训练。

局限性与未来工作

虽然模型能够一步生成令人满意的结果，但存在一些局限性，如无法指定指导强度和训练内存消耗大，未来可能探索用于更高分辨率图像合成的方法。

想要了解更多内容？

查看原文：只需一步！One-Step图像转换来了！亲测效果惊艳！（卡内基梅隆&Adobe）

文章来源：

AI生成未来

扫码关注公众号

相关推荐

麻瓜+AI混合工作流试验 2：文章周边的生成，以及一些思考

556

如何给文章启发思路、起标题、配图、写摘要等等

周鸿祎终于如愿以偿，让360成了AI圈最大的流量王。

432

产品 AI 360 老周

只能感叹一句，老周，NB

AI时代的生成式3D大模型全面评测 - “ChatGPT时刻”的前夜

802

3D AI Tripo 建模

未来的3D会内容无限扩大，每个人都可以成为超级创作者，像神一样创造那新的世界

ChatGPT全面暂停PLUS订阅 - 因成功而受苦

414

ChatGPT 用户 OpenAI 。。。

大中午的，奥特曼又整幺蛾子了

最近用大模型的几点感想~

251

模型 AI 写作文件

用大模型猜谜语

UBCFashion和TikTok新SOTA！复旦和腾讯优图发布端到端人像动画生成器VividPose！

319

点击下方卡片，关注“AI生成未来”>>后台回复“

AI生成未来

AIGC最新技术及资讯

159 篇文章

浏览 68.8K

AI生成未来的其他文章

又见神仙打架，全面超越快手可灵？智谱AI联合清华发布CogVideoX | 技术报告解析

点击下方卡片，关注“AI生成未来”>>后台回复“

图像生成里程碑！VAR:自回归模型首超Diffusion Transformer！（北大&字节）

点击下方卡片，关注“AI生成未来”>>后台回复“

兼顾身份保护和文本对齐！中山大学等提出CoRe：任意提示的文本到图像个性化生成！

点击下方卡片，关注“AI生成未来”作者：Feize Wu、Xud

图像文本擦除无痕迹！复旦提出EAFormer：最新场景文本分割新SOTA！(ECCV`24)

点击下方卡片，关注“AI生成未来”>>后台回复“

我常用的几款免费AI生成视频平台

1. D-ID 网址：https://www.d-id.com/ D-ID是一个数字人AI视频?

随机阅读

COSMIC规模度量案例集二：业务应用软件案例——银行卡签约/解约

10-01

COSMIC规模度量案例集四：业务应用软件案例—新增用户

10-01

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

只需一步！One-Step图像转换来了！亲测效果惊艳！（卡内基梅隆&Adobe）

主要内容

介绍

方法

实验

相关工作

扩展

结论

局限性与未来工作

联系我们

融实践库

微信公众号

微信视频号

社区微信群

只需一步！One-Step图像转换来了！亲测效果惊艳！（卡内基梅隆&Adobe）

主要内容

介绍

方法

实验

相关工作

扩展

结论

局限性与未来工作

如何更好地导入Scrum？

联系我们

融实践库

微信公众号

微信视频号

社区微信群