扫码阅读

手机扫码阅读

精度提升10个点！HD-Painter:无需训练的文本引导高分辨率图像修复方案！

365 2024-10-22

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：精度提升10个点！HD-Painter:无需训练的文本引导高分辨率图像修复方案！

文章来源：

AI生成未来

扫码关注公众号

文章摘要

HD-Painter: High-Resolution and Prompt-Faithful Text-Guided Image Inpainting with Diffusion Models

摘要

HD-Painter是一种新型的无需训练的文本引导图像修复方法，它利用扩散模型，在修复过程中实现了与用户提示的更好对齐和高分辨率图像的补全。这一方法的核心是引入了Prompt-Aware Introverted Attention（PAIntA）层和Reweighting Attention Score Guidance（RASG）机制，它们能够提高文本对齐性和防止潜在分布偏移，从而生成视觉上逼真的结果。

引言

文本到图像的扩散模型取得了显著进步，使得基于文本提示的图像编辑成为可能。尽管现有方法能够生成视觉上协调的补全效果，但在理解全局场景和高分辨率补全方面仍有不足。本文提出了HD-Painter，利用PAIntA和RASG机制，无需训练即可更好地与文本提示对齐，并实现高分辨率图像补全。

相关工作

图像修复的研究始于使用深度学习方法传播已知区域的深度特征，后来引入了扩散模型。现有的文本引导图像修复方法通过微调预训练模型来融合已知区域和生成的区域。本文提出的方法不需要训练，通过PAIntA和RASG组件改善文本提示对齐，并支持高分辨率图像修复。

方法

HD-Painter首先在较低分辨率上进行文本引导的图像修复，随后通过专门技术处理实现高分辨率补全。PAIntA层通过提示信息增强自注意力分数，而RASG机制通过重量化注意力分数来引导采样，保持生成在训练域内。此外，本方法支持高达2048×2048分辨率的图像修复。

实验

实验表明，HD-Painter在定性和定量上都优于现有方法。本方法在CLIP分数和生成准确率上都有显著提升，且用户研究也证实了其在提示对齐和整体质量方面的优越性。

结论

HD-Painter通过PAIntA和RASG组件有效地解决了文本引导图像修复中的提示忽略问题，实现了高分辨率和与文本提示高度一致的图像修复，超越了当前的最先进方法。

想要了解更多内容？

查看原文：精度提升10个点！HD-Painter:无需训练的文本引导高分辨率图像修复方案！

文章来源：

AI生成未来

扫码关注公众号

相关推荐

从马斯克造火箭到产品开发，快速失败很重要

691

敏捷开发~

2024人工智能开源大模型生态研究（附下载链接）

602

数据模型开源治理

【关注公众号】：获更多精品资料下载！【新粉丝福利】：文章底部添加助理微信，获取100套共18个行业数字化方案及报告大礼包免费下载链接（2024.6月整理），备注“新粉丝”。

AI时代下的程序员路在何方？

463

AI 技术程序员学习

AI时代下的程序员路在何方？随着人工智能（AI）技术的飞速发展，越来越多的行业开始应用AI技术，这使得许多传

10个杀手级AI插件，提升VS Code开发效率

637

代码插件 https marketplace.visualstudio.com

介绍10个提高代码质量和编程效率的AI插件。

2023 世界人工智能大会（WAIC）人才培养论坛成功举办！

387

成功举办！

世界首位AI程序员爆火：Cognition公司的Devin

353

Devin是由Cognition 开发的全自主AI软件工程师，是世界上第一个能够独立完成项目从概念到完成的AI。

AIGC最新技术及资讯

161 篇文章

浏览 80.1K

AI生成未来的其他文章

生成一个好故事！StoryDiffusion:一致自注意力和语义运动预测器必不可少（南开&字节）

击下方卡片，关注“AI生成未来”>>后台回复“GAI

SIGGRAPH`24 | 毫米级接近真实动作生成！LGTM：文本驱动！(深大&快手&字节)

击下方卡片，关注“AI生成未来”>>后台回复“GAI

FDGaussian:又快又好的三维重建方案 | Gaussian Splatting和扩散模型超强联合

点击下方卡片，关注“AI生成未来”>>后台回复“

无性能损失！让SAM加速近50倍！EfficientViT-SAM来了！

关注【AI生成未来】公众号，回复“GAI”，免费获取??

超越DiffEdit、SDEdit等6大编辑模型！字节等提出人像服饰、卡通表情编辑新SOTA！

点击下方卡片，关注“AI生成未来”>>后台回复“

随机阅读

杂谈推理逻辑的严密性

案例：缺陷状态数据分析

采用Minitab进行logistic回归分析

各阶段缺陷检出密度的统计分析案例

GOV与II两个PA的案例

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线