扫码阅读

手机扫码阅读

CVPR 2024 | 出手就是SOTA！扩散模型杀入部分监督多任务预测领域！(港科大)

417 2024-10-22

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：CVPR 2024 | 出手就是SOTA！扩散模型杀入部分监督多任务预测领域！(港科大)

文章来源：

AI生成未来

扫码关注公众号

摘要

本文由Hanrong Ye和Dan Xu撰写，介绍了一个名为DiffusionMTL的新型多任务去噪扩散框架，用于解决从部分标签数据中学习多个密集场景理解任务时出现的预测质量低下问题。DiffusionMTL工作原理是将多任务密集预测问题转化为像素级去噪问题，并引入了一种多任务调节策略来提高不同任务的去噪性能。广泛的实验证明，DiffusionMTL在几个多任务基准测试中超越了先进方法。

引言

多任务学习旨在同时学习多个相关任务，以提高效率和性能。然而，真实世界的多任务数据集标注成本高，因此多任务部分监督学习（MTPSL）成为了一个重要课题。MTPSL中每个样本只标注了部分任务，造成了训练标签的稀疏性和预测噪声问题。本文提出了DiffusionMTL框架，通过联合像素级去噪和生成过程来解决噪声预测问题，并通过多任务调节机制来促进无标签任务的学习。

相关工作

多任务学习的研究集中在提高计算效率和性能上。先前的方法在全监督环境下设计，对每个训练图像假设提供了所有任务的标签。然而，这在实际中往往不现实，因此MTPSL问题应运而生，它需要新的方法来利用部分标签数据。

DiffusionMTL方法

DiffusionMTL包括一个初始主干模型和去噪扩散网络（MTDNet），后者利用Prediction Diffusion和特征扩散来改善初始预测图。DiffusionMTL的训练和推理过程包括扩散步骤和去噪步骤，以及一个多任务条件化策略，帮助去噪并学习无标签任务。

实验

在PASCAL、NYUD和Cityscapes三个多任务数据集上进行了实验，结果显示DiffusionMTL优于现行最先进方法，尤其是在部分标签设置下。

结论

DiffusionMTL框架通过联合像素级的去噪和生成过程，有效地改善了多任务预测图的质量，并且利用多任务条件策略提高了去噪性能和无标签任务的学习。在三个挑战性的数据集上的实验证明了其有效性。

想要了解更多内容？

查看原文：CVPR 2024 | 出手就是SOTA！扩散模型杀入部分监督多任务预测领域！(港科大)

文章来源：

AI生成未来

扫码关注公众号

相关推荐

WPS Office AI实战：智能表格化身智能助理

1723

AI 表格智能 ChatGPT

前面我们已经拿 WPS AI 对Word文字、PPT幻灯片、PDF 做了开箱体验，还没有看过的小伙伴，请翻看

AIGC时代，软件研发组织如何构建AI战略？（演讲全文，PPT下载）

1300

模型 AI

分三步走，形成软件研发组织构建AI战略的三部曲

制造业中AI的应用案例

1015

人工智能制造商机器人协作

制造公司正在转向人工智能来简化他们的业务方式并提高效率。

科大讯飞发布星火V4.0大模型！

180

据说能赶上GPT4.0

基于Llama3，为本地文件创建生成式AI搜索引擎

579

文档模型索引 Qdrant

介绍一款集成Llama 3模型的开源生成式搜索引擎，实现本地文件的智能语义搜索。

国务院国资委：要加快布局和发展人工智能产业

234

国务院国资委2月21日消息。2月19日，国务院国资委召开“AI赋能产业焕新”中央企业人工智能专题推进会明确表示，中央企业要加快布局和发展人工智能产业。

AIGC最新技术及资讯

159 篇文章

浏览 68.2K

AI生成未来的其他文章

Vidu官方论文来了！媲美Sora的国产视频生成器背后技术探秘

击下方卡片，关注“AI生成未来”>>后台回复“GAI

6款AI商品海报创作神器，让设计创意无限！

曾经，为了展现物品的美好，我们煞费苦心地设计造?

兼顾身份保护和文本对齐！中山大学等提出CoRe：任意提示的文本到图像个性化生成！

点击下方卡片，关注“AI生成未来”作者：Feize Wu、Xud

精度提升10个点！HD-Painter:无需训练的文本引导高分辨率图像修复方案！

作者：Zhangyang Wang等解读：AIGCer基于文本到图像扩散?

实例级图像生成最新SOTA！InstanceDiffusion：文本到实例图像生成控制方法

关注【AI生成未来】公众号，回复“GAI”，免费获取??

随机阅读

敏捷实践大全

和任老师聊聊质量工作

3分钟弄懂CMMI2.0基准评估的抽样规则

聊聊故事点背后的故事

从3级到高成熟度的18项可能的变化

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线