扫码阅读

手机扫码阅读

谷歌重磅发布CAT3D：一分钟搞定任意数量视图到3D场景重建

419 2024-10-22

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：谷歌重磅发布CAT3D：一分钟搞定任意数量视图到3D场景重建

文章来源：

AI生成未来

扫码关注公众号

CAT3D: Multi-View Diffusion Models for 3D Generation

摘要

CAT3D是一种利用多视图扩散模型从任意数量的输入图像生成高度一致的3D场景新视图的方法，其生成的视图可以用于3D重建技术以创建实时渲染的3D representation。CAT3D在单图像和少视点3D场景创建方面优于现有方法，且能在短至一分钟内创建完整的3D场景。

介绍

3D内容需求上升，但创建高质量3D内容相对困难，需复杂工具和大量时间。最新摄影测量技术提高了从2D图像创建3D资产的可能性，但详细场景的创建仍需大量照片。CAT3D将这一需求简化，通过生成更多观测将未完全观测的3D创建问题转化为完全观测的3D重建环境。

相关工作

本文工作基于3D生成模型研究，特别是在未见区域中创建内容的技术。前人研究通过转移2D图像空间先验知识，利用视频和多视图扩散模型生成高度一致的新视图等。CAT3D结合多视图扩散模型与3D重建技术，实现高效且高质量的3D内容创建。

方法

CAT3D使用两步法：首先，通过多视点扩散模型生成一组新视点的图像；其次，将这些图像通过3D重建pipeline转换成3D representation。模型训练采用相机姿态embedding和3D自注意力，以及在训练期间随机选择条件视图数量的策略。生成新视点时，将目标视点聚类成小组并独立生成，同时根据生成视图与观察视图的近似程度对损失进行加权，以提高3D重建的精确性和鲁棒性。

实验

CAT3D在若干数据集上训练并在少视图3D重建和单图像到3D任务上评估，显示出定性和定量上的改进。消融实验表明，视频扩散架构结合3D自注意力和相机姿态的射线图embedding，能够生成足够一致的视图以恢复3D representation。

讨论与未来方向

尽管CAT3D在多个任务上取得了显著成果，但仍存在限制，如处理不同相机内参的场景、依赖基础文本到图像模型的表现能力以及生成大量样本时的视图一致性问题。未来的工作可以探索利用预训练的视频扩散模型，改善样本的一致性，以及自动确定相机轨迹以提高系统灵活性。

想要了解更多内容？

查看原文：谷歌重磅发布CAT3D：一分钟搞定任意数量视图到3D场景重建

文章来源：

AI生成未来

扫码关注公众号

相关推荐

我对AI态度转变的几个阶段

684

我们生活在一个科技日新月异的时代，每天都会有新的技术、新的产品出现在我们的视野中。

波士顿动力发布新一代Atlas机器人 - 模仿人类，然后超越人类

292

人类 Atlas 机器人物种

为什么我们不从一开始就创造一个超越人类的新物种呢？

5个超级AI插件，全面提升VS Code开发效率

1587

代码 AI 文档开发者

介绍5个顶级的VSCode AI插件。

大语言模型的前世今生：万字长文完整梳理所有里程碑式大语言模型（LLMs）

1028

点击下方卡片，关注“AI生成未来”>>后台回复“

AI顶会 ICLR 最新演讲：“The ChatGLM's Road to AGI”，首个中国大模型团队！

386

国产大模型的全球影响力！

专科拿到季军：微茫星火，奋起直追！

276

Datawhale干货作者：“不啻微茫”团队，季军方案?

AIGC最新技术及资讯

159 篇文章

浏览 69K

AI生成未来的其他文章

CVPR 2024 | 稳定提升！CAN和Diffusion Transformer才是最佳拍档(MIT&清华&英伟达)

点击下方卡片，关注“AI生成未来”>>后台回复“

能训出SOTA模型的优质数据集发布！复旦最新VidGen-1M: 文生视频还得靠好数据

点击下方卡片，关注“AI生成未来”>>后台回复“

只需微调，大幅提升人脸生成质量！上交联合OPPO发布新标准和新方法

点击下方卡片，关注“AI生成未来”>>后台回复“

第一个包含百万图像文本对的时尚数据集

文本驱动的时尚合成和设计是AIGC中极为有价值的一部

可提示 3D 分割研究里程碑！SAM2Point：SAM2加持泛化任意3D场景、任意提示！

点击下方卡片，关注“AI生成未来”作者：Ziyu Guo等 ?

随机阅读

3分钟弄懂CMMI2.0基准评估的抽样规则

聊聊故事点背后的故事

从3级到高成熟度的18项可能的变化

三个团队的站立会议旁观笔记

案例：工时数据分析

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线