扫码阅读

手机扫码阅读

ECCV`24 | 编辑能力无上限！北航&谷歌&旷视等开源Chat-Edit-3D: 3D 场景编辑新范式！

195 2024-10-25

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：ECCV`24 | 编辑能力无上限！北航&谷歌&旷视等开源Chat-Edit-3D: 3D 场景编辑新范式！

文章来源：

AI生成未来

扫码关注公众号

摘要

引言

传统3D场景编辑方法受限于固定的输入模式和有限的编辑能力，无法满足用户丰富的语言和编辑需求。为了解决这一问题，本文提出了一种新的编辑范式——CE3D（Chat-Edit-3D），利用大规模语言模型和解耦的2D编辑与3D重建实现灵活高效的场景编辑。

什么是CE3D？

CE3D是一种对话式3D场景编辑方法，通过解析用户文本输入，并调用视觉模型来编辑3D场景。通过Hash-Atlas映射网络，将3D编辑过程映射到2D图集空间，从而实现2D与3D过程的解耦。CE3D提供了强大的扩展性，支持多轮对话，并在多个方面优于传统方法。

方法

CE3D方法的核心是Hash-Atlas网络，它将3D视图映射到2D图集，为此设计了一种基于哈希结构的网络。通过特定训练和损失项，保证图集的自然性和准确性。在图集空间中，采用合并-拆分策略进行编辑，并利用ChatGPT及VQA模型辅助确定编辑区域。

对话系统

CE3D的对话系统考虑了场景文件的处理和用户查询的推理过程。场景文件以特定字符串代替实际文件名，通过前后端处理实现真实文件的管理。同时，ChatGPT被预先注入视觉工具信息，以有效处理用户输入。

编辑能力展示

CE3D展示了其在多轮对话中处理各种编辑请求的能力，如对象移除、风格迁移、深度图预测等，以及视觉问答和文本对话任务。

未来展望

尽管CE3D在3D场景编辑领域取得了进步，但仍有改进空间，如处理360度全景场景的挑战。

想要了解更多内容？

查看原文：ECCV`24 | 编辑能力无上限！北航&谷歌&旷视等开源Chat-Edit-3D: 3D 场景编辑新范式！

文章来源：

AI生成未来

扫码关注公众号

相关推荐

AI绘画与SD工具介绍

478

AI 绘画工具 Firefly

介绍AI绘画涉及的4个工具，使用场景，以及Stable diffusion工具的介绍

AI芯片领域掀起波澜，Groq挑战英伟达霸主地位

418

芯片 AI Groq 领域

在当今这个科技飞速发展的时代，人工智能（AI）已经渗透到我们生活的方方面面。

用chatGPT高效学习-Vue的组件通信方式有哪些？

357

太香了！！！！

LlamaIndex结合DSPy，进一步优化RAG系统

268

DSPy LlamaIndex 优化 RAG

结合LlamaIndex和DSPy，优化RAG系统的开发过程，提升性能，包括具体的代码实现步骤。

3D版"裁缝"开源来袭！Tailor3D:自定义3D编辑和资产生成（港大&上海AI-Lab&港中文）

299

点击下方卡片，关注“AI生成未来”>>后台回复“

用AI就能做背单词神器，Claude3.5的最强大脑

960

字体单词翻译造句

打工人的夏天结束，是PPT里的第三季度。

AI生成未来

AIGC最新技术及资讯

159 篇文章

浏览 68.7K

AI生成未来的其他文章

CVPR 2024 | 稳定提升！CAN和Diffusion Transformer才是最佳拍档(MIT&清华&英伟达)

点击下方卡片，关注“AI生成未来”>>后台回复“

CVPR 2024 | 万物皆可移动！SceneDiffusion：可控场景生成新SOTA!（Meta AI&南洋理工）

点击下方卡片，关注“AI生成未来”>>后台回复“

8款AI写作神器，轻松创作高质量内容

随着AI技术的不断发展，AI生成文案平台也逐渐成为一

FDGaussian:又快又好的三维重建方案 | Gaussian Splatting和扩散模型超强联合

点击下方卡片，关注“AI生成未来”>>后台回复“

第一个包含百万图像文本对的时尚数据集

文本驱动的时尚合成和设计是AIGC中极为有价值的一部

随机阅读

采用Minitab进行logistic回归分析

10-01

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

ECCV`24 | 编辑能力无上限！北航&谷歌&旷视等开源Chat-Edit-3D: 3D 场景编辑新范式！

摘要

引言

什么是CE3D？

方法

对话系统

编辑能力展示

未来展望

联系我们

融实践库

微信公众号

微信视频号

社区微信群

ECCV`24 | 编辑能力无上限！北航&谷歌&旷视等开源Chat-Edit-3D: 3D 场景编辑新范式！

摘要

引言

什么是CE3D？

方法

对话系统

编辑能力展示

未来展望

抢占先机！2025，三大认知降低To B赛道门槛

联系我们

融实践库

微信公众号

微信视频号

社区微信群