扫码阅读

手机扫码阅读

车道拓扑、目标布局、天气条件全都要！Text2Street：犀利的街景生成神器！

347 2024-10-22

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：车道拓扑、目标布局、天气条件全都要！Text2Street：犀利的街景生成神器！

文章来源：

AI生成未来

扫码关注公众号

摘要

本文介绍了一种面向街景的可控文本到图像生成框架Text2Street，旨在解决传统文本到图像模型难以处理街景的复杂道路拓扑、多样交通状况和不同天气情况的问题。框架包含三个主要部分：基于车道的道路拓扑生成器（通过计数适配器实现文本到地图的生成）、基于位置的目标布局生成器（通过目标级边界框扩散策略实现文本到布局的生成）以及多控制图像生成器（整合道路拓扑、目标布局和天气描述以生成街景图像）。实验验证了该方法在可控街景文本到图像生成方面的有效性。

介绍

街景文本到图像生成在自动驾驶感知和地图构建数据生成中具有重要价值，但面临生成道路拓扑结构、交通状态和天气条件的挑战。Text2Street框架提出以解决这些挑战，通过新颖的生成器控制道路拓扑、交通目标布局和天气条件，提高生成图像的准确性和可控性。

相关工作

通用的文本到图像生成任务近年来取得了显著进展，但街景文本到图像生成效果并不理想，需要专门的框架来处理街景生成的复杂性。

提出的方法

Text2Street框架包括三个核心部分：道路拓扑生成器、目标布局生成器和多控制图像生成器。这些生成器分别控制道路结构、交通目标布局和天气条件，通过引入计数适配器和扩散策略来提高生成图像的控制度和准确性。

实验和结果

在nuScenes数据集上的实验表明，Text2Street在多个评价指标上优于现有方法，尤其是在属性级别指标上展现出更佳的可控性。消融实验进一步验证了各个组件的有效性，并证明了方法在目标检测等下游任务上的实用性。

结论

Text2Street作为街景的可控文本到图像生成框架，有效地解决了传统方法在街景生成中的不足，具有实际应用价值。

想要了解更多内容？

查看原文：车道拓扑、目标布局、天气条件全都要！Text2Street：犀利的街景生成神器！

文章来源：

AI生成未来

扫码关注公众号

相关推荐

一款国产免费AI绘画软件

434

福利快来

AI视频的质量，离世界顶级的渲染大赛还有多远的路？

367

作品 AI 渲染视频

AI视频还是个弟弟

10个必知必会的Python Pandas函数，轻松完成数据探索

385

数据数据集 10 唯一值

10个超级实用的Pandas数据探索方法

常用AI工具汇总

389

人工智能（AI）工具正迅速成为现代生活和工作中不可或缺的助手。它们通过模拟人类智能，执行一系列复杂的任务，从而提高效率和生产力。

72页PPT | 构建智慧城市的新基石：平安城市联网共享平台解决方案（附PPT方案下载）

380

数据下载平台治理

【关注公众号】：获更多精品资料下载！【新粉丝福利】：公众号后台发送关键字：“新粉丝福利”，自动获取100套共18个行业数字化方案及报告大礼包免费下载链接（2024.07月整理）。

太猛了！用AI做一只“会做饭的猫”，狂吸4.6万粉，条条爆款！附保姆级教程

96

视频生成 AI 图片

“会做饭的猫“”AI副业拆解，小白也能开启自媒体之旅！涨粉嘎嘎快！

AIGC最新技术及资讯

159 篇文章

浏览 73.1K

AI生成未来的其他文章

文本生成图像新SOTA！RealCompo：逼真和构图的动态平衡（清北最新）

点击上方蓝字，关注 AI 生成未来，干货不停后台??

上海交大&阿里巴巴推出虚拟试衣新里程碑式工作——AnyFit：任意场景、任意组合！

点击下方卡片，关注“AI生成未来”>>后台回复“

简单、快速、低成本、强大！高分辨率图像生成扩散外推方法CutDiffusion发布！

击下方卡片，关注“AI生成未来”>>后台回复“GAI

效果超越ControlNet+IP-Adapter和FreeControl！Ctrl-X：可控文生图新框架（加州大学&英伟达）

点击下方卡片，关注“AI生成未来”>>后台回复“

亲测大火的AI视频创作平台，哪些更好用？

点击下方卡片，关注“AI生成未来”>>后台回复“

随机阅读

3分钟弄懂CMMI2.0基准评估的抽样规则

聊聊故事点背后的故事

三个团队的站立会议旁观笔记

公司级项目管理例会的汇报内容

项目级目标与组织级目标的差别

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线