扫码阅读

手机扫码阅读

寥寥数笔，动画自成！阿里Tora: 首个轨迹引导的DiT创新实现精确运动控制视频生成

348 2024-10-25

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：寥寥数笔，动画自成！阿里Tora: 首个轨迹引导的DiT创新实现精确运动控制视频生成

文章来源：

AI生成未来

扫码关注公众号

Tora摘要

亮点直击

引入了Tora，首个轨迹导向的Diffusion Transformer（DiT）用于视频生成。融合了文本、视觉和轨迹条件，通过新颖的轨迹提取器和运动引导融合机制，实现时空运动块的获取和注入，以创建遵循轨迹的视频。Tora能够生成高分辨率（720p）、多变纵横比、长达204帧的视频，并在模拟物理世界运动方面表现卓越。

方法

Preliminary

介绍了潜在视频扩散模型（LVDM）和Diffusion Transformer（DiT），后者结合了扩散模型和transformer架构的优势，超越了传统U-Net模型的局限。

Tora

Tora基于OpenSora模型，引入轨迹提取器（TE）和运动引导融合器（MGF），将提供的轨迹编码为时空运动补丁，精细集成到DiT块中。通过视频自动编码器减少视频维度，使用轨迹图和3D VAE进行轨迹压缩，并通过MGF将运动块注入ST-DiT块。

训练策略和数据处理

采用两阶段训练策略，先使用稠密光流，后微调稀疏轨迹，实现细粒度运动控制。同时支持视觉条件，通过结构化数据处理满足训练数据集需求。

实验

定量和定性结果

对比其他运动引导视频生成方法，Tora在生成长帧序列视频时表现出更高的轨迹准确性和运动保真度，尤其是在长时长内保持有效的轨迹控制。

消融实验

通过消融实验分析了轨迹压缩方法和MGF的集成位置的影响。结果显示本文方法的自适应归一化层和将MGF集成于Temporal DiT块中效果最佳。

结论

Tora作为第一个面向轨迹的扩散Transformer框架，集成了文本、图像和轨迹条件，有效地模拟了物理世界的运动，展现了高视觉保真度和多功能性。为基于DiT的运动控制研究提供了实证基线。

想要了解更多内容？

查看原文：寥寥数笔，动画自成！阿里Tora: 首个轨迹引导的DiT创新实现精确运动控制视频生成

文章来源：

AI生成未来

扫码关注公众号

相关推荐

“人人都想推倒李一舟，人人又都想做李一舟”，「AI 变现第一人」李一舟正在经历狂风暴雨！#AI #知识付费

640

有人说“人人都想推倒李一舟，人人又都想做李一舟”！

人工智能那么火~如今AI的企业应用场景都有哪些？

891

一、企业自动化与效率提升原理：企业自动化利用AI模仿人类在办公环境中的行为，执行重复性任务，减少人工干预，提高

免费，无广告，超强AI学习助手

408

软件 AI 一款推送

今天馆长就给大家介绍一款APP可以手把手教你使用AI，还可以帮助你工作学习。

我用ChatGPT做了一下姜萍的数学竞赛题，它懵了，我也懵了。

355

ChatGPT 数学竞赛 AI

对不起，我们是废物...

使用LangChain SQLChain，连接LLM和SQL数据库

506

SQL 数据库 LLM 查询

介绍如何将LLM与SQL数据库结合来提高信息的准确性。

好用又免费的AI生图创作平台介绍

511

好用又免费的AI生图创作平台介绍

AIGC最新技术及资讯

159 篇文章

浏览 69K

AI生成未来的其他文章

风格控制水平创新高！南理工&InstantX&小红书发布CSGO:简单高效的端到端风格迁移框架

点击下方卡片，关注“AI生成未来”作者：Peng Xing等

ECCV`24 | 首次解决文本到3D NeRFs分解问题！港中文等提出DreamDissector

点击下方卡片，关注“AI生成未来”>>后台回复“

如何高效定制视频扩散模型？卡内基梅隆提出VADER：通过奖励梯度进行视频扩散对齐

点击下方卡片，关注“AI生成未来”>>后台回复“

超越DiffEdit、SDEdit等6大编辑模型！字节等提出人像服饰、卡通表情编辑新SOTA！

点击下方卡片，关注“AI生成未来”>>后台回复“

你的文生图模型可以秘密接收多模态提示了！南洋理工&腾讯最新提出EMMA

点击下方卡片，关注“AI生成未来”>>后台回复“

随机阅读

采用Minitab进行logistic回归分析

GOV与II两个PA的案例

COSMIC案例：发票处理功能的规模度量

《以道御术》荣耀上市，专家书评

Lehman的软件演化定律

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线