扫码阅读

手机扫码阅读

像俄罗斯方块一样生成视频！北大联合快手AI团队推出新框架VideoTetris实现跟随复杂指令的文生视频！

220 2024-10-22

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：像俄罗斯方块一样生成视频！北大联合快手AI团队推出新框架VideoTetris实现跟随复杂指令的文生视频！

文章来源：

AI生成未来

扫码关注公众号

文章摘要

研究背景：扩散模型在文本到视频（T2V）生成领域取得显著成果，但面对复杂、细节丰富的指令时存在挑战。

研究成果：北京大学与快手AI团队提出了VideoTetris项目，一个新框架用于应对复杂视频生成任务，能增强现有模型的组合生成能力，支持多复杂指令和长视频生成。

框架方法：提出时空合成扩散方法来遵循复杂文本特征，并通过增强的视频数据预处理和参考帧注意力机制提高视频生成一致性。

技术实现：VideoTetris利用时空组合扩散方法，通过解构提示词和应用交叉注意力进行高效的组合指令生成，结合增强训练数据预处理和参考帧注意力机制优化长视频生成。

实验评测：引入新的评测指标VBLIP-VQA和VUnidet，显示VideoTetris在组合视频生成上优于开源及商用模型。

相关链接：项目主页及代码已公开，可供进一步了解和研究。

参考文献：详细研究可参考论文“VideoTetris: Towards Compositional Text-To-Video Generation”。

这个摘要基于原文内容和结构，简洁地总结了文章的核心信息，划分为研究背景、研究成果、框架方法、技术实现和实验评测五个部分，每一部分都简要概括了原文中的关键点。同时提供了相关链接和参考文献，方便读者进一步探索和研究。

想要了解更多内容？

查看原文：像俄罗斯方块一样生成视频！北大联合快手AI团队推出新框架VideoTetris实现跟随复杂指令的文生视频！

文章来源：

AI生成未来

扫码关注公众号

相关推荐

用蒙特卡罗来评估你的交易系统

376

交易交易系统蒙特卡罗模板

用蒙特卡罗来评估你的交易系统

图解：高手认知思维进阶的大杀器--布鲁姆认知层次理论

1424

布鲁姆的认知层次理论的核心是将认知过程划分为六个层次，从低级到高级分别是识记、理解、应用、分析、评价和创造。

发现 AI 宝藏：你不能错过的AI产品推荐

360

AI 模型生成绘画

hi, 大家好, 我是徐小夕, 一名前端资深玩家. 今天暂时不分享前端技术, 带大家聊聊AI和AIGC产品

今年苹果的WWDC大会只有一件事 - AI、AI、还是AI。

258

苹果 Siri AI 乔布斯

乔布斯年代的苹果，还能回来吗？

基于Llama3，为本地文件创建生成式AI搜索引擎

592

文档模型索引 Qdrant

介绍一款集成Llama 3模型的开源生成式搜索引擎，实现本地文件的智能语义搜索。

我破防了！花了10天做的AI写作课，被deepseek两招打回解放前？

deepseek 思考 AI 提示

绷不住了

AI生成未来

AIGC最新技术及资讯

159 篇文章

浏览 69K

AI生成未来的其他文章

高保真+通用！视频扩散模型加持，稀疏视图重建任意场景！清华&港科大发布ReconX

点击下方卡片，关注“AI生成未来”作者：Fangfu Liu等?

能训出SOTA模型的优质数据集发布！复旦最新VidGen-1M: 文生视频还得靠好数据

点击下方卡片，关注“AI生成未来”>>后台回复“

揭秘神秘的种子：Adobe联合宾夕法尼亚大学发布文本到图像扩散模型大规模种子分析

点击下方卡片，关注“AI生成未来”>>后台回复“

ECCV`24 | 比DragDiffusion快100倍！RegionDrag：快·准·好的图像编辑方法！港大&牛津

点击下方卡片，关注“AI生成未来”>>后台回复“

即插即用，效率远超ControlNet！贾佳亚团队重磅开源ControlNeXt：超强图像视频生成方法

点击下方卡片，关注“AI生成未来”>>后台回复“

随机阅读

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

像俄罗斯方块一样生成视频！北大联合快手AI团队推出新框架VideoTetris实现跟随复杂指令的文生视频！

文章摘要

联系我们

融实践库

微信公众号

微信视频号

社区微信群

像俄罗斯方块一样生成视频！ 北大联合快手AI团队推出新框架VideoTetris实现跟随复杂指令的文生视频！

文章摘要

在禅道软件团队做产品经理是什么体验？

联系我们

融实践库

微信公众号

微信视频号

社区微信群

像俄罗斯方块一样生成视频！北大联合快手AI团队推出新框架VideoTetris实现跟随复杂指令的文生视频！