扫码阅读

手机扫码阅读

长视频生成速度提升100倍！新加坡国立提出Video-Infinity：分布式长视频生成

333 2024-10-25

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：长视频生成速度提升100倍！新加坡国立提出Video-Infinity：分布式长视频生成

文章来源：

AI生成未来

扫码关注公众号

摘要

本文介绍了Video-Infinity，一种能够在多个GPU上并行处理以生成长视频的分布式推理pipeline。它通过剪辑并行和双范围注意力这两种一致性机制，最小化通信开销，并有效平衡局部和全局上下文，实现快速生成长视频。在8×Nvidia 6000 Ada GPU上，本文的方法可以在5分钟内生成最多2300帧的视频，速度比现有方法快100倍。

亮点直击

首次通过分布式并行计算解决长视频生成问题，提高可扩展性并减少生成时间。
引入剪辑并行化优化GPU间的上下文信息共享，双范围注意力机制调整时间自注意力以确保设备间视频的连贯性。
与现有的超长文本到视频方法Streaming T2V相比，本文的方法可以快达100倍。

视频扩散的剪辑并行化机制

Video-Infinity将视频的潜变量分割成片段，分散到多设备上并行去噪处理。剪辑并行机制优化了设备间时间信息的同步，而双范围注意力机制集成本地和全局上下文到注意力中，实现无需额外训练的长视频一致性。

实验设置

实验中选择了VideoCrafter2模型作为基础，并使用VBench作为评估工具。基线方法包括FreeNoise、Streaming T2V和OpenSora V1.1。实验在8 × Nvidia 6000 Ada（48G内存）上进行。

主要结果

本文的方法在生成长视频方面表现出色，不仅视频长度远超现有方法，而且生成速度大幅提升，视频质量在多个指标上也得到了保证。

结论

Video-Infinity显著改进了长视频生成的速度和长度，为长视频生成效率设立了新的基准，尽管它依赖于多GPU的可用性，并且在涉及场景转换的视频生成方面表现不佳。

想要了解更多内容？

查看原文：长视频生成速度提升100倍！新加坡国立提出Video-Infinity：分布式长视频生成

文章来源：

AI生成未来

扫码关注公众号

相关推荐

干货 | 一文掌握如何成为优秀的PDT经理（附PPT）

1513

经理 PDT 团队产品

以客户需求为中心，从投资角度考虑产品开发，努力成为优秀的工程商人！

OpenAI上周解散核心安全团队，今天就发布了安全更新信息？

318

点击下方卡片，关注“AI生成未来”>>关注【AI生?

DreamTech联合南大和牛津发布最强3D内容生成大模型——Direct3D

438

点击下方卡片，关注“AI生成未来”>>后台回复“

人工智能在供应链应用中面临的挑战

500

随着人工智能技术的不断发展，未来几年供应链领域将迎来一系列技术进步。

AI工具汇总

465

AI工具主要利用人工智能技术来实现各种工具软件,这些工具软件可以增强人的认知和工作能力。

我破防了！花了10天做的AI写作课，被deepseek两招打回解放前？

122

deepseek 思考 AI 提示

绷不住了

AIGC最新技术及资讯

160 篇文章

浏览 79.9K

AI生成未来的其他文章

大语言模型高效推理知多少？三万字长文带你揭开神秘面纱（数据级、模型级和系统级）

击下方卡片，关注“AI生成未来”>>后台回复“GAI

如何拯救LoRA初始化？LoRA-GA：性能显著提升+收敛速度更快！

点击下方卡片，关注“AI生成未来”>>后台回复“

重大突破！IDAdapter：首个无需微调，单张图像生成多样和个性化头像方案(北大&格灵深瞳）

点击下方卡片，关注“AI生成未来”>>后台回复“

低比特量化的LLAMA3模型有多好？ | 香港大学&北航最新研究发布

击下方卡片，关注“AI生成未来”>>后台回复“GAI

单GPU一分钟生成16K高清图像！新加坡国立发布LinFusion:无缝兼容Stable Diffusion插件

点击下方卡片，关注“AI生成未来”作者：Songhua Liu等

随机阅读

3分钟弄懂CMMI2.0基准评估的抽样规则

聊聊故事点背后的故事

解读微信团队的七个价值观

公司级项目管理例会的汇报内容

一表搞定最小可行产品（MVP）与最小可市场化特性（MMF）

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线