扫码阅读

手机扫码阅读

超燃！纯AI生成《泰坦尼克号》大片！浙大&阿里发布MovieDreamer:超长电影生成"梦工厂"

328 2024-10-25

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：超燃！纯AI生成《泰坦尼克号》大片！浙大&阿里发布MovieDreamer:超长电影生成"梦工厂"

文章来源：

AI生成未来

扫码关注公众号

MovieDreamer: AI Generating Long Visual Sequences

摘要

本文介绍了MovieDreamer，这是一个新颖的分层框架，它结合了自回归模型和扩散渲染，旨在生成长时间的视觉内容，平衡叙事连贯性与视觉保真度。该方法增加了视频内容生成的时长，且能够保持角色一致性和场景描述的丰富性。通过自回归模型预测视觉token序列，进而利用扩散渲染转换为高质量的视频帧。多模态脚本结合了文本描述和面部embeddings，增强了角色控制和身份保持能力。

方法概览

MovieDreamer框架利用自回归模型保持叙事连贯性，使用扩散自编码器创建图像表示，然后通过自回归模型预测关键帧tokens。该方法包含了反过拟合策略，并提出了结构良好的多模态脚本以及个性化生成的few-shot训练。此外，为了提升生成视频的细节质量，特别是面部特征，本文增强了扩散渲染过程中的交叉注意力模块。

实验与比较

MovieDreamer在多个电影类型中进行了广泛测试，与现有模型相比，展示了出色的生成质量和长时间视频生成能力。实验结果表明，本文方法在保持角色一致性和叙事连贯性方面表现优异，并且生成的视频质量在长时间维度上保持稳定。

结论

MovieDreamer提出了一种有效的方法，以生成具有复杂叙事和高视觉保真度的长时间视频内容。该方法通过结合自回归和扩散的优势，加之多模态脚本和身份保持渲染策略，支持few-shot电影创作，为自动化长时间视频制作的未来发展提供了新的可能性。

想要了解更多内容？

查看原文：超燃！纯AI生成《泰坦尼克号》大片！浙大&阿里发布MovieDreamer:超长电影生成"梦工厂"

文章来源：

AI生成未来

扫码关注公众号

相关推荐

干货 | 一文掌握如何成为优秀的PDT经理（附PPT）

1482

经理 PDT 团队产品

以客户需求为中心，从投资角度考虑产品开发，努力成为优秀的工程商人！

【AI人工智能系列】5.安装Jupyter插件实现在线Pyhton编程

524

jupyter root 7_1 djt_3

关于jupyter Jupyter Notebook 的本质是一个 Web 应用程序，便于创建和共享程

五一期间“AI伴游”火了！智能旅游的新宠

382

很棒的AI应用场景

《一起AI，交个朋友》深圳场来了！这个活动是越办越刺激了。。。

418

AI 交流会 2024 混元

5.25号，深圳见！

SD全新开源模型SDXL1.0评测 - 留给Midjourney的时间不多了

399

SD SDXL 模型 SDXL1.0

所有的SD玩家都特么的可以自豪的说一句：劳资也有通用大模型啦！MJ吔屎啦你！

10个必知必会的Python Pandas函数，轻松完成数据探索

396

数据数据集 10 唯一值

10个超级实用的Pandas数据探索方法

AIGC最新技术及资讯

159 篇文章

浏览 76.7K

AI生成未来的其他文章

视觉效果超赞！随意画个草图就能生成3D交互游戏场景！腾讯XR出品

点击下方卡片，关注“AI生成未来”>>后台回复“

国内首个中文原生DiT架构SOTA大模型全面开源！———Hunyuan-DiT技术报告详解

击下方卡片，关注“AI生成未来”>>后台回复“GAI

ECCV2024 | 小成本微调CLIP大模型！CLAP开源来袭：零样本和少样本训练有救了！

.点击下方卡片，关注“AI生成未来”>>后台回复?

2024年了,Diffusion模型还有什么可做的？

点击下方卡片，关注“AI生成未来”>>后台回复“

一文详解AutoEncoder在图像生成和多模态大模型中的应用

点击下方卡片，关注“AI生成未来”>>关注【AI生

随机阅读

和任老师聊聊质量工作

聊聊故事点背后的故事

采用Minitab进行logistic回归分析

回归方程有效性的检查

COSMIC案例：发票处理功能的规模度量

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线