扫码阅读

手机扫码阅读

UBCFashion和TikTok新SOTA！复旦和腾讯优图发布端到端人像动画生成器VividPose！

333 2024-10-26

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：UBCFashion和TikTok新SOTA！复旦和腾讯优图发布端到端人像动画生成器VividPose！

文章来源：

AI生成未来

扫码关注公众号

摘要

本文介绍了一种名为VividPose的新型人像动画生成方法，它是基于Stable Video Diffusion (SVD)的端到端pipeline。VividPose旨在解决之前方法中存在的外观退化和时间不一致问题。它通过集成额外的面部信息到身份感知外观控制器中，从而在不同姿势下保持对人物身份的高度保真度。同时，引入了一种几何感知姿势控制器，这使得生成的视频能够准确对齐姿势和形状，并适应多样的体型和手部动作。在UBCFashion和TikTok数据集上的实验表明，VividPose实现了最先进的性能，并且在提出的数据集上展示了出色的泛化能力。

方法概述

VividPose采用了SVD，这是一种先进的视频生成模型，能够创建高分辨率、时间一致的视频。SVD引入了3D卷积和时间注意力层，并使用了连续噪声尺度σ来实现更灵活高效的采样。此外，VividPose利用SMPL-X模型来处理人体姿势和形状的表示，通过可微渲染过程将3D人体模型投影到2D图像平面，确保生成的视频在体型上与参考图像准确对齐，同时跟随驱动视频的动态姿势。

关键组件

身份感知的外观控制器通过使用ArcFace提取面部特征并通过交叉注意力层将其注入到UNet中，有效地保留了关键面部特征。几何感知姿势控制器结合了来自SMPL-X的渲染图和骨架图，允许对动态姿势和复杂手势进行精确建模，保持了生成视频的体型和运动的准确性。

实验结果

VividPose在UBCFashion和TikTok数据集上与几种最先进的方法进行了比较，结果表明VividPose在多个评估指标上取得了最佳性能，尤其在视频保真度方面表现突出。此外，VividPose在新收集的数据集上表现出了良好的泛化能力，证实了其在实际应用中的稳健性。

结论

VividPose通过其创新的身份感知外观控制器和几何感知姿势控制器，为人体图像动画提供了一个新的稳健且高效的解决方案。大量实验验证了其在时间一致性、视觉保真度和泛化能力方面的优越性，使其成为一个有前景的人体动画生成工具。

想要了解更多内容？

查看原文：UBCFashion和TikTok新SOTA！复旦和腾讯优图发布端到端人像动画生成器VividPose！

文章来源：

AI生成未来

扫码关注公众号

相关推荐

AIGC｜花5分钟带你了解什么是LangChain！

1108

人工智能 AIGC

学会自己做一个人工智能应用✔

AI一键抠图，太强了！

284

软件模型推送文件夹

不会PS，不会修图如何把照片里面的人物抠出来呢？

他用Luma和Suno复活了逝去11年的爱人，给我看破防了。

267

小鸟松尾视频妻子

即使人生结束，故事也仍将继续。

使用Dify 构建国土空间规划智能问答应用

660

模型知识库检索文本

使用Dify来构建国土空间规划智能问答应用

OpenAI秘密武器，使用Ray实现强化学习智能体

687

Ray 智能学习环境

介绍利用Open AI Gym和Ray框架进行强化学习的方法，通过DQN算法实例，展示智能体学习完成复杂任务的过程。

大模型理论基础(so-large-lm)课程笔记！

278

Datawhale干货作者：辣条，Datawhale优秀学习者前言

AIGC最新技术及资讯

159 篇文章

浏览 70.8K

AI生成未来的其他文章

超越DiffEdit、SDEdit等6大编辑模型！字节等提出人像服饰、卡通表情编辑新SOTA！

点击下方卡片，关注“AI生成未来”>>后台回复“

虚拟试衣&人像合成新SOTA！IMAGDressing-v1:ControlNet和IP-Adapter的最佳拍档

点击下方卡片，关注“AI生成未来”>>后台回复“

MSRA古纾旸：2024年，视觉生成领域最重要的问题有哪些？

点击下方卡片，关注“AI生成未来”>>后台回复“

ECCV`24 | 蚂蚁集团开源风格控制新SOTA!StyleTokenizer：零样本精确控制图像生成

点击下方卡片，关注“AI生成未来”作者：Wen Li等

ECCV`24 | 少步比多步好？TurboEdit:少步扩散和解耦控制的实时精确图像编辑(Adobe出品)

点击下方卡片，关注“AI生成未来”>>后台回复“

随机阅读

杂谈推理逻辑的严密性

三个团队的站立会议旁观笔记

使用Gompertz模型预测非典的趋势

对需求签字画押，有用吗？

如何近似计算回归方程的预测区间？

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线