扫码阅读

手机扫码阅读

SD和Sora们背后的关键技术！一文搞懂所有 VAE 模型（4个AE+12个VAE原理汇总）

1531 2024-10-26

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：SD和Sora们背后的关键技术！一文搞懂所有 VAE 模型（4个AE+12个VAE原理汇总）

文章来源：

AI生成未来

扫码关注公众号

VAE及其扩展概述

随着图像和视频生成技术的进步，如Stable Diffusion和Sora，高效的低维度计算变得至关重要。变分自编码器（VAE）及其变体在这方面发挥着重要作用。

1. 引言

自编码器（AE）和变分自编码器（VAE）是深度学习中理解和生成复杂数据结构的关键。它们在图像处理、自然语言处理等多个领域中起着至关重要的作用。

2. 符号术语

本文涉及AE和VAE的相关术语，包括编码器、解码器、损失函数等。

3. 自编码器的类型

自编码器有多种类型，包括Autoencoder、Denoising Autoencoder、Sparse Autoencoder和Contractive Autoencoder。它们通过不同方式进行数据压缩和特征提取。

4. 变分自编码器及其扩展

VAE通过将输入映射到概率分布而非固定向量，能够进行数据重构和生成。CVAE、Beta-VAE、VQ-VAE、VQ-VAE-2和TD-VAE是VAE的几种扩展，每种都有各自的特点和应用场景。

4.1 VAE

VAE结合了贝叶斯网络的概念，通过概率分布进行数据映射和生成。

4.2 Conditional VAE

CVAE通过条件变量控制生成过程，根据给定信息生成特定类型的数据。

4.3 Beta-VAE

Beta-VAE通过改变损失函数中的β值来平衡重构质量和潜在表示的解耦。

4.4 VQ-VAE

VQ-VAE利用向量量化技术离散化潜在空间，适用于处理需要离散表示的数据。

4.5 VQ-VAE-2

VQ-VAE-2通过层次化结构和自注意力机制改进图像生成的质量和细节。

4.6 TD-VAE

TD-VAE专门处理序列数据，结合状态空间模型和时间差分学习。

4.7 其他VAE变体

介绍了Adversarial Autoencoder、Dynamic VAE、Seq2Seq VAE、Hierarchical VAE等其他VAE变体。

文章最后提出了关于在潜在空间中引入额外限制的思考，并邀请读者讨论。

原文链接：专栏文章

想要了解更多内容？

查看原文：SD和Sora们背后的关键技术！一文搞懂所有 VAE 模型（4个AE+12个VAE原理汇总）

文章来源：

AI生成未来

扫码关注公众号

相关推荐

基于 AI大模型训练自己的小模型

1887

GPT 模型 ML DL

目前不只有OpenAI、ChatGPT，可选择性越来越多，来帮助我们做更强大的产品

不必依赖ChatGPT，这几款AI工具同样好用

1069

ChatGPT AI Bard 机器人

大语言模型（LLM）下的AI对话机器人值得每一个人新自去体验，去感知，相信会有更深的感触

黑洞系列图片

285

AI 技术 AIGC 生成

AIGC 黑洞系列图片最近我用 AI 创作了黑洞系列的图片，主要使用的是 Stable Diffuson ,

使用kimi大模型开发招投标爬虫程序（2）

614

代码爬取 Kimi 编程

使用kimi大模型开发招投标爬虫程序（2）

单图创造虚拟世界只需10秒！斯坦福&MIT联合发布WonderWorld：高质量交互生成

534

点击下方卡片，关注“AI生成未来”>>后台回复“

拜拜了deepseek，AI大集成时代，它来了！

AI 生成夸克 PPT

举手之劳，事半功倍

AI生成未来

AIGC最新技术及资讯

207 篇文章

浏览 86.1K

AI生成未来的其他文章

图像生成/编辑应用落地必不可少！MuLAn：首个实例级RGBA分解数据集（华为诺亚）

点击下方卡片，关注“AI生成未来”>>后台回复“

图像生成地表最强！Playground v2.5技术报告解读重磅来袭！超越SD、DALL·E 3和 Midjourney

点击上方蓝字，关注 AI 生成未来，干货不停后台??

ECCV2024｜LightenDiffusion 超越现有无监督方法，引领低光图像增强新纪元！

点击下方卡片，关注“AI生成未来”>>后台回复??

文本和单图如何生成无缝的360度全景图像？

与普通的2D图像不同，360度全景图像捕捉整个360°×180?

ACM MM24 | Hi3D: 3D生成领域再突破！新视角生成和高分辨率生成双SOTA(复旦&智象等)

点击下方卡片，关注“AI生成未来” 作者：Haibo Yang ??

随机阅读

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

SD和Sora们背后的关键技术！一文搞懂所有 VAE 模型（4个AE+12个VAE原理汇总）

VAE及其扩展概述

1. 引言

2. 符号术语

3. 自编码器的类型