Skip to content

编码器-解码器架构

编码器 - 解码器架构是一种广泛应用于深度学习的神经网络架构,最早用于序列到序列(Seq2Seq)任务,此类模型架构由编码器和解码器两个核心模块组成。

编码器的作用是通过一系列神经网络层,将输入数据映射为一个紧凑的、低维的特征表示,即上下文向量,这个过程实现了特征提取、维度压缩以及去除冗余和噪声。

解码器则基于编码器生成的上下文向量,逐步生成所需的输出内容,具有逐步生成、自回归等特性。

本章将从最简单编码-解码器组合学起,介绍AE、VAE、CVAE及其他变种,最终利用PyTorch库在代码层面实现基于条件变分自编码器的手写数字生成项目。