自编码器应用简介与基于循环神经网络的手写蒙古文词语识别

由天下分享时间：2025/1/9 11:23:19 加入收藏我要投稿点赞

高维数据可视化（隐空间只有两维，所以我们可以可视化一下。我们来看看2D平面中不同类的近邻分布）

数据生成（隐平面上采样一些点，然后生成对应的显变量）

???

蒙古文词语实际上是由字母或者形状片段序列组成的。蒙科立编码是形码编码，将蒙古文词语表示由一个有限个的形状片段的编码集中的元素组成的序列。

非受限的蒙古文词语可以通过序列识别算法RNN+CTC来实现。

1为采用滑动窗口的技术，使用PCA进行窗口像素特征降维、CNN提取窗口图像特征和自编码器提取窗口图像特征，获取序列特征。

?2为解码阶段：非受限解码和受限解码

?受限解码可以使用语言模型，提高识别精度

数据预处理

?归一化为128 *64的图片。

?变长数据：根据手写蒙古文词语的长度不同，调整数据的有效长度，最后填充为统一的长度。

?联机数据：根据原始数据构造有效的联机数据。

特征帧序列提取

?对于128 *64 的图片数据，采用大小为32 *64滑动窗口，采用滑动步长为4，进行特征序列选取，序列的长度为41。