为加强研究生学术交流活动,推进学术创新,特开通“研究生学术报告预告区”。我校研究生和教师可以在预告区及时发布和了解有关研究生学术报告的信息,届时参加。也可就某学术报告展开专题讨论与交流。
本次学术报告介绍了一种基于CNN的手写英文文档识别方法,包括:获取由手写英文字母及标点符号文本组成的数据集,基于数据集构造训练样本集及测试样本集;构造8层卷积神经网络,包括5个卷积层和3个全连接层,最后一个全连接层的输出被送到一个具有59个输出向量的softmax层当中;采用重叠的Pooling,对输入图像的每个像素进行卷积、下采样、池化操作,得到每层的特征图的大小;输入训练样本集,提取字符特征,进行分类训练;将提取的单个字符图像统一缩放到320*320像素;添加彩色通道,将字符图像类型转化为320*320*3 uint8型数据,得到测试样本集;利用训练后的神经网络自动识别英文符号。