当前位置：网站首页>【手写数字识别】基于Lenet网络实现手写数字识别附matlab代码

【手写数字识别】基于Lenet网络实现手写数字识别附matlab代码

2022-07-17 13:18:00 【Matlab科研工作室】

1 内容介绍

当今社会，人工智能得到快速发展，而模式识别作为人工智能的一个重要应用领域也得到了飞速发展，它利用计算机通过计算的方法根据样本的特征对样本进行分类，其中的光学字符识别技术受到广大研究学者的青睐。手写数字识别是光学字符识别技术的一个分支，主要研究如何利用电子计算机自动辨认人手写在纸上的阿拉伯数字。现阶段手写数字识别的主要研究方法有统计、聚类分析和神经网络。最小距离分类算法是模式识别中较传统、简单的方法之一，但是对手写字体适应性不高［1］。K 最近邻算法（KNN）是一种基于统计学的分类算法，最早于1968年由Cover和Hart提出，作为最简单的机器学习方法，理论上研究已比较成熟［2］。支持向量机（SVM）是由Corinna Cortes和Vapnik等于1995年首先提出的，该算法有很好的泛化能力与学习能力，以结构风险最小化为目标，所求得的解是全局最优解，克服“维数灾难”问题，大大增加效率［3］。BP（back propagation）神经网络是 1986 年由 Rumel⁃ hart 和 McCelland 为首的科学家小组提出的，作为一种多层前馈网络，是在误差逆传播的基础上建立的［4］，常与梯度下降法等最优化方法结合使用。BP 神经网络算法是一种有监督的训练方法，且激活函数为非线性可导的［5］。以上这些传统的识别方法对复杂分类问题的数学函数表示能力以及网络的泛化能力有限，往往达不到高精度识别的要求［6］。卷积神经网络（CNN）最初由美国学者Cun等提出，是一种层与层之间局部连接的深度神经网络［7］，需要经过信息的正反向传递。因为 CNN 的局部连接、权值共享及池化操作等特性，CNN 可以有效降低网络的复杂度和减少训练参数的数目［8］。近年来，由于神经网络具有推广能力、记忆力、非线性和自学习能力以及高速运算能力［9］，所以卷积神经网络被广泛用于手写数字识别。LeNet-5模型作为一种典型的用来识别数字的卷积神经网络不断地被优化改进。本课题即在 LeNet-5 模型的基础上，利用 MNIST字符库，通过改变样本训练方式，从而获得一种更高效准确的手写数字信息自动识别方法。

2 仿真代码

<span style="color:#333333"><span style="background-color:rgba(0, 0, 0, 0.03)"><code>function layer1_mp = max_pool( layer1 )</code><code></code><code>[H,W,C] = size(layer1);</code><code></code><code>col_odd = 1:2:W;</code><code>col_even = 2:2:W;</code><code>row_odd = 1:2:H;</code><code>row_even = 2:2:H;</code><code></code><code>f1 = layer1(row_odd,col_odd,:);</code><code>f2 = layer1(row_odd,col_even,:);</code><code>f3 = layer1(row_even,col_odd,:);</code><code>f4 = layer1(row_even,col_even,:);</code><code></code><code>layer1_mp = zeros(size(f4));</code><code></code><code>for c = 1:C</code><code>    max_val1 = max(f1(:,:,c),f2(:,:,c));</code><code>    max_val2 = max(f3(:,:,c),f4(:,:,c));</code><code>    max_val = max(max_val1,max_val2);</code><code>    layer1_mp(:,:,c) = max_val;</code><code>end</code><code>end</code><code></code><code></code></span></span>