当前位置:网站首页>【手写数字识别】基于Lenet网络实现手写数字识别附matlab代码
【手写数字识别】基于Lenet网络实现手写数字识别附matlab代码
2022-07-17 13:18:00 【Matlab科研工作室】
1 内容介绍
当今社会,人工智能得到快速发展,而模式识 别作为人工智能的一个重要应用领域也得到了飞 速发展,它利用计算机通过计算的方法根据样本的 特征对样本进行分类,其中的光学字符识别技术受 到广大研究学者的青睐。手写数字识别是光学字 符识别技术的一个分支,主要研究如何利用电子计 算机自动辨认人手写在纸上的阿拉伯数字。现阶 段手写数字识别的主要研究方法有统计、聚类分析 和神经网络。 最小距离分类算法是模式识别中较传统、简单 的方法之一,但是对手写字体适应性不高[1]。K 最 近邻算法(KNN)是一种基于统计学的分类算法,最 早于1968年由Cover和Hart提出,作为最简单的机 器学习方法,理论上研究已比较成熟[2]。支持向量 机(SVM)是由Corinna Cortes和Vapnik等于1995年 首先提出的,该算法有很好的泛化能力与学习能 力,以结构风险最小化为目标,所求得的解是全局 最优解,克服“维数灾难”问题,大大增加效率[3]。BP(back propagation)神经网络是 1986 年由 Rumel⁃ hart 和 McCelland 为首的科学家小组提出的,作为 一种多层前馈网络,是在误差逆传播的基础上建立 的[4],常与梯度下降法等最优化方法结合使用。BP 神经网络算法是一种有监督的训练方法,且激活函 数为非线性可导的[5]。以上这些传统的识别方法 对复杂分类问题的数学函数表示能力以及网络的 泛化能力有限,往往达不到高精度识别的要求[6]。 卷积神经网络(CNN)最初由美国学者Cun等提出, 是一种层与层之间局部连接的深度神经网络[7],需 要经过信息的正反向传递。因为 CNN 的局部连 接、权值共享及池化操作等特性,CNN 可以有效降 低网络的复杂度和减少训练参数的数目[8]。 近年来,由于神经网络具有推广能力、记忆力、 非线性和自学习能力以及高速运算能力[9],所以卷 积神经网络被广泛用于手写数字识别。LeNet-5模 型作为一种典型的用来识别数字的卷积神经网络 不断地被优化改进。本课题即在 LeNet-5 模型的基础上,利用 MNIST字符库,通过改变样本训练方式,从而获得一种更高效准确的手写数字信息自动 识别方法。

2 仿真代码
<span style="color:#333333"><span style="background-color:rgba(0, 0, 0, 0.03)"><code>function layer1_mp = max_pool( layer1 )</code><code></code><code>[H,W,C] = size(layer1);</code><code></code><code>col_odd = 1:2:W;</code><code>col_even = 2:2:W;</code><code>row_odd = 1:2:H;</code><code>row_even = 2:2:H;</code><code></code><code>f1 = layer1(row_odd,col_odd,:);</code><code>f2 = layer1(row_odd,col_even,:);</code><code>f3 = layer1(row_even,col_odd,:);</code><code>f4 = layer1(row_even,col_even,:);</code><code></code><code>layer1_mp = zeros(size(f4));</code><code></code><code>for c = 1:C</code><code> max_val1 = max(f1(:,:,c),f2(:,:,c));</code><code> max_val2 = max(f3(:,:,c),f4(:,:,c));</code><code> max_val = max(max_val1,max_val2);</code><code> layer1_mp(:,:,c) = max_val;</code><code>end</code><code>end</code><code></code><code></code></span></span>3 运行结果


4 参考文献
[1]梅妍玭, 廖倩, 邵万灵. 基于LeNet神经网络的手写数字识别技术研究[J]. 新技术新工艺, 2020(6):3.
[2]丁娇, 丛爽, 林文瑞,等. MATLAB环境下LeNet网络的手写数字识别.
博主简介:擅长智能优化算法、神经网络预测、信号处理、元胞自动机、图像处理、路径规划、无人机等多种领域的Matlab仿真,相关matlab代码问题可私信交流。
部分理论引用网络文献,若有侵权联系博主删除。
边栏推荐
- If you use mybatics to access Damon database, is it exactly the same? Because the SQL syntax has not changed. Right?
- [design process] Net ORM FreeSQL wheredynamicfilter dynamic table query function
- LeetCode 2335. 装满杯子需要的最短总时长
- 华为机试:报文解压缩
- 华为防火墙(NGFW)的双机热备
- Structure the combat battalion | module 7
- [PostgreSQL] PostgreSQL 15 optimizes distinct
- Stream stream
- 博弈论(depu)与投资(40/100)
- mysql 查询报错
猜你喜欢

ROS 重名

ue4对动画蓝图的理解

Analysis and solution of application jar package conflict in yarn environment

The use and Simulation of stack and queue in STL

过拟合与欠拟合

37. flex布局

Pytorch框架 学习记录1 CIFAR-10分类

Convert excel table to word table, and keep the formula in Excel table unchanged

常见集合特性

Leetcode ugly number problem solution
随机推荐
antd表单设置数组字段
博弈论(depu)与投资(40/100)
[LeetCode周赛复盘] 第 302 场周赛20220717
【PostgreSQL 】PostgreSQL 15对distinct的优化
R language uses the ordinal of epidisplay package or. The display function obtains the summary statistical information of the ordered logistic regression model (the odds ratio and its confidence inter
华为防火墙(NGFW)的双机热备
vulnhub inclusiveness: 1
Analysis and solution of application jar package conflict in yarn environment
使用tesseract.js-offline识别图片文字记录
破案了卧槽---从MQ消费的逻辑怎么改代码都不生效
Design of the multi live architecture in different places of the king glory mall
JSP based novel writing and creation website
Transplant Wu Enda's deep learning 01 machine learning and neural network second week neural network basic programming homework elective homework to pycharm
6G中的卫星通信高效天基计算技术
NAT技术及NAT ALG
Figure an introduction to the interpretable method of neural network and a code example of gnnexplainer interpreting prediction
R language uses LM function to build linear regression model, and uses subset function to specify the subset of data set to build regression model (uses subset function to filter the data subset that
c语言指针的有关总结
内核态和用户态
openfoam热流边界条件