基于 Python K-近邻算法的手写识别系统
推荐
在线提问>>
这里我们一步步的构造使用k-近邻分类器的手写识别系统,为了简单起见,这里构造的系统只能识别数字0到9,参考图2-6,需要识别的数字已经使用图形处理软件,处理成具有相同的色彩和大小:宽高是32像素*32像素的黑白图形。尽管采用文本格式存储图形不能有效地利用内存空间,但是为了方便理解,我们还是将图像转化为文本格式。
1.1,使用k-近邻算法的手写识别系统步骤
(1)收集数据:提供文本文件
(2)准备数据:编写函数classify0(),将图像格式转换为分类器使用的list格式
(3)分析数据:在Python命令提示符中检查数据,确保它符合要求
(4)训练算法:此步骤不适用与k-近邻算法
(5)测试算法:编写函数使用提供的部分数据集作为测试样本,测试样本与非测试样本的区别在于测试样本是已经完成分类的数据,如果预测分类与实际类别不同,则标记为一个错误
(6)使用算法:本例没有完成此步骤,如果感兴趣的话,可以构建完整的应用程序,从图形中提取数字,并完成数字识别
1.2,准备数据:将图像转换为测试向量
实际图形存储在源码的两个子目录中:目标trainingDigits中包含了大约2000个例子,每个例子如图2-6所示,每个数字大约有200个样本;目录testDigits中包含了大约900个测试数据,我们使用目录trainingDigits中的数据训练分类器,使用目录testDigits中的数据测试分类器的效果,两组数据没有覆盖,你可以检查一下这些文件夹的文件是否符合要求。
以上内容为大家介绍了基于PythonK-近邻算法的手写识别系统,希望对大家有所帮助,如果想要了解更多Python相关知识,请关注IT培训机构:千锋教育。