120 likes | 266 Views
手写体两位数字识别. 翁立波. 2012 年 2 月 28 日. 问题提出. 随着模式识别及相关理论和技术的发展,其在现实生活中也得到越来越广泛的应用。 微软推出了 kinect ,可以通过人脸、手势、动作进行控制以及人机交互,使得体感游戏开始进入普通家庭。 可以预见不久之后的家用电视机也将会带上这样的功能:可以用手势来操控电视频道。 那么,是否能通过临空手写数字来切换频道? 于是提出这个问题,手写体数字识别。. 问题简化.
E N D
手写体两位数字识别 翁立波 2012年2月28日
问题提出 随着模式识别及相关理论和技术的发展,其在现实生活中也得到越来越广泛的应用。 微软推出了kinect,可以通过人脸、手势、动作进行控制以及人机交互,使得体感游戏开始进入普通家庭。 可以预见不久之后的家用电视机也将会带上这样的功能:可以用手势来操控电视频道。 那么,是否能通过临空手写数字来切换频道? 于是提出这个问题,手写体数字识别。
问题简化 假设需要识别的是从0-99的频道,那么就是需要识别100类,从原问题看,需要识别的是从0-99这100类数字,且每个数字都是用一笔写成的。
数据采集 采集100类数据,每类30个,并已经过二值化处理,每幅图像分辨率为170×160 Figure1 some original images
数据处理 170×160 80×80 80×80 Figure2 processing
训练与识别 对每类30张图片使用PCA进行降维 每类前25张作为训练集,后5张作为测试集 使用SVM方法进行训练和识别
训练与识别 results Figure3 some test results
实验结果 PCA n=60
实验结果 PCA n=20 PCA n=40 PCA n=80
小结 使用PCA降维后得到的相同维度下,用linear 或者polynomial的kernel type进行训练能得到较好结果 在使用PCA分别降维至20、40、60和80后进行SVM方法训练与分类,其中在60的时候有最高正确率
小结 是否能够改进图像预处理来提高正确率? 通过使用其他方法来得到更好的结果?
Thanks! 翁立波 2012年2月28日