150 likes | 354 Views
基于 多空间字典学习法的稀疏分类器. 汇报者:徐楚 指导教师:金志刚 教授 学院:电子信息工程. 课题背景及研究现状. 1. 课题目标. 2. 算法原理. 3. 整体框架. 4. 目录. 课题背景及研究现状. 课题背景 人脸识别一直是计算机视觉领域一个很活跃的课题。 Wright 等人提出用基于压缩感知理论的稀疏分类器 (SRC) 对人脸进行识别,取得了不错的效果。
E N D
基于多空间字典学习法的稀疏分类器 汇报者:徐楚 指导教师:金志刚 教授 学院:电子信息工程
课题背景及研究现状 1 课题目标 2 • 算法原理 3 整体框架 4 目录 天津大学电子信息工程学院
课题背景及研究现状 • 课题背景 • 人脸识别一直是计算机视觉领域一个很活跃的课题。Wright等人提出用基于压缩感知理论的稀疏分类器(SRC)对人脸进行识别,取得了不错的效果。 • 该算法直接利用训练图片作为字典对检测图片进行L1范数约束的稀疏表示,显然不能充分表征待测人脸图片的特征,且字典的原子数过高增加了编码的复杂度。 天津大学电子信息工程学院
课题背景及研究现状 • 课题研究现状 • 于是如何从原始训练样本学习得到最优化字典成为研究的热点方向。 • 目前有很多种用于FR的字典学习算法:1.Metaface,DKSVD都是对原始训练样本统一学习得到一个所有类别共同使用的字典。 2.Fisher 等为每一类别学习一个字典,让每个字典尽量独立。 • 以上提到的两类字典学习方法都是在单一空间对原始训练图片进行学习,不能充分利用原训练样本的特征,泛化能力不好。 天津大学电子信息工程学院
课题目标 • 课题研究目标及意义 本文提出一种基于遗传算法的多空间字典学习法,用于稀疏分类器进行人脸识别。该算法在正确性和多样性的限制下,充分利用不同特征空间的关系,充分降低了各个子字典的泛化误差,使得人脸识别的正确率提高。 天津大学电子信息工程学院
算法原理 天津大学电子信息工程学院
特征空间的选择 1.Eigenface,该方法是整体特佂能克服光线的变化,但对姿势和表情比较敏感. YK=WPCATXK 2.Laplacianface保留图片空间的局部流特征,具有很好的分类能力 YK=WTXK, W=WPCAWLPP. 3.Gobor特征提取是通过滤波器对每个训练样本进行处理,滤波系数为 然后再用PCA进行将为处理。gabor特征能够很好的表征局部的变化所以能更好的克服姿势和表情的变化。 检测时间:5125.64ms 检测时间:6326.91ms 天津大学电子信息工程学院
字典联合学习 OE,OL,OG联合学习→NE,NL,NG。 采用二进制样本选择算子S=[SE,SL,SG],将选择算子分别作用于子空间对应的原始字典即SE(OE), SL(OL), SG(OG),得到新的字典。 天津大学电子信息工程学院
字典联合学习 联合字典训练的目标函数是: 对于第K个已标记人脸训练样本,函数f(XkE,SE)表示用子字典SE(OE)训练的分类器对XkE的分类标签。 • 当3个子分类器都对时为3; • 有1个错误时候2+λ; • 有2个错误时1+2λ; 该字典学习法目的在于分别选出每个子字典中最具区分能力的样 本,并鼓励不同子字典有不同的识别结果。 天津大学电子信息工程学院
字典联合学习 天津大学电子信息工程学院
字典联合学习 天津大学电子信息工程学院
染色体杂交 Eigenface Laplacian Gabor 天津大学电子信息工程学院
整体框架 天津大学电子信息工程学院
课题背景及研究现状 • 预期结果: • (1)用Extented Yale B进行测试,其包含38类共2414张不同明暗程度的人脸图片。在不同维数情况下(例如30 d,120d 500d)进行训练测试,预计ms-SRC分类的正确率比原SRC有提高,且在选取特征维数较低的情况下效果更好。 • (2)用AR Database 进行测试,与Extented Yale B相比它的人脸图片有更多表情的变化和局部遮挡的情况,同样在不同维数下进行训练测试,预计ms-SRC分类的正确率比SRC有明显的提高,且在选取特征维数较低的情况下效果更好。 天津大学电子信息工程学院
Thank You ! 天津大学电子信息工程学院