天问

机器视觉学习路径(三):5天进阶

 

深度人脸识别方向

 

 

  

学习目标

 

  • 了解典型的CNN模型框架,如AlexNet,VGG,NIN,Googlenet, ResNet

  • 训练人脸分类网络

 

  

学习目标

 

Day 1: 了解典型CNN模型框架

 

小目标:学习VGG网络模型结构,了解其它经典CNN模型

 

必读:VGG http://www.robots.ox.ac.uk/~vgg/research/very_deep/

 

选读:

1.AlexNet

https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf

 

2.Network in Network

https://arxiv.org/pdf/1312.4400v3.pdf

 

3.GoogLeNet

http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Szegedy_Going_Deeper_With_2015_CVPR_paper.pdf

 

4.ResNet

https://arxiv.org/pdf/1512.03385v1.pdf

 


Day 2: VGG-Face 人脸识别

 

小目标:理解VGG-Face人脸识别原理和流程

 

必读:VGG-Face (这篇论文很重要!!!多看几遍哟~~)

http://www.robots.ox.ac.uk/~vgg/publications/2015/Parkhi15/parkhi15.pdf

 

选读:人脸识别简史与近期进展

https://zhuanlan.zhihu.com/p/21465605?refer=dlclass

 

Day 3: VGG-Face 模型上手体验

 

小目标:使用VGG-Face模型进行人脸识别

 

必读:VGG-Face 模型

http://www.robots.ox.ac.uk/~vgg/software/vgg_face/

 

内有训练好的model,大家下载下来跑起来看看,并结合论文,理清楚如何训练人脸分类网络,如何用这个网络提取特征用于人脸识别。

 

选读:Valse2016 | 刘昕-CNN近期进展与实用技巧

http://pan.baidu.com/s/1bo4mCeN

 

Vasle2016 | 山世光-深度学习多层神经网络的复兴与变革

http://pan.baidu.com/s/1slxoKkX

 

Day 4-5: 训练人脸分类网络

 

小目标:利用训练营提供的人脸数据集训练人脸分类模型

 

必读:

1.自己动手训练一个网络

 

数据集

  • 训练集 9W+张人脸图片,包含10000 ID;测试集1包含 400 对人脸图片;测试集2包含 1000 对人脸图片。

  • 训练集、测试集的文件夹名称即为每组图片的ID。

  • 训练集中每个文件夹中的图片为同一个人的图片,测试集中每对图片不一定是同一个人。

  • 11月25日提供训练集下载,测试集1和测试集2下载时间见文章最后说明。大家可以先在训练集中自行划分训练集、验证集和测试集,进行模型训练和测试。

  • 训练集下载链接: https://pan.baidu.com/s/1jHAflki 密码: mr7f

  • 本数据集由云从科技提供,仅供学习交流使用,未经许可不得用于商业目的。

 

网络模型:基于VGG-Face模型进行finetune, 也可以选用其它网络如AlexNet,GoogleNet,ResNet或是你自己设计的网络都可以~~(讲道理,网络越深效果越好)

 

如果基于现有的网络模型finetune,请参考:

-caffe/examples/finetune_flickr_style

http://blog.csdn.net/hlx371240/article/details/51388022

 

2.CNN训练技巧 – 南大 魏秀参

http://pan.baidu.com/s/1bpuZwJX

 

  

One more thing...

 

 

本次深度学习训练营的最终实战项目是真实的人脸识别问题。

 

同学们所做实现的人脸识别的算法结果,将以练习赛的形式通过科赛网的竞赛平台进行提交与评估。练习赛成绩优异的同学,将有机会获得最佳作品的奖学金奖励。

 

第三周学习材料已提供训练集的下载链接(见上文Day4-5必读/1/数据集/5)。学员可以先在训练集中自行划分训练集、验证集和测试集,进行模型训练和测试。

 

12月1日开始,同学们就可以通过科赛网提交练习赛的结果,实时了解自己的算法成绩和排名。同学们可以在练习赛中检验自己的学习成果,不断调整和完善自己的算法方案,进行更有针对性的交流和请教。

 

练习赛分成两个阶段。

第一阶段,主要供大家熟悉比赛流程,练习分类算法,这一阶段提供测试集1(400对图片)作为测试集,本阶段成绩不计入总成绩;

 

第二阶段,提供测试集2(1000对图片),本阶段成绩计入最终成绩,时间也会比第一阶段短。

 

参赛者需要提交测试集图片对ID和相似度,本次比赛使用AUC作为评估标准(可以用scikit-learn中的AUC方法计算),训练营学员需要独立完成比赛。

 

提交样例:https://pan.baidu.com/s/1i4EkUMh

AUC方法:http://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_auc_score.html

 

除了训练营的成员,其他对人脸识别感兴趣的小伙伴,也将有机会参与到比赛中来与各位同台竞技,但不会作为训练营奖学金的人选。这次人脸识别比赛的最终冠军会是谁,让我们拭目以待吧!

 

人脸美颜实战方向

 

 

  

学习目标

 

  • 头部动作识别:抬头,点头,左转,右转

  • 在视频里显示相应的动作标签

  • 学习头部姿态估计的基础理论(感兴趣就看看咯~~)

 

 

  

学习指引

 

Day 1: 非常naïve的头部动作判断~~

 

小目标:根据关键点位置变化,判断头部动作

 

既然可以获取人脸关键点位置,那最easy的方法就是通过这些点坐标的变化来判断头部动作,比如所有关键点都向左偏移大于一定阈值,则可认为左转,其它动作以此类推~~

大家编个小程序试试看吧

 

Tips:这种方法太简单粗暴了,同时也会有一个问题,比如当头部向左平移时,也会被判断为左转~~ 老司机们应该也发现了吧

 

Day 2: 头部姿态估计

 

小目标:理解头部姿态估计原理

 

必读:人脸姿态估计浅谈(科普)

http://blog.csdn.net/wsj998689aa/article/details/39294171

 

选读:PAMI09 – Head Pose Estimation in Computer Vision: A Survey

http://cvrr.ucsd.edu/publications/2009/MurphyChutorian_Trivedi_PAMI09.pdf

 

Day 3: 头部姿态估计 – OpenCV (上)

 

小目标:参考下面的代码来实现头部姿态估计

 

必读:Head Pose Estimation using OpenCV

http://www.learnopencv.com/head-pose-estimation-using-opencv-and-dlib/

 

Day 4: 头部姿态估计 – OpenCV (下)

 

小目标:参考下面的内容和代码来实现头部姿态估计

 

必读:Mastering OpenCV with Practical Computer Vision Projects

-Chaper 7 3D Head Pose Estimation Using AAM and POSIT

http://pan.baidu.com/s/1slldvPV

 

-Code:

https://github.com/MasteringOpenCV/code/tree/master/Chapter7_HeadPoseEstimation

 

Day 5: 头部姿态估计 – 动作识别

 

小目标:基于day3-4完成头部动作判断,并显示相应的标签(left,right,up,down)

 

Tips: 计算头部旋转角度,如果左转角度超过一定阈值(比如10度),则可以认为头部左转,其它情况类似。

 

 

博客地址:http://blog.yoqi.me/?p=1232
扫我捐助哦
喜欢 2

这篇文章还没有评论

发表评论