要求:在人脸数据集中加入自己的若干张照片。按照以下要求分别训练线性模型、决策树模型、神经网络模型、支持向量机模型、贝叶斯模型来识别给定的人脸照片是谁,并回答以下问题。
1、 将照片分辨率分别调至4×3、8×7、12×11、16×15、20×18、24×22、28×26、32×30,给出各模型在不同分辨率下进行十折交叉验证的准确率、召回率、F1指标,并将指标绘制成曲线,分析曲线表示的含义(A类60分)。根据MDL原理,综合各模型的复杂度(参数量)与正确率,分析哪个模型是最优识别模型(10分)。
2、 针对一种学习模型,选择一张可以正确识别的自己照片,给出将自己照片进行最小修改(改动的字节最少)方案,使得该模型无法正确识别自己的照片(须展示原始图片、改动后图片、原始数据、改动后数据,并标注改动位置)。并据此分析该模型的过拟合条件(10分)。
3、 如果直接对数据集中的数据进行聚类,能否得到每人一类的结果。如能,请说明采取的聚类方法,如不能,请分析原因(10分)。
4、 针对4×3、8×7、12×11、16×15、20×18、24×22、28×26、32×30分辨率的图像数据集,选择合适的数据预处理方法(包括但不限于降维方法),分析说明数据预处理对各学习器最终性能有何影响(B类10分)。
问题补充: 有参考PPT