编辑: 山南水北 | 2019-07-08 |
14 传感器 ? 产生物理读数 ? 物理学、声学、电子学、光学、触觉、味觉、… 数字信息 ? 文本、图像、音频、视频、三维点集、… 模式 ? 物体检测和识别、音频转化为文本、行为识别、姿态识 别、… 应用 ? 决策、计划、处理、… (虚拟例子)性别识别:特征
15 ? 选取什么数据来判别一个人的性别? ? 长相?喉结? ? 身高? ? 体重? ? 声音? ? 行为? ? … ? 被使用的数据或从原始输入数据(raw input data) 中提取(extract)的数据称为特征(feature) ? 为什么要选取、提取、或者学习特征? (虚拟例子)性别识别:评估
16 ? 怎么知道模式识别的结果好坏? ? 评估或评价(evaluate) ? 通常是把模式识别系统的输出(称为预测, prediction)与真实值(groundtruth)进行比较 ? 真实值从哪里来? ? 女性的性染色体XX→X(来自母亲)+X(来自父亲) ? 男性的性染色体XY→X(来自母亲)+Y(来自父亲) ? 如何进行比较? ? 以后会讲.现在先想一想? (虚拟例子)性别识别:转换
17 ? 如何构建一个模式识别系统将输入转换为输出 ? 常见方法:机器学习(machine learning) ? 从过去的经验学习Learning from experience ? 训练集(training set):已搜集的数据 ? 模型(model): 从训练集得到的规律,表现形式多样 ? 测试(prediction, testing): 将这些规律应用到新 的例子以得到针对该例子的结果(模式识别的输出) ? 测试集(testing set):为了评估这些规律搜集的数 据?那么,对训练集和测试集应该有什么要求? (虚拟例子)性别识别:应用
18 ? 得到输出后,有什么用? ? 通常在更大的系统中起作用 ? iOnRoad, Siri, Kinect, … ? 那么,模式识别系统要做到多好呢? ? 由那个 更大的系统 决定 ? 是不是越高越好? 小结:模式识别的步骤
19 问题: ? 是这样吗? ? 需要多次反馈 (feedback)、尝试、修改?什么步骤最重要 ? ?? ? 深度学习在图中什么位置? 模式识别为什么困难?
20 ? 多种原因 ? 语义鸿沟semantic gap,如,一副2000*1000的图像是 什么? ? 对人的眼睛和大脑:教师、桌椅、讲台、黑板、人、… ? 对计算机:3 *
2000 *
1000 = 6,000,000个数字 ? 计算能力computational power ? 很多算法在台式机上要数年或更长时间 ? 大数据,存储和计算都成为问题 ? 数据的获取data acquiring ? 很多时候数据难以获取(如,医学图像medical imaging) ? 或者虽然容易获取,但是难以标注(如,对google图像的精确 标注annotation)
21 一个例子
22 ? ILSVRC2010: Large Scale Visual Recognition Challenge
2010 ? 图像分类:1,000个类别, 1,200,000训练图像 ? 原始输入(图像)约100+GB ? 有效的图像表示:每个图像表示为262,144的向量, 需要1258GB空间来存储特征 ? 设计新的机器学习算法,使得存储开销缩小到约40G ? 用SVMlight 或LIBSVM要很多年 ? 用LIBLINEAR要大概2个月 ? 使用新的深度学习(deep learning)方法,用GPU辅助 计算,可以得到更好的精度accuracy ? 尝试一下用你的笔记本电脑测试这个网络? 各步骤的(实践)重要性
23 1. 提取特征 ? 设想一下,告诉你一个人的年纪,需要判别其性别? ? 或者,告诉你一个人的染色体组成,需要判别其性 别? 2. 数据获取 ? 设想一下,根据图像判断性别,所有训练图像都只 包含男子、而不包含任何女子? ? 或者,图像中有男有女,但是所有都标记为女? 3. 机器学习 ? 有很多理论上重要的问题,对实践效果也非常重要 和其他领域的关系