编辑: ok2015 | 2019-07-04 |
另一种是基于 3D 模型的光场数据 库,构建这种数据库,可以从互联网上搜集各种模型,在软件中利用虚拟摄像机 阵列模拟光场来进行拍摄,比较容易实现.在本文的研究工作中,利用到了苏黎 世理工大学提供的基于实物的光场数据库 ETH-80,以及本人作为主要设计者参 与搭建的基于 3D 模型的光场数据库 Sphere60. 2.2 ETH-80 数据库 ETH-80 数据库是由苏黎世理工大学提供的实物光场数据库[12] . 该数据库的背 景单一,能够很方便地从视图中提取出对象,并从对象中提取出各种特征.数据 库中一共有
8 个类,每个类中有
10 个对象,总共
80 个对象.这8个类中,既有 自然界的物体,又有人造物体.8 个类分别为:苹果、梨、西红柿、牛、狗、马、 杯子和汽车.每个类的
10 个对象在采集时尽量选取了差异较大,但又明显属于 该类的对象.搭建光场时,在对象实物的周围构造一个正八面体,然后对其进行 三级细分,取上半部分,在得到的顶点上设置照相机进行拍摄,这样每个对象可 以获取
41 个视图,80 个对象一共
3280 幅图片.ETH-80 数据库中,可以提取出 对象的轮廓、颜色、纹理等各种特征. 图2.1 正八面体的三级细分
3 ETH-80 数据库中
80 个对象的代表视图如下: 图2.2 ETH-80数据库对象代表视图 2.3 Sphere60 数据库 Sphere60 数据库是由本人作为主要设计者在实验室参与搭建的 3D 模型光场 数据库.数据库一共有
8 个类,每个类有
10 个对象,总共
80 个对象.8 个类分 别为自行车、水龙头、轮船、沙发、鸟、恐龙、鱼和树,其中
4 类为自然界的物 体,4 类为人造物体.与ETH-80 数据库相比,Sphere60 数据库中每个类中的对 象差异性要大得多,比如鸟这一类中,既有展翅飞翔的鹰,也有奔跑的鸵鸟,还 有收翅的企鹅,这无疑使检索难度大大增加. Sphere60 数据库中,每个对象有
60 个视图.拍摄时在对象的周围构建一个球 面,球面上按照 C60 分子
32 面体的结构选取
60 个顶点,在顶点上安置照相机进 行拍摄. 数据库的搭建过程中我们使用 3D max 软件, 并利用 3D max 脚本语言编 写拍摄程序.
4 图2.3 C60分子32面体结构 Sphere60 数据库的构建过程如下: 1) 在互联网上收集 3D 模型,并按类整理,对于 obj 格式的文件可以直接保 留用于拍摄,对于 max 等非 obj 格式的文件,需将对象统一导出为 obj 格式;
2) 将obj 格式的 3D 模型导入 3D max 场景,置于场景的中心;
3) 设置球面半径和光照参数,使得既能拍摄到完整的模型,不出现对象超 出图片的情况,又能使对象在图片中所占的面积比例较大;
4) 试拍单张图片进行效果测试;
5) 如果效果合适,则进行完整的拍摄,得到对象的
60 张图片;
6) 将图片格式转换为 jpg 格式. 由于网上搜集的 3D 模型很多都没有颜色、纹理等信息,因此拍摄时将光强 设置为较大值,这样可以突出轮廓特征.
5 第3章 检索过程与算法 3.1 检索系统概述 我们在图 3.1 中给出整个检索系统的基本流程.可以看到,除了数据库部分 之外,检索过程主要包括对象输入、特征提取、相似性度量、相关反馈和结果输 出五大模块. 对象输入模块提供一定的输入方式,使得用户可以从数据库中选择要进行检 索的 3D 对象,选择完成后,该对象被传递到特征提取模块. 特征提取模块让用户能够从输入的 3D 对象中提取不同的特征,这些特征被 保存到特征文件中,并被相似性度量模块所调用. 相似性度量模块根据对象的特征,计算不同对象之间的距离,并进行从小到 大的排序,将排序结果传递到输出模块. 而相关反馈模块使用户可以对输出结果进行标注,并将标注的信息返回到相 似性度量模块,从而影响下一轮的输出. 在后面的几节中, 我们将针对检索系统中的各个模块进行详细而深入的讨论. 图3.1 检索系统基本流程