编辑: 此身滑稽 | 2019-07-04 |
根据数据集的特点, 建立数据模型, 分析实际任务需 求并进行映射;
最后进行视觉元素编码, 完成可视化.
2 可视化基本模型
2
1 数据立方体 数据立方体是多维模型的形象概念.虽然立方 体只有三维, 但多维模型不限于此, 可以组合更多的 维度, 展示更多维度的数据特征.食品的抽检不合 格报告维数众多, 经过数据预处理、 转换, 根据实际 需要, 能够按照预先定义的多维模型, 将数据加载进 去. 实现多维数据操作的一种方法是使用维的层次 关系, 每个层次包含一个或多个维成员, 多个层次中 的维成员排列成多个层次, 这种层次结构为数据的 上钻和下钻提供了基础.实现多维数据操作的另一 种方法是使用维内元素的类, 对应类的属性对维成 员进行划分, 类属性不同, 得到的划分也不同.层次 和类是两个不同的概念, 层次有父子关系, 而类的成 员之间不存在父子关系, 只反映成员的共同特征. 在对食品抽检报告的分析中, 既有按维的层次 关系进行的分析, 也有按维成 员的类进 行的 分析. 在层次关系上进行的分析, 包括从维的低层次到高 层次的数据综合, 即聚集分析, 以及从维的高层次到 低层次的数据钻取分析.成员类的分析包括分类与 归纳, 分类是由粗粒度成员向细粒度成员进行的下 探, 归纳则是由细粒度成员向粗粒度成员进行的汇 总. 聚合、 组织数据集是将数据按照所需的 n个维 度进行转换.比如, 选择食品、 抽检项目和地点 3个 维度, 分别表示为 F ( 食品) 、 P ( 项目) 和L(地点) , 则笛卡 尔乘积F*P*L隐喻地称为数据立方体[
1 7 ] .出于实际目的, 3个集合 F 、 P和 L离散且有 限.由指定食品 f ∈F 、 抽检项目 p ∈P和地点 l ∈L 组成的任何组合称为立方体的点, 表示为( f , p , l ) .
2
2 切片和投影 任务分析是探索数据集三维空间中的研究对象 的变化和关系.但是, 不能从结构 F*P*L的高维 度看到这种变化和关系, 所以整个任务被分解成为 更简单的子任务.可以通过考虑其切片来完成任务 分析, 其中一个维度固定, 探究剩余维度变量的变化
3 7
2 第 6期 杨璐 等:挖掘........