编辑: 此身滑稽 | 2019-07-04 |
d a t ar e l a t i o n s h i pm i n i n g ;
v i s u a l i z a t i o n
0 引言 可视化是把数据信息转换为人眼能识别的可视 符号, 是人机交互、 虚拟现实应用的关键技术[
1 ] . 图可视化是信息可视化领域的一个重要分支,又称 为关联网络、 网络或关联图, 是关联数据分析过程中 的重要部分[
2 ] . 为了对结构语义进行可视化, 研究者提出了文 本的语义结构可视化技术[
3 ] .D A V i e w e r 将文本的 叙述结构语义以树的形式进行可视化, 同时进行了 相似度统计、 修辞 结构, 以及展示了相 应的 文本内 容[
4 ] .D o c u B u r s t 以放射状层次圆环的形式表示文 本结构[
5 ] .基于主题的 文本聚类 是文 本数 据挖掘 的重要研究内容, 为了可视化表示文本聚类效果, 通 常将一维的文本信息投射到二维空间中, 以便于对 聚类的关系予以展示.H i p p是一种基于层次化点 排布的投影方法, 可广泛用于 文本 聚类可 视化[
6 ] . 在面对高维数据时, L A I 等[
7 ] 提出一种通过局部增 强的投影探索高维数据的交互式探索方案, 以帮助 用户根据他们的兴趣点和分析任务定制线性投影. 可视化分析视图或分析系统是一种辅助数据分 析和决策的技术, 能够让用户更好地理解复杂的领 域知识.C H E N等[
8 ] 根据农药残留数据的特点和食 品安全领域的需求, 提出一种基于层次聚类的关联 层次数据可视化分析方法.C H E N等[
9 ] 在面临综合 比较多区域 MR L标准数据的挑战时, 提出一种复杂 层次数据多重比较可视化分析方法.C H U I 等[
1 0 ] 以 多面板图展现年龄、 时间和疾病之间的相互作用, 帮 助流行病学家构造了视觉分析图.L I 等[
1 1 ] 提出了 为不同背景的房地产市场用户提供服务、 满足不同 程度需求的交互式视觉分析系统. 近年来, 农产品及食品质量安全事件时有发生, 在给消费者带来健康威胁的同时, 也给行业带来了 冲击[
1 2 ] .食品安全相关的大数据通常具有多源、 多维、 时空、 层次、 关联和不确定性等特征[
1 3 ] .而对于 食品安全这一特殊领域, 监控、 溯源食品安全事件, 进行风险评估和预警是十分重要的[
1 4 ] .食品安全 检测是食品安全监管的重要环节, 检测环节的薄弱 和缺失是我国出现食品安全问题的直接原因[
1 5-
1 6 ] . 借助于可视化方式, 能够清晰地展现数据的表面特 征, 挖掘数据的内在关系, 总结不合格产品的产生原 因,对评价当前食品安全形势、 查找风险因素、 引导 监管方向、 推动食品行业健康发展具有重要作用. 为更好地挖掘以食品抽检不合格报告为代表的 数据关系, 本文提出一种数据关系挖掘可视分析图― ― ―E x p l o r e V i e w , 展现数据集中的层次结构, 同时 提供隐藏在数据层次结构中的关联关系.
1 研究对象 以2017年
1 2月25日至
2 0
1 8年 1月
1 5日间 的国家食品药品监督管理总局抽检不合格报告的数 据集为研究对象, 共包含
10 1 4条抽检数据.不合 格抽检报告数据集一般包括标称生产企业名称、 企 业地址、 被抽样单位名称、 单位地址、 食品名称、 规格 型号、 商标、 生产日期及批号、 不合格项目名称、 检验 结果、 标准值、 食品分类、 公告号、 公告日期、 任务来 源和检验机构等内容. 对数据集进行数据预处理、 规范化和特征提取;