编辑: 黎文定 | 2019-06-27 |
6 次数据,所以我们把测量到的数据量数字除以 6.
8 /
17 Table
5 C 加载数据的存储量 ( 单位 : MB) 下面的
图表比较了图存储量大小,比较基准为原始数据量大小. 图2C加载数据后数据库数据容量比较 数据存储量综述 原始数据被压缩并存储在 TigerGraph 数据库中,从而为 Graph
500 数据集节省了 50% 的存 储空间,并为 Twitter 数据集节省了 61% 的存储空间. 其他的图数据库创建的图数据量都比原始数据量大,需要比 TigerGraph 多5倍到
13 倍的存储 空间存储数据. Dataset Raw Data Tiger Graph Neo4j Neptune JanusGraph ArangoDB graph500
967 482 2,300 3,850 2,764 6,657 twitter 24,375 9,500 49,000 91,140 55,296 126,970 查询性能测试 数据检索或查询是任何数据库系统的基本功能之一.数据分析系统必须能够执行用户应用程序所需的 查询类型,并且必须快速执行.
9 /
17 查询性能测试检查了这三个方面 : K 度顶点计数查询的查询响应时间 弱联通子图和 PageRank( 全图查询 ) 的查询响应时间 查询响应时间的可扩展性 K 度查询 K 度路径顶点计数查询,它计算从起始顶点有长度为 K 的路径的顶点的总计数,这是一个很好的图遍 历性能的度量.对于每个数据集,我们测量下列查询的查询响应时间 : 计算
300 个固定随机种子的所有一度的顶点,并将超时设置为
3 分钟 / 查询. 计算
300 个固定随机种子的所有两度的顶点,并将超时设置为
3 分钟 / 查询. 计算
10 个固定随机种子的三度的顶点,并将超时设置为 2.5 小时 / 查询. 计算
10 个固定随机种子的六度的顶点,并将超时设置为 2.5 小时 / 查询. 固定随机种子 ,意思是我们从图中一次性随机选择 N 个顶点,并将这个列表保存为测试的可重复输 入条件.每条路径查询都从一个顶点开始,并找到所有位于长度为 K 路径末端的顶点. N 个查询是按顺序运行的.每个起始顶点都有不同的查询子图大小 ;
我们报告中取平均值.为了将注 意力集中在图遍历和最小化网络输出时间上,我们只输出 K 度路径查询子图的大小,而不是完整的顶 点列表.我们在参与测试的图数据库中,对所有测试查询结果进行交叉验证. Table
6 C 平均 K 度查询的大小 我们在每个数据库的原生查询语言中实现查询 : 用于 TigerGraph 的GSQL、N........