编辑: 阿拉蕾 | 2013-04-06 |
您可以下载数据集,以便在自己的 Tableau 软件副本中跟着操作. 这是开始屏幕.我们可以在这里连接到新数据,连接到保存的数据源,或者打开最近使用的工作 簿. 连接到数据 在 连接 窗格,我们可以看到 Tableau 可以本地连接的许多种数据源. 在本视频中,我们将连接全球超市数据(这些数据可以下载).超市数据是像这样的一个 Excel 文件. 数据的形状类似数据库表:第一行包含列标题. 该数据集包含购买具体产品的客户交易. 我们返回 Tableau Desktop... ...然后选择连接到 Excel.导航到您电脑上的该文件,然后双击打开. 现在,我们来到了 数据源 页面. 从这里,我们可以选择使用哪些工作表或表格.我们可以把 订单 拖到画布中. 如果要从这个数据源调出更多信息,只需将其他表拖至画布. 如果有位于另一个数据源的相关数据,我们可以单击 添加 ,通过添加连接来创建整合式数据 源.我们将在这里引入关于被退回订单的 csv. 文本文件(此文件同样可以下载).工作表已自 动添加到画布,我们可以在这里看到自己的跨数据库联接.为了让大家能够跟上,我们现在使用 的是平面文件.但这可以是例如对来自 Hadoop 和Redshift 数据的联接,而跨数据库联接是一 项极为强大的功能. 联接和数据准备 Tableau Desktop 自动创建默认联接,就像我们在此处图标中看到的一样.单击该图标即可查 看联接的详细信息,我们可以直接编辑这些信息. 我们将选择左联接,这样既可以获取 订单 表格的所有信息,又可以仅引入被退回交易的相关
2 退回 信息.订单 ID 已经被用作联接子句,但我们可以根据需要改变联接子句. 下方的网格让我们能够验证自己有什么样的数据―我们有很多来自 退回 数据库的黄色 Null (这很好,我们不喜欢 退回 !),而我们的所有订单信息均显示为蓝色. 我们可以在这个网格视图中进行一些基本的元数据管理.只需单击图标,我们就可以将行 ID 从 数字改为字符串.此数据集中的 订单 ID 字段包含多个部分,配送中心代码、年份以及两个 其他代码.如果我们想拆分此字段并且仅保留配送中心代码,这非常容易办到.只需单击字段名 称旁边的下拉菜单并选择 自定义拆分 .我们将在连字符处拆分,只保留第一列.让我们将该 字段重命名为 配送中心 . 实时连接与提取 接下来,我们可以决定是实时连接到数据还是提取数据.如果数据不断变化,或者希望利用高性 能数据库,实时连接是很不错的选择. 我们也可以选择通过数据提取把数据导入 Tableau 的快速数据引擎.这样可以获得离线数据, 并让我们能够将关键系统受到的性能影响降到最低,同时仍然可以定期进行计划刷新,保持数据 时效性. 我们将实时连接并单击底部的工作表标签. 维度与度量 我们连接到了数据集.现在,让我们来看看探索数据有多简单.我们只需要拖出字段,现在把 ? 类别 拖至行 ? 细分市场 拖至行 ? 数量 拖至列 ? 市场 拖至列 ? 同时将 市场 拖至 颜色 我们可以非常轻松地根据销售的物品数量,为每个类别、客户细分和市场的销售情况创建可视 化.可以很快看到,非洲是我们的新兴市场. 您可以看到,我从左侧的这个数据窗格引入了这些字段.它分成不同的维度与度量,代表 Excel 工作表中的列标题. 维度与度量是什么? 维度是类别字段,在本例中,就是日期、客户和类别等字段.这些字段是我们对数值数据进行切