编辑: 过于眷恋 2017-09-30

0 . 8. 单击 组合规则 ,可以对特征之间进行组合,通过单击组合关系, 设置为 或 或 和 组合关系. 设置输出列. 9. 在左侧目录中选择需要作为输出列的特征,将特征拖拽到右侧输出 列区域,如图所示. 选择输出列 10. 单击输出列的 , 可以修改输出列的名称, 或设置为多周期值计算. 11. (可选)单击 计算列 ,可以根据计算函数,添加计算列. 输出列支持的计算函数与基于数据模型数据取数类似,详细信息请 参见计算公式中支持的函数. 12. 单击 多周期取数 ,在弹出的对话框中可以选择多个周期进行取 数计算. 单击 预览 ,预览数据是否符合提取的要求. 单击 保存数据集 ,输入 数据集名称 和 数据集描述 ,单击 确定 . 单击 确定 后,数据探索根据设置的筛选规则和输出列开始提取数据.当数据量较大时,会 自动转到后台提取.在 我的数据 页面,显示生成的数据集信息.当数据集显示类似如图 7-10 所示时,表明数据提取完成. 数据提取完成 单击生成的数据集,可以预览数据集的详情和数据分布情况. 在 数据分布 页签中,您可以单击对应特征的 数据分布图 列的图形,查看此特征的数据分 布详细信息,如图 7-11 所示. 查看数据分布 ----结束 从数据模型提取数据集 通过高级模式创建数据,实现从数据治理配置的数据模型数据中配置输出列、过滤条件、计 算公式等,提取数据集. 前提条件 已经在数据治理中配置数据模型且已同步到探索分析 (同步耗时约

10 分钟) , 或者通过导入 数据的方式得到了对应的数据模型和数据. 操作步骤 登录 Universe 统一门户,单击 智能分析 ,进入 智能分析 主页面. 选择 我的数据 . 单击 创建数据 >

从数据库取数 >

按数据连接 . 在左侧目录中选择模型数据下对应的实体, 将实体拖拽到右侧 模型分析 区域,如图所示. 选择实体 您可以在 所有 页签输入关键字,搜索需要的实体名称或属性名称,搜索实体或属性信息. 搜索结果展示匹配关键词的实体名称和属性名称.在搜索结果中: 8. 单击 显示属性 , 可以查看匹配的实体的与关键词相关的属性列表. 9. 单击实体后的 ,查看实体中字段名称的匹配结果. 您可以单击 热门 和 我最常用 页签,选择热门的实体和最常用的实体,提取数据.单击 我 的数据 页签,可以基于导入的数据,选择数据模型,提取数据. (可选)设置关联关系. 当涉及多个实体之间需要关联时,需要设置实体间的关联关系. 拖拽实体到工作区后,会默认匹配对应字段,自动关联.若默认匹配字段关联的与实际业务 场景不适合时,需要重新设置关联关系. 13. 单击实体之间的 . 若未自动建立关联关系,则需要拖拽两个实体之间的连线:鼠标悬 浮在一个实体上,当出现的连接线时,拖拽此连接线到另一个实体 上. 14. 在弹出的对话框中,设置关系类别,如 左侧 . 数据探索缺省提供 内部 、 左侧 、 右侧 和 全外部 四种关 联关系. 15. (可选)单击 ,删除多余的关联关系. 若默认匹配字段关联的与实际业务场景多余,或匹配不正确时,需 要删除关联关系. 16. (可选) 单击 = 两边的下拉框, 选择关联的字段, 设置关联关系. 若默认匹配字段关联的与实际业务场景缺少时,需要添加关联关系. 设置结果的如图 7-13 所示. 设置关联关系 17. 若两个字段的关联关系涉及换算,则单击 ,设置计算函数. 其中函数为数据库中常见的通用的函数,要了解函数的详细信息, 请参见计算公式中支持的函数. 18. 单击关联关系对话框右上角的 ,或单击对话框以外的空白区域, 回到工作区. 添加输出列和过滤条件. 输出列和过滤条件的字段是从实体中的字段选择的,可以根据业务情况,依次选择各实体, 添加输出列和过滤条件. 19. 单击工作区的实体名. 在工作区下侧显示此实体的所有字段的详细信息. 单击空白区域,工作区下侧默认显示所有实体的字段列表. 20. 选择输出列,单击 添加输出列 ,如图 7-14 所示添加输出列. 添加输出列 添加成功后,在 输出列 页签下显示添加的输出列. 21. 选择输出列,单击 添加过滤 ,添加过滤条件. 添加成功后,在 过滤条件 页签下显示添加的过滤条件. 配置过滤条件. 过滤条件是提取数据的维度,通过过滤条件,可以提取指定条件的数据.也是后续探索分析 的维度. 22. 单击 过滤条件 页签. 默认情况下,添加的过滤条件之间都是 并且 的关系. 23. (可选)单击 ,添加高级过滤条件. 若需要通过计算才能得到的过滤条件,如 话单与流量日总费用 , 则需要添加计算条件. 过滤条件只能进行行级运算. 24. 输入计算公式名称,并依次设置计算结果类型、选择计算函数、选 择函数中的字段名称,如图 7-15 所示,检查公式结果的正确性后, 单击 确定 . 设置计算条件 其中函数为数据库中常见的通用的函数,要了解函数的详细信息, 请参见计算公式中支持的函数. 添加计算条件完成后,在 过滤条件 页签下显示新增的计算条件. 25. 设置添加的过滤条件各字段的 关系 和 取值 ,如图所示. 设置过滤条件 过滤条件支持如下关系: 10. 字符串过滤:支持等于、不等于、大于、大于等于、小于、小于等 于、介于、属于、不属于、为空、非空、包含文字、不包含文字、 匹配前缀、匹配后缀. 11. 数字、日期过滤:支持设置判断关系:等于、不等于、大于、大于 等于、小于、小于等于、介于、属于、不属于、为空、非空.统计 日期、统计月份,支持日期控件选择. 过滤条件的取值支持: 12. 周期性生成:格式为 ${昨日} 、 ${上月} ,表示周期性生成当前 的数据集数据,每次生成数据集的时间过滤条件设定为当前时间的 昨日、上月. 13. 如果某个字段与维表关联,且设定为了过滤条件,则在设置过滤条 件时,可进行维度的选择,无需手动录入维值. 14. 计算字段作为过滤条件. 15. 子查询过滤:仅针对 属于、不属于 关系时有效. 26. 单击 显示高级 ,选择其中的条件,单击 组合 并设置组合关 系,可以设置高级的关系,如图 7-17 所示. 高级条件 配置输出列. 27. 单击 输出列 页签. 28. 双击输出列的 属性名 ,修改属性列的名称. 29. 双击输出列对应字段的统计方法,选择统计函数,如图 7-18 所示. 如果用统计函数,会使用所有维度作为基准进行聚合计算. 设置统计方法 30. (可选)当简单的统计函数无法满足计算要求时,可以自定义计算 方法.单击 ,添加计算的输出列,设置计算公式, 如图 7-19 所示,检查公式结果的正确性后,单击 确定 . 添加计算列 31. (可选)当需要对输出的数据进行剔重时,选中 数据集剔重 前 的复选框. 单击 样例数据预览 页签,单击 预览 ,可以预览数据. 在 样例数据预览 页签中,单击 ,可以修改列名、设置统计方法或移除此列;

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题