编辑: 过于眷恋 | 2017-09-30 |
自助取数包括从业务特征提取数据集以及从数据模型提取数据集. 数据集取到之后进行探索分析. 最后发布应用和分享. 服务应用 配置分析系统参数 使用探索分析功能需要先设置分析系统参数,赋予探索分析访问租户对应 Hadoop 集群的权 限. 前提条件 1. 探索分析用户已有所属租户. 2. 数据治理中已创建数据分层. 背景信息 数据治理中创建数据分层可参考(可选)创建数据分层. 操作步骤 登录 Universe 统一门户,单击 智能分析 ,进入 智能分析 主页面. 选择 系统管理 >
系统维护 >
分析系统参数配置 ,进入 系统配置信 息 页面. 在配置编码 ISAE_TEAMID 右侧单击 编辑 . 数据 列状态变更为可选. 在 数据 中选择租户,单击 保存 . ----结束 自助取数 自助取数是从数据源中提取数据的过程. 自助取数提取的数据可以直接下载, 也可以在探索 分析时进行自助分析和应用开发. 导入数据(可选) 若统一数据治理平台中没有需要提取数据的数据模型, 且已经获取相关的数据文件时, 可以 通过导入数据功能,通过数据生成数据模型,进而通过数据模型取数提取数据. 前提条件 导入数据的用户已经配置了对应的租户,且此租户有导入数据的权限. 背景信息 需要导入的数据,需要按照如下要求存储: 3. 存储为指定的文件格式:支持.txt 和.csv 的格式. 4. 存储为指定的文件编码:支持 UTF-8 和GBK. 5. 每行存放一条记录. 6. 每个属性值之间以指定的分隔符分隔. 支持:逗号(,) 、竖线(|) 、标题开始(对应 ASCII 码x01 的字符) 和水平制表符(Tab) . 7. 首行可以是表头,按照分隔符依次存放的列名称. 导入数据完成后,可以在数据模型取数过程中,在数据模型树中看到导入的数据模型,实现 对导入的数据进行取数操作. 操作步骤 登录 Universe 统一门户,单击 智能分析 ,进入 智能分析 主页面. 选择 系统管理 >
系统维护 >
分析数据源设置 . 选择租户的 数据源 、 FI 用户 、 数据源类型 ,单击 保存 . ? 此处配置的数据源将用于存储导入的数据. 选择 我的数据 . 单击 创建数据 >
从文件取数 >
导入数据模型 . 设置模型格式. 1. 单击 ,选择按照指定格式存放的数据文件,单击 打开 . 2. 选择正确的 文件编码 和分隔符. 3. 若数据中首行为表头,选中 首行是表头 . 4. 单击 获取格式 . 系统自动识别数据文件中的列名、类型、长度和精度信息,如图 7-7 所示. 设置模型格式 5. 根据实际情况,修改列名、类型、长度和精度信息,勾选对应行选 择是否需要此列. 其中,字段的长度设置时不能比实际数据小,否则在后续基于数据 模型取数时,会引起预览失败. 在 模型名称 中输入名称,单击 上传数据并创建模型 . 导入成功后,在 我的数据 页面显示导入的数据模型信息. ----结束 从业务特征提取数据集 从数据治理配置的业务特征数据中配置筛选规则,提取数据集. 前提条件 已经在数据治理中配置业务特征且已同步到探索分析(同步耗时约
10 分钟) . 操作步骤 登录 Universe 统一门户,单击 智能分析 ,进入 智能分析 主页面. 选择 我的数据 . 单击 创建数据 >
从数据库取数 >
按业务特征 . 在左侧目录中单击 所有 页签,选择特征域和子域下对应的特征,将特 征拖拽到右侧筛选条件区域,如图所示. 选择特征 在 所有 页签下,您可以输入关键字,搜索并获取需要的特征. 您可以单击 热门 和 我最常用 ,选择热门的特征和最常用的特征,提取数据. 设置筛选规则. 6. 单击特征的名称,设置对特征为默认计算或者历史周期计算. 数据探索支持灵活的基于历史周期数据进行比较计算. 7. 设置对特征的筛选规则,如 大于