【PDF】数据探索 - 资源下载

编辑：

过于眷恋

2017-09-30

数据探索快速入门操作流程数据探索操作很简单,主要分为两个步骤:自助取数和探索分析.

自助取数包括从业务特征提取数据集以及从数据模型提取数据集. 数据集取到之后进行探索分析. 最后发布应用和分享. 服务应用配置分析系统参数使用探索分析功能需要先设置分析系统参数,赋予探索分析访问租户对应 Hadoop 集群的权限. 前提条件 1. 探索分析用户已有所属租户. 2. 数据治理中已创建数据分层. 背景信息数据治理中创建数据分层可参考(可选)创建数据分层. 操作步骤登录 Universe 统一门户,单击智能分析 ,进入智能分析主页面. 选择系统管理 >

系统维护 >

分析系统参数配置 ,进入系统配置信息页面. 在配置编码 ISAE_TEAMID 右侧单击编辑 . 数据列状态变更为可选. 在数据中选择租户,单击保存 . ----结束自助取数自助取数是从数据源中提取数据的过程. 自助取数提取的数据可以直接下载, 也可以在探索分析时进行自助分析和应用开发. 导入数据(可选) 若统一数据治理平台中没有需要提取数据的数据模型, 且已经获取相关的数据文件时, 可以通过导入数据功能,通过数据生成数据模型,进而通过数据模型取数提取数据. 前提条件导入数据的用户已经配置了对应的租户,且此租户有导入数据的权限. 背景信息需要导入的数据,需要按照如下要求存储: 3. 存储为指定的文件格式:支持.txt 和.csv 的格式. 4. 存储为指定的文件编码:支持 UTF-8 和GBK. 5. 每行存放一条记录. 6. 每个属性值之间以指定的分隔符分隔. 支持:逗号(,) 、竖线(|) 、标题开始(对应 ASCII 码x01 的字符) 和水平制表符(Tab) . 7. 首行可以是表头,按照分隔符依次存放的列名称. 导入数据完成后,可以在数据模型取数过程中,在数据模型树中看到导入的数据模型,实现对导入的数据进行取数操作. 操作步骤登录 Universe 统一门户,单击智能分析 ,进入智能分析主页面. 选择系统管理 >

系统维护 >

分析数据源设置 . 选择租户的数据源、 FI 用户、数据源类型 ,单击保存 . ? 此处配置的数据源将用于存储导入的数据. 选择我的数据 . 单击创建数据 >

从文件取数 >

导入数据模型 . 设置模型格式. 1. 单击 ,选择按照指定格式存放的数据文件,单击打开 . 2. 选择正确的文件编码和分隔符. 3. 若数据中首行为表头,选中首行是表头 . 4. 单击获取格式 . 系统自动识别数据文件中的列名、类型、长度和精度信息,如图 7-7 所示. 设置模型格式 5. 根据实际情况,修改列名、类型、长度和精度信息,勾选对应行选择是否需要此列. 其中,字段的长度设置时不能比实际数据小,否则在后续基于数据模型取数时,会引起预览失败. 在模型名称中输入名称,单击上传数据并创建模型 . 导入成功后,在我的数据页面显示导入的数据模型信息. ----结束从业务特征提取数据集从数据治理配置的业务特征数据中配置筛选规则,提取数据集. 前提条件已经在数据治理中配置业务特征且已同步到探索分析(同步耗时约

10 分钟) . 操作步骤登录 Universe 统一门户,单击智能分析 ,进入智能分析主页面. 选择我的数据 . 单击创建数据 >

从数据库取数 >

按业务特征 . 在左侧目录中单击所有页签,选择特征域和子域下对应的特征,将特征拖拽到右侧筛选条件区域,如图所示. 选择特征在所有页签下,您可以输入关键字,搜索并获取需要的特征. 您可以单击热门和我最常用 ,选择热门的特征和最常用的特征,提取数据. 设置筛选规则. 6. 单击特征的名称,设置对特征为默认计算或者历史周期计算. 数据探索支持灵活的基于历史周期数据进行比较计算. 7. 设置对特征的筛选规则,如大于

注：以上内容是本站开源项目的机器提供的预览内容，更完整和更好的阅读体验请直接免费下载资源后阅读

下载（注：源文件不在本站服务器，都将跳转到源网站下载）

备用下载

PDF《数据探索》