编辑: 紫甘兰 | 2019-08-31 |
2. 1. 2. 3. 4. 5. 6. 7. 8. 快速入门 概述 工业大脑AI创作间包含两种角色:行业顾问和AI训练师.行业顾问可以创建并配置行业模板;
AI训练师可以在 项目清单中,使用行业模板创建项目,然后在云资源管理中添加云计算资源,最后在AI创作间配置数据接入、 数据字典、算法等,并上线发布. 本文档以锅炉燃烧管理为例,为您演示从行业顾问到AI训练师的一系列配置方法,让您快速掌握工业大脑AI创 作间的使用方法,整体步骤如下: 行业顾问: 新建模板 配置模板 AI训练师: 准备数据 创建项目 配置知识图谱 配置数据接入 配置数据预处理 配置知识图谱数据映射 配置算法 下载API SDK 登录工业大脑控制台 阿里云ET工业大脑使用阿里云RAM账号体系,同时继承DataWorks的租户信息.在登录工业大脑之前,请准 备阿里云账号,并开通DataWorks租户. 如果您以前使用过阿里云ET工业大脑,直接单击ET工业大脑控制台,输入账号和密码登录.如果您是首次使用 阿里云ET工业大脑,需要进行合作申请,申请方式如下: ET 工业大脑开放平台 快速入门
1 操作步骤 单击ET工业大脑控制台,进入合作申请页面. 在合作申请页面,填入个人和企业的相关信息,如下图所示. 行业分类:单击下拉箭头,选择您的行业分类.选择了行业分类后,当以AI训练师的角色 进入控制台时,您只能看到所选行业下的模板. 注意:行业分类选择后将不能更改,请谨慎选择. 角色:分为AI训练师和行业顾问,一个账号只能申请一种角色,具体说明如下: AI训练师:即项目开发工程师.如果您是一个开发工程师,需要使用某个行业模 ET 工业大脑开放平台 快速入门
2 板来开发项目,将结果以API的形式提供给其它应用,需要选择该角色. 说明:该角色只有编辑数据和算法的权限,没有编辑行业模板的权限,但有 查看权限. 行业顾问:即模板开发工程师.如果您是某个行业的专家,需要创建这个行业的 通用模板,提供给项目开发工程师使用,需要选择该角色. 说明:该角色只有创建和配置行业模板的权限,没有编辑数据和算法的权限 . 信息填写完成后,单击申请提交,我们会在7个工作日内完成审核.审核通过之后(短信或邮件通知 ),您就可以使用该账号登录阿里云工业大脑控制台了. 快速开始-行业顾问 新建模板 登录阿里云ET工业大脑控制台. 登录成功后,进入AI创作间->
行业模板页面. 在该页面上,您可以看到所有的行业模板.单击模板下方的复制按钮,可以复制某个模板进行编辑. ET 工业大脑开放平台 快速入门
3 单击页面右上角的新建模板开始创建行业模板. 在新建模板对话框中选择行业,填写模板名称及描述. 本案例中我们选择通用设备制造业 / 锅炉及原动设备制造,名称填写锅炉燃烧模板,以及关于此模板 的描述,单击确定即可创建新的模板. 配置模板 模板创建成功后,会直接进入模板编辑页面,即下图中的知识图谱页面.页面左侧为组件栏,中间为画布区 ,右侧为数据字典配置区. ET 工业大脑开放平台 快速入门
4 i. ii. iii. iv. 您可以通过以下步骤,完成模板的配置: 配置数据字典 从左侧组件库中单击物料堆,并将其拖入画布中,双击重命名为氧含量.同样拖入一个锅炉和风机组 件,名称保持不变,如下图所示. 单击锅炉组件,在页面右侧配置行业数据字典. 双击属性输入框,编辑设备属性(或者从本地一次性复制粘贴多个属性),如下图所示. 编辑完成后,单击空白处退出编辑,系统会自动保存. 单击单位下拉框,选择或输入属性单位. 双击配置数据过滤规则输入框,配置数据过滤规则. 说明:数据过滤规则,操作符支持 操作数支持离散数值,例如 <
1.2 , = 女 . 单击数据类型下拉框,选择或输入属性的数据类型.系统目前支持CATEGORY、 NUMERIC和DATETIME三种数据类型,如果您没有选择数据类型,系统会按照您数据原 本的格式作为算法输入. 本案例中锅炉的数据字典配置如下图所示: ET 工业大脑开放平台 快速入门
5 同样的方式配置氧含量和风机组件的数据字典,如下图所示: 配置数据链路 单击页面上方菜单栏的数据链路,进入数据链路配置页面.在该页面中,可以看到上一步中配置的锅 炉燃烧数据字典已经以知识图谱数据映射组件的形式,同步到了数据映射区域中. ET 工业大脑开放平台 快速入门
6 - 在左侧组件库中,选择数据接入->
设备数据接入,将设备数据接入组件拖入右侧的数据接入区域中 . 注意:数据接入区域中的组件类型不能重复. 用同样的方式,分别拖入以下组件: 在数据预处理模块下,将设备数据缺失值填充组件拖入数据预处理区域中. 在算法模块下,将燃烧控制优化组件、分类回归引擎-训练组件、分类回归引擎-预测组件拖 入算法配置区域中,最终效果如下图所示: 说明:设备数据接入、设备数据缺失值填充及知识图谱数据映射组件的编辑权限对行 业顾问不开放. 单击画布中的锅炉燃烧优化v2.0算法组件,进入算法配置页面.或将鼠标移动到页面最左侧,展开左 侧导航栏,单击锅炉燃烧优化v2.0组件,进入其配置页面. ET 工业大脑开放平台 快速入门
7 单击左侧数据字典中的锅炉,将其拖至右侧画布中,单击每个属性右侧圆点将属性与相应算法中的元 素相连(按住shift键,单击鼠标进行框选,可一次性选中多个组件进行连线).您也可以在画布中拖 入特征规则组件,对数据进行求和、平均、最大值、最小值的计算,然后再与对应的算法元素相连. 完成后,在页面右侧进行算法参数、特征规则和数据覆盖值配置,如下图所示. 同样的方式,配置分类回归引擎-训练和分类回归引擎-预测算法组件的输入和输出,如下图所示: 配置完成后,系统会自动保存,至此您已经完成了锅炉燃烧模板的创建.单击页面右上角的发布,发 布您的模板,供同行业的项目工程师使用. 发布成功后,您的行业模板上会显示 ET 工业大脑开放平台 快速入门
8 图标,如下图所示 . 快速开始―AI训练师 ET 工业大脑开放平台 快速入门
9 准备云资源 登录阿里云ET工业大脑控制台后,您可以通过以下步骤添加云资源,为数据接入做准备. 添加云资源步骤 登录阿里云ET工业大脑控制台,选择云资源管理->
+ 添加云计算资源. 目前ET工业大脑开放平台支持关联的云资源包括:MaxCompute、MySQL for RDS、Datahub Service、Object Storage Service.本案例以添加MaxCompute资源为例. 在添加云资源计算对话框中,输入云计算资源名称,MaxCompute资源的project名称和endPoint ,您用户的Access Key ID和Access Key Secret,以及该云资源的描述,完成后单击添加,完成 MaxCompute云计算资源的添加. 创建项目 操作步骤 登录阿里云ET工业大脑控制台,选择AI创作间->
项目清单->
新建项目. ET 工业大脑开放平台 快速入门
10 在新建项目对话框中,选择行业、数据类型及行业模板,并输入名称和描述.本案例选择的数据类型 为时序数据,行业模板为行业顾问已经创建的锅炉燃烧模板,如下图所示. 行业模板是可选项,如果您需要自定义生产流程,可不选择此选项. 信息填写完成后,单击确定,系统直接进入知识图谱页面.在知识图谱页面,您可以看到模板中已经 配置的数据字典. ET 工业大脑开放平台 快速入门
11 单击页面左上角的 图标,返回项目清单页面,查看您创建的项目. 配置知识图谱 项目创建成功后,系统默认进入知识图谱页面.在知识图谱页面,可以看到模板所使用的组件及对应的数据字 典配置. ET 工业大脑开放平台 快速入门
12 请参考配置模板的配置数据字典章节,在模板的基础上对组件和数据字典配置进行增删改等操作.本案例直接 使用模板的配置,不做修改. 配置数据链路 知识图谱配置完成后,单击页面上方导航栏的数据链路,进入数据链路配置页面.在数据链路配置页面,可以 看到模板配置的数据接入、数据预处理及算法组件. 请参考配置模板的配置数据链路章节,在模板的基础上对数据链路配置进行增删改等操作.本案例直接使用模 板的配置,不做修改. 注意:删除项目或设备数据接入组件后,正在进行的数据上云会中断,请谨慎操作! ET 工业大脑开放平台 快速入门
13 配置数据接入 项目创建成功后,您可以通过数据接入功能,将您的数据接入到数据链路中. 注意:删除项目或设备数据接入组件后,正在进行的数据上云会中断,请谨慎操作! 操作步骤 单击您的项目,系统默认进入知识图谱页面. 选择数据链路,在画布中的数据接入区域,单击设备数据接入组件. 关联云资源:选择您已经添加的MaxCompute和Datahub资源,单击完成.本案例选择的云资源如 下: 关联成功后,系统会显示关联云资源成功. 如果您还没有相关的云资源,可单击+新建云资源,系统会跳转到云资源管理页面.单击+添加云计 算资源,选择MaxCompute或Datahub Service类型的资源,填写相关信息,单击添加,完成云资 源的添加. 注意:如果您添加的云资源被其他项目使用过,再次添加时系统会报错,此时请使用项目设备 数据引用组件代替设备接入组件,进行数据接入. 添加上云设备及测点:本案例选择批量录入.您也可以选择手动录入,需要手动输入设备和测点信息 . ET 工业大脑开放平台 快速入门
14 单击下载设备&
测点导入模板. 单击批量导入设备&
测点,选择填好的数据文件. 单击打开,等待加载完成后,单击录入. 勾选所有已经录入的设备,单击导出已选设备和测点,下载设备配置文件.前往您的数据 采集软件进行配置,配置完成后,采集的数据将会导入到您关联的Datahub和MaxCompute中,供算法调用. 配置数据预处理 通过设备数据缺失值填充的配置,您可以选择不同的方式替换数据缺失值,避免因空值数据太多导致算法运行 结果误差太大的问题. 注意:只有当您的数据接入组件为设备数据接入时,设备数据缺失值填充组件才起作用. 操作步骤 单击您的项目,进入项目配置页面. ET 工业大脑开放平台 快速入门
15 选择数据链路,在画布中的数据预处理区域,单击设备缺失值填充组件. 在数据预处理配置页面,单击操作栏下的笔状图标. 在缺失值填充页面,打开缺失值填充状态开关,选择填充方式,单击确定.本案例选择前值填充. 修改完成后,可以看到开启状态显示为开启,处理方式显示为前值填充. 配置数据字典 通过数据字典的配置,您可以将实际生产的数据与设备属性进行关联,为算法的运行做好准备. 操作步骤 单击您的项目,进入项目配置页面. 选择数据链路,在画布中的数据映射区域,单击知识图谱数据映射组件,进入数据字典配置页面. 在项目数据项中,选择您已经准备的设备名称和测点名称,完成后系统会自动保存,本案例配置如下 图所示. ET 工业大脑开放平台 快速入门
16 配置算法 本案例介绍的算法模型是先进行算法训练,然后进行算法预测.但不是所有的算法都需要训练,您也可以直接 选择预测算法,在配置完成行业数据字典和选择合适的原子算法之后,直接运行,最终发布成API供前端应用程 序调用. 操作步骤 单击您的项目,进入项目配置页面. 配置算法数据源:选择数据链路,在画布中的算法配置区域,单击分类回归引擎-训练组件,进入算 法组件配置页面. 可以看到算法组件的输入属性已经自动关联上了数据,如下图所示. ET 工业大脑开放平台 快速入门
17 如果您使用的模板没有配置算法的输入和输出,或者您需要修改模板的算法配置,请参考配置模板进 行配置.由于本案例使用的模板已经配置了算法的输入和输出,此处不需要重复配置. 配置算法参数:单击画布中的分类回归引擎-训练组件,在右侧的算法配置页面中,选择算法版本号 、算法运行的起始时间和结束时间(如选择的数据源无时间分区,可不选择起止时间). 训练模型:单击画布左上角的保存,保存成功后,单击训练,输入模型名称和模型版本号,单击确定 ,开始训练模型. 说明:只有模型名称和版本号都相同时,系统才会提示模型重复. 在模型训练过程中,可查看运行日志: ET 工业大脑开放平台 快速入门
18 模型训练成功后,会显示如下界面,鼠标移至模型上可删除或下载该模型. 说明:只有模型训练成功后,才可以进行预测. 配置预测组件:单击数据链路,回到数据链路配置页面,使用同样的方法配置分类回归引擎-预测组 件.不同的是,预测算法需要在右侧的配置面板配置模型输入,如下图所示. 运行算法:单击测试运行,在运行过程中可........