编辑: 黎文定 | 2019-09-11 |
一、前言 在大数据和人工智能时代,数据是非常重要的资源.
通过知识图 谱,可以将企业海量且繁杂的数据内容整合为一个知识网络,从而突 破关系型数据库的限制,更精准、迅速地攫取数据价值,提高内审的 效率和精度,为企业打造更加高效、专业的风险管理方案.
二、正文
1、形态 随着大数据时代的到来,大数据分析技术受到了广泛关注,而将 海量的数据转化为知识,是大数据分析的关键.知识图谱技术提供了 一种从海量非结构化数据(如文本、图像)中抽取计算机能够理解的 结构化数据的手段,对大数据时代的知识获取、知识共享、知识创新 具有非常重要的应用价值. 知识图谱是语义网络的知识库,以语义网络为基础,结合自然语 言处理、机器学习、数据挖掘、知识表示等技术,旨在描述客观世界 的概念实体事件以及其之间的关系. 通过知识图谱可以高效直观地刻 画目标主体(如企业、事件等)之间地关联网络,从而全维度地对企 业进行画像,立体复现主体的真实情况和错综复杂的关系.
2
2、招式 相对于传统的知识表示形式,知识图谱可提供更多的隐含知识. 利用知识图谱技术,可以将银行内部、外部海量且繁杂的数据内容整 合为一个统一的知识网络,通过与银行业务经验相结合,实现知识图 谱技术在银行内部审计中的具体应用. ? 反欺诈 除了通过信息造假等手段进行欺诈申请外, 不少欺诈会涉及团伙 作案并形成复杂的关联网络,这就给反欺诈审核带来了新的挑战.知 识图谱包含丰富复杂的关系, 这种直观的表示方法可以帮助我们更有 效地分析复杂关系中潜在的风险. ? 企业风险图谱 由于企业业务间的交叉、创新,外部的风险对企业的影响越来越
3 大.通过构建企业风险图谱可以描绘企业风险视图全貌,结合外部风 险点, 实现内外部风险数据的融合, 从而高效地感知外部风险的传导、 渗透对企业的影响.如果某公司风险发生变动,可以通过经营关系、 担保关系、投资等关系进行传播,通过知识图谱可以轻松通过复杂网 络挖掘进行判断. ? 关联担保识别 银行信贷审批对关联担保十分敏感. 中小企业为了满足银行放贷 要求、提高其信用等级,通过关联企业、产业链上下游客户、关系人 等相互担保,形成担保链乃至关系更为复杂的"担保网" .担保链中 的企业普遍存在超出自身实力对外融资和担保的现象, 担保链整体净 资产无法覆盖银行信贷风险,容易爆发风险连锁反应.基于知识图谱 可以直观高效地识别出客户是否存在循环担保和多头抵押. ? 资金监管 传统的贷后资金管理往往流于形式, 通过知识图谱可以掌握账户 交易情况,通过账户及账户间交易和交易特征(交易时间、形式等) 可以挖掘循环交易网络. ? 失联客户管理
4 现实中,借款人借后不还,进入"失联"状态的情况,即便试图 联系借款人曾经提供过的其他联系人,仍无法联系到本人,使催收人 员也无从下手.通过知识图谱复杂关联网络可以发现更多的关系,挖 掘出更多潜在新联系人,大大提高催收成功率.
3、实战 场景 1:银行信贷反欺诈知识图谱 反欺诈是信贷领域非常重要的一道环节. 基于大数据的反欺诈的 难点在于如何把不同来源的数据 (结构化和非结构数据) 整合在一起, 构建反欺诈知识图谱,从而有效地识别出欺诈案件,是当前业内较为 关注的应用趋势. ? 数据收集:客户实体及担保等关联实体、地址、社会关系、受理 分支行、受理行员等信息;
? 建立模型:通过知识图谱建模、实体与关系的抽取与清洗,得到 客户关联关系图谱;
? 模型应用:当新客户在银行进行申请和办理业务时,该客户作为 新增实体会与现存图谱产生一定的关联;
? 发现异常:挖掘与客观现实相冲突的实体间的关系,识别为异常 情况;
? 人工排查:人工分析异常情况,确定欺诈行为;
5 ? 认定欺诈:固化此种欺诈模式,利用图搜索算法定时批量和监听 式发掘欺诈嫌疑人或团伙,预防该欺诈再次发生. 通过引入外部数据源,构建知识图谱,查找同一实体与多个实体 通过同一种关系相连的情况,可以检测信息是否存在冲突,排查欺诈 嫌疑. 场景 2:企业风险知识图谱 通过引入外部风险数据, 构建企业风险画像, 结合内部风险数据, 实现内外部风险数据的融合, 从而高效地感知外部风险对企业的传导, 更有效地预警潜在风险,提高内审效率. ? 外部数据采集 政府机构数据源:公安局、人力资源与社会保障局、法院、检察院 非政府机构数据源:主流新闻媒体、社交网络平台 ? 风险信息分类:通过自然语言处理、机器学习等技术,细化企业 负面信息类别.以负面新闻为例:
6 ? 建立模型:通过知识图谱建模、实体与关系的抽取与清洗,构建 企业风险画像;
? 风险传导感知:如果某公司风险发生变动,可以通过知识图谱识 别风险传导链路,及时预测此风险事件牵扯到的相关主体,从而 触发风险预警,实现动态监控.
4、奥义 在传统的银行业风险管理流程中, 多通过对目标主体的特征进行 严格审核,例如:负债、资产状况、现金流水等方面,但是这些都无 法判断主体间的关联风险.知识图谱带来的天然关联检索的特点,将 内审人员从审计数据量庞大且类别纷繁复杂的困境中解放出来, 将隐 含的关系网络梳理清楚,有效地提升了内审工作的效率,扩大了业务 覆盖范围,发现了更多潜在的风险与问题,从数据中挖掘出更大的价 值. (原文链接:https://mp.weixin.qq.com/s/WgJ6RYexrfy2iSvC_mx4Vg ,转载请 注明. )