编辑: 芳甲窍交 2016-05-16

二、 数据背后的人、业务、技术和科学 大部分人认为数据这个问题是通过技术来解决,更多是 IT 部门 的事情,实际上不仅仅是 IT 或技术的问题,还有人和业务的因素在 内,这两个不同的专业在关注和处理数据模型的做法,以及模型从公 式到数据库的关系怎么衔接融合,里面的缺口怎么填补,我觉得是需 要大家更多的参与和讨论的问题. 语言是个很复杂的问题,语言、对话成了数据后对数据管理行业 的冲击和影响很大.我们每天都在通过语言沟通、解释,语言变成数 据后怎么处理是个比较大的挑战.以风险管理为例,原纽约联储的主 席Jerry Corrigan 曾说过一段话 风险管理,对我来讲归根到底简 单的说,就是要把正确的信息在正确的时间提交给正确的人,所以人 们能够问正确的问题以作出最好的判断.这是最根本的. 他高度概 括了金融风险除了技术以外应该怎么管理,这里好几次都提到了人. 一个金融模型再好, 如果管理层不能理解模型的背景、 算法、 统计等, 也无法发挥最大的效果. 脑科学和人工智能分别各占一端,传统数据管理在中间的话,那 么数据背后到底是什么科学呢. 比较起来我觉得最接近数据科学的应 该是认知科学或者认知心理学.因为有人的因素在里面,所以我看数 据背后的科学在哪个领域, 是看这个领域怎样能够把脑科学和人工智 能的一些进展联系起来,然后跟传统数据如何结合. -7-

三、 目前全球数据管理面临的几个主要挑战 一是仍较普遍的认为数据问题是个技术的问题, 或可被新技术手 段或工具来解决. 二是行业间数据的割裂, 比如传统的, 人工智能的, 各种币和区块链的,跨领域不同的术语和标准体系等.现在大家都在 说数据整合,我觉得要从数据全周期的角度来考虑这些问题.三是数 据的共享和交叉过程远比一般理解的要复杂的多, 数据的产生者和使 用者不一定对称,互联网的产生使信息更加对称解决了部分问题,但 还有更深层次的问题没有解决.Feynman 曾说过 the rhythm and pattern of phenomena of nature which is not apparent to the eye, but only to the eye of analysis ,眼睛感官看到的和经过脑处 理的数据并不是一回事.四是元数据(描述数据的数据)仍是数据的 纠结.用图

1 来解释的话,第三世界里的数据仍是数据,一部分数据 是用来描述另一部分数据,这与场景有关,但都是数据.上个月有家 媒体分析了特朗普与其他总统风格的区别, 以前奥巴马时代发表的话 大家听了就会接受,在美国国会和参议院达成共识的过程中,可以有 不同的解释或者不同的意见,但都是基于一样的事实(fact) .现在 特朗普的智库就提出有 alternative facts,每个人对事实怎么看有 不一样的解释.哪些是事实,哪些是数据,哪些是意见(意见本身也 是数据)已很难划分,讨论变得困难.这些反映了我们的确进入了另 一个数据时代, 社会、 学术界、 业界都需要反思一下数据究竟是什么, 为什么这么容易又这么难. -8-

四、 几点看法和建议 一是理解数据是以人为本的过程,人处于中心的地位,数据的问 题有一部分也是人产生的,怎么达成共识是一个关键的问题.不论场 景是业务还是技术,两种场景如何融合沟通达成共识,还是要回到以 人为中心上来. 二是少发明一些不必要的名词.发明了一个新的名词,要解释这 个名词是什么,不管是大数据、人工智能,还是其他很多新名词,当 发明一个名词,就需要解释这个名词跟原来其他名词的区别、关系, 增加了很多信息........

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题