编辑: kr9梯 | 2019-07-06 |
2018 年.
第33 卷.第8期科学大数据 DD国家大数据战略的基石 郭华东 中国科学院遥感与数字地球研究所 北京
100094 摘要 作为人类的新型战略资源,大数据已成为知识经济时代的战略高地.其少量依赖因果关系、主要依靠数据 相关性发现知识的新模式,使得其成为继经验、理论和计算模式之后的数据密集型科学范式的典型代表,带来了 科研方法论的变革,正成为科学发现的新引擎.科学大数据作为大数据的重要分支,具有不可重复性、高度不确 定性、高维性及计算分析高度复杂性的内部特征,以及在数据内容、数据体量、数据获取、数据分析等方面的外 部特征,这给科学大数据的处理技术与方法提出了新的挑战.在以上分析基础上,文章提出了科学认知科学大数 据,建设科学大数据基础设施,建立科学数据研究中心,以及构建科学大数据学术平台等建议. 关键词 大数据,科学大数据,数据驱动,数据密集型科学 DOI 10.16418/j.issn.1000-3045.2018.08.001 资助项目:中国科学院战略性先导科技专项(A类)(XDA19030000) 修改稿收到日期:2018年8月13日 总论 General Overview
1 蓬勃发展的大数据
2013 年7月17日,习近平总书记指出: 浩瀚的数 据海洋就如同工业社会的石油资源,蕴含着巨大生产力 和商机.谁掌握了大数据技术,谁就掌握了发展的资源 和主动权. 大数据已成为信息主权的一种表现形式, 将是继边防、海防、空防之后大国博弈的另一个空间[1] . 大数据正在改变人类生活和对世界的深层理解. 第二次工业革命的爆发,导致以文字为载体的数据 量约每
10 年翻一番;
从工业化时代进入信息化时代,数 据量每
3 年翻一番.当前,新一轮信息技术革命与人类 社会活动交汇融合,半结构化、非结构化数据的大量涌 现,数据的产生已不受时间和空间的限制,引发了数据 爆炸式增长,数据类型繁多且复杂,已经超越了传统数 据管理系统和处理模式的能力范围[2] ,人类正在开启大数 据时代新航程.据国际数据公司(IDC)发布的
2017 年 大数据白皮书预测,2025 年全球大数据规模将增长 至163 ZB,相当于
2016 年的
10 倍,大数据继续表现出更 为强健的增长态势[3] .中国拥有的数据在国际上举足轻 重,截至
2012 年,已占全球的 13%,预计到
2020 年将产 院刊
769 生全球 20% 的数据[4] . 从大数据搜索热度数据可清晰看出近年来全球对大 数据的关注程度.国际上对大数据的关注度在
2012 年之 前处于较低水平,2012―2015 年对大数据的关注度飞速 增长,2016 年至今保持接近
100 的关注度. 国际上,从联合国到各国政府竞相重视大数据发 展;
在我国,大数据被列为国家战略后发展迅猛.全球 大数据的发展方兴未艾,大数据已经开始显著地影响全 球的生产、流通、分配和消费方式,它正在改变人类的 生产方式、生活方式、经济运行机制和国家治理模式, 它是知识驱动下经济时代的战略制高点,是国家和人类 的新型战略资源.
2 科学大数据的认识 作为大数据的一个分支,科学大数据正在成为科 学发现的新型驱动力,引起有关国家和科技界的高度重 视.欧盟提出 科学是一项全球性事业,而科研数据是 全球的资产 的理念[5] .美国的 从大数据到知识 计划、欧盟的 数据价值链战略计划 、英国的 科研数 据之春 计划、澳大利亚的 大数据知识发现 项目、 欧洲 地平线