编辑: ok2015 | 2019-07-15 |
36 2013 年 论文在线发布号 No.10 CHINESE JOURNAL OF COMPUTERS
2013 Article Online No.10 本课题得到国家自然科学基金项目(No.91118006)资助.冯登国,男,1965年生,博士,研究员,主要研究领域为信息安全与密码学、可信计算与信息 保障.张敏,女,1975年生,博士,副研究员,主要研究领域为数据隐私保护与可信计算.李昊,男,1983年生,博士,助理研究员,主要研究领域为 数据隐私保护与可信计算. 大数据安全与隐私保护 冯登国, 张敏, 李昊 (中国科学院软件研究所 可信计算与信息保障实验室, 北京 中国 100190) 摘要大数据(Big Data)已成为学术界和产业界的研究热点,正影响着人们日常生活、工作习惯及思考方式.但是目前 大数据在收集、存储和使用过程中面临着诸多安全风险,大数据所导致的隐私泄露为用户带来严重困扰,而虚假大数据将导 致错误或无效的分析结果. 本文分析了实现大数据安全与隐私保护所面临的技术挑战, 整理出解决问题的若干关键技术及其 最新进展.通过分析指出大数据在引入安全问题的同时,也是解决信息安全问题的有效手段.它为信息安全领域的发展带来 了新的契机. 关键词 大数据;
大数据安全;
隐私保护 中图法分类号 TP309 Big Data Security and Privacy Protection FENG Deng-Guo, ZHANG Min, LI Hao (Department of TCA, Institute of Software, Chinese Academy of Sciences, Beijing 100191, China) Abstract Nowadays big data has become a hot topic in academic and industrial research. It is regarded as a revolution that will transform how we live, work and think. However, there are many security risks in the field of data security and privacy protection when collecting, storing and utilizing big data. Privacy issues related with big data analysis spell trouble for individuals. And deceptive or fake information within big data may lead to incorrect analysis results. This paper summarizes and analyzes the security challenges brought by big data, and then describes the key technologies which can be exploited to deal with these challenges. Finally, this paper argues that big data brings not only challenges, but also technical revolution in the field of information security. Key words big data;
big data security;
privacy protection
1 引言 当今,由于社会信息化和网络化的发展导致产 生的数据爆炸式增长. 据统计, 平均每一秒都有
200 万用户在使用谷歌搜索, Facebook 用户每天共享的 东西超过
40 亿,Twitter 每天处理的推特数量超过 3.4 亿.同时,各种监测、感应设备也在源源不断 的产生数据,科学计算、医疗卫生、金融、零售业 等各行业也有大量数据不断产生.
2012 年全球信息 总量已经达到 2.7ZB, 而2015 年这一数值预计会达 到8ZB.显然,大数据时代已经到来. 这一现象引发了人们的广泛关注.在学术界, 图灵奖获得者Jim Gray提出了科学研究的第四范式 即以大数据为基础的数据密集型科学研究;
2008 年《Nature》推出了大数据专刊对其展开探讨;
2011 年《Science》也推出类似的数据处理专刊.IT产业 界行动更为积极,持续关注数据再利用,挖掘大数 据的潜在价值.其中一个典型的案例是Google公司 的Google Flu Trends网站.它通过统计人们对流感
2 计算机学报2013 年 信息的搜索,并查询Google服务器日志的IP地址判 定搜索来源,从而发布世界各地流感情况的预测. 目前,大数据已成为继云计算之后信息技术领域的 另一个信息产业增长点.据Gartner预测,2013 年大 数据将带动全球IT支出