编辑: 迷音桑 | 2018-06-19 |
3 8 N o .
1 2 D e c .
2 0
1 5 收稿日期:
2 0
1 5
0 3
1 7;
在线出版日期:
2 0
1 5
1 0
1 0. 本课题得到国家自然科学基金(
6 1
3 0
3 0
2 9) 、 教育部留学回国基金( [
2 0
1 2]
1 7
0 7) 、 美国 国家自然科学基金资助. 袁景凌, 女,
1 9
7 5年生, 博士, 教授, 博士生导师, 中国计算机学会( C C F) 会员, 主要研究领域为绿色计算、 机器学 习、 数据挖掘. E m a i l : y u a n j i n g l i n g @1
2 6. c o m. 钟珞, 男,
1 9
5 7年生, 博士, 教授, 博士生导师, 主要研究领域为智能方法. 杨光, 男,
1 9
8 9年生, 硕士研究生, 主要研究方向为云计算、 数据挖掘. 陈骋, 男,
1 9
9 0年生, 硕士研究生, 主要研究方向为绿色计算、 数据挖掘. 顾骏程, 男,
1 9
9 1年生, 硕士研究生, 主要研究方向为计算机体系结构、 绿色数据中心. 李涛, 男,
1 9
7 2年生, 博士, 教授, 博士生导师, 主 要研究领域为计算机体系结构、 绿色计算. 绿色数据中心不完备能耗大数据填补及分类算法研究 袁景凌1) 钟珞1) 杨光1 ) 陈骋1) 顾骏程2 ) 李涛2 ) 1) ( 武汉理工大学计算机科学与技术学院 武汉
4 3
0 0
7 0 ) 2) ( 佛罗里达大学电气与计算机工程系 佛罗里达州 美国
3 2
6 1
1 ) 摘要随着云计算和大数据时代的到来, 大规模数据中心在全球范围内得到了广泛的部署. 但大规模数据中心 的高能耗仍然是当今亟待解决的问题. 为解决这一问题, 通常采用太阳能等可再生绿色新能源为数据中心供电. 绿 色数据中心能够根据新能源的变化配合市电为数据中心提供高效、 低能耗且稳定的电能供给, 这是数据中心发展 的趋势. 文中针对数据收集不完善和断电等因素会造成一定程度的数据缺失情况, 提出了一种基于完备相容类的 不完备大数据填补算法, 来填补数据中心的缺失数据;
针对绿色数据中心能耗大数据的不稳定、 间歇性和随时变化 等特点, 提出了一种基于离散弱相关的决策森林并行分类算法, 通过对数据中心能耗大数据并行分类, 来指导供电 方式, 以利于高效节能和延长电池寿命;
此外进一步提出了一种增量更新决策森林的算法, 来增量更新分类模型, 该算法能够保障分类模型不断适应数据变化, 防止分类准确率随时间而下降, 从而避免电池频繁充放电, 以保证稳 定供电. 整体来说, 文中提出了一种数据中心能耗大数据管理模型, 该模型针对大规模绿色数据中心的能源供给相 关问题, 运用不完备能耗大数据的填补、 能耗大数据的并行分类、 分类模型更新这三方面的技术方法, 动态调控太 阳能和市电供电端口, 为数据中心提供高效、 低能耗且稳定的电能供给. 最后, 采用绿色数据中心真实的能耗相关 大数据集进行实验, 实验结果说明文中提出的能耗大数据管理模型, 能够帮助绿色数据中心有效管理太阳能和其 他资源来配合市电提供稳定且充足的电能供应, 从而为整个数据中心服务体系提供高效的能源服务. 关键词 绿色数据中心;
能耗大数据;
不完备大数据填补;
并行分类;
增量更新;
大数据 中图法分类号 T P
3 0
2 珊
1 0.
1 1