编辑: 贾雷坪皮 | 2019-07-08 |
的形式进行, 结果也 以<
k e y , v a l u e >
对形式输出.首先定义键值对: 当输 入为<
k e y , v a l u e >
对时, M a p函数的k e y值为数据的 行号, v a l u e代表一行记录, R e d u c e函数的 k e y代表 频繁项集, v a l u e值为1;
当输出为<
k e y , v a l u e >
对时, M a p 函数的key值是频繁项集, v a l u e 值为1, R e d u c e函数的 k e y代表候选项集合, v a l u e值为计 算出的支持度.其MapReduce计算模型描述如下:
5 1
1 郭晓利, 等 基于云计算的家庭智能用电策略 M a p : ( k e y 1, v a l u e
1 )→l i s t ( k e y 2, v a l u e
2 ) R e d u c e : ( k e y 2, l i s t ( v a l u e
2 ) )→l i s t ( k e y 3, v a l u e
3 ) { (
3 ) M a p函数负责将家庭用户用电行为的大数据 集分解成小数据集, 并进行处理本地统计候选项集, 产生中间格式<
k e y , l i s t ( v a l u e ) >
, 其中 k e y值是事 务标识符, l i s t代表事务对应的列表值.R e d u c e阶 段首先将各自节点上生成的局部频繁项集合并, 相 同项集的计数累加, 然后得到项集的全部支持度, 再 得到全局候选频繁项集, 即用户用电行为间的关联 规则. 家庭智能用电策略还包括对家庭用电规划的问 题, 通过使用遗传算法对家用电器的启动时间进行 优化, 达到经济用电的目标.用户用电行为的启动 时间看作遗传算法的决策变量.对用电时间问题的 规划采用把1h划分为5个单位时段, 每个单位时 段时长为1 2m i n , 即一天的2 4h划分为1
2 0个时间 段, 用u 代表各时段, u∈ U={ 1, 2, 3, …,
1 2
0 } , 因此 遗传算法编码采用七位二进制数表示.在一天的时 段区域 U 内以目标函数的倒数为适应度 函数, 如式(
4 ) 所示. f( u) =
1 ∑
1 2
0 u=1 [ Pd a y( u) pr c( u) ] (
4 ) 式中: Pd a y 为日总电能消耗;
pr c( u) 为u 时段的电价. 给定种群规模 Ns, 交叉率 Pc 和变异率 Pm , 代数T.遗传算法的实现过程如下. 首先, 在实际启动时间的范围随机产生一定数 量的初始种群个体, 将这些种群视为第一代.然后 计算每个个体的适应度值, 再依次完成选择、 交叉、 变异, 然后得到实际启动时间的一种新的种群个体, 然后判断是否达到循环结束要求, 在选择过程中采 用轮盘赌的方式选择适应度较大的个体 进入下一 步.综合以上两个算法, 完成对家庭智能用户用电 行为的数据挖掘, 同时结合实时电价在合适的电价 时段开启家用电器, 以此生成智能用电策略达到高 效用电的目的.
3 实验及分析结果 3.
1 实验准备 本数据来自美国加州大学欧文分校( U C I ) 数据 库[
1 0 ] , 由3块智能电表对一个智能用电家庭电力消 耗进行测量, 其中每分钟进行一次采样, 整个数据集 包含了该家庭4年(
2 0
0 7年―2
0 1 0年) 的用电数据. 虽然本文算例主要应用了国外的数据, 但由于国内 智能电网的建设越来越完善, 国内对大功率设备必 然也会向采用分相计量的方式发展.初始数据格式 如表1所示, 其中能源分户计量1号对应厨房, 主要 电器是洗碗机、 烤箱和微波炉;
能源分户计量2号对 应洗衣房, 电器是洗涤机、 一个滚筒式烘干机以及一 台冰箱;
能源分户计量3号主要测量电热水器和空 调器的电力消耗. 表1 初始数据格式 T a b l e1 I n i t i a l d a t af o r m a t 日期 时间 全局有 功功率/ kW 全局无 功功率/ k v a r 平均 电压/ V 能源分户计量电 量/( W・h ) 1号 2号 3号2010-01-0100: