编辑: 252276522 | 2017-08-05 |
27 2016/9/27 北京数联众创科技有限公司
28 Robot ?
2016 年第一季度 Facebook 发文称,其Atlas DSP 平台半年的流量质量 测试结果显示,由机器人模拟和黑 IP 等手段导致的非人恶意流量高达 75% . 仅2016 上半年,AdMaster 反作弊解决方案认定平均每天能有高 达28% 的作弊流量. ? 反作弊需要强大的数据支撑,AdMaster 有大量的项目积累和经验积累, 在广告不同环节的数据触及等.该题目需要参赛者基于 IP,cookie,设备ID,访问时间序列,UA信息分布等行为属性来建立一个模型,区分 正常用户记录与作弊行为记录,并进行标记. ? AdMaster 提供了近亿级日志记录用作学习使用. ? 以F1_score 为标准衡量大家对作弊日志的数据分析,特征提取及模型 筛选学习等能力. 异常流量检测 计算广告 分类 机器学习 基于多源数据的 青藏高原湖泊面积预测 百卓网络&
中科院计算机网络中心-赛题介绍 2016/9/27 北京数联众创科技有限公司
29 2016/9/27 北京数联众创科技有限公司
30 全球气候变化对青藏高原的湖泊水储量有很大影响,因 此精确的估计青藏高原湖泊面积变化对于研究气候变化变得 很重要.海量多源异构数据和大数据处理与挖掘技术给湖泊 面积变化研究带来新的解决思路;
如何通过多源数据对青藏 高原的湖泊面积进行预测,将大数据技术应用到全球气候变 化研究中来成为一项新的挑战. 本赛题希望通过研究青藏高原湖泊面积变化的多种影响 因素,构建青藏高原湖泊面积预测模型.如通过研究2000年- 2015年期间的降水总量、温度变化趋势、地形起伏度、海拔、 2000年、2005年和2010年青藏高原湖泊面积和分布数据,分 析各个因素对湖泊面积变化的影响,并对2015年的湖泊面积 进行预测. 青藏高 原湖泊 变化影 像因素 降水是青藏高原湖泊 水量的主要来源之一. 地形 青藏高原的高海拔和复 杂的地形起伏是形成整 个区域独特气候环境的 主要成因之一. 温度 温度变化通过影响冰川、 水的蒸发量等,影响湖泊 的水量,导致面积的变化. 人为影响 土地利用变化,人工 开发盐湖等. 降水 其他 公开可获得的遥感影像数据: -- 月均温度、月均降水、数字高程(海拔);
基于众包协作采集、处理得到的数据: -- Open Street Map、青藏高原湖泊面积与分布数据;
其他公开可获得数据,例如MODIS系列数据. 数据源地理预测 多源数据整合 机器学习 农产品价格预测分析 普开数据-赛题介绍 2016/9/27 北京数联众创科技有限公司
31 2016/9/27 北京数联众创科技有限公司
32 本赛题为农产品价格预测,出题方将提供2015年全国各大农产品交易市场的交易数据,在初赛阶段,参赛者只需根据 历史交易数据,选择合适的算法来预测各农产品接下来固定时间的价格;
在复赛阶段出题方将提供对价格有影响的其他数 据,例如:天气数据.参赛者需要综合考虑出题方给出的数据,对价格进行预测. 结果评判:在参赛者提交预测结果后,出题方将计算各参赛者的预测误差:R=∑(pf-pv)^2/t 其中pf为参赛者预测的价格,pv为实际价格,t为预测的天数,R表示结果的误差.按照R值对参赛者进行排序. 数据挖掘 市场预测 大赛报名官网 Datafountain平台 www.datafountain.cn ........