编辑: 喜太狼911 2013-04-22

2 ? SQL 基础概念 1.领会:关系型数据库基本概念-属性,主键,外键,E-R 图.ANSI-SQL 以及不同的数 据库实现的关系. 2.熟知:逻辑运算符,比较运算符,算术运算符,通配符. ? SQL 查询语句 1.应用:select 语句,包括查询单列,多列,去重,前N列;

from 语句;

where 语句;

SQL 数据库基础 CDA 数据分析研究院 group by 语句;

having 语句;

order By 语句;

子查询.SQL 聚合函数,包括 count、sum、avg、 max、min 等. ? SQL 连接语句 1.领会:表的连接类型,包括内连接(等值,不等值) ,外连接(左,右,全) ,交叉 连接(笛卡尔连接) ;

查询的集合操作,只包括并集操作. 2.应用:inner join 的用法,left/right/full join 的用法,cross join 的用法,union 的用法. ? 其它 SQL 语句 1.领会:表的创建,视图及索引的概念及创建,数据插入、更新、删除. PART

3 ? 数据采集方法 1.领会 一手数据与二手数据来源渠道,优劣势分析,使用注意事项. 2.熟知:一手数据采集中的概率抽样与非概率抽样的区别与优缺点. 3.运用:概率抽样方法,包括简单随机抽样、分层抽样、系统抽样、分段抽样,明确 每种抽样的优缺点, 根据给定条件选择最可行的抽样方式;

计算简单随机抽样所需的样本量. ? 市场调研 1.熟知:市场调研的基本步骤(提出问题,调查收集材料,分析预测问题) 、单选题及 多项选择题的设置、数据编码及录入. ? 数据预处理方法 1.熟知:数据预处理的基本步骤,包括数据集成(不同数据源的整合) ,数据探索,数 据变换(标准化) ,数据归约(维度归约技术,数值归约技术) ,这部分内容不需要涉及计算, 只需要根据需求明确可选的处理技术即可. 2.应用:数据清洗,包括填补遗漏的数据值(根据业务场景使用常数,或者中位数、 众数等方法, 不涉及多重查补的方法) 、 平滑有噪声数据 (移动平均) 、 识别或除去异常值 (单 变量根据中心标准化值,多变量使用快速聚类) ,以及解决不一致问题(熟知概念即可) ,查重(只考核 SQL 的语句,不涉及 R、SAS 等其它语言) . P........

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题