编辑: xiong447385 | 2013-07-21 |
电话:
01012345678 电子邮件: [email protected] 姓名: 李四 工作单位: 清华大学 姓名: 王五 电子邮件: [email protected] …………………… 11. 编写一个宏子程序,可以自动输入一个 CSV 文件为 SAS 数据集.难 点包括:自动确定变量个数和变量名;
自动确定变量是数值型还是字 符型;
确定字符型变量的长度;
自动识别和转换日期、时间.
12
第二章 SAS 语言与数据管理
第三章 SAS 功能基础 1. 对SAMP.BUSINESS 数据集: (1) 列出数据集的内容, 要求给各列加上合理的中文列标题, 不要观测 序号. (2) 把观测按国家、部门、销售额 (由高到低) 排序后按国家、部门列 出公司名、销售额、利润,计算销售额的小计和总计. (3) 用TABULATE 过程绘制按国家和部门交叉分类的销售额及总 计, 使用中文标签. 2. (1) 把
第二章习题8中的数据集 D1 的X1―X100 转置,保存为 E1;
(2) 把D1 中每个观测的 X1―X100 合并到一列中,结果数据集取名 为F1. 3. 对SASUSER.GPA: (1) 用UNIVARIATE 过程分析 SATM 分布并简述结果;
(2) 叙述性别分布;
(3) 计算 HSS、HSM、HSE 的相关系数. (4) 绘制 SATM 的直方图;
(5) 画SATV 对SATM 的散点图;
4. 对SAMP.FITNESS: (1) 用UNIVARIATE 过程分析 OXYGEN 分布并简述结果. (2) 按GROUP 分组计算各变量的简单统计量. (3) 计算各变量的相关系数.
13 14
第三章 SAS 功能基础 5. 把
第二章习题8中的数据集 D1 每一行的 X1CX100 看作一组样本,作 直方图. 提示: (1) 用转置和 BY 语句;
(2) 用宏、SET 语句选项、转置解决. 6. 绘制 F 分布自由度为 (1,30), (2,30), (3,30), (4,30), (5,30), (10,30) 的 密度曲线图,画在同一坐标系中. 提示:F(1,30) 的密度在左端有奇点. 7. 长表和宽表的互相转换时经常遇到的问题.设我们有 X 和Y两个变 量,10 个人的观测,每个人在
4 个时间点上观测.数据集 LONG 有10*4=40 个观测,两个测量值变量 X 和Y.我们希望: (1) 计算后一期减前一期的值,如X的第
2 期减去 X 的第
1 期,存为DX12. (2) 每个人的所有信息汇集在一个观测内,作成一个宽表 WIDE,包括X01, X02, X03, X04 即X的四个不同时间点值,Y01, Y02, Y03, Y04, 以及差分值 DX12,DX23,DX34, DY12,DY23,DY34. 用PROC TRANSPOSE, 横向拆分,横向合并解决,或用数据步和 宏解决. 其中生成表 LONG 的代码如下: data long;
nsubjects=10;
ntimes=4;
array vars(2) x y;
do subject=1 to nsubjects;
do time=1 to ntimes;
x = ceil(uniform(111333)*10);
y = ceil(uniform(111333)*10);
output;
end;
end;
keep subject time x y;
run;
15 8. 在
第二章的习题9中读入了语文的小题题型和学生的小题分. (1) 把数据集 subsyw 中Y1-Y18 合并为一列,另外增加一列变量表 示小题序号.设结果数据集为 S1. (2) 把S1 与subayw 按小题序号横向合并. (3) 计算每个学生四种不同题型的分数, 生成包含学号、T
1、T
2、T
3、 T4 变量的结果数据集,其中 T
1、T
2、T
3、T4 是每个学生四种 题型的分数. 9. (选做) 编写 SAS 宏程序,对任一数据集,可以分析每个数据集变量, 对字符型,如果其不同值的个数不超过
10 个(此界限可更改) ,显示 所有不同值及频数、百分比、缺失个数和比例,否则列出其........