编辑: xiong447385 2013-07-21

电话:

01012345678 电子邮件: [email protected] 姓名: 李四 工作单位: 清华大学 姓名: 王五 电子邮件: [email protected] …………………… 11. 编写一个宏子程序,可以自动输入一个 CSV 文件为 SAS 数据集.难 点包括:自动确定变量个数和变量名;

自动确定变量是数值型还是字 符型;

确定字符型变量的长度;

自动识别和转换日期、时间.

12

第二章 SAS 语言与数据管理

第三章 SAS 功能基础 1. 对SAMP.BUSINESS 数据集: (1) 列出数据集的内容, 要求给各列加上合理的中文列标题, 不要观测 序号. (2) 把观测按国家、部门、销售额 (由高到低) 排序后按国家、部门列 出公司名、销售额、利润,计算销售额的小计和总计. (3) 用TABULATE 过程绘制按国家和部门交叉分类的销售额及总 计, 使用中文标签. 2. (1) 把

第二章习题8中的数据集 D1 的X1―X100 转置,保存为 E1;

(2) 把D1 中每个观测的 X1―X100 合并到一列中,结果数据集取名 为F1. 3. 对SASUSER.GPA: (1) 用UNIVARIATE 过程分析 SATM 分布并简述结果;

(2) 叙述性别分布;

(3) 计算 HSS、HSM、HSE 的相关系数. (4) 绘制 SATM 的直方图;

(5) 画SATV 对SATM 的散点图;

4. 对SAMP.FITNESS: (1) 用UNIVARIATE 过程分析 OXYGEN 分布并简述结果. (2) 按GROUP 分组计算各变量的简单统计量. (3) 计算各变量的相关系数.

13 14

第三章 SAS 功能基础 5. 把

第二章习题8中的数据集 D1 每一行的 X1CX100 看作一组样本,作 直方图. 提示: (1) 用转置和 BY 语句;

(2) 用宏、SET 语句选项、转置解决. 6. 绘制 F 分布自由度为 (1,30), (2,30), (3,30), (4,30), (5,30), (10,30) 的 密度曲线图,画在同一坐标系中. 提示:F(1,30) 的密度在左端有奇点. 7. 长表和宽表的互相转换时经常遇到的问题.设我们有 X 和Y两个变 量,10 个人的观测,每个人在

4 个时间点上观测.数据集 LONG 有10*4=40 个观测,两个测量值变量 X 和Y.我们希望: (1) 计算后一期减前一期的值,如X的第

2 期减去 X 的第

1 期,存为DX12. (2) 每个人的所有信息汇集在一个观测内,作成一个宽表 WIDE,包括X01, X02, X03, X04 即X的四个不同时间点值,Y01, Y02, Y03, Y04, 以及差分值 DX12,DX23,DX34, DY12,DY23,DY34. 用PROC TRANSPOSE, 横向拆分,横向合并解决,或用数据步和 宏解决. 其中生成表 LONG 的代码如下: data long;

nsubjects=10;

ntimes=4;

array vars(2) x y;

do subject=1 to nsubjects;

do time=1 to ntimes;

x = ceil(uniform(111333)*10);

y = ceil(uniform(111333)*10);

output;

end;

end;

keep subject time x y;

run;

15 8. 在

第二章的习题9中读入了语文的小题题型和学生的小题分. (1) 把数据集 subsyw 中Y1-Y18 合并为一列,另外增加一列变量表 示小题序号.设结果数据集为 S1. (2) 把S1 与subayw 按小题序号横向合并. (3) 计算每个学生四种不同题型的分数, 生成包含学号、T

1、T

2、T

3、 T4 变量的结果数据集,其中 T

1、T

2、T

3、T4 是每个学生四种 题型的分数. 9. (选做) 编写 SAS 宏程序,对任一数据集,可以分析每个数据集变量, 对字符型,如果其不同值的个数不超过

10 个(此界限可更改) ,显示 所有不同值及频数、百分比、缺失个数和比例,否则列出其........

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题