编辑: xiong447385 2013-07-21

8

第一章 SAS 初阶

第二章 SAS 语言与数据管理 1. (1) 用SAS 数据步列出

10000 以下的素数, 写出程序. (2) 把上述问题改写成可以求出 N 以下的素数的宏. 2. (1) 写出一个程序,可以给出

280 的素因子分解. (2) 把上述问题改写成可以求出任意正整数素因子分解的宏. 3. 生成 t 分布的双侧分位数表.水平取 0.001, 0.002, 0.005, 0.01, 0.02, 0.05, 0.10, 0.20, 自由度取 1C100, 分位数精确到小数点后

3 位.表格 应为行、列对齐的形式, 并有列标题.写出生成这样的表格并存放到一 个文本文件中的 SAS 程序(用数据步 FILE 和PUT 语句) . 注:一个随机变量 X 的双侧 p 分位数是指 xp 使得 P(|X| >

xp) = p. 4. 写出计算从自己生日到

2000 年初经过的天数的程序. 5. 下表为某邮购服务部的部分顾客记录: 姓名 性别 地区 日期 金额 章文 男 华东 1996-3-20

1099 王国铭 男 华东 1996-5-19

39 童子敏 女 华北 1996-1-5

986 刘念新 男 东北 1997-10-1

3581 李思今 女 华北 1997-4-4

659 关昭 女 东北 1996-11-5

358 赵霞 女 东北 1998-9-6

2010 (1) 用数据步把此表输入到 SAS 数据集;

(2) 用程序找出男性顾客购买金额超过

1000 的哪些人;

9 10

第二章 SAS 语言与数据管理 (3) 把数据拆分为包含姓名、性别、地区的一个数据集和包含姓名、 日期、金额的一个数据集;

(4) 用MERGE 和BY 合并上一步拆开的两个数据集. 6. 设有三位老师分别带三个兴趣小组,人员情况如下: 老师情况 组号 老师姓名

1 张民

2 李秀丽

3 曾维薇 一组情况 学号 姓名

101 刘娜

102 张秀敏

103 于长江 二组情况 学号 姓名

201 方开祥

202 耿火清

203 李芳 三组情况 学号 姓名

301 何明

302 孙成秀

303 张克成 (1) 输入这四个表到数据集 teachers, g1, g2, g3 中;

(2) 用这四个表合并生成包括所有兴趣组成员的数据集,每个学生为 一个观测,变量包括学生学号 (SID)、学生姓名 (SNAME)、指导 老师 (TNAME).要求所写的程序不能依赖于数据集内容. 7. 设某校的兴趣小组名单格式如下: 组名 指导教师 小组成员 数学 张民 刘娜, 张秀敏 美术 李秀丽 方开祥, 耿火清, 李芳 英语 曾维薇 何明 (1) 把这些原始数据输入成每组一个观测的数据集 A. (2) 把数据集 A 转换成每个组员一个观测的数据集 B,变量为组名 (GNAME)、指导教师 (TNAME)、组员姓名 (SNAME). 8. (1) 生成一个数据集 D1, 包含

50 行,

101 个变量, 其中变量 X1―X100 用标准正态分布随机数产生, 变量 R 为行号;

(2) 用宏按 (1) 的办法生成

20 个数据集 D1―D20;

(3) 对每个数据集,计算每个观测的

100 个变量的平均值、标准差、 最小值、最大值,以及

100 个值落入 ±1.96 之间的比例,各数据 集的结果合并存入一个新的数据集. 9. 在下载数据包的文件 data.zip 中有一个 ex-midsch.zip 数据包,其中 包含了三个中学毕业班某次考试的一些情况:

11 ? student.csv: 学生名单;

? scores.csv: 各科考试成绩表;

? subayw.csv: 语文各小题的题型;

? subsyw.csv: 学生的语文小题成绩,每个 subayw.csv 中出现的小 题对应于这个文件的一列. 输入这四个文件为 SAS 数据集,用如下两种方法解决: (1) PROC IMPORT;

(2) 数据步,INFILE 和INPUT 配合读入 CSV 格式数据,变量名在 程序中输入;

10. 设有如下格式的联系方式数据 (数据量很大,所以不能考虑另行输入 的方法),用数据步把数据输入为 SAS 数据集,要求每个联系人一个 观测.注意数据中每个联系人第一行都是姓名,但是电话、电子邮件 和单位则不是所有人都有,每个人的信息项数不定. 姓名: 张三

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题