编辑: 麒麟兔爷 2019-07-02

10000 得修正值. 这6户家庭为: fid12=

140068、 fid12=

420330、 fid12=

430152、 fid12=

430182、fid12=

140046、fid12=

140058、fid12=430151. fr2a_a_2,离家渐远的其他第二套房产市值,以万元为单位.有两户在

1000 万以上, 通过录音数据纠正. fr2a_a_3,离家渐远的其他第三套房产市值,以万元为单位.有两户在

1000 万以上, 通过录音数据修正. 3.houseprice1 变量,数据库中系统根据变量 fq4a(万元) 、fq4b(千元) 、fq4c(百元) 、 fq4d(十元) 、fq4e(元)综合生成以元为单位的现住房市价.对fq4a 进行清理并处理极值 后,houseprice 变量需要重新生成,在数据库中用以 best 为后缀的 houseprice 变量表示. houseprice2_a_1――houseprice2_a_4 是其他房产以元为单位的市价, 一方面因为修改了 以万为单位的极值, 另一方面由于系统在生成以元为单位的房子市价时存在某些问题, 有些 计算不准确,所以这五个变量都根据新清理的值重新生成了以 best 为后缀的变量. 4.fq501,现住房待还房贷本息,以万元为单位.将房贷在

500 万以上的家庭挑出来, 与该房子的市价、房子类型、住房内设施、城乡性质结合起来考虑,发现

500 万以上的家庭 除了

1 家外,其他的都是误将单位 万元 当成了 元 填写.无法判断的这一户房贷填写 的是

5000 万,但是房子市价 不知道 ,所以将该户的房贷赋为缺失(fid12=282783) . fr301_a_2,其他房产中第二套房产待偿贷款本息总额,以万元为单位.出现一户奇异 值,待还房贷填写的是

10000 万元(fid12=230626) ,通过综合判断,认为是

10000 元.

3 5.fq701,您家现住房建筑面积,单位为平方米.有四户的面积出现了偏离总体分布过 远的情况,分别达到 5447(fid12=220242) 、5925(fid12=130174) 、8533(fid12=211149) 、 5238(fid12=230262)平方米.经过与

2010 年面积对比,发现

2012 年扩大了

100 倍,而房 屋类型并没有发生变化. 由此判断可能是访员填答时漏掉了小数点, 故将这四户的面积在原 值上除以

100 即得到修正值. 6.fm4_a_1,第一项个体私营总资产,单位万元.2012 年CFPS 财产数据中的奇异值处 理办法主要是通过录音纠正.2012 年家庭第一项个体私营总资产在

1000 万以上的共有

172 户.其中通过录音回听纠正了

115 户的数据. 将录音回听数据与原始数据对比可以看出,绝大部分家户是错将单位 元 当成了 万元 .剩下的

57 户录音数据缺失,根据

2012 年相应的股份比例、雇佣人数、净收入、城乡 性质、家庭收入、家庭各项支出、住房类型、住房市价、住房设施(水、燃料、厕所)以及

2010 年对应的资产值修正.其中

53 户十分确定是错将单位 万元 当成了 元 的家庭, 将原资产值缩小到原值的 1/10000.其他无法确定的

4 户家庭,直接赋值为缺失. fm4_a_2,第二项个体私营总资产,单位万元.该变量值在

1000 万以上的共有

4 家, 其中

3 家通过录音进行了修正,剩下的一家雇佣了

12 人,净收入写的

30000 万,原资产值 填写的是

4 亿, 无法确定该值是否被扩大了

10000 倍, 所以赋为缺失. 另外一家 fid12=430357 地处村委会,填写的资产值为

500 万,但是雇佣人数是 0,净收入也是

0 元,通过录音进行 了纠正. 7.fm7_a_1,第一项经营的净收入,单位元. 通过比较 fm4_a_1(单位:万元)和fm7_a_1(单位:元) ,发现有六户的 fm7_a_1 值 有问题,主要表现为前者与后者差距过大,比如 fm4_a_1 为130 万,但fm7_a_1 却仅为

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题