编辑: 麒麟兔爷 2019-07-02

30 元.有四户家庭 fid12=

211393、fid12=

411032、fid12=

411568、fid12=510857 的第一项经营 净收入填错了,通过录音纠正了.其余两户 fid12=510803 和fid12=530051 无法找到录音未 改动. fr2a_a_

4、 fr301_a_

1、 fr301_a_

3、 fr301_a_

4、 houseprice2_a_

5、 houseprice2_a_6 和fm4_a_

3、 fm4_a_

4、fm7_a_

2、fm7_a_

3、fm7_a_4 没有极值,未做任何改动. 为了统一,便于用户使用,这些变量都重新生成了以 best 为后缀名的变量.

4 fm7_a_4_best 除了调整不合理的值外,还根据填报的最大值和最小值,采用取平均值的 方法估计了回答不知道和拒绝回答的情况.

(二)2010 年财产数据修正

2010 年财产数据中,主要有四组变量存在极值问题:①fd4(上个月,您家现居住房子 的市值约为多少万元?) ;

②fd703(其他几处住房现在的总市值约为多少万元) ;

③fv4_a_1 (经营第一家企业/公司的产业的总资产为多少万元) 、fv4_a_2(经营第二家企业/公司的产 业的总资产为多少万元) ;

④fv7_a_

1、f7_a_2(经营的第一家、第二家公司去年的营业额为 多少万元) ;

5.f8_a_

1、f8_a_2(经营的第一家、第二家公司去年的税后纯利润是多少万元) . 1.fd4,上个月您家现居住房子的市值约为多少万元,以万元为单位. 有17 家的现居住房市价在

1000 万以上,结合住房类型(单元房、平凡、小楼房、别墅 等) 、房内设施(厕所类型、做饭燃料、水) 、住房面积、家庭年收入、各项支出以及城乡性 质判断,确定有三户是混淆了单位 元 和 万元 ,故将原值除以 10000(fid=

320074、 fid=

350187、fid=530334)进行修正.其中有两户是上海和北京的住房,考虑到上海和北京 房价高的问题,认为

1000 万以上的住房是合理的. 其余

12 户, 能够确定这些家庭的住房不可能在

1000 万以上, 但直接除以

10000 的值也 不太符合家庭特征,因此,将这些家庭的住房市价赋值为缺失.这些家庭的家户号(fid) 为:

211308 311669

320193 320195

320198 320201

320202 330041

330045 330175

340363 350186 2. fd703,其他几处住房现在的总市值约为多少万元,以万元为单位.共有

77 户的其他 房产在

1000 万以上.参照该家庭户现住房的市价、其他房产的面积以及其他在修正现住房 市价 fd4 时考虑到的因素, 判断是否为极值. 同样的, 上海的两户 (fid=

312050、 fid=312391) fd703 不变动,另外有

14 户可以判定属于极值,但无法确定是否扩大了

10000 倍,所以赋 值为缺失. 这些家庭的家户号(fid)如下:

5 230109

370488 410775

411693 420054

430368 441455

441468 441829

510645 520008

520318 530120

620534 其余的家户均缩小为原值的 1/10000. 3.fv4_a_1,家庭经营第一项资产,以万元为单位.首先将资产在

1000 万及以上的家户 全部挑出来,结合该项资产的股份比例、雇佣人数、营业额(万元) 、纯利润(万元) ,2010 年家庭收入、各项支出、城乡性质、居住房子类型、市价及设施(如厕所类型、做饭燃料、 水) ,以及相对应的

2010 年的资产额,综合这些信息判断

1000 万以上的资产是否是混淆了 元和万元. 逐条判断后发现: 家户号为 fid=

120015、 fid=

130608、 fid=

230503、 fid=

310172、 fid=

330169、 fid=

430088、fid=

430613、fid=

430639、fid=530342 的家庭资产在

1000 万以上是合理的,不 过需要注意的是其中除 fid=120015 和fid=430088 两户外, 其他虽然填的资产是在

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题