编辑: 麒麟兔爷 | 2019-07-02 |
30 元.有四户家庭 fid12=
211393、fid12=
411032、fid12=
411568、fid12=510857 的第一项经营 净收入填错了,通过录音纠正了.其余两户 fid12=510803 和fid12=530051 无法找到录音未 改动. fr2a_a_
4、 fr301_a_
1、 fr301_a_
3、 fr301_a_
4、 houseprice2_a_
5、 houseprice2_a_6 和fm4_a_
3、 fm4_a_
4、fm7_a_
2、fm7_a_
3、fm7_a_4 没有极值,未做任何改动. 为了统一,便于用户使用,这些变量都重新生成了以 best 为后缀名的变量.
4 fm7_a_4_best 除了调整不合理的值外,还根据填报的最大值和最小值,采用取平均值的 方法估计了回答不知道和拒绝回答的情况.
(二)2010 年财产数据修正
2010 年财产数据中,主要有四组变量存在极值问题:①fd4(上个月,您家现居住房子 的市值约为多少万元?) ;
②fd703(其他几处住房现在的总市值约为多少万元) ;
③fv4_a_1 (经营第一家企业/公司的产业的总资产为多少万元) 、fv4_a_2(经营第二家企业/公司的产 业的总资产为多少万元) ;
④fv7_a_
1、f7_a_2(经营的第一家、第二家公司去年的营业额为 多少万元) ;
5.f8_a_
1、f8_a_2(经营的第一家、第二家公司去年的税后纯利润是多少万元) . 1.fd4,上个月您家现居住房子的市值约为多少万元,以万元为单位. 有17 家的现居住房市价在
1000 万以上,结合住房类型(单元房、平凡、小楼房、别墅 等) 、房内设施(厕所类型、做饭燃料、水) 、住房面积、家庭年收入、各项支出以及城乡性 质判断,确定有三户是混淆了单位 元 和 万元 ,故将原值除以 10000(fid=
320074、 fid=
350187、fid=530334)进行修正.其中有两户是上海和北京的住房,考虑到上海和北京 房价高的问题,认为
1000 万以上的住房是合理的. 其余
12 户, 能够确定这些家庭的住房不可能在
1000 万以上, 但直接除以
10000 的值也 不太符合家庭特征,因此,将这些家庭的住房市价赋值为缺失.这些家庭的家户号(fid) 为:
211308 311669
320193 320195
320198 320201
320202 330041
330045 330175
340363 350186 2. fd703,其他几处住房现在的总市值约为多少万元,以万元为单位.共有
77 户的其他 房产在
1000 万以上.参照该家庭户现住房的市价、其他房产的面积以及其他在修正现住房 市价 fd4 时考虑到的因素, 判断是否为极值. 同样的, 上海的两户 (fid=
312050、 fid=312391) fd703 不变动,另外有
14 户可以判定属于极值,但无法确定是否扩大了
10000 倍,所以赋 值为缺失. 这些家庭的家户号(fid)如下:
5 230109
370488 410775
411693 420054
430368 441455
441468 441829
510645 520008
520318 530120
620534 其余的家户均缩小为原值的 1/10000. 3.fv4_a_1,家庭经营第一项资产,以万元为单位.首先将资产在
1000 万及以上的家户 全部挑出来,结合该项资产的股份比例、雇佣人数、营业额(万元) 、纯利润(万元) ,2010 年家庭收入、各项支出、城乡性质、居住房子类型、市价及设施(如厕所类型、做饭燃料、 水) ,以及相对应的
2010 年的资产额,综合这些信息判断
1000 万以上的资产是否是混淆了 元和万元. 逐条判断后发现: 家户号为 fid=
120015、 fid=
130608、 fid=
230503、 fid=
310172、 fid=
330169、 fid=
430088、fid=
430613、fid=
430639、fid=530342 的家庭资产在
1000 万以上是合理的,不 过需要注意的是其中除 fid=120015 和fid=430088 两户外, 其他虽然填的资产是在