编辑: 麒麟兔爷 | 2019-07-02 |
2012 年和
2010 年财产数据技术报告 靳永爱 谢宇 2014-12-10 CFPS China Family Panel Studies 中国家庭追踪调查 技术报告系列:CFPS-29 系列编辑:谢宇 责任编辑:张聪
1 本报告主要记录了财产数据的清理、缺失值处理以及综合变量生成过程.
中国家庭追踪调查(以下简称 CFPS)2012 年和
2010 年在财产问题的设计上有一定差 异,主要差别在于: (1)2012 年各项财产询问更细更准确,如耐用消费品在
2010 年被包含 在家庭其他资产里面统一询问 您家的其他资产现值为___元 ,而在
2012 年则是分项提问 价值.2010 年财产中漏掉了政府债券、金融衍生品和其他金融产品.2010 年除了现住房外, 其他房产是统一询问价值,2012 年则是分别询问其他房产中每套房产的价值. (2)2010 年 财产相关问题的缺失值未进一步追问,而2012 年则使用逼近法(unfolding brackets)的方式 进行了追问.考虑到这些不同,两年数据在具体清理过程、缺失值插补以及综合变量生成上 也存在一些差别,以下将分年份介绍数据处理过程.
一、 数据清理 本节介绍单位弄错的变量的处理过程.
(一)2012 年财产数据修正 对2012 年数据清理和修正主要采取两个办法:一是回听所有大于
1000 万的值的录音, 根据录音修正数据;
二是因没有录音数据、录音听不清楚、地方方言等原因而无法依据录音 修正的观测,结合家庭中的其他信息和
2010 年对应的信息进行判断与修正.
2012 年财产数据中,主要有以下变量存在不合理的值:①fq4a,您家现住房当前市价;
②fr2a_a_1,离您家渐远的第
1 套房产市价;
fr2a_a_2,离您家渐远的第
2 套房产;
fr2a_a_3, 离您家渐远的第
3 套房产市价;
③系统自动生成的以 元 为单位的现住房和其他每套房产 的市价, 如houseprice
1、 houseprice2_a_
1、 houseprice2_a_
2、 houseprice2_a_
3、 houseprice2_a_4;
④fq501,现住房的待还房贷;
fr301_a_2,其他房产中第
2 套待还房贷;
⑤fq701,您家现住 房建筑面积;
⑥fm4_a_1,第一项个体私营总资产;
fm4_a_2,第二项个体私营总资产;
⑦ fm7_a_1,第一项经营的净收入.下面将分别对这
7 种情形加以说明. 1.fq4a,现住房的市价,以万元为单位.这个变量存在两个方面的数据问题:一是
1000 万以上的房产可能是混淆了单位 万元 和 元 ;
二是在单位上多填或少填几个 0,比如
80 万填成了
800 万,这个问题与
2010 年房价对比可以发现.
2 报告的 fq4a 在1000 万以上的共有
45 户,通过录音能够纠正其中的
11 户数据,剩下的
34 户中有
31 户可以根据现在家庭信息,如住房类型、住房面积、住房内设施(水、做饭燃 料、厕所) 、城乡性质、所在省份、家庭收入、各项支出以及
2010 年住房信息,判断其存在 混淆了 万元 和 元 的问题.对于这些家庭户,其填答的 fq4a 值直接除以
10000 就可 以得到修正值.其余
3 户虽然可以判断填答的值是弄错了单位,但不能确定是混淆了 元 和 万元 ,因此将这三户赋为缺失值(fid12=
312405、fid12=
621784、fid=643364) . 2. fr2a_a_1,离家渐远的其他第一套房产市值,以万元为单位.值在
1000 万以上的有
8 户家庭,其中
3 户根据录音数据修正,其余
6 户可以判断是误将单位 万元 当作 元 填写, 直接除以