最近国家统计局公布了自2003年以来逐年的全国居民收入基尼系数。数据显示,这些年中国居民收入基尼系数一直在0.47以上,2008年以前逐年上升,最高点达到0.491,近几年有轻微回落,2012年为0.474。
近日不断有记者询问笔者对上述基尼系数有何评价。应该说,到目前为止,国家统计局拥有全国最大、覆盖面最全的城镇居民和农村居民调查样本,这两个样本的抽样工作是根据随机抽样调查方法进行的,可以相信是符合统计规范的,在反映中、低收入居民的收入方面是基本可信的。基于该样本计算的基尼系数有一定的参考价值。而且,由于样本稳定可比,在反映历年变动趋势方面也有意义。
但是迄今为止,国家统计局的城乡住户调查数据也存在明显的缺点,即高收入居民的收入被大大低估了,因此没有能够如实反映中国目前的收入分布状况。例如根据该城镇住户调查数据,2008年城镇10%最高收入家庭的人均可支配年收入仅为4.3万元,而笔者的推算为13.9万元,相差3倍以上。2011年,根据该样本的城镇10%最高收入家庭的人均可支配收入也还不到5.9万元。最高收入居民这样低的年收入水平,根本无法解释房价居高不下、汽车市场火爆、银行的个人存款高达35万亿元(2012年已超过41万亿元)、中国居民的大量海外存款和在海外奢侈品市场上的巨额采购等等一系列现象。
国家统计局长马建堂前不久也明确表示:“我们经过认真研究评估,感觉到靠我们现在的城镇住户调查计算出来的城镇居民收入基尼系数偏低,原因主要是难以获取高收入阶层居民的真实收入信息”。这一态度是客观的。
数据偏差主要是两个原因导致的。其一,很多高收入居民都不愿意接受调查,而更替的样本不能保证处于同样的收入水平,因此在样本的抽样过程中会导致高收入样本的遗失,使样本的覆盖面发生偏差。其二,纳入样本的高收入居民有很多人不愿意提供他们真实的家庭收入情况,报告的数据严重偏低,尤其是当他们拥有大量灰色收入时更是如此。这种情况在高收入居民中相当普遍。
很自然,由于存在上述问题,根据该样本计算的基尼系数也必然是显著偏低的。尽管如此,目前0.474的基尼系数也还是反映了相当大的收入差距。根据世界银行2011年公布的全世界162个国家和地区的收入或消费基尼系数(不同年份),基尼系数超过0.47的国家和地区只有34个。收入数据不真实的情况在中国很严重,但可能在不同程度上也存在于很多国家。如果我们假设世界各国都和中国一样存在低估收入差距的问题,而且程度相同,仍然可以判断中国目前处于世界上20%的收入差距最大国家的行列,说明中国的收入分配问题相当严重。
面对统计数据存在偏差的情况,自然会引出这样一个问题:统计部门能做什么,不能做什么?
解决数据偏差问题是一个困难的挑战,但仍然可以采取一些补救措施。例如,既然在调查中存在遗漏高收入样本的问题,就有可能对遗漏的程度进行推算,据此在精心设计的基础上增补高收入样本。
对一个随机抽样形成的调查样本来说,要纠正收入数据不真实的问题更加困难,但也可以考虑补充额外信息进行检验和校正的方法。例如,统计部门可以与其他政府部门协作,利用私人住房登记、家用汽车注册、实名银行存款等信息对某些高收入样本的收入数据进行推算和交叉检验,在此基础上对调查数据的偏差进行校正。也可以考虑采取不同的调查方法或根据某些可信程度较高的宏观层面数据进行推算,以取得更真实的居民收入数据,据此对原有样本的数据进行校正。
当然,靠统计方法、调查方法的改进,不可能改变一个更基本的事实,即目前腐败现象严重,某些高收入居民拥有大量来自隐秘途径的灰色收入。这是导致目前数据偏差的主要原因。产生这一现象的根源是体制方面的缺陷,例如公共资金大量流失、土地市场、金融市场、资本市场和垄断行业收益的不当分配等等。解决这些根本性的问题不是统计部门的责任,而只能靠推进体制改革、完善制度,提高政府、要素市场和垄断部门的透明度,把权力关进笼子,靠公众监督来消除制度隐患。