新闻检索 关键字:   高级
您的位置:首页 >  新闻中心 > 即时新闻

数字漫天飞虚实真难辨 我该相信谁的调查?

中原网(www.zynews.cn) 发布时间: 2011-09-15 07:22:38   来源:人民日报 我要评论

字号    意见反馈 新闻爆料 进入论坛 打印 关闭

    ■仅凭平均数可能会被误导?

    平均数不能代表一组数据,更不能反映一组数据间有多大差异,还会受到极端值的巨大影响

    大学生小仇还没毕业,就掉进了“平均数的陷阱”。她曾到一家展会公司求职,被老板告知企业平均工资为3000元,她的实习起薪是800元。后来她托熟人一打听,发现公司业务员的薪水都是1000元,便去找老板理论。

    老板给她算了一笔账:公司业务员10名,薪水1000元;业务经理5名,薪水2000元;部门主管6名,薪水2500元;副总经理拿10000元,总经理拿24000元。由于收入差距悬殊,全体人员一平均,平均工资确实是3000元。而对于小仇这样的求职者而言,一组数据中出现最多的数值——众数,即大多数员工的工资1000元,以及一组数据从小到大排列位于中间的数值——中位数,即员工中等工资2000元,可能比平均数更具有参考价值。

    实际上,小仇的经历也反映了目前统计数据无法反映社会收入分配差距的问题。2010年我国城镇非私营单位在岗职工年平均工资为37147元。其中,最高工资行业与最低工资行业年平均工资之比为4.7∶1;最高工资行业金融业中,非私营单位与私营单位在岗职工年平均工资之比为2.6∶1。由于行业差距、地域差距,以及同行业中不同企业、同企业中不同级别的收入差距,导致低收入群体在看到37147元时,往往产生“被增收”的感觉,而高收入人群看到37147元时,又觉得该数值被严重低估。

    由于可以简洁地反映样本总体的情况,统计中的“平均数”无处不在。然而平均数也具有误导性,常会掩盖原始数据的信息,还会受到极端值的巨大影响。比如在中小学里,班级平均分往往会因为一两名不及格的学生而大幅下滑,因此总有老师会愤懑地说:“真是一颗坏小豆,毁了一锅粥”。再比如,在各种体育、文艺比赛中,往往会“减去一个最高分、再减去一个最低分”,这也是因为将少数异常值去掉后计算出的平均值具有更好的代表性与稳定性。

    “仅靠平均数不能反映一组数据间有多大差异。平均数通常需要与标准偏差结合起来报告或考察,才能得出相对全面的分布描述。”金兼斌认为,人们对统计数据产生误读或误解,往往是因为有关部门发布这些调查数据时,只报告了平均数,而没有解释相关指标的分布差异情况。“那些与平均数水平差别较大的民众,会觉得调查结果与他们实际感受有出入,进而认为数据有问题。”

    实际上,统计是无限接近现实,却不能代替现实,很多统计数据只能反映宏观趋势的变化,不适合作为个体选择的参考。比如,统计部门公布的商品住房销售均价、销售额与销售面积,在研究一个区域的经济、产业走势上的作用突出,对单一购房者,这种“均价”在判断房价走势、决定是否该买房等方面,没有太多参考价值。

    ■哪些调查的“百分比”不可信?

    样本容量小、抽样不科学,一些街边问卷与网上调查的结果不可偏听偏信

    “89.3%的人坦言物价上涨影响生活”、“一半人认为房屋单位售价在5000元以下最能接受”……每天电视、报纸、网络都在刊登着各种调查机构的调查结果,这些耸动视听的“百分比”调查结果真的反映了现实情况吗?

    张小姐曾经供职于北京一家小型的信息咨询公司。她接到的第一份工作就是问卷调查都市人群的牙齿保健行为。但令她不解的是,公司并没有采取严格的抽样方法,而是让员工和临时志愿者去城市商圈、地铁站等处,临时找人填写问卷。而且问卷中的一些问题,受访人可能不会真实回答。“比如您现在存在哪些口腔问题,我想不会有人主动选择口臭一项。而且上班时间逛商场的人群是否就能代表这个都市的基本面,我也很怀疑。”

    金兼斌认为,统计数字误导最常见来自抽样问题。抽样调查首先要保证一定的样本容量。另一方面,样本能很好地代表总体,避免调查受到社会倾向的影响。“例如,恐怕很少有人愿意填写问卷承认自己歧视农民工,但实际言行显然是另一回事。”

    不仅是街头问卷调查,很多所谓的网上民意调查的结果也值得商榷。例如今年8月,中国青年报社会调查中心的一项网络调查显示,83.2%的受访者确认现在社会谣言很多,其中34.4%的人表示“非常多”。大量媒体据此撰文“八成民众认为现在社会谣言很多”。实际上,该调查是仅对1714人进行的在线调查,而且参与者最可能是上述网站的常客以及曾经历过该话题的人群。媒体的结论显然有以偏概全之嫌。

    网络调查是一种计算机辅助的信函访问方式。通过电子邮件和互联网页面,被调查者可以轻松而不受拘束地完成调查,提高了调查的便捷性。但网络调查不能实现人口全覆盖,且受到虚拟匿名等局限,真实性很难鉴别。

    “目前很多网上调查,包括一些调查机构发布的调查,有时从抽样方案上看是一个非概率调查,样本对总体没有代表性。对于谁有资格参加调查不加设计和筛选,得到的样本不管多大,都属于方便样本,调查所得到的意见和看法,只能反映调查参加者这部分人群的意见和看法。”金兼斌说,“因此这样的调查结果是不可以推广应用到样本以外的人群的;但从对结果的解释和得出的结论上,这些调查又恰恰试图去作过分的推广或推论。”

    如今,在日常社会生活中,特别是描述经济增长、宣传商品价值乃至吸引眼球时,“百分数”也常常被滥用,以掩盖样本容量过小的事实。比如,广告中常常出现“80%的测试人员”一致认可某种牙膏、某种咖啡的质量,而参加测试的人员可能只有5个人。再比如河南某媒体报道“九成家长愿孩子当班干部、近半孩子不愿当班干部”,这一调查结果被广为传播,但其实只调查了30个孩子及家长。

    “百分数不仅被当作催人入眠的安眠药,还被用做使人激动不已的兴奋剂。正如一架望远镜,如果人们没有正确地使用,那么,它既可以把小东西变成大东西,也可以把大东西变成小东西。”德国学者瓦尔特·克莱默在《统计数据的真相》一书中这样表述,“滥用百分数往往只有一个目的:用百分数比例来隐藏基础数据。因此公众应尽可能关注基础数据,规避百分数的欺骗性。”

【 作者:孙璐  编辑: 】

  相关新闻
abc
  版权声明