原标题:“用数据说话”应更重视“科学性”
近日,“40%”成了媒体讨论科技话题的“热数字”。先是有作者为同一人的《科研投入大国何以成为科研创新大国》、《别让万亿科研投入成为“唐僧肉”》两篇文章见诸报刊,作者在文中很“机智”地引用某市副市长的话:“全国科研经费大概只有40%是真正用于科技研发的,60%都用于开会、出差等”,由此,作者进行了推算,“全国万亿科研经费,就用6000亿用于开会、出差”,并以此作为科研投入被挥霍浪费的证据。
一篇题为《科技部部长的愤怒警示了什么》的文章称,“科技部部长的愤怒事出有因。据中国科协调查:我国科研资金用于项目本身的仅占40%左右,大量科研经费流失在项目之外。依据目前我国每年投入科研经费1万亿元左右来估算,这是一笔让人惊悚的巨额资金”。此外,《科研经费运行缘何成为腐败高发区?》、《科研经费腐败,错愕之后要求解》、《科研经费,不能这么瞎花》等文章也都引用了中国科协的调查数据。看来“40%”这个数字的由来成了关键。
而早在2011年9月,中国科协通过媒体发表声明,“中国科协于2003年组织开展第一次全国科技工作者状况调查,并于2004年公开出版《全国科技工作者状况调查报告》(中国科学技术出版社)。该报告中有关内容为:‘三、直接用于科研项目的资金比例。调查结果显示,从全国来说,资金用于项目本身的比例在40%左右’,未有所谓‘科研经费流失’的相关内容。”中国科协当时还表示,“针对科研经费数据不实报道,要求相关单位尽快采取措施予以澄清,同时保留追究责任的权利”。
暂且不论一个10年前的调查结果是否适用于当下,也不计较“直接用于科研项目的资金比例”这个提法的外延和内涵究竟如何,但凡有一点科研经费使用常识的人都知道,仅凭“资金用于项目本身的比例在40%左右”这一调查结果,如何能推断出“60%都用于开会、出差等”这样的结论呢?科研活动需要的水、电、气、暖消耗等间接费用,知识产权代理费用,科技人员一直大声呼吁要增加的人员费用,不也都是开展科研活动的重要条件吗?更何况,参加必要的学术会议、与同行进行交流就一定等同于“游山玩水”吗?这样不靠谱的推论再乘上个10000亿,如果不是故意的话,只能以“不负责任”来解释。
在今天这个“阅读快餐化”的阶段,鲜明的数字往往成为媒体吸引眼球的利器。然而媒体在引用各种数字并作出解读的时候,无论是何种“专家”所言,都需要对数字本身做一下判断和思考,不能人云亦云,推波助澜。以“科技成果转化率”为例,为说明我国科技与经济结合不够紧密,时常会有人举出“科技成果转化率低”的例子,有说“5%”,有说“10%”。然而这些言之凿凿的数字背后有什么样的研究成果支撑,不得而知;能够算出“转化率”的分子分母究竟都是什么?这些原始数据从哪儿得来的?听起来更像是“一个传说”。
近年来,有关研究机构围绕当前科技改革发展的一些热点难点问题,以科技人员为对象开展了一系列调查研究,很多研究成果和结论为科技界和决策层所重视。然而,正是由于这些结论和数字的敏感性,需要我们对这些调查研究过程本身和调查方法的科学性和合理性给予更多的关注。
例如,同样是面对几千人的问卷调查,随机抽样调查和非随机抽样调查的代表性有着本质的不同,得出的结论可能会大相径庭。此外,调查问卷回收率是决定和影响调查样本代表性的重要因素。学术界比较有共识的是,一项大型调查的问卷回收率要在60%—70%左右,当回收率低于这一比例时,研究者有责任对未回收的调查对象所具有的基本特征及其所带来的误差进行分析和说明。因为这种误差在相当大的程度上将影响调查研究结果的适用范围。如果你发放了4000份问卷,只收回了1000份,无论你的研究方法有多么“先进”,不可避免地会出现“样本代表性偏差”,而这种“偏差”将直接影响到研究结论的科学性和可靠性。
这方面最著名的例子是美国《文学文摘》杂志关于美国总统选举的调查。该杂志在1936年的总统选举调查中发出的1000多万张调查表,收回了200多万份调查表,数量不可谓不大,然而正是这20%左右的回收率以及在抽样框方面的失误,直接导致调查失败和这家杂志的关门。
更多详细信息,请您微信关注“计算网”公众号: