|
虽然“统计学(stat
ist ics) ”的定义在当今世界的百科全书和统计教科书中在文字上、侧重点上或描述方式有所出入,
但就其所包含的总体内容和应用领域来说则差不多。比如《大英百科全书》在一开始说:“统计学是一门收集数据、分析数据,
并根据数据进行推断的艺术和科学。最初与政府收集的数据有关,
现在包括了范围广泛的方法和理论”。该书随后还列举了主要应用
领域并详尽介绍了统计学的各方面的内容。由Ko
tzJohnson 和Read
编辑的《统计科学百科全书》是迄今最完整的关于统计的具有权威性的百科全书,
它说“统计学”这个术语表示“涉及收集、表示和分析数据的普遍方法和原理的领域”。它还列举了四十多个运用统计的领域。
本文所讨论的就是这个有普遍意义的统计学,
而不局限于某一个应用统计领域(比如政府统计或工业统计)。社会对统计的这种认识是在长期的应用实践中自然形成的,
不是靠立法、决议、行政命令或辩论来决定的。统计在每一个应用领域都有它自己的目标和特点,
有的还有自己的名字,
如生物统计、统计质量控制、政府统计等等。各个应用统计领域既有个性又有共性,多数普遍应用的统计方法最初是为某一个应用领域而发展的,
然后为其它领域所利用,
这些统计方法和原理逐渐形成我们第一段所指的统计学的基础。因为统计学为如此多的领域所应用,
我们应尽量基于一个较广阔的基础来讨论。
统计和数学
数学是以公理系统为基础,
以演绎为基本思想方法的逻辑体系。它属于少数可以和世界具体事物无关的自成体系的学科。数学可以完全脱离实际,
因而国外一般认为数学是艺术(art) 而不是科学,
因为科学( science)
是研究实际事物的。统计和数学相反,
是以实际事物为对象的。它以归纳为其基本思想,
归纳和演绎并用。统计作为一门科学,
随着其应用的发展和深入,
涉及大量的数据及复杂的模型;
因而也需要计算机和越来越多的数学。事实表明,
数学和计算机的大量运用加速了统计学的发展,
也更新了统计学的面貌。当前,
统计是计算机的最重要的用户。虽然目前有某些统计的应用领域的某些方面还没有用到很多数学或计算机,但作为面向所有应用领域的统计科学来说,
否定数学或否定计算机在统计中的作用就等于否定现代统计。统计应用的广泛性既造就了一批为各个具体应用领域服务的、并懂得该领域内容的统计学家,
同时也造就了一些相对独立于某一两项具体应用,
而从事于研究具有普遍性的统计方法或原理的统计学家。后者所研究的内容有时也被称为“数理统计”。他们对目前广泛应用的大量的统计模型有着重要的贡献。然而这些似乎“脱离”某一两个具体应用领域的表面现象以及他们所使用的复杂的数学工具,
使得有些人认为统计(或数理统计) 就是数学。当然,
的确有许多人把统计学当成数学来研究。在统计教学中也有数学化的倾向,
这反映在一些教科书上。统计数学化自然引起一些争议。《大英百科全书》和《统计科学百科全书》都未说统计是数学的一个分支。强调统计是数学的一个分支似乎对统计和对数学二者都是不公平的;
这忽视了统计和数学在研究目标和思想方法上的差异,
忘记了统计和其
它领域的纽带。可以理解,
统计数学化是一个客观存在的现象, 是由环境决定的,
每一个人都应该被允许干他们所喜爱的研究课题。但当涉及有关统计的教学、科研、应用和政府机构的方针政策的制订时,
统计数学化就不是一个无所谓的个人问题了。
统计在美国
美国是统计学最发达国家,
它拥有世界上绝大多数的统计应用及大量优秀的统计学家,
看一看美国的实践是有益的。在美国,
最好的统计专业有独立于数学系的统计系,
它还有许多与某些应用领域密切关联的统计系,
比如医学院的生物统计系,
管理学院或商学院的统计系,
及计算机和统计科学系等等。美国的实践表明,
在纯数学系中的统计学家的发展受到极大的约束,许多著名大学的统计系都比数学系兴旺发达,
而生物统计系又比统计系要紧俏。所有的应用或理论的统计在那里都可称为统计(
stat ist ics) , 为统计大家族的成员, 没有人在乎标签,
也没有人来决定它是“几级学科”或“几级学会”。
美国的统计之所以先进是与全民族文化素质及整体经济水准有关的。几乎每一个大学生都知道统计这个学科,
而且对统计学和统计学家都十分尊重,
许多非统计学科都把统计作为必修课, 这样,
当人们遇到了统计问题,
也都知道如何去寻求答案。因此,统计在美国就用得十分广泛,
统计成为除计算机专业之外的最好找工作的专业。由于需要和立法等原因,
医药界成了使用统计最多的行业之一,
医药领域也成了统计方法和理论发展的一个重要源泉。生物统计成了统计家族中的一大热门。此外,
美国的工业界,
如汽车工业、化学工业及电讯工业等都雇用了世界上最优秀的统计学家,他们对这些工业的发展起了重大作用。此外,
工商业、金融管理、市场和民意调查及各级政府同样大量地、普遍地和经常性地使用统计。
在应用统计发展的同时,
理论统计在美国也十分发达,
也有着不同程度的数学化问题,
随着环境与市场的变化,
统计的数学化在那里有起有落。
中国的实践
统计在中国的问题有其特殊性,
这也是中国国情造成的。50 年代初,
中国的体制及学科分类等基本上是照搬苏联的,
而在苏联, 本文所说的统计学被认为是资本主义的,
是受批判的。当时所提倡的“统计学”是“马克思列宁主义的统计学”。中国的文科“统计学”就是基于这个模式设定的,
它在我国改革开放实行市场经济之前对我国社会主义计划经济起了重大作用。但由于意识形态的原因,
我国的文科“统计学”在改革开放前和世界统计学的主流相脱节。而在另一方面,
西方意义的统计学在“概率统计”(包括“数理统计”)
的帽子下在数学系中存活了下来,
我国直到现在还沿用“概率统计”作为研究生的专业及协会名称;
这个“概率统计”一直受到世界统计界的影响,
并且曾大量地和我国工农业及科学实验相结合,
在困难的环境中解决了不少实际课题,
培养了大批优秀人才, 为国家作出了重要的贡献。“数理统计”被作为数学的一个分支划分为数学之下的“二级学科”,
这反映在1988 年出版的《中国大百科全书》的“数理统计”的定义中。我国“数理统计”过去长期以来生存于以纯数学占主导的数学系中,
这使得它本身很容易受到纯数学及国外部分人统计数学化的影响,
而同时又容易被应用部门把它等同于数学而产生误解。
我国文科“统计学”和“数理统计”在过去的一段时期中成为两个往来甚少的学科,
在国外十分具有活力的生物统计及其他应用统计学科在我国则长期处于很不被重视的地位。我国统计的这种状态使得中国本来可以应用统计和各个领域对统计基本不了解或者有误解,
使得统计的应用受到极大的限制。举例来说,
中国在医药领域几乎没有关于统计结论的立法; 中国ISO
9000 认证的统计部分没有得到真正实施(根本没有统计学家的参与)
;
中国工商业的不正之风使得质量控制不能很好实行。所有这一切都妨碍着中国统计的健康发展,
而统计的落后又严重妨碍着国民经济的发展。
目前中国统计科学的状态是否需要改变,
不是争论的焦点,
问题是如何改变。我希望我国统计界各方面尽可能地增进接触,
加深相互理解, 使我们有更多的共同语言, 更多的合作,
互相取长补短以增强我国统计在国民经济中的促进作用。令人欣慰的是,近几年随着改革开放的不断深入,
各方面的统计学家在教学、科研、人才等方面的交流不断加强,
情况越来越好。在这种气氛下, 出现“大统计”的设想是自然的。这对于在行政上或组织上为使中国统计和世界接轨有好处,
有利于促进统计科学在国民经济各领域发挥作用及统计本身的发展。应鼓励发表不同意见并善于聆听;
要心平气和,发扬民主;
要充分认识到问题的复杂性和多样性,
许多事情需要时间,
以求水到渠成。这里不存在以谁为基础的问题,
因为统计科学的理论基础和思想方法是世界各国统计工作者在长期实践中形成的,
不是行政手段所能决定的。人为因素只能暂时影响统计在中国的发展,
但不能决定统计科学本身的性质。一门科学的发展不可避免地要走弯路,
有发展也有淘汰, 只要社会进步, 经济发展,
中国统计科学的光明前途是可以预见的。
统计与数学
摘自:《北京统计》
数学是至今为止人类所创造的最丰富的而又最纯粹的逻辑体系,任何称得上
“科学”的体系都需要数学来描述其模型。纯粹数学和其他学科不同,它的基本思维方式是演绎,即从假设的模型或条件来推导出具体的结论。在确定的大前提或公理系统下,数学世界为仅有的存在绝对的“是”与
“非”的世界;其他学科的模型和我们所生活的现实世界则往往不存在绝对的
“对”与“错”。虽然人们从小就被告知“大灰狼”是
“坏蛋”,但是谁又能说狼吃羊是错误的呢?是非完全是人类思维的产物,其标准随时代、环境、族群、历史和宗教等许多因素而异。在纯粹的自然界中则绝对没有是非对错的。
并不是所有学科都能够如物理学那样用具有物理意义的数学模型来描述。注意,这里所提的物理意义和物理模型代表物理、化学、天文、地理、生物等科学所研究对象的内在规律,并不仅限于物理学本身。多数人文社会科学和许多自然科学中的现象并不能用具有物理意义的模型来描述;它们所应用的数学模型是从实际观测数据归纳而来的;模型中的参数即使能够用来解释事物之间的一些关系,也不像物理模型那么确定、精确和具有明确的物理解释。这里从数据到取得数学模型的过程称为归纳;而归纳是典型的统计学思维方式。统计学是迄今为止最完善的从数据中通过归纳取得数学模型的科学。它服务于几乎所有领域,但又不从属于任何具体的学科。只要有数据的地方,就有统计的用武之地。所以有人不无道理地建议把
“统计”改名为 “数据分析”。
要处理数据和得到数学模型,统计学和数学及计算机科学关系最密切;而在实践中又必须与那些和研究对象相关联的学科密切结合。统计可以按照不同的研究对象来分类,如生物统计、经济金融统计和人文社会统计等;而这些统计应用体系所共有的数学模型的产生和研究则往往被称为数理统计。而数理统计的分支则不一定按照对象,而往往按照理论和方法来归类,如多元分析,时间序列,贝叶斯统计,非参数统计等等。
统计与物理有很多相似之处。比如,它们的模型都可以根据数据来产生和验证,它们都是在否定旧模型中发展的。但是,在得不到数据的情况下,物理学家可以按照已经掌握的物理规律来提出假设;这在近代物理中是相当普遍的作法;反过来这些物理模型又与数学的发展相辅相成。当然,这些先验理论的最终被承认,一定要有实验结果的支持,否则仅仅是猜想而已。与此相反,统计学家在没有数据支持的情况下,一般不去假定全新的统计模型。只有崭新的数据结构才能推动新模型的产生及数理统计的发展。
综上所述,称统计为数学的一部分是不那么恰当的;即使数理统计也不能说是数学的一部分。而国内一些学者是把统计称为是经济学科的一部分,则是中国特有的与前苏联关联的国情所造成;读者可以从《苏联大百科全书》的统计学条款得到答案。虽然经济学非常需要大量的统计和数学,但前苏联的经济学中的统计学概念是其意识形态和计划经济体系的产物,其模型多属于小学数学水平,很难称为数学模型。该
“统计学”基本上应属于经济学的一个分支学派,不能称为目前国际流行意义上的统计学或统计学的分支。目前中国的统计已经和国际主流广泛接轨;一部分人愿意延续前苏联文科统计传统也未尝不可。
虽然学科的分类有其严肃的一面,但是,任何与数据打交道的人都可以称为统计学家。实际上绝大多数统计应用并不是有统计文凭的人实行的。任何懂得一些统计的实际工作者都可以利用统计软件包来解决有些已知的统计问题;当他们有自己解决不了的问题时,往往请教统计学家来帮忙。这也是推动统计理论、方法和相关软件发展的源泉。所以统计的“扫盲”很重要,即所有专业的本科都应把统计设为必修课。否则,不仅影响相关学科,而且统计学也不会发展。专业统计学家主要的责任是根据实际要求发展新模型、新的理论和新的方法;通常这些新的方法需要编制新的软件来为实际工作者所用。他们一般应该有较好的数学修养和计算机编程能力
(使用现成软件包对统计学家来说是不足为道的),最好还要懂得一些应用领域的内容。
在纯粹的数学世界之外,不存在完美的模型;统计模型当然不能例外。统计模型是根据某些数据而建立的,新的数据必然会改进原有的模型。而数据本身仅仅反映了我们所研究客体的某些方面,不可避免地有误差甚至会有其他干扰。数据和模型之间的关系在统计学中是一对永恒的互相约制、互相促进的两个重要因素。
统计的一个重要但又不易为人所理解的特点是统计从来不绝对地说
“是”或者 “不是”。统计只能够说可能,而且往往提供某事可能发生的概率。这其实并不是统计生性圆滑,而是实际世界的真实体现。真实世界充满了不确定性;从某种意义来说,生活中唯一确定的事情是其不确定性。也正是这些不确定性使得生活充满了魅力和迷人的色彩。有多少人会享受其未来每一时刻全部已经确定了的世界呢?统计结论的不确定性恰恰符合我们所生活的世界。
首页[1]末页
|