www.T1soft.com

 

首页 | 关于我们 | 软件产品与服务 | 解决方案 | 技术理论基础 | 成功案例和科研成果 | 动态和评述 | 联系我们 | 留言簿 

  

 

统计研究的国际动态与最新进展

国际统计学会第56届大会学术成果介绍
作者:蒋萍/金剑/熊友达  摘自:《中国统计学会》

 

  

  国际统计学会第56届大会于2007年8月22-29日在美丽的大西洋海滨城市、葡萄牙首都里斯本召开。来自120多个国家的近3000名代表参加这次世界统计盛会,中国统计界(不含港澳台地区)共有58名代表参加了这次大会。

  大会共收到论文摘要1710篇(其中有1380位注册人同时提交论文),有1200篇收录到大会论文集。大会论文分为特邀论文和投稿论文,其中特邀论文涉及94个主题,大致归纳为数理统计,经济、社会统计和官方统计,统计教育和统计应用四类;投稿论文又分为专题投稿论文和一般投稿论文,专题投稿论文共设40个主题,一般投稿论文设59个主题,无论专题投稿论文还是一般投稿论文,其研究主题可大致概括为统计史,数理统计理论和方法,经济、社会统计和官方统计,统计教育,统计应用等方面。中国代表共提交论文摘要100多篇(含港澳台地区),在全部投稿论文中占有一定的比重。

  本届论文论题范围极其广泛,研究与讨论的内容涉及到经济、社会和自然科学的各个方面,代表了统计科学的最高水平和最新动态,尤其是特邀论文的研究成果更具前瞻性、前沿性和代表性。本文选择特邀论文中最具代表的学术成果进行介绍,供广大国内统计同行学习与借鉴。

  一、数理统计研究方面的最新成果

  数理统计作为统计科学的一个重要部分,特别是随机过程和回归分析依然展现着古老理论的活力,一直受到统计界的重视并吸引着众多的研究者。本届大会也不例外。

  非参数和半参数回归模型吸引了许多代表的目光,其中美国数理统计学会主席范剑青,Horowitz Joel,Nielsen Jens Perch的研究最具代表性,他们主要研究了生存分析和经济计量学中的非参数和半参数回归模型。范剑青建议一种估计状态价格密度和金融衍生产品定价的新的半参数技术,这种方法建立在将非参数方法引入估计标准化状态变量的状态价格分布的物理模型基础上,被称为定价公式中的自动误差修正。实证研究显示,与其它定价模型相比,该方法在预测和避险能力方面表现出。Horowitz Joel研究了使用链接函数估计非参数可加回归模型的可加分量的问题。他的研究同时考虑了均值回归和分位数回归。研究表明,如果可加成份和链接函数是二阶可微的,那么可加成份可以使用概率论中的一维非参数点态收敛速度进行估计,且每一个可加成份的估计都是oracle有效的,不存在维数灾难问题。还表明在均值回归情况下,对于链接函数未知的情况,不存在渐近惩罚。Nielsen Jens Perch研究了对截断或删失数据使用降维信息和平尾转换的多变量密度估计。在简单的独立同分布变量情形下Buch-Kroman, Guillen, Linton and Nielsen (2007)建议多变量密度估计的非参数和半参数估计方法,并在某些情况下在尾部使用误差消除和方差减少技术对它们进行改进,从而变换核密度估计方法被扩展到多变量情形,并与半参数方法结合起来。Nielsen Jens Perch的研究得出了一种允许左截断右删失滤波数据情形下的类似方法,给出了建立在计数过程理论基础上的分布理论。使用不同水平的模拟滤波,这种方法被应用到与Buch-Kroman 等(2007)相同的数据库,结果证明新的滤波数据方法效果良好。

  关于半监督学习算法,学者Belkin Milkhail、Mease David和Seeger Matthias研究了半监督学习的原理、自我训练的半监督学习、以及半监督学习的分类系统。

  Mease David研究了使用基于随机森林的自我训练的半监督学习。自我训练是一种用于实施半监督学习的迭代程序。在每一次迭代中,用基础分类器将数据根据对分类标签所做的训练进行分类。每一点的权数是这些预测出来的分类标签信度测算的比例。由于使用随机森林可以得到比许多其它流行分类器更精确的分类概率估计,因此建议使用随机森林作为基础分类器。Seeger  Matthias建议了一种简单的半监督学习问题概率图模型分类系统。对于每一族方法,给出了一些算法的粗分类,并指出它们在文献中的具体实现;同时更详细地说明了使用投入依赖规则的方法族,并证明了它与合作训练范例相似。

  关于空间统计理论,学者Calder Catherine,Diggle Peter和Fuentes Montserrat报告了他们的最新研究成果。地质统计学涉及到空间连续模型对空间离散数据的拟合。传统的地质统计学方法假定,抽样是没有偏好的,即使当外部环境使得这一假定不可能时也是如此。Diggle Peter用一个理想的模型来描述不正确地假定抽样无偏好时的结果,说明了当拟合偏好抽样模型时可能遇到的困难,给出了两个已知为偏好抽样的环境监测的例子,并讨论可能的分析策略。风暴潮常常导致沿海地区居民的财产和生命损失,海洋模型对于实现沿海地区风暴潮的预测非常重要。传统海洋模型并不总能准确描述飓风的非对称性动态特征。为此,引入了一种新的贝叶斯多变量空间统计模型框架,将其与关于风场物理知识的数据结合起来,目的在于改进风矢量的估计。许多空间模型假定数据服从高斯分布,而这对于常常显示出不稳定行为的风场数据来说可能是过度约束的。Fuentes Montserrat为这些数据发展了一个半参数多变量空间数据模型,建立了飓风海面风场模型框架的多变量非参数贝叶斯空间模型框架。研究表明,对于飓风伊万的风场来说,与通常的贝叶斯-克里金方法相比,该半参数空间模型改进了预测效果。

  关于多尺度分析和提升问题,学者Jansen Maarten,Nunes Matthew和von sachs Rainer的研究最具代表性。Jansen Maarten研究了有转折点的光滑数据的边缘自适应提升。这是一种新奇的基于提升方法的非线性多尺度构造算法。经典的小波转换受到一些在实践中常常难以满足的假定条件的限制,解决这些问题的一个非常有效的方法是采用提升转换方式建立一个第二代小波。Nunes Matthew建议了一种自适应提升算法,描述了这一自适应技术的建立过程和特点,将这一方法与能够处理不规则数据的现行小波和非小波方法进行了比较,讨论了它在非参数回归中的应用,并给出了使用实际数据的例子。von sachs Raine回顾了著名的HAAR思想如何转换为成套的非均衡设计,这些设计创始了最近在非参数统计中的一些研究,包括一维和多维多尺度提升以及当出现结构突变时的非参数函数估计。尝试对提升给出更一般的解释;引导建立一种特殊类型的“第二代小波基”,生成一种非常广义的小波变换。由于多尺度提升方法论及其应用的文献在过去几年内激增,所以,该研究并未追求包括所有的内容。

  贝叶斯理论和实践是吸引代表注意力的另一个研究主题,Liseo Brunero、Silva Giovani L等研究者在这方面分别进行了介绍。Liseo Brunero考查了多变量偏正态分布的贝叶斯推断问题。多变量偏正态模型的经典推断常常遇到一些困难,并且对于估计和检验问题没有广泛令人满意的解决办法。在Celeux 等(2005)对多变量偏正态随机变量的随机表现进行研究的基础上,建议了一个一般的迭代重要性抽样方法,目的在于提供模型的一个全面的贝叶斯分析。这一方法可以被定义为弱信息量的,因为对于形状参数向量,使用接近实际参考先验的先验信息。该项研究使用了Chib (1995)的方法,提供了参数的全面后验分布的IIS近似,以及检验多变量正态或偏正态的贝叶斯因子的近似。对于过度分散的纵向空间相关二元数据,一般建议使用多层贝叶斯分析模型。Silva Giovani L研究了相关二元数据的时空层次模型。这一类模型在使用随机效应的基础上,解释了不同地区之间的相关性,并灵活模拟使用平滑样条得到的时空差异。

  贝叶斯推断的先验描述几乎总是不完备的。常用的方法是用公式表示一个与能得到的先验信息一致的、有方便函数形式的先验分布,如共轭先验分布。但这种先验表示可能显示出较差的稳健性,因此有必要采用先验的更稳健形式。Sweeting Trevor给出了已知部分先验信息情形下的稳健预期推断。研究集中于讨论以预测作为统计分析主要目标的情形,考虑了一个或更多未来观测的预测分布的先验稳健性。分析建立在由基本的对数得分规则产生的预测后悔值的相对熵指标基础上,从一组与给定先验信息一致的先验估计中选择最小化最大渐近后悔值的先验估计。这一方法的优势在于,无论仅仅考虑一个未来观测或许多未来观测的预测分布,都将得到相同的最小最大先验估计。报告了许多正态基础上模型的结果,包括一个正态层次模型,并说明了如何使用仿真计算方法得到最小最大先验估计。尽管没有考虑含糊先验信息,但是注意到最小最大先验估计可以从所有的连续非退化先验估计中推导出来。

  Nicholas Longford,Li-Chun Zhang 和Parthasarathi Lahiri 等研究者以美国等国家为例,尝试测算和报告了小范围估计的质量。Li-Chun Zhang研究了信息缺失情形下评价以行政记录为基础的小区域成分的问题。政府机构经常实施大样本调查,目的在于报告全国和一些重要的大区域内社会经济、卫生健康等方面的状况。Parthasarathi Lahiri认为,使用简单的随机抽样和一步聚类抽样设计,即使对于点估计量相当可靠的较大区域,传统的基于设计的方差估计量也可能高度不可靠。为理解大规模复杂抽样调查中不同方差估计量的行为,使用美国当前就业统计调查数据库设计了一个稳健的模拟实验,从一个真实的有限商业基层单位总体使用CES抽样设计生成样本,研究月度就业增长率,目的在于测算美国当前就业统计调查中小区域估计的测算质量,研究基于模型的小区域估计量标准误。模拟研究表明,月度就业增长率估计量基于设计的方差常常不稳定,即使在全国范围的行业水平上(此时样本能够得出良好的点估计)也是如此。还发展了一个新的线性经验贝叶斯方差估计量,并将其与现有的基于设计的方法进行比较。

  Paolo Giudici研究了金融数据挖掘问题,主要考察了运营风险管理的贝叶斯模型。过去的几年间,巴塞尔银行监管委员会发布了为战胜银行业组织面对的风险、尤其是营运风险(包括所有那些可能决定不能预期的损失的管理事件)必须做出的正确资本决策方面的建议。而对于银行业组织来说,有必要发展有效的统计模型来测算、预测以及减轻营运风险。Paolo Giudici比较了各种方法,提出了具体建议:采用贝叶斯模型,使质量专家的观点和数量损失数据紧密结合在一起。

 

  二、经济、社会统计和官方统计方面的最新研究成果

  虽然一直有学者试图将经济和社会统计排除在统计科学之外,但是经济和社会统计仍然在统计科学界占有不可替代的重要地位。与历届大会一样,在本届大会上,经济、社会统计和官方统计方面的研究是统计研究中的又一重要研究领域。

  关于统计标准和质量管理问题,学者Frank Nolan等研究了官方统计的内在标准和质量管理问题,目的是改善官方统计的公众信任度。新一届英国统计委员会的法定目标之一是促进和保证官方统计的质量、官方统计中好的做法和官方统计的全面性。其职能之一是,根据执业行为规范评价官方统计,目的在于识别出与国家统计局一致的实际做法。除与执业行为规范一致外,需要建立一套评价官方统计的原则和程序。评价程序应当是“风险导向”的,建立在现有质量保证程序之上,并要考虑到统计数据提供者的负担;透明性也很重要,评价的原则、程序和结果都应当公开。这将是一项具有挑战性的工作,还存在许多需要解决的问题。Marie Bohatá考察了欧洲统计实施规范对于质量标准的含义。统计机构程序和产品的质量是欧洲统计实施规范的核心。各国国家统计机构和欧盟统计局根据规范原则所作的自我评价得出了比较满意的结果。要全面完善这一自我规范工具,还将面临许多挑战。Peter Hackl建议通过标准化的程序和工具,降低成本,提高国家统计局的统计质量。为实现提供高质量统计产品和信息这一目标,奥地利国家统计局将其战略管理建立在全面质量管理(TQM)原则基础上。全面质量管理的概念覆盖了整个机构的所有质量方面,除产品质量外,还包括过程的质量、机构的效率、工作人员的胜任程度和工作动机,以及向数据使用者提供服务的质量。全面质量管理概念的核心是产品质量、顾客满意度、回答负担的降低和效率。为实施TQM战略,奥地利国家统计局开展了各种各样不同的项目以保证质量管理的所有方面都有所改进。这些项目包括为每一个统计产品书写标准的质量报告,安排反馈谈话以得到改善统计产品质量的建议,为工作人员开展综合培训项目,提供测算反馈负担的工具等。Marina Signore介绍了意大利国家统计局为保证产品、过程和管理等各方面的质量而采取的措施,并从质量标准的角度对意大利官方统计进行了评价。意大利官方统计的工作重点是制定标准、测量活动和上报结果。制定标准是为保证统计工作达到预期的质量,减少不必要的质量波动。意大利国家统计局为实现特定调查阶段或程序的标准化提供了工具,包括实施调查操作的指导方针和最佳做法手册。测量活动对于改善统计工作质量来说至关重要,因此涉及这一机构的所有活动都应当进行测量,从传统过程测量(如质量指标)到计划和监控过程测量,或到意大利国家统计局监管委员会评价过程的测量。各种不同类型的测量可以通过不同的监测系统实现。最近开展的内部质量审计活动也可以看作是改进统计质量的高级测量工具。报告活动同时面向统计系统内部用户和数据使用者。内部报告以上述测量活动为基础,提交给意大利国家统计局的领导阶层,目的是为不同层次的管理者提供支持决策过程的信息库。意大利国家统计局同时注意与数据使用者的沟通,并为此采取了一定措施,通过各种渠道发布统计信息的同时将相关的质量检验指标发布出去以接受公众检验。

  在联合国统计委员会指导下,在世界五个主要国际组织和各国国家统计局努力下,目前正在进行的 1993SNA修订工作运行良好,预计2008年发布。修订的目标包括:(1)加强SNA的理论研究,强调基本概念;(2)更新SNA,使其能够反映近些年的一些重要经济发展;(3)改进和提高SNA与当前经济政策和分析问题的相关性。Landefeld J Steven回顾了这三方面的目标,并提供了一套从概念上来说更为可靠的账户(这套账户能够为经济决策者提供精确的相关信息)的例子。Linacre Susan使用广义的社会统计定义,研究社会统计各子领域的统计标准发展现状,从社会统计相关框架和标准的现状出发,考察到目前为止哪些方面做得比较好,提出了一些可用于改善当前工作并将其扩展到新领域的机制,并分析了当前社会统计的国际标准面临的挑战。这些挑战包括:参与者的多样性,许多概念如贫困和财富的多维特性,经济与社会概念的相互关系,需要考虑为不同的数据收集方法发展相应的标准等。

  关于生产率增长与测算问题,作为经济增长的根本来源,生产率增长是当前许多国家和国际组织关注的焦点之一。本届大会期间, Carlos Coimbra比较了 1960至2005年G7国家的全要素生产率增长对这些国家经济增长的贡献。他使用21个OECD国家的面板数据,通过贝叶斯统计方法计算出来一个动态超越对数随机生产边界。根据Carlos Coimbra的研究,这些国家的实际GDP增长率被分解为TFP与资本和劳动投入积累的贡献,TFP又被分解为效率提高和技术进步两部分。研究结果显示,上个世纪70年代之后, G7国家的TFP对经济增长的平均贡献有相当程度的下降,日本表现得尤其明显。加拿大和美国未显示出这一特征。实际上,九十年代中期以来美国TFP对经济增长的贡献完全依赖于技术进步而不是效率提高。OECD关于生产率测算问题的研究一直处于相关理论研究的前沿,因此,Enrico Giovannini关于OECD生产率增长测算的介绍吸引了众多代表的关注。 他给出了编篡生产率增长和生产率水平数据的基本原理,描述了可以从OECD生产率数据库得到哪些生产率指标、它们如何实现、能够从哪里得到进一步的信息等。2007年3月,欧盟发布了KLEMS生产率增长和生产率账户。这些账户反映欧盟成员国自1970年以来行业水平的产出增长、就业和技能创造、资本形成和多要素生产率指标。Bart van Ark对欧盟KLEMS生产率增长和生产率账户做了综合的概括性介绍。他首先讨论了数据库和变量的主要特征、国家和行业覆盖情况;然后回顾了增长核算方法论,包括劳动和资本服务的测算方法论;最后给出了对主要趋势的简短分析。

  关于金融服务产出的测算问题,学者Marshall Reinsdorf,Triono Widodo,Kil-Hyo AHN和Puntharik Supaarmorakul 等以泰国和韩国等国家为例了研究。他们认为,近些年许多国家采用了一种测算商业银行产出在其GDP账户中所占比重的参照比率法,从而很自然地想知道,是什么理论支持这一新的方法,我们能够从中学到哪些以前不知道的知识?参照比率是用来分别估计存款人和贷款人未明确定价的金融服务消费的指标。虽然1993SNA提供了测算FISIM(间接测算的金融中介服务)的基本原理,但参照比率法的概念框架来自金融服务价格的使用者成本理论。Marshall Reinsdorf对国民经济核算中这一银行服务产出测算方法进行了研究。Triono Widodo研究了印度尼西亚的银行中介服务业测算情况。印度尼西亚银行长期以来一直与印度尼西亚国家统计局合作,把金融服务产业作为GDP测算的一部分。最初采用1968SNA建议的方法,称为虚拟银行服务费(IBSC)法。然而随着时间的推移,随着1998年经济危机的到来和更灵活汇率的采用,出现了大量的问题,该方法不能够解决由于汇率变化和商业银行资产负债表结构变化、以及大量的负利率扩散导致的大量重估价问题。这促使印度尼西亚采用了1993SNA建议的间接测算的金融中介服务法,为的是方便不同国家的比较和更好地反映银行中介功能。同时,印度尼西亚还尝试采用加拿大的FISIM法,效果也不明显。最后,为致力于解决资产负债表结构变化问题,印度尼西亚采用了自称为“金融中介服务专门测算法”的方法,对利息收入求平均,但SBI和GDN利率未包括在内。Kil-Hyo AHN考察了韩国FISIM计算和分配过程中的一些实际问题。一般来说,生产FISIM的金融工具仅限于贷款和存款,但在韩国认为,金融机构(FI)发行的债券对于它们的购买者来说具有与定期存款相类似的特征,债券参与FISIM的生产和分配过程。也就是说,在韩国,有三个类别的金融机构­——S.122、 S.123 和S.124(金融附属机构)被视作生产FISIM。一般来说,S.124不涉及金融中介服务。但在韩国,证券公司(S.124)为其顾客开立账户并提供存贷款服务,这一活动被认为生产了FISIM。三种不同的参照利率分别被应用到金融机构的这三个子部门中,据以计算出FISIM。从产品质量来看,分机构部门的FISIM数据质量良好,但是由于缺乏分行业存款数据资料,分行业FISIM数据的提供到目前为止并不令人满意。

  金融服务构成金融中介的产出。为补偿营业成本和可能发生的风险,金融中介机构需要收费。对金融服务收取的费用可能以明确或不明确定价的形式提供。因为有助于反映金融企业的全部增加值和得到更精确的GDP水平,不明确定价的金融服务或间接测算的金融中介服务的正确分配被看作国民经济账户编纂方面的改进。Puntharik Supaarmorakul研究了泰国金融服务业中介服务的间接测算问题。他首先讨论主要建立在1993SNA基础上的FISIM概念,以及泰国由金融中介提供的未明确定价的金融服务的估价;还讨论了1993SNA建议的、并被其它国家使用的方法,以及这些方法是否可以应用到泰国的FISIM编纂中;为得到不变价FISIM数据序列,讨论了如何使用不同的缩减因子、以及使用单个或多个缩减因子对FISIM结果的影响等问题。

  关于金融账户的流量和存量测算问题,学者Luigi Federico Signorini,Leon Taub和Reimund Mink作了相当广泛的研究。Luigi Federico Signorini考查了金融账户中微小企业的价值测算问题。根据普查数据,在意大利,四百万非金融企业中大约有三百四十万是独资非法人微小企业。这些企业的就业占全部非金融部门就业的近一半,在意大利经济活动中占有相当大的比重。然而,直接统计资料(如资产负债表)的不可获得性使得对这些微小企业价值的测算成为一项需要一些技巧的工作。根据国际统计标准及相关记账原则,该价值应当出现在金融账户中:对于住户部门来说,它是住户部门“股利和其它权益”的资产;对于非金融企业部门来说,它是相应的负债。然而,由于“股利和其它权益”难以估计,因此,在大部分国家公布的数据中将其忽略掉了。为(部分地)填补意大利的这一缺口,在意大利银行实施的家庭收入和财富调查(该调查包含了住户在所有类型企业持有的权益)基础上建议了一种估计微小企业价值的方法。使用微小企业的微观数据估计金融账户带来了概念、统计和实践方面的问题。对于这些问题,主要讨论了无回答和瞒报行为的定义和处理方法。

  关于金融稳定性问题,国际货币基金组织对金融稳定性问题进行了大量研究。本届大会上,Armida San Jose介绍了IMF在金融稳定性指标方面所做的工作;Natacha Valla研究了银行流动性、宏观经济和金融稳定性之间的关系;Paolo Poloni则对ECB和IMF金融部门金融稳定性指标方法进行了比较。IMF方法为国内控制跨领域监管方法,而大部分欧盟国家更青睐的、并将通过ECB/BSC收集到的数据应用其中的方法是国内控制跨领域跨部门的监管方法(DCCBS)。由于后者与国家监管实践和标准相对应,所以,用这种方法编纂金融稳健性指标(FSI)几乎不要求任何其它资料来源。此外,对金融脆弱性监管来说,DCCBS被认为是更恰当的方法。在ECB方法下,采用共同货币(或者从欧盟的角度,单一市场的建立)被认为是连接欧洲范围内银行(和市场)运行的主要渠道。Paolo Poloni还研究了IMF和ECB/BSC方法的潜在契合领域。

  关于城市、地区和人口迁移研究的新方法,学者Xu Doeve Willian LJ认为 许多国家,无论发达国家或发展中国家,都经历过提供及时可靠的国内和国际移民流量和存量规模及趋势信息方面的巨大困难。从方法论的角度看,仍然存在相当的不明确性:  (1)使用哪一个来源的数据最好,(2)如何对移民数据进行最佳描述,(3)移民流量和存量及其随时间推移的动态变化的测算方法。在2006年出版的《测算国内和国际迁移的方法》基础上,给出了致力于解决这些问题的新的人口统计学测算方法,并说明了其方法论如何可靠,统计上如何可行。

  关于绿色GDP的研究问题,在当前国际社会越来越认识到环境保护问题重要性的背景下,许多国家和国际组织开始着手绿色GDP的研究、或通过绿化国民经济账户实现这一目标。但是,从客观性、经济性、可操作性等角度考虑,各国究竟应该开展全面的绿色GDP研究,还是应该在现有SNA体系基础上,通过绿化国民经济账户实现既定目标?为解答这一问题,Peter Van de Ven和Giles Atkinson 等人向代表们展示了绿色GDP和绿化国民经济账户领域研究的最新进展以及面临的挑战。

 

  三、统计教育方面的最新研究成果

  统计教育是统计事业生生不息的前提和基本保证,关于统计教育的研究也是统计科学研究不可或缺的重要领域之一。在本届大会上,Penelope Bidgood、Carmen Batanero等发表了他们在统计教育方面的独到见解。英国政府正在主编一项名为MEC(数学加强课程)的行动,目的是为学过一些数学或统计学知识的、有志于从事统计学或数学教学工作的其它专业毕业生如心理学或工商管理专业学生提供培训。除发展学生的技能和对统计概念的理解外,MEC的一个主要目的是将科目知识与教学方法结合起来。实际上,课程参与者在这个课程班中主要做两件事:学习更多的统计学,经历大量各种各样的教育和学习实践,帮助他们变成称职的教师。研究主要讨论了其中的两个方面,即发展合适的教学大纲和教学方法,评价这一类课程的教学过程可以采用的方法。Carmen Batanero的研究首先提出,无论对于以后将从事统计学教学工作的人,还是对于未来的官方统计工作人员,进行一些必要的训练都很重要;接下来他假定未来的统计工作者非常熟悉相关理论和应用统计知识,考查他们需要什么样合适的教育策略;最后给出并分析了面向统计工作人员的统计教育课程中使用的一些案例。案例回顾了十多年以前就开始开设统计教育选修课程的Granada大学的经历,鼓励大学里组织类似课程,无论作为官方本科教育项目还是在研究生教育中都是如此。

  中国代表团的张仲梁介绍了中国采用因特网方式向大量数据使用者提供一般性官方统计培训的情况。中国政府统计系统在过去的二十年间建立了一个庞大的对统计工作者进行继续教育的网络,网络的核心支撑是音频视频课程班以及分布在全国各地的培训中心。每年有许许多多政府统计工作者通过继续教育网络参与各种形式的培训。但是,随着因特网和现代通讯技术的发展,音频视频教育的吸引力和影响力变得越来越弱。为应对这一挑战,中国政府统计系统的继续教育机构创建了一个从主要依靠音频视频方式向因特网教育的转换项目。在这种方式下,统计工作者可以灵活利用时间和空间进行学习,结合自己的学习基础学习,改革学习方式等。

  除以上研究者外,Andrew Zieffler,Joachim Engel和Nicolas Christou研究了模拟在统计和概率教学中的应用,以及如何讲授统计推理;Marie-Christine Ponsonnet,Giulio Ghellini等报告了调查统计的教学问题;Iddo Gal,Mary Townsend和Paul Fields研究了在当前互联网络发达的背景下,如何充分利用因特网资源开展统计教育的问题;Pali Lehohla等以南非国家为例说明了当前统计教育面临的困难和挑战;Don Royce介绍了加拿大的调查统计人员培训情况;James Brown介绍了来自MSC官方统计项目的经验;Gad Nathan则指出,统计部门和学术研究机构的合作在官方统计教育中起着重要的基础作用。

四、统计应用方面的最新研究成果

  统计作为认识社会的有力工具,几乎可以应用于社会生活的各个方面。

  统计的最广泛应用领域之一是经济领域。中国代表团的王惠文研究了流量数据的三方向符号主元分析及其在期货市场数据的应用。在一类特殊的流量数据中,每一个样本有一个生命区间,不同的数据有不同的产生时间,不能够在研究时期内连续观测。为解决这一问题,根据一些相对比较稳定的属性,样本被分为性质相对规律的几类,随着时间的推移,在每一时间点上会进入和退出一定的数据。然后,每一类数据的变化范围被表示为实区间数据,其变化规律和发展趋势通过三方向符号主元分析得到。作为一个案例,通过形成未来合同的连续时间序列,王惠文将这一方法应用到中国大豆期货市场,结果显示,较传统方法相比,该方法可以更全面地分析与描述系统状态的动态规律和趋势。

  统计在医学领域的应用也相当广泛。在本届大会上,Chen Yi-Hau,David Clayton和Goncalo Abecasis等介绍了遗传流行病学统计方法的最新进展情况;Chen Yi-Hau给出了基于单体型的病例对照研究的回顾;Nilanjan Chatterjee给出了半参数方法在相关领域的应用。目前大部分研究者或者在同一时间、或者在通过基因组的邻接定义的小群体范围内检验遗传学多态性出现的方式,但研究过程产生很小的效果,却要求大的样本规模来展示置信水平的显著性。有些基因学家认为,多样的基因将以复杂的方式交互作用,较小的边际效果可以反映较大的交互作用。为此,David Clayton讨论了允许基因-基因型交互作用的检验,考察了对多种检验进行过恰当修正后的结果。相关物种间许多表现型的变化或反应是由于基因表达式差异,多种物种的时间序列基因表达数据对于标志分歧和收敛相关物种间的基因组特征是一个有用的平台。Keles Sunduz在聚类、网络建设和基因组丰富程度分析环境下,从比较基因组学的基本理论入手,探讨了多物种基因分析中的统计问题,研究了这一高维问题的统计模型。先天性畸形是在胚胎或胎儿时期形成的人体结构或功能缺陷,其病原学是异质的,包括遗传的、染色体的、身体的、传染性的或生物化学的因素,以及环境因素。EUROCAT的研究表明,50-60% 先天性畸形的确切原因未知。Nunes Matthew根据葡萄牙的先天性畸形登记记录,使用一些专用的统计方法如空间统计和时间序列模型来识别、描述和理解这些疾病发生的空间和时态模式,识别可能影响出生缺陷率的解释变量或因素。

  统计学在气象学和气候研究方面也已经有了非常广泛的应用。本届大会对统计学在气象学方面的应用进行前沿研究的有Ana Cristina Costa,Elizabeth Shamseldin和John Haslett等人。Stephan Sain,Pedro Miranda和Myles Allen等还利用概率知识研究了气候统计的一些相关问题。

  此外,Gordon Bell,Leonard Roseman研究了市场营销中的实验设计,Martin Koschat考查了当前统计所面临的机遇和挑战等。

 

  四、丁伯根奖得主的最新研究成果

  本届大会特邀论文的另一大亮点是丁伯根奖得主论文。共有三位获奖者同与会代表分享他们的研究成果。其中Caio Lucidius Naberezny Azevedo考查了多层隐类分布Rasch模型的贝叶斯估计,Lishamol Tomy Muthirakalayil研究了具有高斯和非高斯混合边际的自回归过程,Archana V则对改进的有限总体方差系数估计量进行了探讨。

  在Caio Lucidius Naberezny Azevedo的研究中,给定未观测到的潜在特征和每一时期的增广数据,给出了一个基于条件期望估价的EM算法来拟合IRT Rasch模型。应用这一拟合方法,潜在特征分布可以通过一个自由度未知的T分布来描述。Caio Lucidius Naberezny Azevedo实施了这一模拟研究,以评价这一估计方法的精确性。结果表明,这一方法得出比较好的估计结果,同时,当总体T分布是潜在特征行为的基础时,Rasch模型是关于正态潜在特征分布稳健的。Lishamol Tomy Muthirakalayil考查了具有高斯和非高斯混合边际的自回归过程,介绍了具有正态拉普拉斯平稳边际分布的一阶自回归过程即NLAR(1)。NLAR(1)是对一般情形的进一步扩展。两种过程都第一次给出高斯和非高斯时间序列模型并避免了零缺陷问题。Lishamol Tomy Muthirakalayil对样本路径特征进行了模拟研究,研究了过程的回归行为,同时考虑了推断方面;最后,结果被扩展到一个更大类的、具有广泛应用的分布即广义正态 -拉普拉斯分布。这些模型在各种不同的环境中都有应用,如金融模型、基因微阵表达模型、通信工程、天体物理学、生长-衰变分析、强度干涉模型等。Archana V研究了改进的有限总体方差系数估计量。方差系数广泛应用于许多科学调查和社会调查。尽管人们已经在无限总体模型方差方面做了大量工作,它在有限总体中却常常被忽略,而方差系数的许多应用涉及到有限总体。这促使研究者在回归估计量基础上提出6个新的总体方差系数估计量。提出的其中三个估计量是稳定变量方差系数回归估计量,其它的三个估计量利用了总体均值和方差回归估计量来估计稳定变量的总体方差系数。对于简单随机抽样设计,推导了这三个估计量的偏差和均方误差。研究过程还使用两个实际生活数据集对这些估计量的表现进行比较。模拟过程显示,其中的四个估计量表现得比通常的估计量即样本方差系数要好,其中使用关于总体方差系数的信息得到的回归估计量表现最好。

 

  五、几点认识与体会

  1、社会经济统计类研究成果是本届大会学术交流的主旋律。反映出统计研究贴近社会、注重应用的取向。本届大会特邀论文共分94个专题,其中约近四成的专题与社会经济统计有关,在全部专题中占有相当大的比重。另外,从国际统计学会的组成结构也可以反映出,社会经济统计越来越受到国际社会的重视。国际统计学会共有7个分会:贝努力数理统计与概率学会、国际统计计算协会、国际官方统计协会、国际调查统计学家协会、国际统计教育协会、国际工商统计学会、欧文费雪货币与金融统计委员会(或称中央银行统计的欧文费雪委员会)。从这7个分会的研究领域可以看出,与社会经济统计研究有关的分会有国际官方统计协会、国际工商统计学会、欧文费雪货币与金融统计委员会。在国际统计学会分会中占有较大比重。在我国,从事社会经济统计研究的学者或多或少有些自卑感,社会上似乎存在着“社会经济统计不是国际上统计研究的主流方向”的观点。事实上,国际上关于社会经济统计的研究一直是统计研究的重要内容,特别是在1985年国际统计学会第45届大会上,国际官方统计协会正式成立以来,社会经济统计研究的范围更广,群体更加明确,重心更加突出。国际官方统计协会的成立是社会经济统计研究国际认可的重要标志。

  2、工商统计成为统计研究的新亮点。在2005年国际统计学会第55届大会上,国际工商统计学会正式成立,这标志着国际上对工业统计、商务统计等中观问题的研究提到了议事日程。国际工商统计学会的目的是:(1)促进商务统计、金融统计和工业统计知识的提高与交流。(2)为商务统计、金融统计、工业统计学家与用户建立国际合作的平台。(3)通过国际会议、国际研讨会、出版物交换思想与信息。(4)鼓励发展中国家和发达国家统计学家的联系。(5)发展国家级、地区级商务统计、金融统计、工业统计学会或团体,并促进他们之间的联系。在我国,曾经是中国强项的“部门统计”,在高校改革的浪潮中,不仅专业被取消,课程在大多数学校也被取消。致使现在仍然坚持进行工商统计研究的专家学者相对较少。国际工商统计学会自成立以来开展了若干项活动,中国学者或实际工作者很少参加。

  3、货币与金融统计脱颖为国际统计研究的新领域。为了适应金融改革与创新带来的统计改革,在2003.8.13-8.18的国际统计学会大会上,成立了欧文费雪货币与金融统计委员会(或称中央银行统计的欧文费雪委员会),该分会是一个转型期的临时分会。考虑到该分会进一步发展的需要,在2005.4悉尼召开的国际统计学会第55届大会上又宣布,在不定期内保留该临时性分会。欧文费雪货币与金融统计委员会的目的是促进中央银行的经济学家、统计学家和对中央银行统计感兴趣的其他人员(包括研究经济问题、货币与金融稳定性人员)之间的交流。它特别强调统计资料编制人员之间的联系,强调统计信息用户(包括中央银行内部用户和外部用户)与统计信息分析人员(包括中央银行内部的分析人员与外部的分析人员)的联系。

  4、统计方法的创新与应用达到了一个新的层次与高度。贝努力数理统计与概率学会(成立于1975年)、国际统计计算协会(成立于1977年)、国际调查统计学家协会(成立于1973年)是成立最早的三个国际统计学会分会,也是与统计方法论研究关系最为密切的三个分会。通过本届大会特邀论文可以看出,国际上统计方法的创新和应用都达到了一个新的水准和层次。如美国的劳登布什、英国的高登斯坦因等关于复合数据处理技术方面的研究。再比如,统计调查的仿真研究,这是一种节约统计实践成本的好途径,会上不少商家争相推介他们的统计仿真软件,令代表们大开眼界。相比之下,我国在这方面的研究严重低于国际水准。中国不仅存在社会经济统计领域的研究低于国际水准的问题,数理统计领域等方法论方面的研究问题更为严重。而且,从中国代表团参会人员的结构可以看出,从事社会经济统计研究的人员较多,从事数理统计研究的人员较少。虽然中国代表团提交的论文质量与国际同行还有一定的距离,但这种勇于参与国际讨论、希望提升自我、渴望了解国外先进做法的积极性值得提倡。

 

  

首页[1]末页

 

版权所有 ©2003 中国人民大学统计数据库研究室