www.T1soft.com

 

首页 | 关于我们 | 软件产品与服务 | 解决方案 | 技术理论基础 | 成功案例和科研成果 | 动态和评述 | 联系我们 | 留言簿 

  

 

构筑“云计算”时代的统计信息系统

作者:郑紫峰 摘自:《孝感统计信息网》

 

 

 

  2008年6月24日,IBM在北京IBM中国创新中心隆重举行了以“携手云端•创新未来”为主题的IBM大中华区云计算中心启动仪式。IBM宣布建立IBM大中华区云计算中心,该中心将帮助大中华地区的客户设计和部署自己的云计算设施和程序。实际上这并不是在中国的第一个云计算中心,早在今年的早些时候IBM就已经在中国无锡太湖新城科教产业园建立了第一个中国商业云计算中心。这些云计算中心的建立预示着计算技术已经开始由网络计算时代进入云计算时代,一种新的计算技术正开始迅速兴起。

  毫无疑问,云计算技术将在不久的将来全面替代现有的计算模式,这对于我们的统计信息系统将是一次新一轮的机遇和挑战。那么什么是“云计算”?云计算能为我们统计信息系统带来什么样的好处和帮助?在云计算时代来临之前我们的统计信息系统又该做好哪些准备呢?本文将就这些问题做一些简要的阐述,籍此与统计系统的同仁们交流云计算技术的相关知识,以提高我们的业务能力和水平。

 

  一、了解“云计算”技术

  首先,云计算(cloud computing)是一种新兴的共享基础架构的方法,云计算的基本原理是:通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,数据中心的运行将更与互联网相似,使得中心能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。更进一步的理解是,云计算是分布式计算技术的一种,其最基本的概念是:透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户。透过这项技术,网络服务提供者可以在数秒之内,达成处理数以千万计甚至亿计的信息,达到和“超级计算机”同样强大效能的网络服务。

  这是一种革命性的举措,打个比方,这就好比是从古老的单台发电机模式转向了电网集中供电的模式。它意味着计算能力也可以作为一种商品进行流通,就像煤气、水电一样,取用方便,费用低廉。最大的不同在于,它是通过互联网进行传输的。在云计算模式下,互联网对于用户不再只是一个传输手段,而是具有无数个处理和存储单元的的计算机系统。这个计算机系统无比庞大,其上为用户服务的主机系统就像量子物理中的“电子云”(Electron Cloud)一般,具有弥漫性、无所不在的分布性和社会性特征。量子物理上的“电子云(electron cloud)”是指在原子核周围运动的电子不是一个经验世界的轨道,例如像天体一样的运行轨道,而是弥漫空间的、云状的存在。描述电子的运动不是牛顿经典力学而是一个概率分布的密度函数,用薛定谔波动方程来描述,特定的时间内粒子位于某个位置的概率有多大,这跟经典力学的提法完全不同。

  电子云具有概然性、弥漫性、同时性等特征,云计算具有与之相似的特点。前几年IBM就提出所谓“无处不在的计算”(Ubiquitous)的概念,云计算正是这一概念的实现和发展。云计算是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的具体实现

 

  二、“云计算”将给统计信息系统带来什么样好处和帮助?

  目前,PC和服务器依然是我们数据处理的核心工具——我们用PC处理文档、存储资料,然后通过电子邮件、U盘、服务器交换信息。但是如果PC或服务器硬件损坏,我们就会因为资料丢失而束手无策,大多数时候计算资源是靠人来调度的。而在“云计算”时代,“云”会替我们做存储和计算的工作。“云”就是计算机群,每一群包括了几十万台、甚至上百万台计算机。“云”的好处还在于,其中的计算机可以随时更新,保证“云”长生不老。目前Google拥有好几个这样的“云”,其他IT巨头,如微软、雅虎、亚马逊(Amazon)也有或正在建设这样的“云”。一般来说云计算可以为我们提供如下的好处和帮助:

  1. 高性价比:云计算系统具有比现在集中式系统更好的性能价格比。我们计算中心不再需要花费巨额的费用就能获得高效能计算。

  2. 高协同性:多数应用本身可以是分布式的。同一任务的各协作部门不必在同一个地方,从而使协同性大大提高。

  3. 高可靠性:冗余不仅是生物进化的必要条件,而且也是信息技术所必须的。云计算系统具有高度容错机制,由于计算和存储是交由“计算云”去完成,而“计算云”本身是高度的弹性系统,具有无可比拟的冗余性能。

  4. 高可扩展性:买一台性能更高的大型机,或者再买一台性能相同的大型机的费用都比添加几十台PC的费用高得多。云计算时代不再需要对高性能计算机的追求,分布计算技术可以将巨大的计算任务化整为零, “计算云”可以随时低成本的无限扩展。

  5. 高度灵活性:能够兼容不同硬件厂商的产品,兼容低配置机器和外设而获得高性能计算。

  6. 高度自治性:通过自动化配置管理服务,可以按需自动调配服务,以及根据需要自动增加、减少服务的数量。IBM开发“蓝云”的目标也是基于此——该平台可以根据需要动态的提供、配置、再配置和解除提供的云应用服务。而从计算平台的角度来说,云计算的目标是解决超大规模数据中心的分布式计算的问题。

 

  三、展望未来的“云计算”模式

  现阶段,随着统计信息的不断发展,数据也变得越来越臃肿,“计算与数据”跷跷板式的平衡已发生变化,即已经到了“移动计算要比移动数据要便宜的多(Moving computation is cheaper than moving data)”的地步。用经济的眼光看,这些臃肿的数据应该被固定下来。云计算可以让计算流动的特性正是解决这一矛盾的有效方法。

  云计算的蓝图已经呼之欲出:在未来,只需要一台笔记本或者一个手机,就可以通过网络服务来实现我们需要的一切,甚至包括超级计算这样的任务。从这个角度而言,最终用户才是云计算的真正拥有者。这不是夸夸其谈也不是要颠覆传统,云计算技术最终会将全球的计算机系统组织成一个统一的云计算系统。在这一过程中,我们将不会扔掉已有的硬件、设备和软件,它们会被更高效的组织利用起来,也不会像以往一样无休止的追求新的计算机性能。在未来,或许你手里移动电话中的CPU也会加入到气象计算和火星计划这样的任务中来。

  与其它一切伟大事物的出现一样,云计算发展的道路必然是艰难曲折的,或许会受到现有主要计算机利益阵营的抵制,但我们坚信前景是无比光明的,她是计算技术的一次革命和突破,她不仅将网络上的计算机紧密联系起来,更重要的是将计算者的智力资源也紧密的联合起来。届时她将裹挟一大批全新的软件和硬件汹涌而至,浩浩汤汤。优秀数据处理技术将成为漂浮在虚拟空间中的一朵朵彩云,技术越好云朵会越大、越美。任何人都可能成为“布云者”,同样也可以是收益者。云计算时代拥有超级计算机这样的运算“航母”不再是必须的,分布式的联合运算成为最普遍的计算方法。计算可以被计量和传递,任何人都可以使用任何所需的计算,计算将成为超市里的商品任由消费者选择。要完全实现这一愿景,我们的统计信息系统必须在各方面做好足够的准备,才可以在云计算时代到来之时顺利步入云端,以致云中漫步。就如一首歌中唱到的“如果可以飞檐走壁找到你,爱的委屈不必澄清,只要你将我抱紧,如果云知道……”

 

 

   

 首页[1]末页

 

版权所有 ©2003 中国人民大学统计数据库研究室