中国数据中心市场在规模不断扩大的同时,正由野蛮生长迈向精耕细作,对运维管理的重视度与日俱增。另一方面,传统行业的数字化转型、物联网在工业领域的应用将带来远超以往的数据量,这也对数据中心的运维管理提出了更高的要求。
ZNV中兴力维4月下旬发布了最新一版的智慧数据中心综合管理系统——维统管2.1。与传统数据中心基础设施管理系统(DCIM)相比,其最主要差别就在于创新性地引入大数据技术,以此来打破数据库桎梏、支持秒级的高密度数据采集,带来更高效、更精准、更实时的管理,数据中心业主及运营者亦能藉此延展出更多新业务。
ZNV中兴力维CTO曹友盛博士
“当DCIM遇上大数据,维统管2.1将为一路向前的数据中心产业加载更高速发展的引擎。”ZNV中兴力维CTO曹友盛博士向C114表示。曹博士是图像处理、信号传输方面的专家,尤其在大数据智能管理方面具有很深造诣。
他旗帜鲜明地指出,大数据的应用是数据中心智能化运维的基础,同时亦符合产业由IT信息技术向DT数据技术发展的趋势。维统管2.1是DCIM领域第一款也是唯一一款以大数据来驱动的产品,力维希望以此来解决数据中心现存的一些痛点、面向未来做好准备,带来真正的价值。
第一家将大数据引入DCIM
随着物理世界与数字世界融合进程不断加快,越来越多企业将业务迁往云端,数据中心的地位不断增强。以电信行业为例,在以NFV/SDN为代表的新一代网络技术驱动下,未来的电信网络将彻底转型为“以数据中心为中心”的架构,所有的网络功能和业务应用都将运行在云数据中心上。
与此同时,正如百年前电气化进程带来的发电量突飞猛进一般,人类迈向智能社会的进程中所产生的数据量亦呈几何式增长,特别是当物联网在工业领域的应用达到一定规模。IDC预计,未来全球数据总量的年复合增长率将达到50%,到2020年产生的数据量将超过40ZB,相当于地球上每个人产生5200GB的数据;还有厂商调研分析认为,到2025年全球产生并存储的数据量将达到180ZB,相较2010年增长150倍。
“我们这个时代正从互联网时代转向物联网时代,信息交互变为数据交互,传感器取代传统面向个人的手机、电脑。力维认为,未来每年所产生的数据中将有80%以上来自物联网,而工业物联网所产生的数据量将远远大于消费者物联网。”曹博士指出,这既为大数据的广泛应用奠定了基础,同时也将深刻影响并改变数据中心的运维管理模式,传统的工具、手段逐渐难以为继。
一方面,传统DCIM受限于数据库,无法存储蜂拥而来的数据,采集到的数据量、反应的速度均不能尽如人意,由此作出的决策也缺乏足够的真实性支撑;另一方面,大多数数据中心的预警、告警、检测等运维功能彼此孤立,以往没有手段将一个个“烟囱”中的数据进行比对,数据多样性有限,带来的价值也有限。
“现在的DCIM每小时采集一次数据,很难形成连续思维,要想真正了解数据中心,必须将采集密度加速到每秒——这意味着过去一年数据库爆满一次,现在每天就要爆满十次。”维统管2.1将整套功能软件架设在大数据技术框架上,一改以往“数据采集、传输、存储到数据库,有需求再调用”的流程,数据获取、存取、搜索、分析都在大数据引擎中执行,以事件流的形式来呈现,其作用相当于电脑的内存。
具体而言,采用维统管2.1,实时数据、报警上报只须1秒,并可及时发现、处理故障,数据采集每秒300万;基于事件流驱动的规范化管理,可以大大缩短响应时间、操作员秒变专家,令效率提升50%以上;云端接入,支持专家远程诊断,快速定位、处理问题;同时千亿条数据秒级搜索的“快”,使得海量数据的实时分析成为可能。
从PUE值优化看维统管2.1深层次价值
基于大数据引擎的维统管2.1赋予了DCIM新的意义,由此掀起了一场产业革命。除了在软件架构、存储密度、读取速度、数据安全上有着天然的优势外,其更深层次的价值在于大数据的数据分析,包括响应型分析、实时数据诊断、海量预测分析与模型、认知转换,进而找到有价值的、真实的结果。
“如果大数据不能真正产生价值,就只是赶时髦。”曹友盛这样说道。他以数据中心PUE值优化为例进一步向C114作出阐述——PUE值即数据中心总能耗除以IT设备能耗所得,越接近1.0越好。
PUE值现已成为衡量数据中心环境情况的最重要指标之一,广受产业链各方关注。数据中心的PUE值受环境、设备使用量等各种因素综合影响,每秒钟都在变化;计算PUE值则要采集到所有的IT设备的实时用电量和IDC总用电量,再经过复杂的数据清洗后才能得出,计算量非常大。导致现有DCIM只能提供粗略的一段时间的平均值,无法实时、连续地将一个数据中心的PUE值展现出来。而维统管2.1是第一款且唯一一款将PUE值计算降到秒级的DCIM,令数据中心业主及运营者得以全面了解每一秒状态。
同时,PUE值是由设计院设计出来的,数据中心交付后要达到或者说无限接近这个理论值往往要花费一段时间来优化,一般在半年到一年之间,这被曹博士比喻为新车上路后需要几个月来“Tune up”。在这段时间内,PUE值显示出非常的不稳定和不正确。维统管2.1则能够通过实施的PUE值计算,乃至能耗指标同比/环比分析,建立能耗分析模型、给出优化方案,尽可能快地将PUE值“Tune up”到设计值——谷歌在使用DeepMind大数据技术后的两年,其数据中心的能耗降低了40%、整个数据中心的PUE值相应下降了15%,维统管的性能同样可以达到这个效果。
那么当PUE值达到设计值,能否进一步降下来?答案亦是肯定的。ZNV中兴力维特意将DCIM的大数据引擎设计成开放式的。这样一来,当数据中心运行了一段时间后,大量的数据被存储在大数据引擎中的数据池里,业主和运营者可以通过能力开放平台获取这些数据和力维预先做好的模型,他们可以用这些数据进一步训练机器,改善模型,也即是所谓的深度学习。另一方面,很多人对大数据的理解等同于认知转换,“啤酒和尿布”的故事时常被提到,数据中心业主和运营者也同样能从众多数据中找出其他未被我们所认识的、潜在的商业规律以及设备优化方法。
在福建长乐云计算中心项目中,就采用了ZNV中兴力维基于大数据引擎的DCIM框架。力维承建了其中的综合管理平台和动力环境监控子系统,软件平台采用分布式、模块化结构设计,实时呈现动力设备及环境信息,并集资产管理、能耗管理、运维管理、3D可视化等功能于一体。维统管通过对温度数据的采集、搜索、清洗、重塑、模拟学习、深度学习,一步步建立制冷优化模型,再通过模型的计算结果自动控制空调,从而优化数据中心的能耗。
“通过维统管,力维不仅给提供了运维管理的方法,还提供了大数据深度挖掘的平台,令数据中心业主及经营者可以充分使用积累下的数据实现自己的目的。”曹博士总结说。
维统管渐成标配:第一季度收入增长100%
尽管进入数据中心运维市场较晚,凭借超过20年运营商机房、基站监控管理的项目经验,以及技术和产品上的领先性,ZNV中兴力维已经迅速在这一市场上站稳了脚跟,而维统管自2016年5月推出以来也已赢得了市场的肯定与客户的推崇。
据曹友盛介绍,今年第一季度力维的DCIM业务实现了收入同比增长100%以上的佳绩;同时,维统管获得了国家绿色DCIM认证、中国数据中心工作组(ODCC)的DCIM技术创新奖等殊荣,新版本推出后有望进一步扩大市场份额及影响力。
“维统管的不仅是数据中心基础设施,更是其中的所有资源,力维在维统管设计之初就瞄准了宕机、高人工、高能耗等行业痛点,希望给客户带来最大化的价值。”曹博士谈到。也正因此,有着“高效、节能、省心、省钱”一系列亮点的维统管逐渐成为数据中心中不可或缺的组成部分,在国内三大运营商、BAT等互联网巨头的数据中心也均有应用。
比如在中国电信西咸智慧云基地IDC、深圳联通坪山腾讯IDC、中国联通华北(廊坊)基地数据中心、浙江移动萧山阿里巴巴IDC、中国移动(贵州)大数据中心等项目中,ZNV中兴力维均提供了包括维统管在内的一站式解决方案。
此外,在一些第三方诸如数据中心托管服务提供商、互联网服务及云服务提供商的大型数据中心项目中,同样有着力维和维统管的身影。比如在位于上海宝山月浦的云基地中,国富光启采用了ZNV中兴力维的一整套运维系统和智能软件平台,包括动力环境监控、视频监控、智能门禁、综合布线等子系统,同时接入消防系统、微模块系统数据,实现了数据中心的高效统一管理。在数字福建云计算中心、智慧银川大数据中心等政府牵头的项目中,力维的表现亦获得了好评。