使“去集群化”成为可能
大型互联网企业、云服务提供商及运营商网络中的核心路由器基本都会采用集群系统。这种结构在可扩展性和灵活性方面具备优势,但随着业务的不断增长,集群规模需要不断扩张,导致占用空间增加、功耗升高、对机房设施要求提高,以及故障影响面扩大等问题也越来越突出。为此,业界提出了“去集群化”这一理念。得益于网络芯片设计及制造水平的发展,以及光通信效率的提升,路由器容量和集成度都相较以往有了显著提高,这些因素使得“去集群化”成为了可能。
目前核心路由器市场中单台路由器的端口容量已经能够达到几十Tbps,预计不久每端口容量将突破到一百甚至几百Tbps的水准。在这种情况下,目前每端口的容量就已经相当于以往单个槽位、甚至单台路由器的总吞吐量。这在芯片技术没有得到突破之前,是根本无法想象的。从某种意义上说,以往用户采用集群化解决方案,也是受限于设备性能无法满足实际业务需求的一种无奈之举。
单机系统与集群系统孰优孰劣?
在单机系统与集群系统的PK中,到底谁能更胜一筹呢?下面我们就从几方面逐一进行分析。
在产品性能方面
随着端口密度和新一代线卡的进一步升级,单机容量将得到成倍增长。目前已知单机容量可以达到200Tbps以上,而主流的集群路由器的较大容量基本保持在128Tbps级别。因此,面对当前需要2-4台矩阵机箱所组成的集群系统,今后只需要一套单机系统就能完全胜任,这就使得整个数据中心在包括空间占用、功耗、成本和可维护性等多方面得到了极大优化。
而大容量单机路由器的主要缺陷则体现在,对低速和传统端口类型的支持和低速端口的容量总和方面。集群系统的优势是可以通过扩充槽位(线卡框)数量的累加来解决这一问题,这也意味着要付出空间、功耗、成本不断上升的高额代价。目前核心路由器端口类型已经开始向高速以太网进行收敛, 所以,无论是面对未来路由器市场从100GE到400GE的主流演进趋势,还是从数据中心总拥有成本(TCO)来考虑,以高性能单机系统去替代低效集群系统将成为核心路由器市场中的一个主要方向。
在网络架构方面
目前,构建“去集群化”的核心节点主要有两种形式,第一种是直接采用单台或少量大容量单机路由器去替代原有庞大的集群路由器,这种网络结构较为简单明了,也是绝大多数运营商采用的方式;第二种是单机系统与集群系统的混合组网,通过标准协议将多厂商的单机路由器与集群系统构建成一种松耦合的网络架构。由于这种结构相对比较复杂,因此目前只有少数互联网、云服务提供商会采用该方式。
即使是采用单机系统完全替代集群系统,在迁移过程中也会选择业务的柔性迁移,就是暂时保留原有集群路由器系统,再通过大容量单机路由器逐渐分担流量。这种方式能够较大限度地保障数据中心核心业务的可靠性需求。
而相比传统的集群方式, 单机系统不但在性能和网络结构上更具优势,同时在第二种结构中还有效抑制了单一厂商产品的技术锁定,提高了产品的可扩展性与技术的开放性。无论是对大多数云服务提供商,还是运营商而言,采用这种松耦合的大容量单机系统架构对其业务拓展与产品快速上线,亦或后期升级维护都是一种更为合理的选择。
在核心路由器领域,无论是“集群化”,还是“去集群化”,较终还是应该由市场来决定。当单机容量达到极限,不能满足业务需求时,用户自然会采用“集群化”来进行部署,以扩展数据中心网络的承载能力。而当单机容量不断提升,端口转发性能不断得到突破后,用户自然也会更倾向采用单机的方式去承载业务,毕竟无论是在结构简单性,还是维护难度以及成本方面单机系统都具有明显优势。因此,未来的核心路由器发展也将会在“集群化”与“去集群化”之间不断切换,并实现交替演进与发展。