华为自述:做数据中心交换机到底有多难?
江湖上,总有那么几款经典爆品
人人知道它的名字
却不了解它的故事
正如威镇寰宇的它
▼
华为CE12800数据中心交换机
看着它们
冷不丁冒出一个问题
答案是唯一的
↓
难
哪怕是华为这样的大牛公司做
也很难!
到底有多难?
↓
数据中心交换机真正进入人们的视野,还是2010年。
那一年云计算持续升温,数据中心迎来了大发展,人们发现,一个新的80/20原则诞生了——80%的流量产生在数据中心内部。
也正是从那时起,“东西流量”在业界被广泛提及,数据中心交换机作为处理“东西流量”的神器,引领了整个交换机产业的新一轮增长。
当时的华为,已是运营商网络市场的龙头,正在蓄势进军企业网市场。
要想在企业网市场站稳脚跟,首先就是要占据企业数据中心这个战略高地,而数据中心交换机无疑是攻占这个高地的利器。
转过年来的2011年,华为迎来了一次重大的组织变革,EBG,一个专攻企业级市场的BG成立了,成立之初,管理层便一锤定音:上马数据中心交换机!
2011年4月,华为数据中心交换机正式立项,起个什么样的名字呢?CloudEngine。这个名字包含了两层意思:
①数据中心交换机主要是面向云的,华为要做最好的云网络引擎。
②与华为大名鼎鼎的NE路由器一脉相承,左手NetEngine,右手CloudEngine,包打天下。
现在看来,“CloudEngine”这个经典产品能在最恰当的时机立项,既有技术大趋势发展的因素,又有华为内部业务战略的驱动。
总之,外因+内因,就这么踩准了一个点,翻过了一道坎。
大方向定下了,只是万里长征的第一步。
彼时不同今日,7年前,业界对与数据中心网络的技术路线,存在很多争议。最主要的有两大流派:稳健型的“二层派”和颠覆型的“一层派”。
“二层派”的思路是在传统网络架构上进行优化,核心交换机和接入交换机具备独立功能,Spine+Leaf的模式来组网,基于通用的标准协议实现互联互通。
“一层派”的玩法比较激进,裁剪接入交换机的功能,只把它们作为“端口扩展器”,这种“子交换机”不能独立工作,需要一台功能强悍的“母交换机”来配合。“子母”交换机组合起来,变成一台超级交换机,这就是当年很火的“一层架构”。
面对这种“0或1”的选择,华为交换机项目组经历了痛苦的抉择期,一旦架构选错,未来根本就没有机会回头。
当年,“一层派”在业界呼声很高,方案很完美,看起来很有创新性,还有交换机大厂扛旗力挺,芯片厂商和部分客户,也对这种方案很心动。
然而,华为研发经过评估认为,“一层派”这个方案看上去很美,但是意味着“子母”交换机只能使用同一家厂商的方案,这个结构不够开放,会对客户形成绑架。从网络发展的历史看,这不大可能成为主流。
最终,华为选择了“二层”架构,保持系统的开放性,给客户选择权。当然,华为还是留了一手,在架构设计上做了兼容考虑,即便未来“一层”成为主流,华为也能平滑演进。
多年以后,几乎所有的厂商最终都和华为选择了一样的路线,而那种曾经火爆一时的“子母交换机”,早已绝迹江湖。
这种所谓的架构之争,现在已经没有什么争议了,而在当年,对华为交换机团队来说,就是“大是大非”问题。
面对这样的抉择,华为的解决思路是,跳出具体的技术比较,从客户角度思考,把选择权留给客户,把麻烦留给自己。
事实证明,这种“以客户为中心”的思想,很有效。
在数据中心交换机的硬件设计上,有一道绕不开的坎,叫做“正交架构”。
我们知道,交换机的板卡,主要分为三大类:主控卡、线卡、交换网板。主控卡相当于交换机的大脑,线卡主要提供各种不同速率的端口,而交换网板则提供线卡间高速互联的能力。
如何把这三种板卡“物理的”连在一起呢?需要一个载体,这就是背板,在“正交架构”出现之前,主流的架构是“无源背板”技术。
“扒开”这种交换机瞧一瞧,我们会发现,各种卡都是插在背板上的,大家通过背板这个“中介”,完成彼此的连接和互通。
这种架构是过去的主流,但随着数据中心交换机对速率和扩展性的要求越来越高,弊端就表现出来:要想实现超高速的数据传输,链路要尽可能短,尽量减少中间路径,故障点越少越好。
如果能不绕道长长的背板,而是让线卡和交换网板直接连接,就可以最大限度避免瓶颈。于是,就有了划时代的正交架构↓
拿CE12800举例,所谓正交架构,就是前面的线卡和主控卡横着插,背面的交换网板竖着插,两者相互垂直,板卡相交的地方采用“正交连接器”直接相连,不再通过“漫长”而“坎坷”的背板走线。
这种方式,距离更短、故障点更少,能够搭建起超高速通信的“立交桥”。
对应正交架构,业界还有“非正交”和“伪正交”:
传统无源背板架构,所有的板卡,都插在背板上,通过无源铜背板上的走线完成“中介”,更早的时候,还有“有源背板”,即背板上也有芯片,故障率更高,扩展性更差。
伪正交架构,从外面看起来,和正交架构很“高仿”,也是前面横插(竖插),后面竖插(横插) ,前后板卡垂直相交⊥。
然鹅,真相是,他们共同插在一个中置大背板上,而不是采用“正交连接器”直接相连,所以,该绕的路,一点都没有少。
华为CE12800在设计之初,就考虑了一步到位的正交Clos架构,这个架构一直沿用至今,保持了高度的延续性,一套板卡适用于所有规格的机箱。
用户即使在2012年产品发布之初就买入了交换机,用到2019年的今天,所有线卡任然保持通用,交换容量仍然可以平滑升级,与时俱进。
这个时候,我们才能更深的理解,设计一款具备真正“十年生命周期”的产品,是对自己的挑战,也对客户负责任……
今天,我们再去看整个数据中心交换机市场,会发现主流品牌,基本都“正交”了,但他们大部分都经过了几次“迭代”,出现过好几代机箱,从非正交→伪正交→真正交。这些机箱命名相似而不相同,线卡彼此不兼容,既造成用户选择困难,又不利于投资保护。
真正做到正交架构一步到位的,似乎只有华为。
因为,在当年,要做成一款正交架构的交换机,是对工程能力的巨大挑战:例如关键器件“正交连接器”的成熟度、正交架构对散热的考验、大尺寸单板的设计和加工能力、整机及结构精度控制等等。
说白了,正交架构体现出各厂家研发能力的积累,它就像一个“放大镜”,能充分展现优秀设计的精妙之处,也能把低劣的设计放大数倍揭露出来。
迈过“正交架构”这道坎,似乎前面一片坦途。
然而,接下来的每个“细枝末节”,都暗藏玄机。
正交架构的后遗症之一是散热问题,交换机散热主要依靠“风冷”,从流体力学的角度看,正交架构不容易实现冷热风道隔离,对散热很不友好。
CE12800在早期架构设计的时候,架构师们仔细研究了国际标准组织对设备散热的定义、要求及未来展望,并参观了业界最先进的数据中心,做了多种设计模型不断的对比和优化,最后决定面向未来把CE12800设计成“严格前后风道”架构。
以前,我们常常把交换机“前后风道设计”当成一种控标参数来运用,实际上,无论从行业标准要求还是数据中心的对“能效比”的追求,“前后风道”都是刚需。
在高等级的数据中心机房,为了追求PUE指标,会采用机柜“面对面、背靠背”交错排列,形成隔离的冷热通道,这样可以形成较强的冷热对流循环,所以,设备采用前后风道设计,才能达到这种对流效果。
作为一款“潜伏”在机房深处的设备,数据中心交换机有点“深藏功与名”,到底要不要重视颜值呢?
华为的工程师们陷入了激烈的思想斗争:以前产品强调的是功能、性能规格,外观上“抗造”就好,本质上就是一“铁疙瘩”,大家也都司空见惯。相对而言,企业网客户对产品的外观和质感会更加关注,“高颜值”的产品更容易赢得客户信任。
这个方针敲定以后,团队加大了工业设计投入,邀请知名的设计公司操刀,第一次从零开始讨论产品的眉头、走线齿、扳手、防尘门以及总体外观,关注每一个细节……
在设计板卡面板时,为增强产品质感,采用了更高成本的不锈钢。 但测试时发现,面板在人触摸后会留下指纹,可能影响观感,虽然这不影响使用,毕竟用户也不会天天跑到机房摸面板玩。
但是负责工业设计小伙儿不甘心,验证了多个方案,最终确保设备面板在人手触摸、插拔应用后,依然油光锃亮,“可以当镜子用”。
正是因为这种精益求精的精神,CE12800一发布,就引起了轰动,很多用户不光被强悍的性能和规格震撼,也被高颜值圈了粉。
硬件的坎,就这样,一道道被华为人趟完了,但这只是一半。
硬件,只决定交换机的下限,它让交换机有了一副好皮囊,一副10年不落伍的好皮囊;软件,才定义了交换机的上限,它赋予了交换机灵魂。
于是,接下来,华为人又趟过一道道软件坎,实现了多个业内第一:
业界首个实现集群的业务通道和控制通道物理分离,可靠性更高;
业界首个将“1虚多”虚拟比实现到16的数据中心交换机;
业界首个在同一平台实现CSS集群和M-LAG技术的完美组合;
拥有归一化软件平台,使得一套板卡可以支持所有软件特性;
……
2012年6月,在迈过无数道坎之后,凝聚着华为VRP平台、硬件和整机工程20余年深厚积累的数据中心交换机旗舰——CloudEngine12800,终于震撼发布。
.
.
.
.
时至2019年
我想,当年CE12800交换机的研发项目组,在殚精竭虑、埋头攻关的时候,一定许过愿、吹过牛,憧憬过自己这款亲手打磨的产品,未来能到什么样的高度。
七年后,那些许过的愿、吹过NB,都成了真……,我们来看看成绩单吧。
CE12800创造了一个神话:七年前奠定的体系架构,其间未再做任何硬件迭代,延用至今,仍然是业界最具竞争力的交换机旗舰。这块“金字招牌”,还可以挂上几年。
然而,华为人不满足,七年之痒,华为人“痒了”,他们的目光,瞄准了下个10年。
随着人工智能和机器学习等应用的涌现,存储(存储介质从HDD到SDD/NVMe)和计算(CPU到GPU甚至AI芯片)性能都得到了百倍提升,数据中心网络也需要更大带宽和效率支撑AI业务。
400GE光接口已经开始踏上数据中心交换机的舞台,随之而来的,则是在功耗密度、高速互联、硬件可靠性等方面的技术挑战。
迪浮科技课程服务承诺:
1、免费重修:
学员缺课或者学校效果不理想,可以免费重修,确保课程内容完全掌握。重修过程中绝对不收取任何费用!
2、单独辅导:
如果学生在学习过程中,因各种原因无法跟班级进度同步,公司安排专家讲师一对一辅导,手把手带你成为IT精英!
3、自由实验:
清默网络有先进完善的实验中心,全天开放,实验机时不限,不断提高动手操作能力!
4、考试辅导:
学员考试前先通过清默内部模拟考试,技术确定达到考试要求并提供考前辅导及考试技巧讲解。
如果模拟考试未能通过,专家讲师会给予建议和辅导,合格后再参加正式考试,确保学员能高分通过认证考试。
5、企业实战项目:
即通过先进的设备完全搭建和企业项目完全一致的网络环境,把学习内容融会贯通并在实际项目中加以应用,以达到学员迅速掌握实际技能并弥补经验不足的目的,让学员的学习内容不再纸上谈兵,理论与实战完全吻合
咨询老师:郭老师
咨询电话:15056089769
咨询Q Q :1027831018