数据中心自动驾驶网络白皮书数据中心自动驾驶网络白皮书
目录
目录
CONTENTS
1 自动驾驶网络的产生背景和驱动力
1.1 数据中心网络的挑战1.2 数据中心网络的机遇
1.2.1 人工智能驱动的网络保障1.2.2 数学验证技术的引入1.2.3 意图驱动网络的发展0303040404040505
1.3 业界在积极行动
1.3.1 行业领导者大力规划实践网络自动驾驶1.3.1 TOP标准组织积极推动网络自动驾驶标准0506080811
2 华为自动驾驶网络战略解读3 华为数据中心自动驾驶网络方案
3.1 整体解决方案3.2 意图决策模块3.3 自动化模块3.4 仿真验证模块3.5 分析模块3.6 数字仓库3.7 用户体验
12131516161919
4 华为数据中心自动驾驶网络典型应用场景
4.1 规建环节:规划设计仿真并自动验收
01
数据中心自动驾驶网络白皮书
目录
目录
CONTENTS
4.2 维护环节:自动翻译业务意图,自动验收,异常回退4.3 维护环节:网络变更意图buildin,异常快速回退4.4 维护环节:基于意图的网络监控,实现故障闭环
21242629
4 华为数据中心自动驾驶网络典型应用场景
02
数据中心自动驾驶网络白皮书
自动驾驶网络的产生背景和驱动力
01
自动驾驶网络的产生背景和驱动力
过去十多年来,数据中心无论在技术还是部署上都在极速发展,日新月异。粗略可以将其划分为三个阶段:??
第一阶段是以数据中心大集中(DataCenterConsolidation)为主的DC1.0,对应的网络是传统的二层架构STP+VLAN。第二阶段是以利用资源虚拟化(Virtualization)和服务动态管理(DynamicServiceOrchestration)为手段,提升资源共享利用率和资源部署灵活度的DC2.0,网络架构演进到全互联的Overlay架构。
上述两个阶段技术上最大的分野为云计算技术的日趋成熟和大批量部署?
第三阶段是为适应智能化时代所带来的业务量爆发性增长而产生的DC3.0,最大的特点是超大规模和分布式多地多中心,容器、RDMA等各种新技术都在应用中,网络架构的智能化要求也越来越高。
总结数据中心的发展趋势,可以看出数据中心发展始终以支撑业务发展为中心,以开放性、高容量、易扩展、成本可控和安全稳定为要求,最终实现业务弹性适配、应用快速部署、信息互通共享、系统分布扩展和负载灵活调度等各种能力的不断提升。
这些发展趋势对数据中心的规模、成本、规划设计、部署建设、维护优化、运营管理等各个方面都产生了巨大影响和全新要求。面对这些新要求,当前的数据中心运营管理方案显得力不从心。产业界普遍达成共识,寻求建立一套更加高度智能化的网络管理方案来应对。
通过将人工智能、数学验证及意图驱动网络等关键核心技术和理念的引入,我们针对数据中心构建了一套自动驾驶网络方案,围绕全面智能化和自动化的终极目标进行阶段式迭代发展,逐步演进到全面智能自治的数据中心网络。
1.1 数据中心网络的挑战
?大企业和运营商面临管理大规模网络的诉求,仅靠人工管理很难满足要求,需要引入网络自动化管控系统,自动化配置和编排大规模网络比人工操作更安全、高效。
?企业数字化转型对网络敏捷性、可用性等需求日益增加,网络变更频繁,传统运维方式无以为继,急需自动化管控系统能够在网络运行中实时验证网络设计实现状况、及时发现故障,减少业务中断时间。
?云应用会跨越异构/多云的基础设施部署,但需要提供一致的网络服务,这就解决异构环境之间网络管理问题,使得用
户能够完成以业务意图为导向的统一管控。同时,屏蔽基础设施层不同设备差异以及各种私有接口,进一步地解除厂商绑定。?
企业投入成本受限,当前OTT对传统行业冲击巨大。企业面临巨大竞争压力,内在要求提升效率。网络投资也会受投入产出限制,降低OPEX压力越来越大,那么如何降低人工成本、提升网络性能成为CIO必须首要解决的问题。
03
数据中心自动驾驶网络白皮书
自动驾驶网络的产生背景和驱动力
?企业投入成本受限,当前OTT对传统行业冲击巨大。企业面临巨大竞争压力,内在要求提升效率。网络投资也会受投入产出限制,降低OPEX压力越来越大,那么如何降低人工成本、提升网络性能成为CIO必须首要解决的问题。
1.2 数据中心网络的机遇
1.2.1人工智能驱动的网络保障
人工智能是一个研究领域,它能赋予机器如人类般的智能。当今网络所产生的海量的配置,状态,告警,日志等运维数据呈指数型增长,数以万计甚至千万计的运维指标远远超出了运维人员可以有效利用的范围,监控阈值不合理或者“报警风暴”甚至对故障的判断产生巨大干扰,人工智能技术为更好地利用网络产生的数据提供了一种可能性。当前,基于人工智能技术对网络数据的分析,能够了解网络环境的复杂性,在网络故障发现,根因定位,网络资源预测等领域已经有了很多应用,显著提升了网络运维的效率。人工智能在网络运维领域的应用已经得到业界的广泛认可,Gartner预测,电信业整体AI市场将以48.8%的年复合增长率从3.157亿美元到2025年增至113亿美元,电信运营商主要将AI用于网络运营监控和管理,此期间这方面支出将占到电信业AI支出的61%。
1.2.2数学验证技术的引入
数学验证技术又称为形式化验证,含义是根据某个或某些形式化规范或属性,使用数学的方法证明其正确性或非正确性。形式化验证方法通过严格的数学证明保证程序行为与预期一致,已经广泛应用于正确性要求极高的领域如无人机、航天器、
操作系统等的程序正确性验证。在数据中心网络承载关键应用的金融行业,断网的损失高达6.89M美元每小时,而Gartner统计40%的网络事故是由于人工配置错误导致,因此网络配置的正确性的要求越来越高,使用形式化验证方法,可以将网络的配置文件信息和所要验证的预期属性如网络节点间的可达性,隔离性、路径信息(必经节点)、路由黑洞,均转换为一系列逻辑公式,使用数学求解器进行求解,这个方法称为网络变更仿真,可以最大程度的降低配置出错的概率,提升数据中心网络的可用性。
1.2.3意图驱动网络的发展
意图驱动网络是一种在掌握自身“全息状态”的条件下,基于人类业务意图,借助人工智能技术进行搭建和操作的闭环网络架构。意图网络的概念最早由ONF在2015年2月提出。2017年2月,Gartner发布报告定义了基于意图的网络系统,并预言意图网络系统是网络领域的“下一件大事(Thenextbigthing)”,预计到2020年底,1000+企业将部署意图网络系统。意图网络的目标是网络提供服务能力的进一步增强,以近似于人类语言的方式操作网络。根据定义,意图构成了全网范围的声明性(declarative)策略,人类操作员定义的是预期,而网络计算出可满足要求的解决方案。在数据中心领域,存在大量异构的设备和多云环境,意图驱动网络能够屏蔽这些差异,使网络管理员能够更为专注业务诉求。另外意图网络是一个闭环系统,这里面有两层含义,第一是网络的不断变化不影响已下发的意图,第二是如果监控发现意图不满足,系统需要主动进行调整以确保意图不受影响。
04