当前位置:首页 期刊杂志

算力感知网络架构与关键技术

时间:2024-05-04

姚惠娟 陆璐 段晓东

摘要:针对运营商信息通信技术(ICT)基础设施面向云网融合、算网一体技术演进中的协同问题,提出了算力感知网络(CAN),即网络可感知应用、网络、算力和用户需求等多维资源,并协同调度算力资源和网络资源,使应用能够按需、实时调用不同地方的计算资源,实现边缘计算与云计算的协同联动,提供最优的用户体验以及计算和网络资源利用率。

关键词:算力感知网络;算力路由;算力服务信息

Abstract: Aiming at the synergy of cloud network integration and computing network integration technology of operator information and communications technology (ICT) infrastructure, computing-aware networking (CAN) is proposed. The network can perceive multi-dimensional resources such as application, network, computing power, and user demand. CAN jointly schedule computing power resources and network resources so that the application can call computing resources in different places on-demand and real-time, realize the collaborative linkage between edge computing and cloud computing, provide the optimal user experience and computing and network resource utilization rate.

Keywords: CAN; computing-aware routing; computing service information

1 算网融合发展的背景

1.1 面向算网融合演进的驱动力

目前是5G网络发展的关键时期,边缘计算和网络功能虚拟化(NFV)等技术都要求网络与计算协同发展。同时,随着物理世界和数字世界的进一步融合,行业数字化转型获得了全方位的提升和改变,给运营商带来全新的市场和发展空间,但同时也面临很多挑战。

(1)应用需求驱动力

随着5G的商用规模部署,工業互联网、车联网、增强现实(AR)/虚拟现实(VR)等垂直领域蓬勃发展。据Machina Research报告显示:2025年,全球网联设备总数将超过270亿,联网设备的指数级增长对网络传输能力及中心云处理能力带来了巨大挑战。据Gartner预测:2025年,超过75%的数据需要分流到网络边缘侧。这对网络灵活调度、服务质量(QoS)等提出了更高的要求。另外,产业智能化的升级会带来设备的多样性,物联网(IoT)传感器、摄像头等设备的应用又会产生多样化的数据。这些异构数据的处理需要泛在的算力来支持。全行业的产业化转型对网络和计算均提出了更高的要求:基础设施信息技术(IT)、通信技术(CT)更多融合;基础设施不仅需要提供泛在的连接,还需要提供算力的支持。

(2)网络技术发展驱动力

NFV技术的引入,使得5G网络开始云化[1],并逐步具备向IT技术演进的基础。这使得算力开始服务于网络,并随着网络进行延伸。此时的IT资源仅是CT网络的一种资源提供方式,并不直接对外提供服务。在此阶段,IT与CT的融合可称为信息通信技术(ICT)纵向融合。同时,5G网络原生支持边缘计算:5G用户面的下沉为边缘计算的实现创造了网络条件,并使计算资源离用户更近,从而推动网络中的计算从集中走向边缘,并嵌入网络。计算资源逐渐成为网络基础设施的重要组成部分。ICT融合的方式由NFV时代的“IT服务于CT”向“IT与CT相互感知”演进,算网协同感知成为网络演进的核心需求[2]。面向6G,算力与网络资源将共生,IT与CT系统需要具备相互感知的能力,以实现网络和算力的联合优化调度,并能提供端到端ICT系统的服务等级协议(SLA)体验保证。

1.2 计算网络融合发展产业现状

面向计算网络融合的演进需求,业界开展了许多研究工作。在2020年第8次网络5.0全会上,中国信息通信研究院联合三大运营商、中兴通讯等成立了网络5.0创新联盟算力网络特设组,就目前算网融合趋势下的不同技术路线展开探索,这些探索包括算力网络[3-5]、算力感知网络[4, 6-7]等。特设组就算力网络研究方面达成共识,推动产业发展[8]。此外,IMT-2030(6G)网络工作组也成立了算力网络研究组,研究6G网络中计算、网络融合对未来网络架构的影响。此外,互联网研究专门工作组(IRTF)成立了在网计算研究组(COINRG)[9-12]。在网计算是指,网络设备的功能不再是简单的转发,而是“转发+计算”;计算服务也不再处于网络边缘,而是嵌入网络设备中。该工作组主要针对可编程网络设备内生功能的场景、潜在有益点展开研究。其中,内生功能包括在网计算、在网存储、在网管理和在网控制等,它是计算、网络更深层次融合的下一发展阶段。内生功能引起了研究人员的关注。

综上所述,在网络和计算深度融合发展的大趋势下,网络演进要求网络和计算能够相互感知、高度协同,并可以基于无处不在的连接将泛在计算互联,以实现云、边、网高效协同,提高网络资源、计算资源利用效率,进而实现以下目标:(1)保证用户体验一致性。网络可以感知无处不在的计算和服务,用户无须关心网络中计算资源的位置和部署状态。网络和计算协同调度保证用户的一致体验。(2)服务灵活动态部署。基于用户的SLA需求,网络综合考虑实时资源状况和计算资源状况,通过灵活匹配、动态调度,将业务流量动态调度至最优节点,并支持动态服务来保证用户体验。

因此,我们提出一种面向计算网络深度融合演进的新型网络——算力感知网络(CAN),以实现用户体验最优化、资源利用率最优化等。

2 CAN的架构体系

2.1 CAN的概念

作为面向计算网络深度融合的新型网络架构,CAN以现有的网络技术为基础,通过无所不在的网络连接分布式的计算节点,实现服务的自动化部署、最优路由和负载均衡,从而构建可以感知算力的全新网络基础设施,保证网络按需、实时调度不同位置的计算资源,提高网络和计算资源利用率。CAN还能进一步提升用户体验,实现网络无所不达、算力无处不在、智能无所不及的愿景。CAN的概念具体如图1所示。

基于CAN的概念,中国移动从架构、协议、度量等方面协同演进,构建面向算网一体化的新型基础网络,如图2所示。从架构层面上看,面对边缘计算、异构计算、人工智能等新业务,在基础设施即服务(IaaS)资源层编排的基础上,未来算网融合架构如何向平台即服务(PaaS)、软件即服务(SaaS)、网络即服务(NaaS)等一系列上层算法、函数、能力编排演进,需要进行研究。如何协同管理、控制数据面,以实现编排系统与网络调度系统的协作,从而实现一切即服务(XaaS)能力按需灵活部署,也需要重点考虑。从协议层面上看,传统网络优化路径仅实现信息在节点之间传输的SLA,并未考虑节点内部算力的负载。未来算网融合的网络需要感知内生算力的资源负载和XaaS性能,并综合考虑网络和算力两个维度的性能指标,从而进行路径和目标服务阶段的联合优化。另外,还需要考虑和数据面可编程技术的结合,如利用SRv6可编程性实现算网信息协同,以实现控制面和数据面的多维度创新。从度量方面看,网络体系的建模已经很成熟,但算力体系还需要综合考虑异构硬件、多样化算法以及业务算力需求,以及形成算力的度量衡和建模体系。CAN需要依托统一的算力度量衡体系以及能力模板,为算力感知和通告、算力开放应用模型(OAM)和算力运维管理等功能提供标准度量准则。

2.2 CAN体系架构

为了实现泛在计算和服务的感知、互联和协同调度,CAN架构体系从逻辑功能上可分为算力服务层、算网管理层、算力资源层、算力路由层和网络资源层。其中,算力路由层包含控制面和转发面,如图3所示。

算力应用层:承载泛在计算的各类服务及应用,并将用户对业务SLA的请求(包括算力请求等)参数传递给算力路由层。

算力管理层:完成算力运营、算力服务编排,以及对算力资源和网络资源的管理。该层的具体工作包括对算力资源的感知、度量,以及OAM管理等,实现对终端用户的算网运营以及对算力路由层和网络资源层的管理。

算力路由层:是CAN的核心。基于抽象后的算网资源,并综合考虑网络状况和计算资源状况。该层可以将业务灵活按需调度到不同的计算资源节点中。

算力资源层:利用现有计算基础设施提供算力资源。计算基础设施包括单核中央处理器(CPU)、多核CPU,以及CPU+图形处理器(GPU)+现场可编程门阵列(FPGA)等多种计算能力的组合。为满足边缘计算领域多样性计算需求,该层能够提供算力模型、算力应用程序编程接口(API)、算网资源标识等功能。

网络资源层:利用现有的网络基础设施为网络中的各个角落提供无处不在的网络连接,网络基础设施包括接入网、城域网和骨干网。

其中,算力资源层和网络资源层是CAN的基础设施层,算网管理层和算力路由层是实现算力感知功能体系的两大核心功能模块。基于所定义的五大功能模块,CAN實现了对算网资源的感知、控制和调度。

总之,作为计算网络深度融合的新型网络,CAN以无所不在的网络连接为基础,基于高度分布式的计算节点,通过服务的自动化部署、最优路由和负载均衡,构建算力感知的全新的网络基础设施,真正实现网络的无所不达、算力无处不在、智能无所不及。海量应用、海量功能函数、海量计算资源则构成一个开放的生态。其中,海量的应用能够按需、实时调用不同地方的计算资源,提高计算资源利用效率,最终实现用户体验最优化、计算资源利用率最优化等。

3 CAN关键技术

3.1 算力度量和建模

如何构建统一的算力模型是CAN的研究基础。基于算力统一的度量体系,通过对不同计算类型的异构算力资源进行统一抽象描述,形成算力能力模板,可以为算力路由、算力设备管理、算力计费等提供标准的算力度量规则。首先,异构硬件设备通过统一的算力度量和建模,实现对现场可编程门阵列(FPGA)、GPU、CPU等异构物理资源的统一资源描述,从而可以有效地提供计算服务。其次,考虑到计算过程受不同算法的影响,需要对不同的算法如人工智能(AI)、机器学习、神经网络等算法所需的算力进行度量,更有效地了解应用调用算法所需的算力,从而服务于应用。最后,由于用户的不同服务会产生不同的算力需求,需要把用户需求映射为实际所需的算力资源,从而可以使网络更充分有效地感知用户的需求,提高和用户交互的效率。

3.2 算力路由关键技术

算力路由层是CAN的核心功能层,支持对网络、计算、存储等多维资源、服务的感知与通告,从而实现“网络+计算”的联合调度。算力路由层包括算力路由控制技术和算力路由转发技术,这两种技术可以实现业务请求在路由层的按需调度。

算力路由控制面可以通告算力节点的信息并生成算力拓扑,进而生成算力感知的新型路由表。算力路由控制面基于业务需求生成动态、按需的算力调度策略,实现算力感知的算网协同调度。算力路由转发需要通过IP协议/SRv6扩展增强实现网络感知应用、算力需求以及随路OAM管理等功能。算力路由支持网络编程、灵活可扩展的新型数据面,能够实现算力服务的最优体验。

3.3 算力管理关键技术

算力管理包含算力设备的注册、OAM、运营等。统一的管理面可以对网络和算力进行管理和监测,并可生成算力服务合约以及计费策略,以实现对算力的统一运营。基于统一的算力度量体系,通过对不同计算类型进行统一抽象描述,算网管理层能够形成算力能力模板,从而为算力设备的管理、合约和计费以及OAM提供标准的算力度量规则。算力注册需要实现对算力节点的注册、更新和注销,并对相应的路由通告策略进行管理。算力OAM需要实现对算力资源层的算力性能监测控制、算力计费管理等。

4 CAN关键技术验证与测试

为了推动CAN的研究和标准化,中国移动搭建实验网,通过集成测试、功能测试和性能测试,多维度进行CAN关键技术的验证。中国移动浙江省公司完成了多个移动边缘计算(MEC)站点的CAN部署,具体的技术测试拓扑如图4所示。其中,多个节点位于杭州、金华的不同机房,平均距离约为30 km,平均时延约4 ms,平均通量接近1 000 kbit/s。

集成测试验证了CAN组件与现有MEC软硬件环境及业务系统的集成能力,实现控制面与数据面端到端的通信流程。

功能测试验证了CAN新增的网络能力,包括根据网络以及服务状态优选计算位置的能力、业务流粘性保持能力,以及主动触发服务质量劣化业务流重连的能力。

性能测试验证了CAN的MEC整体系统与基准MEC系统在数据面性能指标方面的对比情况。测试表明,CAN调度系统单位时间完成的总任务数(QPS)有所提升,同时客户端感知的任务端到端完成时延有所降低,从而验证CAN调度系统可以实现系统资源利用率最优、用户体验最优。

测试案例分为两大类,包含理想情况(系统算力容量和性能都比较均衡),以及系统算力容量、性能不均衡的情况。通过现网测试,我们可以对CAN调度系统与基准系统随机调度的QPS和端到端平均时延进行比较。

当系统算力容量和性能都比较均衡时,测试结果如表1和表2所示。当请求业务数处于小、中两种输入情况时,CAN调度系统的QPS比基准系统随机调度的QPS分别提升5.5%、33.17%,端到端时延分别降低25.62%、16.00%。

本次测试有力地证明了CAN调度系统能够将业务请求分配到更优的边缘节点上,从而实现边边协同、整体系统负载均衡優化、资源利用率优化等。

5 结束语

以“新基建”为导向的一系列政策,使得新一代信息技术间的融合效应逐渐显现。“5G+云+AI”将成为推动中国数字经济持续发展的重要引擎。结合未来计算形态云-边-端泛在分布的趋势,计算与网络的融合将会更加紧密。为了提升“联接+计算”的能力,需要计算和网络两大产业进行有机协同,相互配合。业界也需要积极探索算力资源和算力服务的智能调度、高效分配的方式和途径,打造面向云网融合、算网一体技术演进的新型网络。

致谢

本论文由中国移动研究院算力网络团队共同完成,特向项目组成员孙滔、付月霞、刘鹏、杜宗鹏等致谢!

参考文献

[1] SDN/NFV/AI标准与产业推进委员会. 网络人工智能应用白皮书 [R]. 2019

[2] 边缘计算网络产业联盟.运营商边缘计算网络技术白皮书 [R]. 2019

[3] 雷波, 刘增义, 王旭亮, 等. 基于云、网、边融合的边缘计算新方案:算力网络 [J]. 电信科学, 2019, 35(9): 50-57

[4] 中国联通.中国联通算力网络白皮书 [R]. 2019

[5] 中国移动.算力感知网络技术白皮书 [R]. 2019

[6] 中国通信标准化协会. 面向全网算力的算力感知网络关键技术研究 [R]. 2020

[7] 姚惠娟, 耿亮. 面向计算网络融合的下一代网络架构 [J].电信科学, 2019, 35(9): 38-43

[8] 网络5.0技术和产业创新联盟. 网络5.0技术白皮书 [R]. 2019

[9] GENG L, LEI B, FU Y, et al. IMT2020-CAN- req: use cases and requirements of computing-aware networking for future networks including IMT-2020 [R]. ITU-T, 2020

[10] GENG L, WILLIS P. Compute First Networking(CFN) scenarios and requirements [R]. IETF, 2019

[11] LI Y, HE J, GENG L, et al. Framework of Compute First Networking (CFN) [R]. IETF, 2019

[12] GU S, ZHUANG G, YAO H, et al. A report on Compute First Networking (CFN) field trial [R]. IETF, 2019

作者简介

姚惠娟,中国移动通信研究院网络与IT技术研究所项目经理,担任CCSA TC614架构组组长和算力特设组副组长;长期从事IP网络研究和标准工作,主要涉及承载网络、边缘计算、未来网络架构等领域。

陆璐,中国移动通信研究院网络与IT技术研究所副所长,担任CCSA TC5核心网组组长;长期从事移动核心网策略、演进、标准和技术研究工作,主要涉及未来网络架构、智能管道、边缘计算等领域。

段晓东,中国移动通信研究院副院长,担任IMT-2030(6G)推进组网络技术组组长;主要研究方向为 5G/6G 网络架构、云计算及虚拟化、IP新技术。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!