C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索
查看: 5221|回复: 1

[通信技术与资料] 算力网络三十二大核心技术方向 [复制链接]

军衔等级:

亚星游戏官网-yaxin222  新兵

注册:2006-7-18
发表于 2023-3-19 14:06:47 |显示全部楼层
算力网络核心技术体系

为进一步凝聚产业力量,加速技术和产业成熟,2022 年 6 月,中国移动携手 12 家产业合作伙伴共同发布了《算力网络技术白皮书》,创新提出了算力网络十大技术方向,明确了核心技术体系与技术路线。

算力网络十大技术发展方向包括了泛在智能的新型算力、以数据为中心的多样性计算架构、光电联动的全光网络、超低时延驱动的确定性网络、算网深度融合的原创技术、融数注智的算网大脑、可信共享的算网服务、端到端的绿色低碳技术、算网一体化全程可信和空天地一体的星云算网,覆盖了算力、网络、算网一体、算网大脑、算网服务、绿色安全、空天地一体等领域,全景式的展示了中国移动对算力网络技术发展趋势的判断。

同时,中国移动通过对算力网络的关键技术进行体系化的梳理和深度挖掘,围绕算力网络十大技术发展方向,重点聚焦存算一体、算力原生、算力度量、算力路由、在网计算等三十二大核心技术,构建形成算力网络核心技术体系,横向映射算力网络三层体系架构,纵向串联各技术栈,打造算力网络技术的领先优势。

算力网络重点创新技术成果

中国移动深入推动算力网络技术的创新与应用,在新型算力、新型网络、算网一体、绿色安全四个主要领域取得了一系列技术成果。

新型算力

中国移动正加快构建以数据为中心的新型计算架构,围绕数据中心的第二颗大芯片GPU 和第三颗大芯片 DPU 开展深度攻关,提升多样化算力供给能力;超前布局,推动算力原生、存算一体技术成熟,屏蔽异构硬件差异,提升算能算效;拓宽算力供给,加快社会算力并网方案的探索与实践,构筑社会级算力服务能力。

新型智算中心

智能算力是以 GPU、TPU、NPU 等智能计算芯片为基础,以多样化海量数据为对象,以算法为驱动,以提升 AI 效能为目标的关键计算能力。新型智算中心以智能算力为基础,专注于大规模 AI 模型训练的需求,已成为未来 AI 基础设施发展新趋势。

目前新型智算中心发展存在多条技术路线,生态割裂问题突出,底层硬件差异导致业务开发、迁移、部署的成本居高不下。为应对上述系列挑战,推动国内智算产业生态健康、长远发展,中国移动针对性地打造了智算技术架构、评估评测标准以及生态体系:

一是完成智算中心整体设计方案的制定。通过计算、存储、网络、高密基础设施四大资源横向协同设计,实现智能算力极致性能释放。在计算方面,明确以 XPU +CPU 异构计算范式为主硬件技术路线,将复杂逻辑运算、高并发矢量、矩阵和张量运算模式特征结合,打造 CPU 与 XPU 协同机制。在存储方面,制定分布式融合存储方案,要求一套存储系统支撑块、对象、文件等多种协议。在网络方面,为顺应数据、AI 模型的巨量化趋势,设计服务器节点内多卡互联网络和多服务器节点间网络互联方案。其中,节点内的多卡互联方案以 PCIe、OAM 高速互联等标准互联协议为主;节点间网络方案将基于 RoCE 的以太网络技术搭建,实现池化资源间总线级交互,保证数据访问的极低时延。在数据中心基础设施方面,采用高密度功率机柜、高效制冷技术以实现绿色低碳目标。

二是完成软硬协同框架设计和平台原型构建。兼顾App平台与硬件资源的纵向协同设计,打造广泛支撑智能化应用场景的能力。明确以算力原生为技术锚点,AI 框架优化为辅的跨架构开发、编译、优化环境技术路线,从算子粒度上屏蔽底层智能硬件差异,对下使能智算应用跨架构无感迁移,对上释放 AI 框架协同运用效能,破解竖井式异构生态发展难题。

三是联合产业构建了自主评测体系,牵引 AI 异构产品能力有效迭代。为客观反映 AI芯片部件能力,中国移动已完成统一的功能、性能评估方案制定,通过打造训练、推理全场景验证环境,持续牵引产品优化升级,同时将评估体系纳入“芯巢”多样性算力孵化平台,通过高要求业务牵引芯片能力迭代,进一步支撑跨行业应用推广。

为加快算力网络智算基础设施能力建设,2022 年 12 月,中国移动成立了新型智算开放实验室,围绕技术标准制定、产品评测验证、智算原生体系构建、智算平台应用赋能四大目标,与产业合作伙伴开展深度合作,共同挖掘智算新需求,推动智算技术及产业成熟。

新型数据处理芯片(DPU)

DPU 是当前数据中心新兴的第三颗大芯片,专注于数据处理,可有效分担 CPU 的网络、存储、计算、安全等云化工作负载,达到卸载、加速和应用隔离的效果,在提高算效、降低能耗的同时,更好地支撑裸金属弹性发放等服务,是算力网络以数据为中心的全新计算架构底座。

当前,受限于App的关联和硬件的适配,技术架构不明晰、App标准不健全、硬件定制化严重已成为 DPU 行业健康发展需要解决的问题。为应对上述系列挑战,推动 DPU 产业稳步健康发展,中国移动针对性进行了体系化攻关:

一是完成了 DPU 算力基础设施架构设计。DPU 算力基础设施由服务器硬件层、DPU软硬融合层、平台应用层三层组成,包含管理、网络、存储、计算、安全五大基础功能系统。其中管理功能要实现虚机、容器、裸机的统一管理运维,网络功能要实现高性能vSwitch 转发、支撑 RDMA 无损网络,存储功能要实现云盘灵活挂载和 NVMe 高性能存储加速,计算功能要实现 Hypervisor 卸载和虚机的安全隔离,安全要实现分布式 FW 卸载和网络数据加解密增强等。

亚星游戏官网-yaxin222

DPU 算力基础设施架构


二是明确了 DPU App标准化的关键领域,围绕 DPU 算力基础设施架构中的五大方面展开 DPU App功能及接口标准化工作,目标实现向上与云平台的解耦。网络方面,制定 vSwitch、RDMA 功能要求以及 vSwitch 控制面与转发面、RDMA 兼容性编程接口等关键接口;存储方面,制定存储网络协议 iSCSI、NVMe-oF 卸载标准方案;计算方面,制定 Hypervisor 前后端分离架构与 libvirt 接口标准,管理方面标准化弹性裸金属发放流程和虚机、容器、裸机统一管理运维要求,安全方面,制定网络数据加解密和虚拟化安全增强要求。结合技术成熟度和中国移动业务需求,制定了中国移动 DPU App标准化发展两步走的发展路径,即一阶段重点关注弹性裸金属与 vSwitch 卸载相关功能,二阶段重点关注统一运维管理、高性能存储、无损网络、零信任安全等功能实现。三是确立了 DPU 服务器标准化“四个统一”的方向,围绕 DPU 冷机自运行、远端重启服务器等核心功能在服务器整机结构、供电、散热等方向制定了标准要求,目标实现向下与服务器的解耦。包括统一整机结构及供电最大能力,约束服务器可支撑卡的最大结构规格、最大功耗门限以及卡在服务器未开机状态启动;统一散热能力,约束服务器支撑未开机状态对卡进行散热及调速;统一边带信号定义及管理功能边界,约束服务器能够提供给 DPU 的边带信号,逐步收敛带外管理设备的交互框架;统一运维策略,定义裸金属场景上下电、复位、固件升级、异常下电、故障处理等场景的开关机流程及处理策略。

为固化相关成果,中国移动牵头在 CCSA 推进 DPU 相关标准立项,构建算力卸载软硬件标准体系。2022 年 7 月,在世界数字经济大会上联合十余家产业合作伙伴发布了《中国移动 DPU 技术白皮书》,系统性地阐述了基于 DPU 的算力基础设施架构、App功能接口、服务器硬件三大标准化方向,旨在凝聚行业共识,推动 DPU 产业稳步健康发展。

2022 年 12 月,中国移动联合产业合作伙伴成立 DPU 创新开放实验室,锚定业务场景孵化器、技术方案实验床、产业聚合平台三大定位,发挥中国移动产业链链长责任,拉通产业合作,引导业界产品成熟落地。

算力原生

随着业务多样化需求的增长,以 CPU 为主的通用计算逐渐难以满足计算性能的要求,以 CPU、GPU、FPGA 等不同架构计算单元组合而成的异构计算开始出现,用于满足通用计算和专有计算的不同需求。当前不同异构芯片的开发生态相对独立,应用的跨架构开发和迁移困难,不利于应用的创新以及算力资源的合理规划和高效利用,亟需通过开源、开放的方式建立可屏蔽底层硬件差异的跨架构开发平台。

中国移动面向算力网络中远期的发展,原创性的提出了算力原生概念,通过构建标准统一的算力抽象模型及编程范式接口,打造开放灵活的开发及适配平台,实现各类异构硬件资源与计算任务有效对接、异构算力与业务应用按需适配、灵活迁移,充分释放各类异构算力协同处理效力、加速智算应用业务创新,实现异构算力资源一体池化、应用跨架构无感迁移、产业生态融通发展的目标愿景。一年以来,算力原生技术受到了产业界及学术界的高度关注,为加速技术成熟,中国移动联合业内伙伴加大投入,持续对技术架构、演进路径及关键技术等进行了体系化研究攻关:

一是完成了算力原生总体技术架构制定。明确了算力原生技术栈由算力池化层、算力抽象层两层组成。其中算力池化层对应用调用底层算力资源的请求进行重定向和再调度,从而实现应用对底层算力资源位置和数量的无感使用,支撑业务可根据动态负载情况进行算力资源的弹性调度,充分应对潮汐效应和业务量突发等场景。算力抽象层一方面建立统一原生算力抽象接口及多模混合并行编程模型,以算力原生统一编程 API 及一组编译、优化、适配的核心工具进行呈现,构建可嵌入式融入用户业务的开发环境,辅助用户生成可跨架构流转、无感迁移和任务式映射实行的算力原生程序;另一方面构建包含原生运行时、编程模型转换工具的硬件原生堆栈,完成原生程序的加载、解析,保障计算任务与本地计算资源的即时互映射,按需实行。

亚星游戏官网-yaxin222

算力原生总体架构


二是明确了算力原生三阶段技术演进路径。阶段一的核心目标是实现异构算力资源池化,通过构建分厂家分类型的异构资源池,引入对应用调用底层算力资源 API 的重定向技术,实现同厂家算力资源细粒度的定制化分配和灵活调度;阶段二的核心目标是实现应用的跨架构迁移,通过引入跨架构转译工具,实现将基于特定芯片厂家开发的应用转换成算力原生中间原语,结合算力原生运行时和各厂商工具链,生成可跨架构互识、流转的算力原生程序,最终实现向多厂家芯片上无感迁移和映射实行;阶段三的核心目标是实现全局泛在融通,基于一二阶段实现池化和跨架构无感迁移的基础上,通过打造算力原生统一接口和开发平台,形成统一编程模型及开发环境,使能应用开发者实现跨架构的混合并行编程,加速应用和服务创新。

三是确立了算力原生的三大关键技术。包括算力抽象技术、跨架构编译优化技术和原生运行时技术,其中算力抽象技术着重针对统一编程模型、数据模型、同步机制等领域进行攻关,使开发者在编程时既可以充分利用丰富的异构资源、又不必考虑复杂的系统细节;跨架构编译优化技术着重攻关原生代码自动生成、数据自动管理和模型的多级并行等方向,降低开发复杂度,提高程序的可移植性;原生运行时技术重点针对任务的队列调度及再映射机制、数据共享与同步等方面进行攻关。

为加快算力原生技术成熟,中国移动与产业合作伙伴共同开展技术攻关,完成算力原生原型系统的设计和研发,已初步实现图像识别、视频流分析等 AI 应用的跨架构迁移部署。2022 年 11 月,中国移动联合产业合作伙伴发布《面向智算的算力原生白皮书》,明确了算力原生的定义及愿景,系统性阐述了总体架构设计和关键技术攻关方向,为算力原生技术的发展指明了方向。同时,中国移动已牵头在 ITU、CCSA 完成算力原生标准立项,并积极推进 OIF CFN 开源社区算力原生子工作组的建设,加速构筑繁荣的算力原生产业生态。

存算一体

存算一体是实现算力网络数据高效处理的创新技术,通过拉近计算与存储单元距离,直至在存储器中完成计算功能,突破冯·诺依曼存算分离“存储墙”、“功耗墙”瓶颈,可广泛应用于 AI 等访存密集场景。

当前,存算一体正处于从学术界向工业界转化的关键窗口期,存在多种路线选择,需要从器件制造、电路设计、芯片架构、工具链、App算法等各方面拉通产业链上下游密切协作。为推动存算一体技术更快实现产品化,中国移动从多方面开展攻关:

一是统一广义存算一体概念和技术分类,形成多路径探索策略。联合产业定义广义存算一体概念,提出近存计算、存内处理和存内计算三大分类和技术发展建议,推动业界形成共识。对 SRAM、RRAM、MRAM 等多种器件及其存内计算展开深入研究,并推进多项研发工作。目前已与企业开展面向 SRAM 的存内计算合作研发,与科研院校开展面向物联网端边计算的 RRAM 存算一体技术联合研发。

二是完成存算一体芯片通用架构设计,并初步构建App工具链。面向端边云不同规模算力需求、不同算法需求,设计了具有持续演进能力的存算一体通用芯片架构,结合2.5D/3D/Chiplet 等先进封装技术,将不同器件、不同制程的存内计算芯片相融合,实现优势互补,适配更多应用场景、提供更大芯片算力。

三是推动建立存算一体链式合作平台,进一步加强与产学研联合攻关,推进芯片制造、设计、EDA 等核心环节互促,推动存算一体全产业链成熟。

为加快实现存算一体核心技术突破,2022 年 12 月,中国移动联合产业合作伙伴共同发布《存算一体白皮书》,旨在聚合产业力量,共同攻关关键技术,推动存算一体技术落地应用。此外,中国移动推动“如何实现存算一体芯片工程化和产业化”提案成为中国科协“2022 十大重大产业技术问题”之一,受到了产业界的高度关注。

算力并网

数字经济时代下,我国算力规模虽持续扩大,但是算力分布不均、供需失衡等问题,导致社会算力利用率难以提升。通过多方算力并网,广泛吸纳全社会算力资源,在商业模式上打破传统的算力供给方和消费方的界限,有助于盘活社会算力,在提升资源使用效率的同时,实现算力普惠。算力并网作为算力网络运营服务体系的关键技术,对于实现社会级算力供给,打造全新的算网一体服务能力有重要的意义。

当前,算力并网仍在探索阶段,中国移动系统性地进行了攻关研究:

一是明确了算力并网的四种模式。中国移动结合算力并网业务需求,对于不同的算力类型,包括三方云池、服务器以及超算/智算等算力,按照技术实现由易到难、管理程度由弱到强,明确了包括转售、运营层对接、编排管理层对接及小型算力纳管四种并网模式。

其中转售模式是指通过运营平台嵌入第三方售卖链接,通过运营跳转,由第三方进行算力的售卖,已应用于对接三方公有云;运营层对接指通过运营平台调用第三方算力运营平台接口,实现对三方算力的初步管理并进行售卖,该模式正探索用于对接三方超算/智算中心;编排管理层对接指通过云管平台对接第三方云管平台接口,实现对三方算力的强管理,并通过运营平台进行三方算力售卖,该模式正探索用于对接三方公有云和小型三方云池;小型算力纳管指通过向三方服务器植入插件或代理,实现分布式基础设施的统一管理和多集群调度能力,并通过运营平台统一售卖,当前正在探索用于纳管三方小型服务器算力等。

二是完成了算力并网交易原型平台研发,并在多个省份开展了算力并网模式的探索。

算力并网交易原型已在中国移动算力网络试验示范网进行部署,完成了包括算力并网、多方可信交易等关键技术验证,加快了算力并网技术方案的成熟。此外,中国移动浙江、河南、山东、广东等省企业也同步开展了多种并网模式的探索,为算力网络打造社会级算网服务能力奠定了基础。

三是持续推动算力并网交易的标准化工作。中国移动牵头在 CCSA 推进相关标准立项,加快推进算力注册、接入、度量、分级、交易等并网关键技术环节的规范化和标准化工作,推动行业形成共识,加快多方算力交易生态构建。

未来,中国移动将与产业合作伙伴进一步深入合作,共同攻关算力并网和算力交易技术,探索运营服务模式。同时,综合考虑算力并网技术的成熟度和市场业务需求,分阶段逐步开展算力并网工作,面向近中期加快推进运营调用、云管对接方案的规范化和标准化,面向远期加快实现小型算力资源池纳管方案商业闭环。

2.2.2 新型网络

我国提出的全国一体化大数据中心体系对网络能力提出新的要求,东数西算、东数西渲、东数西训等跨省、跨区域业务将成为未来重要的业务场景。中国移动积极推进G-SRv6、新一代 SD-WAN 技术的应用,实现用户敏捷接入和网络端到端服务质量保障,加快400G/800G 技术的攻关和验证,满足东数西算场景下长距离、大容量的网络需求。

G-SRv6

SRv6 是新一代 IP 网络的核心协议,具备可路由属性和可编程能力,可简化域间路径创建,满足灵活的网络和业务功能需求,SRv6 结合 SDN 技术使能可编程的网络,为网络基础服务、增值服务提供了技术基础。但由于原生 SRv6 面临在长路径编排情况下报文头开销过大,带宽利用率较低,对芯片要求高等一系问题,对现网设备的性能及规模应用带来一定挑战。

为解决上述问题,中国移动主导原创了 G-SRv6 技术,对 IPv6 报文头的基础帧格式和基本转发机制进行创新,通过压缩冗余前缀提升封装效率,在兼容原生 SRv6 的同时,彻底解决了原生 SRv6 存在的转发效率低、部署难度大的问题。为推动 G-SRv6 技术的快速成熟,实现从技术方案到产品落地和产业推广,中国移动在标准制定和产业生态建设两方面共同推动:

一是推动 G-SRv6 成为国际网络标准。中国移动在 IETF 推动成立 SRv6 头压缩设计组,主导完成 SRv6 头压缩需求、方案分析标准立项,推动 G-SRv6 成为 SRv6 国际基础标准之一,实现我国在 IP 网络基础协议方面的突破。

二是实现 G-SRv6 技术产品化和标准化。积极推进 G-SRv6 全产业链生态的构建,牵头完成包括芯片、设备、控制器、测试仪等国内外十多家厂商互联互通验证,推动整体技术成熟。通过在 5 个省进行现网试点,完成了 G-SRv6 基础转发机制、业务保障、跨域互联多场景及多厂家互通能力验证,标志着 G-SRv6 已具备现网规模部署能力。

中国移动正加快完善统一 SRv6/G-SRv6 协议栈的 IP 算力网络底座,推进 SRv6/G-SRv6 规模部署,同时构建基于 G-SRv6 构建技术创新体系,开展随流检测技术标准制定和试点验证,进一步提升业务感知能力,并结合切片技术,为算力网络业务提供确定性的网络质量保障。

新一代 SD-WAN

随着企业数字化转型的不断加速,传统的 Underlay 专线由于业务开通周期长,人工对接多,已越来越难以满足企业诉求。基于 Overlay 的 SD-WAN 虽然通过网络集中管控极大缩短了业务开通周期,但由于管理控制触点多,在提供差异化、确定性 SLA 服务的时候仍面临局限。

相对于传统 SD-WAN,新一代 SD-WAN 通过 Overlay 和 Underlay 网络协同大幅增强差异化质量保障能力,基于统一的 SRv6/G-SRv6 实现端到端网络可编程,通过应用感知能力实现差异化的网络服务,利用业务质量感知技术进行 SLA 闭环控制实现网络质量可靠保障,并采用业务链技术提供连接增值服务。

为推动新一代 SD-WAN 技术的快速成熟,实现从关键技术到迭代验证再到产业推广的闭环,中国移动从标准、产品、生态三方面共同推动:

一是完成新一代 SD-WAN 标准在 BBF、CCSA 立项。提出 SRv6/G-SRv6 面临的入云、无线/有线任意上行、VPN 安全隔离等系列问题的解决方法,实现基于统一 SRv6/G-SRv6 协议体系的应用驱动、泛在接入、差异化连接、安全可靠、算网一体的能力。要求防火墙能够支撑 SRv6/G-SRv6 报文解析,并规定 CPE 发出的 SRv6/G-SRv6 报文的填充内容,以实现防火墙穿越;采用隧道封装的方式,使报文可实现无线/有线任意上行;采用源地址验证等方式保证 VPN 安全性。

二是完成新一代 SD-WAN 方案制定和跨厂商测试验证,推动产业成熟。通过推动 CPE、PoP、控制面全面解耦,提供端到端隧道、端到端加密、应用感知、业务链等服务。联合多家设备厂商开展多厂家实验室测试,推动跨厂商互通问题解决,为大规模组网奠定基础。

当前,新一代 SD-WAN 已实现 Underlay/Overlay 融合的网络连接拉通能力,未来将进一步聚焦于运维、管控、转发的闭环,提供基于业务质量意图的确定性保障能力,同时重点推动算力增值服务和连接服务的协同,基于业务链技术打造算网多要素融合产品。

400G/800 全光高速互联

400G/800G 光传输技术是指在波分复用系统(WDM)中使单波长传输速率达到400G 或 800G、光纤总容量达到 32T 或 64T 的传输技术,是超高速大容量光传送网的重要演进方向,能够进一步提升网络带宽并降低每比特传输成本。

随着“东数西算”工程正式启动,我国算力网络基础资源设施建设已全面展开。如何实现超长距离、超高速的传输,满足大量东部地区用户在西部地区进行数据中心存储、AI训练、渲染等算力应用时提出的大带宽、低时延传输需求,成为业界面临的问题。中国移动加快推动 400G 技术验证与应用,同时超前布局 800G 技术,从多个方面开展技术攻关,取得了一些初步验证结果:

一是持续推进 400G 传输关键技术研究和验证。目前 400G 长距传输存在多种技术路线,决定 400G 技术选择的核心是高波特率光管芯,中国移动联合业界实现调制、频谱、基础设施全面技术革新,完成了全球首个 400G QPSK 准实时系统模拟现网真实参数传输验证。

二是创新设计单载波 800G 传输系统方案,有效抑制信号传输性能恶化。联合采用大有效面积(130um2)超低衰耗 G.654.E 光纤和拉曼放大方案,实现超过 2000km 极限传输距离,为 800G 传输技术的发展提供了重要的方向指引。

三是开展新型光纤技术研究与验证。与科研院校联合攻关,实现了空芯光纤上 40 波×800Gb/s PM-64QAM 大功率光信号传输,进一步提升光纤通信系统的容量,降低传输时延。

中国移动将持续推动 800G 超高速传输技术、核心器件、新型光纤的技术实现和产业化,在长距大容量传输、C6T+L6T 超宽谱波段扩展、光电联动全光组网技术等方面开展技术攻关,推进超高速率、超长距离、超大容量、超宽频谱等关键技术研究和突破,助力光传送网向大带宽、低时延、高效灵活、安全可靠演进,实现算力网络全光高速互联和全光灵活调度。

算网一体

算网一体是计算和网络两大学科交叉融合形成的新型技术体系。中国移动以算力网络化和网络算力化为推进方向,重点攻关算力路由和在网计算技术,在明确技术架构与技术路线的同时开展原型验证,加快技术成熟。

算力路由

算力路由作为算网一体的标志技术,旨在通过网络来感知、调度、编排算力,融合计算和网络形成新的架构和协议,进一步推动基础设施走向算网融合,使海量的应用能够按需、实时调用不同位置、差异化的算力资源,通过连接和算力的全局优化,实现用户体验、资源利用率和网络效率的最优组合。

算力路由需要网络域、计算域协同创新,当前算力和网络各自的技术体系、架构实现和发展路径不同,编排调度、运营优化相对独立,算网一体的统一架构、技术标准和开源生态等还不完备。为应对上述系列挑战,中国移动从顶层设计出发,原创地提出算力感知和路由技术体系,并从技术、标准、产业多方面持续推进:

一是完成了面向算网一体演进的算力路由架构和技术体系的制定,包括一体化调度、一体化协议、一体化设备和一体化服务,推动计算和网络两大学科融为一个体系,共生发展。确立了算力路由 Overlay 和 Underlay 两种技术体系,Underlay 实现算力和距离向量的融合创新; Overlay 实现选路决策从一维变多维,进行算、网、业务多目标联合优化。

二是明确了 Underlay 和 Overlay 并行探索的算力路由技术路线。面向近期,构建算网协同感知技术体系,初步形成基于多维资源感知及 SRv6 选路的集中感知路由调度能力;面向中期,探索演进算力路由方案,Underlay 基于 IPv6/SRv6 等已有协议扩展增强,Overlay 基于应用层优化,形成 Underlay 与 Overlay 协同的智能路由调度方案;面向远期,设计新型算力路由协议体系和算路算法,实现更加优化的多要素叠加融合路由。

为推进算力路由技术创新和应用,中国移动与产业合作伙伴共同开展技术攻关,于2019 年和 2021 年先后发布系列《算力感知网络技术》白皮书,逐步明确了算力感知和路由场景需求、概念、架构和关键技术,为算力路由技术发展奠定了基础。2022 年 8 月,在业界首发《算网一体架构及技术体系展望白皮书》,系统性阐述算网一体架构及技术体系。同时,联合产业伙伴共同推进算力路由创新技术试验验证,初步搭建端到端算力路由验证系统,完成阶段性功能测试和性能测试。在 IETF、CCSA 牵头完成算力路由标准立项,积极推进算力路由需求、场景和关键技术达成共识,加速算力路由技术成熟。

在网计算

在网计算将应用相关的计算卸载至网络设备,在完成数据转发的同时实现部分数据处理,提升了系统的计算效率,降低通信延迟,减少总体能耗,同时有效地提高了网络设备利用率。作为具有重要应用潜力的算网一体关键技术,在网计算可灵活按需卸载多种计算、网络、存储、安全相关功能,如数据在网聚合、在网缓存、分布式系统一致性在网校验等,在网计算将为算力网络发挥关键作用。

当前,在网计算产业实践仍处于探索初期,面临技术路线不清晰,应用前景不明确,软硬件功能不统一,标准体系不完善等问题。中国移动体系化布局在网计算的研究和产业化技术路线,面向近期和远期分别开展研究实践:

一是明确了在网计算的发展思路,分阶段推动在网计算从特定场景到通用场景计算任务承载。初期以智算中心分布式 AI 模型训练和通用数据中心云网关功能灵活卸载两个典型应用场景切入,设计在网计算系统架构和技术方案,在专用场景中验证在网计算的技术优势。面向远期,研究构建通用的在网计算能力,为更广泛的应用场景提供能力支撑。

二是面向典型应用场景制定了在网计算方案,通过可编程网络设备实现部分功能的卸载,完成系统原型验证。中国移动构建分布式 AI 在网计算原型系统,相比业界主流的集中式参数服务器架构,在 8 台 GPU 服务器的计算规模下,可以将 AlexNet、VGG 等标准AI 模型训练速度提升 1 倍以上。基于 x86 CPU、FPGA、ASIC 设计构建算网融合网关,可实现对传统服务器负载均衡、防火墙、NAT、VPN 等网络功能的卸载,进一步提升资源使用效率。

三是面向通用场景开展标准化工作,加快通用在网计算能力构建,推动在网计算从局部应用走向全局泛在。在网计算在分布式 AI 计算加速、分布式存储系统优化以及云网络功能卸载等方面具备一定共性特征,中国移动正通过挖掘在网计算的共性能力,不断推进在网计算相关标准化函数接口的设计工作,为不同应用服务提供按需的在网计算服务。

亚星游戏官网-yaxin222

在网计算技术架构


中国移动不断推进产业实践工作,2022 年 9 月,联合业界产业共同发布了《P4 超融合网关技术白皮书》,推动在网计算基础设施产业生态成熟。标准化方面,2022 年 7 月,中国移动牵头在 CCSA 成立在网计算研究课题,进一步推进在网计算技术研究,形成技术共识。

绿色安全

绿色与安全贯穿算力网络发展始终,中国移动不断加强新型绿色数据中心和一体化全程可信技术的攻关,推动算力网络基础设施可持续发展,筑牢算力网络安全防护屏障。



举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2024-11-14 15:02 , Processed in 0.749318 second(s), 15 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图