当前,我国启动“东数西算”工程,推动全国一体化算力网络枢纽节点建设,致力于构建数据中心、云计算、大数据一体化的新型算力网络体系[1],但在具体实施过程中仍存在算力布局供需失衡、算力标识和度量不统一、算力和网络难以协同发展等难题。为衡量算力网络的发展程度,指引算力网络规划和设计,引导算力网络运营和服务,笔者将针对我国算力网络三大发展阶段开展研究,从算力、网络、调度控制、融合服务、安全可控和低碳节能等多个维度构建全面的评估体系,衡量算力网络各阶段发展水平,以期推动全国算力网络高效协同发展,激发算力产业的无限活力。
1 国内外算力网络发展现状
1.1 算力网络提出背景
算力在数字经济时代已逐渐成为一种新的生产力,为千行百业数字化转型提供新动能。打造融合感知、传输、存储、计算于一体的新型算力基础设施将有力地推动数字经济发展[2]。为了满足未来社会对信息处理的巨大算力需求,需要将大量散落在全网中的闲置算力通过网络连接汇聚成统一的计算资源,并进行管理和调度,再通过网络将计算资源提供给客户进行应用和服务,在此背景下,算力网络应运而生。
1.2 算力网络全球布局加速
全球已开始高度重视新一代信息基础设施系统的全面发展及升级,其中“算力+网络”新一代融合设施系统部署工程被西方各国领导人视为未来新一轮信息化建设竞赛的重点战略方向[3]。当前,以算力基础设施和网络基础设施发展问题为研究着力点,世界主要国家和地区纷纷酝酿出台政策规划与创新激励扶持措施,抢抓国际新一轮信息科技创新潮流和全球产业体系变革机遇。美国将提升“算”和“网”融合服务能力作为目标,依托以往在云计算领域积累的优势,加速推进信息化建设。欧洲各国则主要聚焦区域性算网基设施,正在逐步构建起基于网络数据及安全应用的现代信息通信技术基础设施[4]。
1.3 我国算力网络研究进展
“东数西算”工程的实施将着力推进新型基础设施建设,全面协调推动全国算力网络发展部署和建设落地[5]。在我国,基础电信运营商持有网络带宽资源,并在全国范围内广泛布局算力基础设施[6]。基础电信运营商有着多年研究与实践经验,是算力网络发展的主力军。中国移动通信集团有限公司(简称中国移动)将算力网络定义为一种算为中心、网为基础的新型计算信息基础设施,以及深度融合发展的网、云、数、智、安、边、端、链等技术,并将算力网络战略发展目标设定为“算力泛在、算网共生、智能编排、一体服务”[7]。为实现这一目标,中国移动以重大技术创新为牵引,聚焦新算力、新网络、新算网、新模式、新计算安全和新计算绿色六大创新技术方向,开展算力网络创新技术试验。中国电信集团有限公司(简称中国电信)在通信业内已率先明确提出了云网融合的业务发展新方向。多年来一直致力于云网融合,坚持以“网是基础、云为核心、网随云动、云网一体”为基本原则,持续不断地进行创新,致力于开发面向行业客户的算力网络综合运营服务技术[8]。中国联合网络通信集团有限公司(简称中国联通)积极探索构建新一代的数字基础设施,通过将联接、计算与智能相融合以及服务一体化的方式,积极推动网络建设从“云网融合”向“算网一体”过渡,以实现更高效、更智能的服务[9],并明确将实施路径划分为“协同供给”“融合运营”和“一体共生”三大阶段[10]。
2 算力网络发展面临的挑战
2.1 产业生态有待形成
算力网络涉及领域较多,包括了互联网、通信、软件和信息技术等行业,相互关系复杂。算力网络产业规模大,上下游产业众多,上游为算力基础设施、网络基础设施等底层基础设施,中游为算网大脑、算网运营等相关平台,下游为千行百业的多样应用场景。目前,算力网络处于产业发展的初级阶段。虽然在上游基础设施领域,算力网络的发展相对成熟,但在其他领域仍然存在大量的竞争机会和合作潜力[11],产业生态亟需统一。为推动算力网络高质量建设,应联合多方力量,加快凝聚产业共识,构建统一合作平台,共推、共创算力网络产业影响力,构建算力网络生态圈[12]。
2.2 标准体系尚未建立
标准化建设是推动算力网络有序发展的重要手段,但目前算力网络相关标准尚未健全,缺乏算力与网络资源统一标识、统一调度和统一管理能力的标准体系,无法有效保障算力资源与网络资源的高度协同和一致调度。同时,随着算力调度的发展,算力编排、算网大脑及算力产品交易等技术领域也亟需研制相关标准,以保障算力网络的服务质量。三大基础电信运营商作为国内算力网络发展的主力,应着力联合算力网络各方主体在算力度量、算力交易、网络架构、层间接口协议、调度引擎等领域形成多方认可的算力网络标准体系。
2.3 产品方案和业务模式亟需设计
多元异构算力和动态网络构成的算力网络产品具有种类多、数量大、分布广等特征,并且其具有开发周期长,开发过程受技术限制,以及开发和商业模式不确定等困难,这些都对满足使用者不同业务场景的多样需求提出了挑战。算力网络产品作为发展过程中直接服务用户的形式,需要跨厂商、跨应用、跨地域的集成交互来进行融合,为确保达到此应用目标,行业还需要同步搭建起统一、开放、高效的算网应用创新平台,同步开展技术架构、能力、协议标准等全方位的应用技术研发验证工作,共同探索绿色、高效、可落地的算网产品商业模式,为不同业务需求和应用场景提供匹配的算网产品服务[13]。
2.4 主体责任仍未明确
目前,在整个算力网络体系中,算力提供者、网络运营者和服务使用者的责任边界划分较为模糊,模糊的责任边界可能会造成计算资源的重复使用,影响算网产品的精准调度。算力网络中的算力资源来自不同提供商,存在异构算力匹配性差等问题。网络资源来自基础电信运营商,运营商网络之间的深度融合受限,跨网资源调度困难,网络利用率和传输效率较低。随着算力网络的发展,应出台相应的规划与准则来进行责任划分,促使不同主体共同建设算力网络,支持算网产品在多领域的规模化示范应用,服务国家战略与重点行业领域,形成兼容可替代、性能先进的一体化算力网络体系。
3 算力网络发展阶段分析
算力网络的演进将经历三个阶段,从算网协同逐步走向算网融合,最终发展为云网一体。初期的算网协同阶段通过对算力资源、网络资源以及业务场景的协同感知,按照需要将业务调度到合适的节点,实现算网资源统一编排、统一运维、统一优化。在进阶的算网融合阶段,算力已经无处不在,为实现云、边、端算力之间的高效协同,需要提供更智能的服务,并形成统一的算网大脑,实现计算和网络之间的深度融合。在成熟的云网一体阶段,新的算力网络服务模式和新的产业形态将会形成,从而真正解决算网融合问题,实现在网计算、云上计算、算网一体共生。
3.1 算网协同阶段
算网协同阶段主要表现为物理层面上数据中心与网络设施协同建设发展,算力和网络开始进行布局和运营等方面的协同配合,通过算控制器和网控制器实现算网资源互调,提供算网一站式服务。这一阶段将进一步扩大算力资源的范围,包括利用网络可达的所有云、边、端设施提供的算力资源,同时也将对多样异构算力资源进行全面感知。通过不同应用场景下的流量学习,网络可以获得最优的流量转发与流量控制策略,从而显著提高网络传输和调度的能力,并实现云间互联,通过对应用、算力等资源进行全面感知,将服务调度到合适的节点进行计算。本阶段是算力网络的起步阶段,算网协同阶段的核心是“协同”,算力网络中的算和网协同供给、协同编排、协同运营和一站服务。
3.2 算网融合阶段
算网融合阶段是在全面感知算力和网络的基础上,将多方算力与网络进行融合,面向协同推理、区块共识等位置分散式计算场景,将算力任务与数据传输的调度协同增强,实现网络与算力的融合共生,服务未来网络的各种新业态。该阶段应具备端到端业务开通以及可视、可管、可控能力,需要跨越组织、业务、运维、运营、应用等进行全局规划。该阶段是算力网络发展的第二阶段,发展阶段的核心是“融合”,融合相关应用形成数字连续体,有统一的算网大脑,实现算力网络中算和网的融合运营、智能编排和统一服务。
3.3 云网一体阶段
在云网一体阶段,算力和网络设施在协议层面实现了一体共生,通过全面整合全社会的算力资源,建立泛在多方算力交易平台,同时网络通过内生算力进行自身算力升级,可直接为客户提供服务。在该阶段,算网的边界被彻底打破,算网一体化基础设施形成,为用户提供包括算力、网络、管理、运营、数据等多技术要素融合的一体化服务。该阶段主要关注的是算力网络的服务能力,将算网数智等多要素能力进行深度融合,通过自动感知用户意图,提供种类丰富、类型多样的算网产品,开创算力网络服务的新模式。该阶段是算力网络发展的第三阶段,作为算力网络的成熟阶段,其核心是“一体”,包括一体化供给、一体化运营、一体化服务。
4 评估体系需求分析
4.1 衡量算力网络发展程度
在算力网络建设过程中,建设与运营主体不同,其使用的技术手段及能力也不同,这都将使算力、网络以及算力网络的调度与融合朝着不同的方向发展,算力网络的发展阶段和发展程度也因此而呈现出不同态势。我国应通过构建统一的算力网络评估体系,将算力网络的发展分为不同阶段进行研究,从多层次、多维度选取评估因素,根据算力网络所处阶段的侧重设置不同权重比例,以此来评估和衡量算力网络的发展状态和发展阶段。统一的算力评估体系可为第三方评估算力网络提供指引,获得更为真实准确的评估结果。运营商、算力供应商可借助评估体系形成对算力网络的一致性标尺,明确自身算力网络所处的发展阶段,并助力其对未来的发展方向进行合理的规划与预测,全面支撑我国算力网络健康有序发展。
4.2 指引算力网络规划和设计
现阶段算力网络的规划和设计面临着诸多挑战:算力效率水平与算力规模不匹配;网络支撑能力不足;跨领域架构融通和算网一体化技术尚需突破;算力网络交叉领域的理论研究和技术攻关难度较大;行业各方对算力网络的理解不一致;算力网络产业现有服务和商业模式尚待开发。针对算力网络规划设计的以上困境,需要制定算力网络发展评估体系,以诊断和评估算力网络基础设施现状,衡量业界关注的算力网络关键技术特征,为算力网络应用服务提供理论支撑,指引算力网络各发展阶段的规划和设计工作,从源头上缩减算力网络发展过程中可能出现的矛盾,保障算力网络高质量发展。
4.3 引导算力网络运营和服务
算力网络服务运营的实现是通过调度不同位置、不同类型的算力资源进行整合,为用户提供成本最优的一体化算网服务。其目的是向上开放算力网络的服务能力,通过网络实时感知用户的算力需求以及自身的算力状态,对算力资源、网络资源进行全面接管。为了验证算力网络一体化服务架构及相关技术的可行性,评估一体化服务的商业应用模式及价值[14],需要从多角度着手构建算力网络评估体系,综合评估算力网络的运营和服务现状,为用户提供评估算力网络服务的标准。同时,这也可帮助运营商、算力供应商明确其算力网络运营和服务的发展现状,明晰问题所在,从而找准算力网络运营和服务的正确发展方向,更好地为用户服务。
5 算力网络评估体系建立
5.1 评估因素及关键技术特征选取
基于对我国算力网络发展的分析,并综合中国移动、中国联通和中国电信等相关机构和企业对算力网络发展及相关指标体系的研究,结合算力网络总体技术架构和算力网络各个阶段的技术特点、发展问题、未来趋势等内容,笔者从算力、网络、调度控制、融合服务、低碳节能和安全可控六个维度选取关键技术特征建立我国算力网络发展评估体系(见图1),全面客观地评价我国算力网络发展的状况。
图1 算力网络发展评估因素
5.2 评估因素分析算力、网络和调度控制为性能因素。算力因素主要从算力底座多样性和异构算力感知两个方面来衡量,主要评估通用计算、智能计算、超级计算、边缘计算等算力底座的多样性,以及中央处理器(Central Processing Unit,CPU)、图形处理器(Graphics Processing Unit,GPU)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、数据处理器(Data Processing Unit,DPU)等异构算力的感知和度量情况。网络因素主要从基础网络可靠性、网络敏捷传输、数据跨链传输三个方面来衡量,主要考虑通信网络的质量和效率,可以从网络带宽、网络协议、网络加速和网络时延等方面进行评价。调度控制因素主要从算力调度和算网编排能力两个方面来衡量,主要考虑算力和网络的衔接能力,可以从跨区域调度、多云间调度和算网大脑平台建设等方面进行评价。
融合服务、低碳节能和安全可控为服务因素。融合服务因素主要从算力交易、弹性按需和算网产品三个方面来衡量,主要考虑算力网络的运营服务能力,可以从可提供的算网产品情况、算力交易平台建设等方面进行评价。低碳节能因素主要从硬件设备节能和基础设施节能两个方面来衡量,主要考虑算力网络在各个阶段的节能低碳能力,可从芯片节能、服务器节能、数据中心等基础设施节能和应用节能等方面进行评价。安全可控因素主要从基础设施安全、数据安全和交易安全三个方面来衡量,主要考虑算力网络在各个阶段的安全保障能力,可以从数据中心等基础设施安全能力、网络安全能力、数据安全技术体系构建等方面进行评价。
5.3 评估流程分析在开展算力网络评估工作过程中,首先需要明确评估对象的现状及所处的阶段,主要结合算力网络的总体技术架构,分析评估对象在总体架构涉及的技术层级,判断评估对象所处的发展阶段。确定阶段后需要重点分析评估对象相应的技术基础、现状特点、未来应用需求等内容,选取具体评估分析指标,最后对选取指标的评估结果进行分析得出结论,形成算力网络发展评估体系规范化流程。
6 趋势与展望
6.1 算力网络将高质量发展算力网络是算力基础设施与网络设施融合的重要形式,通过算力网络可以使算力服务“泛在可达、灵活取用”[15]。我国算力网络建设正处于初期阶段,尚不具备完善的技术、运营、监管机制。在“东数西算”工程的背景下,应夯实算网基础设施底座,采取算力调度的方式打造全国一体化算力网络,进一步优化全国算力资源配置。未来,“东数西算”工程将作为主要推动力量,推动建设全国一体化算力网络,实现高质量发展。
6.2 算网主体跨界发展将催生新业态在算力网络发展的各个阶段,算力网络各参与主体将会加快合作协同,催生出更多算力网络的新模式、新业态。运营商的网络管理能力可能会以接口形式得到部分开放,从而使运营商获取更多算力市场份额。云厂商的网络管理能力将持续加强,算网服务质量得以提升。第三方服务商将基于特定服务场景和业务需求提供定制化建设服务方案。在算力网络大发展背景下多主体将会进一步合作协同,催生出成熟的算网融合、云网一体解决方案。
6.3 算网标准评估工作将持续推进未来,随着算力网络的应用场景进一步明确,在算力网络发展的各个阶段,算力网络各参与主体将进一步联合,共同研制行业认可的相关标准规范,统一算力网络服务标准及相关技术标准,并在此基础上开展评估、测试等研究工作,为算力网络资源高质量服务打下基础,支撑引导不同应用场景下的算力网络体系建设。
7 结束语
本文提出的评估体系处于起步阶段,为更好地匹配算力网络发展在各阶段的特点,迫切需要整合各方力量,有针对性地做好算力网络评估工作。我国应通过建立、健全算力网络评估体系,创建集技术验证和应用创新于一体的测试验证机制,加速评估体系落地,推广产业应用,从而推动算力网络体系创新发展。