算网时代的全光算力底座的关键能力——李壮志吕文琳

91百科网 44 0

《信息与通信技术》是由中国联合网络通信集团有限公司主办、主办的国内外公开发行的中英文科技期刊(CN11-5650/TN,ISSN1674-1285),正式创刊2007年12月出版。本刊旨在反映国内外信息通信技术的最新研究成果,提供信息通信技术交流平台,推广先进的信息通信服务和应用,服务我国信息社会建设和创新型国家。

【作者姓名】李壮志、陆文林、陆远、张黎明

【作者单位】中国联合网络通信股份有限公司山东分公司; 山东省邮电规划设计院有限公司

[摘要]文章首先分析了计算网络时代全光基础架构面临的挑战,并介绍了全光计算基础的关键能力。 以某省中国联通为例,介绍了高质量政企网络三步走战略,总结了阶段性建设要素,分析了计算与网络融合全光基地建设的关键能力,包括光学与计算协同、边缘设备连接、视觉传输能力等,最后分享某超算中心的实际案例。

【关键词】计算网络; 光传输网; 低延迟; 光云集成

介绍

在当前数字经济转型浪潮下,运营商面临着传统B2C业务的人口红利逐渐消失、收入增速放缓的现实。 同时,他们也面临着千行百业的云迁移和数字化转型带来的新的收入增长机会。 。 海量数字应用需要差异化的、内生安全的计算网络基础设施和使能平台。 运营商逐渐开始以网促云、网促计算,打造差异化的云网和计算网竞争力,赋能世界。 行业数字化转型将进一步支撑数字经济高质量发展,同时开辟新的收入增长点。 面对数字化转型浪潮,高质量光网络作为计算和网络融合基础设施之一,是数字经济的基石,也是各行各业数字化转型的重要驱动力。

2021年,中国联通发布CUBE-Net3.0网络创新系统。 作为中国联通未来5至10年网络转型的顶层架构设计,提出了计算网络融合、云光融合、确定性服务三大业务使命,以及基于人工智能和数据驱动的控制建设“以计算网络为基础、数字智能为核心、低碳集约、安全可控”的计算与网络一体化基地,将传统连接服务升级为“连接+感知+计算+智能” “智能融合”服务,全光网络是整个转型过程中使算力即服务的关键能力[1]。 某省联通始终坚持“创新、智慧同行”的理念和CUBE-Net架构的指导。 在网络建设上不断探索创新,全力服务全省新旧动能转换和企业数字化转型需求,提出了从智能光网到智能光网的“三步走”战略光云,进而迈向全光算力网时代,持续夯实智慧光云城市基础,构建企业与算力之间的数据高铁,探索F5G+X服务万千新场景行业。

1 计算网络时代全光基地的架构挑战

算力网络是根据业务需求在云、网、边之间分配和灵活调度计算资源、存储资源和网络资源的新型信息基础设施。 计算能力是构建未来智能社会的基础。 未来10年,面向智能世界,计算和网络将快速发展。 未来,算力将分为云、边缘、终端三个层面,三者协同发展[2]。 如图1所示,当前算力的发展趋势是从通用计算向超算/人工智能迈进,架构正在从“端-云”走向“端-边-云”。 云网络时代,企业上云,企业IT需要云资源。 作为组件,大部分应用连接到企业,架构是少量服务在公有云上(非核心应用)。 计算网络时代的特点是从“连接一个企业”到“连接N台机器”,从“部分云/计算”到“根据业务类型不同云/计算”,从“带宽”到“带宽+时间” ”。 延迟+安全可信”。

对网络高效算力的要求主要体现在“高速无处不在”和“弹性协作”两个方面。 前者要求网络有强大的

图1 算力供应架构及网络匹配算力演进

为了保证算力的供应,网络需要能够保证算力供应的敏捷性,体现算力均衡和按需算力的能力。 在运营商层面,迫切需要建设面向未来计算与网络融合的承载网,包括基于增强IP属性(采用SRv6、算力信息感知技术等)的承载网和高质量的全覆盖承载网。 -基于OTN技术(分组增强技术、OSU切片技术等)的光网络[3]。 OTN品质全光网络作为云/计算通道和云间通道的承载方式之一,将面临动态的、不可预测的业务。 而传统的光网络新业务基本都是采用滚动规划的方式进行预测。 基于固定费率的建设、接口采用分层管控。 其“过度设计”和“静态”的特点在承载能力上显得效率低下。 计算网络时代,需要建立灵活、开放的全光计算网络基础架构。 构建智能动态基础交通网络。

如图2所示,全光算力基础面临的架构挑战主要体现在以下四个方面。 1)超宽带互联:在从传统数字专线到云专线再到计算网络的发展过程中,点对点的小带宽专线将转变为云间互联、 DCI互联、边云协同/边边协同等,尽管问

图2 全光计算网络基础架构特点总结

该网络具有超宽带互联的特点。 2)确定性体验:业务体验从传统网络的尽力转发、看不见的服务质量转变为确定性体验。 要重点提升全网流量、时延、抖动、丢包率等指标的感知能力。 3)计算与网络融合:随着企业上云,计算能力成为一种资源。 复杂的网络交互需要在云端完成。 网络和计算能力需要相互感知、相互协作。 例如,OTN品质的光网络需要连接到云端。 / 进入计算通道,管理和编排需要协调计算能力和网络资源。 4)无处不在的接入:个人和行业用户都可以使用多种接入方式,包括OTN/PON/MSTP/ETH等,优质客户可以使用分组增强光传输网络(PeOTN)实现弹性硬管道感知服务并动态调整以保证安全和体验[4]。

2 全光算力基地分步建设策略

以中国联通在某省的实践为例,提出了未来全光算力基地的三步走战略。 第一步:从传统业务到智能光网络,该阶段主要以超宽带互联为主; 第二步:从智能光网络到智能光云,该阶段主要聚焦于云网融合和泛在接入; 第三步:打造全光算力基地,本阶段主要完成计算网络集成和确定性体验。 某省联通2019年创新推出“SD-FAST”智能光网络,通过先进的分组增强OTN技术、云网络协调器和智能管控引擎,为党政、军队、金融提供服务、医疗、制造等行业。 高品质政企专线连接解决方​​案。 2020年至2021年,我们率先启动从智慧光网到智慧光云的探索建设,提出智慧“光云十六城”建设规划。 通过强大的全光网络,与信创云、政务云、医疗云、金融云等业务融合,提供光、云一体化的服务能力。 2022年起,某省中国联通开始建设计算与网络融合的时延确定、带宽确定、可用性确定的高质量全光算力基础网。 在其他方面继续创新。

2.1 智能光网络建设

该战略的第一阶段是从传统业务向智能光网络的转变。 传统OTN网络各层基本是背靠背连接,业务在不同层的分界点上下调度。 集群业务基本都是由本地设备透传和分断。 本地OTN承载传统类型业务,与业务网络流向基本匹配,部署分段承载。 OLT业务在县局二层节点实现,城域网业务在地市核心CR点实现。 不同层次的互连方式为UNI互连。 对于政企客户专线等业务,缺乏端到端的开通管理和业务调度能力,业务时延较大,缺乏智能控制能力。

智能光网络的目标是构建端到端的综合智能控制网络。 网络级技术手段主要解决背靠背、上行业务效率低、成本高、时延长的问题。 跨域互联由传统的小颗粒UNI对接转变为100G NNI对接。 ; 同时面向5G、政企、数据中心布局,部署PeOTN技术,构建适合灵活业务承载的智能光网络。 端到端一体化网络的手段是通过国家与省一体化、省与地方一体化、市县乡一体化三个一体化建设端到端的高质量政企网络。 业务层面,主要基于SDN技术部署单域控制器,部署网络编排器并打通B/O域流程,制定“双线”业务发展规划,推出基于SDN的产品,细分行业应用场景,提供差异化​​产品。 以某省联通为例,打造了“SDFAST”智能光网络专线产品,具有快速响应(Flexible-provide)、弹性带宽(Agile-bandwidth)、自助服务(Self-manageable)等特点。 )和时延可见性(Time-visible)四大功能为政企客户提供优质的服务体验。 通过SD-FAST产品,OTN专线上升趋势明显,MSTP专线逐步向OTN迁移,腾出老旧SDH设备,实现绿色节能[5]。

智能光网络阶段,通过双平面、双节点、双路由、光电一体化与本地网双核构建全光三维骨干网。 中国联通在某省提出的“智能光立方网络”总体架构如图3所示。通过与该省不同局址的本地网络核心MESH互联,构建省级骨干网第二平面。原省级骨干平面,与原第一平面相连。 ROADM光层互联开放,形成三维互联彩灯网络,打造全省全光三维骨干网络。 全网智能融合全光ROADM,路由更加丰富。 可以实现资源互补、多路径保护。 当某条链路使用速率较高时,可以三维绕开部分路径,以平衡整个网络资源的利用率。

图3 智能光立方网络架构

2.2 智慧灯光云建设

第二阶段战略是从智能光网络向智能光云演进。 智能光云的目标是在智能光网络的基础上向前和向后延伸,融入云端和终端,实现云管端协同,让客户连接网络后立即访问云端。 具体在网络建设方式上,一是深度向下覆盖。 终端建设意味着不断下沉全光锚点。 采用PeOTN-CO价值分级建网方式,下沉节点深度覆盖用户热点,让任何企业都能覆盖2公里以内的用户热点。 智能光云网络可在范围内接入,实现用户便捷、高可靠的接入,接入网络即即时接入云端[6]。 二是向上光云融合,实现光云融合,一跃入云,实现云池100%覆盖。 即智能光云网络覆盖所有云池,OTN实现100%预覆盖,随时进行10GE预连接。 可以启用云访问[7]。 智能光云网络架构如图4所示。

图4 智能光云网络 图4 智能光云网络架构

此外,还通过定义智慧光云城市的指标来衡量基础设施建设能力。 智慧光云城市的关键指标从“连接密度”、“一定体验”和“计算密度”三个维度定义,如表1所示。在连接密度方面,覆盖密度至少为0.5定义市区每平方公里OTN节点,每个乡镇至少1个OTN节点。 在体验判定方面,定义可用性、时延、丢包率等硬指标,提升服务标准。 在计算密度方面,要求OTN光节点和云池具有100%的覆盖和预连接配置,以实现快速接入云端。

2.3 计算网络融合,打造确定性全光计算网络

算网时代的全光算力底座的关键能力——李壮志吕文琳 协同 底座 带宽 架构 接入 第1张

第三阶段战略是继续加强计算网络融合,打造确定性全光计算网络。 算力已经成为生产力,天气预报、航空航天、图像渲染、自动驾驶、智能制造等应用场景都需要海量、实时的数据计算能力。 算力网络就是构建一个可以连接算力的网络,让需求方能够快速、无损地享受全部算力供应。 全光算力基础需要不断优化网络。 通过全光网络的不断延伸,打造时延确定、带宽确定、可用性确定的高质量全光算力网络,服务于算力需求方。 而供给侧则提供大带宽、高可靠、低时延、零丢包率、“0”抖动的超大容量“高铁”,让企业时刻享受云算力[8]。

如图5所示,全光算力基础架构的主要特点是: 1)骨干网基于OXC和集群技术,实现大容量、高速互联和灵活调度,由目前的光算力基础架构演变而来。单波长100G/200G到单波长400G/800G,满足大规模应用的需求。 算力节点连接要求。 2)在城域层面引入OSU切片技术,满足业务弹性计算能力,实现弹性带宽容量应对算力峰值。 3)光算力锚点呈现多元化、差异化融合趋势。 OLT与OTN的结合作为光算力的锚点,为边缘端连接提供差异化​​的接入方式。 4)持续优化确定性体验函数和网络可视性,根据带宽、时延、距离、跳数等综合权重创建直观、可视化的容量图,实施精细化管控,实现网络的高效调度计算网络。

3 全光算力基地关键能力

3.1 光计算协作

未来算力将分为三个层次:云(中心算力)、边缘(边缘算力)、终端(智能终端)。 三者之间存在协同关系。 有些数据在云端处理,有些数据在边缘处理,有些数据在终端处理。 同时,还会生成云边、边端、边边等协作数据。 光计算协同是基于上述计算资源的分步情况,通过OTN网络构建确定性的体验。 网络提供计算服务,其价值在于释放算力,比如中心云与边缘云高质量互联,构建边云协同计算网络; 工业互联网、元界等低时延业务在边缘云等闭环。

如图6所示,未来的光计算协同架构,需要在现有云网络架构的基础上进行以下演进: 1)在策略控制层引入计算网络统一编排模块; 在管控层引入算力感知模块。 算力统一编排基于计算资源和网络资源进行业务协同编排,并与云管理平台进行算力通知。 各级算力资源通过网络的集中控制平面进行分配。 算力感知模块分析云端算力。 管理协作。 2)业务映射到全光网络中,全光网络需要具备业务切片功能(依靠OSU技术实现)。 根据业务互联需求,通过切片、灵活调整OSU管道带宽、OSU动态等方式,将业务映射到OSU隧道中,实现差异化、隔离的业务承载。 拆除和建造有助于计算能力的灵活使用[9]。

光计算协同架构创新建议探索三种类型的传感技术:1)地址传感,连接到多个云的灵活性之一。 算力节点动态调度,业务报文根据算力节点地址自动调度到目的节点。 2)应用感知,网络点播服务。 ONT/OLT应用感知、OTN(延迟/带宽要求)通知、OTN按需动态创建/删除/无损调整OSU带宽。 3)算力感知和算力路由优化。 设备/SDN控制算力感知并将其报告给计算网络大脑。 根据综合业务需求、网络信息、算力信息,计算出最优算力路由,并进行路由优化和调度。

3.2 并排连接

无论应用程序在哪里,计算网络的末端都会延伸。 随着OTN下沉到综合业务接入点,边缘设备连接可以提供差异化​​的产品和服务能力。 如图7所示,家庭宽带和业务快线通过传统PON方式接入OLT,高端组网和云专线在末端增加OTN-A设备,实现端到端的高带宽。 -优质的全光纤网络连接。 中端组网/专线上云(商务楼宇、智慧社区)建议采用OTN P2MP技术实现,通过OLT实现泛在接入。 OLT内置P2MP支路板连接末端CPE,配置超级上行板接入政企OTN。 ,完美融合OTN的高品质和PON的广覆盖两大优势,实现商务楼宇、园区企业品质专线的快速开通。

OTN P2MP解决方案的技术特点和价值包括以下几点: 1)双波长CPE基于时隙分配,稳定、低时延。 采用类似SDH的时隙分配技术,实现用户之间的时隙隔离。 2)OLT切片与家庭宽带业务隔离,端到端硬管道可以实现P2MP专线与ODN网络之间的物理隔离。 3)传输和访问跨域管控,服务端到端交付,SLA可见。

3.3 可视化运输能力

确定性体验的关键指标包括可用性、时延、丢包率等,时延是释放算力潜力的核心指标之一。 目前的延迟测量技术仅限于各个专业。 例如,OTN网络通过插入PM/TCM层开销来实现时延测量。 但从业务角度来看,端到端时延缺乏自动计算和可视化能力。

网络延迟的影响与网络工作级别成正比,即工作级别越低,延迟越小。 如表2所示,交换机和路由器的处理时延一般为1ms~10ms,而OTN网络工作在OSI七层协议模型的L0/L1层。 节点时延可以达到μs级别,L0层的光器件可以达到ns级别,光网络相对于IP网络时延具有更大的优势。

可视化容量作为全光算力网络的确定性体验指标,可以将优质的网络能力转化为领先的市场竞争力。 建议基于CO-DC开发时延圆图,按需优化城域网架构配置。 。 如图8所示,全光计算网络的时延可以概括为设备时延与光缆路径时延之和。 光缆路径的单向时延为5μs/km。 OTN设备的站内时延可以通过配置不同的单板参数来确定。 纳入计算,利用SDN控制测量数据叠加路网仿真数据,实现端到端时延测量。 如果企业所在地没有OTN设备,则企业入局网络连接被虚拟化,默认采用IP技术。 用路网长度乘以光缆系数来模拟光缆长度。 上下游业务的IP转发时延设置为0.2ms。 传输网络根据OCH搜索路径,导入SDN控制器时延数据,找到时延最低的路径。

根据时延测量结果,可以进行时延优化。 建议如下: 1)减少弯路:多条路线到达价值节点。 2)一跳直达光层:减少电层节点数量。 3)稳定、低时延:忙闲时稳定,即OTN靠近用户,方便用户接入,减少IP转发。 4)简化封装:减少电节点延迟。 采用OSU封装,简化业务映射封装层次(5层~3层)。

4 超算中心案例实践

如图9所示,某超级计算中心成立于2011年,主要提供海洋气象、生物医学、物理化学、工业等领域的应用服务。 已服务400余家单位,大力支持全省数字经济建设。 超级计算中心新组装的计算机系统采用千万亿次架构,峰值性能为1.0706千万亿次/秒,持续性能为0.796千万亿次/秒。 该系统的综合水平处于当今世界前列。 晋升队伍。 为了解决省内其他城市科研单位到超级计算中心的算力调度能力问题,需要全光算力基地发挥其输送能力。

当计算能力不再是问题时,距离和带宽就成为限制大规模计算的障碍。 某省联通为超算中心建设OSN 1800/9600的端到端PeOTN网络,建设各城市到超算中心端到端硬管道,实现零带宽拥塞、零数据包损失; 提供100G独享带宽和毫秒级超低时延,打破科研单位与超算中心之间的瓶颈,让算力得到充分释放。

5 结论

构建计算网络融合的全光算力基础不可能一蹴而就。 需求变化、架构演进、技术迭代,共同推动全光计算网络基地向开放、智能化、集约化方向发展。 在整个过程中,算力感知、计算网络编排、边端连接和确定性体验是关键要素。 总体目标是通过计算网络基础设施层、计算网络统一编排层、运营服务层的不断突破,最终实现计算网络的目标架构。 实现目标还存在问题和挑战。 例如,跨域架构的协同技术尚未突破,行业和生态都面临挑战。 产业各方需要共同努力,共同推动计算网络融合技术的发展和生态的繁荣。

【关于作者】

李壮志:工学硕士,高级工程师,山东联通网络部副总经理,主要从事F5G技术创新研究和建设管理工作。

陆远:工学硕士,高级工程师,主要从事干线及本地传输网络相关咨询设计工作。

陆文林:工学硕士,高级工程师,山东联通网络部部长,主要从事网络创新和传输网络技术研究

技术研究和施工管理工作。

张黎明:工学学士,工程师,主要从事本地传输网络相关咨询和设计工作。

标签: 协同 底座 带宽 架构 接入

发表评论 (已有0条评论)

还木有评论哦,快来抢沙发吧~