国家十大算力集群上架率提升,网络成本待降低
48岁的大S自从罕见现身小S公公的葬礼之后,关于她的舆论便一直没有停。一开始是关于大S穿着透视装和涂红色指甲油现身葬礼的争议,之后有网友扒出大S在葬礼上的衣服和头饰竟然都是之前刷汪小菲的卡买的。
来自部分西部数据中心集群城市的声音是:希望建立枢纽集群直连网络,降低东西部间数据传输费用
文|吴俊宇
编辑|谢丽容
2022年2月“东数西算”工程启动,迄今已满两年。作为 “东数西算”的核心工程,十个 数据中心集群目前已有较大进展。中国算力资源的区位布局逐步得到了优化。
十个 数据中心集群(也被业内称为“十大集群”,以下称“集群”)包括张家口集群、长三角集群、芜湖集群、韶关集群、天府集群、重庆集群、贵安集群、和林格尔集群、庆阳集群、中卫集群。当时,“十大集群”明确了上架率等发展目标。比如,数据中心平均上架率要达到65%以上。
上架率,即已上架开机运行的服务器数量/机架可容纳的服务器数量。指标越高,一般意味着数据中心利用率越高。第三方市场调研机构沙利文数据曾显示,2022年中国数据中心平均上架率为58%。华东、华北、华南地区上架率超过65%,西北、西南地区分别约为30%和40%。
近一年来,“十大集群”的上架率有较大提升。3月5日,《财经》从相关研究机构和部分枢纽集群获取了一组数据。数据显示,截至2023年11月末,张家口、芜湖、韶关、重庆、贵安、庆阳、和林格尔和集宁、中卫等八个集群的算力总规模超过105万标准机架,整体上架率约为62%。贵安、庆阳、和林格尔和集宁、中卫四个西部集群的平均上架率由2021年的50%提高至60%以上,略低于东部集群。按这一趋势,2025年底“集群”整体上架率有望超过70%,将提前完成65%以上的上架率目标。
西部集群的上架率情况尤其受外界关注。《财经》得到的上述数据显示,截至3月1日,中卫、庆阳等西部集群的上架率已超过80%。上述数据表明,“十大集群”平均上架率已经高于全国平均水平,且西部集群上架率提升明显。中国东西部算力资源分布不均衡局面得到了一定程度改善。
数据中心上架率提升,通常意味着算力效率也得到了提升。不过,严谨地说,衡量算力利用效率的指标不仅包括数据中心服务器上架率,还包括服务器CPU资源利用率。
提升算力利用效率已是数据中心集群城市当下的共同目标。网络的速度、质量、资费同样会制约算力效率。部分数据中心集群城市还有一些个性化诉求,比如:建立枢纽集群直连网络,降低东西部间数据传输费用。
上架率为何得以提升
“东数西算”政策规划、地方城市招商引资、企业自发迁移等因素共同让“十大集群”上架率提升了。
张家口、和林格尔和集宁(和林格尔是呼和浩特市辖县,集宁是乌兰察布市辖区)是“十大集群”中算力规模位居前列的两个集群。它们的天然优势是离东部经济发达地区近,网络延迟低、带宽资费低,土地、绿电资源丰富。两个集群顺势承接了经济发达地区的数据中心。
企业普遍愿意迁移至这两个集群。“东数西算”工程启动前,一批企业就已在张家口、和林格尔和集宁部署数据中心。“东数西算”工程启动后,这两个集群的集聚效应增强了。大批知名科技公司在此部署业务。比如,阿里和华为在张家口、和林格尔和集宁两个集群均规划了可容纳数十万台服务器的智算中心。苹果公司在和林格尔和集宁集群部署了云数据中心,为苹果中国用户提供iCloud服务。
《财经》了解到,张家口、和林格尔和集宁在很多科技公司数据中心布局规划中处于重中之重的位置。这两个集群上架率为60%上下,且发展空间不小。原因在于,不少科技公司数据中心布局规划中,这两个集群处于重中之重的位置。在这里,科技公司不仅会规划可容纳数十万台服务器的数据中心,还留下了较大的扩容和冗余空间。
中卫、庆阳两个集群位于西部,上架率均超过80%。它们的机架规模低于东部,但当地把算力当作支柱产业。“东数西算”工程落地后,当地政府近两年加快了招商引资步伐,大量引入产业链上下游企业。
中卫集群相关人士在近期一场内部讨论中表示,中卫集群数据中心上架率超过80%的一大原因是,企业自主化行为高,政府自建项目少。当地倾向于引入有影响力的平台企业,用市场需求催生良性循环。2013年中卫最先引入亚马逊,形成了产业示范效应。三大电信运营商进入中卫后,当地网络基础设施逐步完善。此后,华为、阿里、三星、小米、小红书、爱奇艺、美团以及一批央国企乃至中小企业逐步在当地建设数据中心或使用当地算力资源。
庆阳集群相关人士在同一个内部讨论中则表示,庆阳集群起步晚,不过已围绕数据中心产业引入了超过110家算力、能源、制造等上下游企业。庆阳引入了包括华为、阿里、百度、京东、金山云、秦淮数据等云公司,以及三大电信运营商,乃至中国能建、易事特等能源相关制造企业。其招商引资逻辑是,算力发展需要能源供给,能源供给又会带动装备制造。这些产业会环环相扣、轮动发展。
数据中心上架率提升,一般意味着算力资源得到了更充分利用。
多位数据中心集群城市相关人士普遍认为,理想上架率应为60%-80%。健康的上架率要根据实际情况评估。比如,部分集群2022年开始起步,随后新引入了一批算力企业,新建的数据中心投产仍需一段时间,因此60%左右的上架率是合理的。部分集群的算力产业发展周期超过十年,理论上架率应该超过80%。但数据中心上架率并非越高越好,因为要保持适度冗余以便随时扩容。
数据中心的服务器上架率提升后,还需要提升服务器CPU利用率。两者共同提升,意味着算力资源的利用效率可以拉到最高。这也是部分集群正在思考的下一步问题。
一位数据中心集群城市人士提到,数据中心上架率提升后,也可能存在部分已上架服务器资源未满载运行的情况。这需要挖掘本地企业、科研机构算力需求,或是通过算力调度平台跨集群、跨城市资源共享。
《财经》了解到,目前不同算力资源的CPU利用率不一。其中,公有云合理利用率为40%-60%,政务云合理利用率区间为25%-40%,智算和超算为50%-80%。
一位央企背景的云厂商人士对《财经》表示,目前各地城市正在推进“一城一云”项目,也就是本地投资建设一朵云,政府、国资企业、医疗教育等公共部门统一使用。一些大型央国企集团也在尝试“一云一网”项目,也就是集团建设一朵云,各子公司统一使用。一城一云、一云一网可以有效提升算力利用效率。这虽然无法实现公有云一样高的利用率,但却是中国当下IT发展阶段最现实的做法。
为什么呼吁提速降费
“十大集群”需要进一步提升上架率。从最新的分析来看,网络传输的速度、质量、资费被认为是核心制约因素。
数据中心并非孤岛,集群城市之间、集群城市与核心城市(如北京、上海、广州、深圳、杭州等)之间有数据传输需求。这需要通过三大电信运营商的网络带宽。不过,东西向远距离传输的带宽资费、网络延迟,“对冲”了中西部集群的电力、土地价格优势。《财经》了解到,一些企业宁愿在东部地区多承受30%到50%的成本,也不愿将业务迁移到西部。这在一定程度上制约了西部集群的算力效率持续提升。
影响东西部间的数据传输成本、时延的因素很复杂。东西部两地数据中心间数据传输通常没有直连网。数据传输需要通过“ 骨干网-省级骨干网-城域网”绕转。三大电信运营商间也无法“三网互通”。路由跳转后实际距离会更长。比如,宁夏中卫与北京、上海的时延分别为8.4毫秒、18.1毫秒,与广州的时延为22.6毫秒,无法满足东部业务对20毫秒内时延的需求。
目前,电信运营商对西部集群仍沿用常规网络收费标准。一些企业在东西向传输数据时,甚至不用通信网,而是用高铁/飞机搬运硬盘。一位数据中心技术人士对《财经》表示,这种极端现象偶尔在远距离部署数据中心时存在。这是时间、成本综合考量下的选择。数据中心的数据规模可能高达EB(100万个TB)。租用的带宽速度如果不够高,网络传输时间长达数月。但高铁/飞机传输数周就能完成,成本甚至更低。《财经》了解到,苏州和青海间租赁一条100G/秒/月带宽的成本为300万元。
多位通信技术人士对《财经》表示,在光纤中,数据传输速度是每200公里1毫秒。这几乎发展到了技术极限。西部地区网络时延是物理距离导致的,无法短时间内通过技术实现优化。理论的解决方案有两条:一是重新布设线缆,建立部分城市的直连网络;二是打通集群与各重点城市间的数据直连通道。
部分集群城市人士认为,“东数西算”需要新一轮“提速降费”。可以考虑的提速方案包括,在集群城市之间、西部集群城市与北上广深杭等一线城市间修建直连网络;或是把枢纽节点的集群城市升级为 一级骨干传输网。降费方案包括,由电信运营商推出针对数据中心的“东数西算套餐”。
比如,芜湖集群相关人士提到,芜湖到上海直线距离300公里,但网络路由距离为500公里,这带来了一定的网络时延。当地的期望是,三大电信运营商能够加强芜湖至上海、杭州、苏州等长三角城市的直连网络建设,同时降低网络资费,以便于芜湖集群承载更多算力需求。
《财经》得到的信息是,一些数据传输需求大的科技公司一直也有降低带宽费用的声音。一般数据传输需求越大,网络成本在数据中心总成本中的占比越高。《财经》掌握的一组数据显示,抖音等*类企业的网络成本约为40%,阿里云、华为云等云厂商网络成本约为20%-30%,讯飞等AI解决方案公司网络成本通常不足10%,一些西部地区专业数据服务公司网络成本占比甚至高达50%。
有政策研究人士和云计算技术人士同时对《财经》表示,数据中心的“提速降费”要有限制条件。因为要考虑到电信运营商的积极性。目前集群城市算力业务大,数据传输需求明确。合理做法是,只针对东西向集群城市之间降低网络传输成本。东西向数据传输需求逐步增长后,运营商也能因此受益。
事实上,曾有电信运营商人士提出,“先定算力、再定网络”的方案。因为在哪儿建网、怎么建网都要考虑成本和收益。如果算力需求够大、够明确,就可以建网。电信运营商也会有继续降低网络时延的动力。但也有网络技术专家针对这种想法提到,这是个“先有鸡还是先有蛋”的问题。有时不是先有需求才有网络,而要先建好网络,需求才会慢慢跟上。
好消息是,上述问题目前正在解决。2023年12月底发改*等五部*联合发布的《深入实施“东数西算”工程,加快构建全国一体化算力网的实施意见》提到过相关建设目标。如, 枢纽节点间网络传输费用大幅降低,建立 枢纽节点专项网络传输计费机制,打通 枢纽节点与非 枢纽节点间网络主干道。
《财经》了解到,优化“东数西算”网络传输的速度、质量、资费等问题已提上议事日程。相关部门已经制定了一系列解决方案。其中包括推动三大电信运营商出台“东数西算”资费优惠套餐。“贵阳-深圳(或广州)”城市间网络降费试点也正在展开。
责编|张雨菲
题图|来源网络