本文作者:理想主义者

王坚院士:算力_云计算_AI,发展云计算需要“三位一体”

王坚院士:算力_云计算_AI,发展云计算需要“三位一体”摘要: 埃隆马斯克怼不是一次两次了这次直接搞个大事把告上了美国旧金山高等法院月日消息显示马斯克指控及其首席执行官山姆奥特曼违反了成立时签阿里云创始人中国工程院院士王坚年在阿里云栖大会上阿里...

埃隆·马斯克怼OpenAI不是一次两次了,这次直接搞个大事,把OpenAI告上了美国旧金山高等法院。3月1日消息显示,马斯克指控OpenAI及其首席执行官山姆·奥特曼违反了成立时签

阿里云创始人、中国工程院院士 王坚

2023年,在阿里云栖大会上,阿里云创始人、中国工程院院士王坚说,人工智能和云计算的发展现在走到了一起。云计算和GPT的关系,将像是电和电动机,模型将会像智能时代的电动机一样,消耗掉云计算提供的大多数算力。当那一天来临,意味着诸多由模型驱动的新业态出现。

最近,在与《中国电子报》记者沟通的过程中,王坚说,当前中国的云计算发展,正面临着一个机遇点:“人工智能给了我们一次机会,要么就赶上了,要么差距会更大。”

王坚院士:算力_云计算_AI,发展云计算需要“三位一体”

云计算要“三位一体”地发展

在王坚看来,人工智能给中国云计算的发展带来了“第三次浪潮”:第一次浪潮,出现在十年前,出现了以Netflix、米哈游为代表的云原生企业,中国的云计算业务在这个阶段起步,但由于国内市场成熟得太慢,便落后于海外;第二次浪潮,出现在传统企业采用云计算之时,但并没有将中国的云计算拉上正确的发展轨道;第三次浪潮,正发生在当下,由生成式人工智能带来机遇。

“算力、云计算、人工智能”,要把握好这次机遇,王坚提到了三个关键词,“不能把这三者拆开来看,这三件事情一定要三位一体地来搞”。

算力是基础,GPU等板卡就像是“砖头”,搭建起算力所需的基础设施;云计算提供的是组织服务能力,把“砖头”提供的算力调动起来;大模型(人工智能)提供最终落地的可能性。找到真正消耗算力的场景,这是发展云计算最重要的环节。

在王坚看来,当前社会上对“大模型”的定义有些宽泛而含混,大模型事实上需要分五个层面来理解。首先是基础模型训练,即如何用万卡集群把一款模型训练出来,这是最消耗算力也是最考验技术能力的环节。第二是模型调整,在通用模型的基础上,调出适用于个别行业或垂直领域的模型。第三是应用模型,可不基于通用模型,而是由其他类型数据训练得来。第四是模型应用,也就是将大模型用到千行百业,很多时候人们常把模型的应用当作是在开发大模型,这是非常不严谨的看法。第五是将模型变成一类服务,并应用到用户那里。

在理解大模型的五个层面中,前两个环节对算力的需求是最高的。但随着用户数量的增长,模型应用过程中所需的算力可能将超过模型训练所需。“如果一个 应用模型的算力成为主流,那么我们的产业就成形了。”王坚说道。

要用“云计算的思路”发展云计算

王坚留给记者最深的印象,是他思考事情的关注点:他不担心产品卖不出去,而最担心产业发展不完备。

记者见到王坚时,阿里云战略发布会召开不久,那次会上,阿里云宣布全线下调云产品 售价,平均降价幅度超过20%,最高降幅达55%。于是,“为什么降价,是否在通过降价寻求突破”,是记者提给王坚的第一个问题。

关于降价,王坚否认了“搞价格战”的推测。他坦言道,降价说明成本低到了一定的程度。但他同时也肯定了,中国云计算的确正受到挑战。

从全球来看,中国企业在云计算行业拥有的市场份额还非常有限。根据2023年第四季度营收排名,全球云计算企业前三强分别为亚马逊、微软、谷歌云,三家企业共占据全球66%的市场份额。阿里云以全球4%的份额居于第四位。

“这个挑战在于,我们没有形成欧美那样成熟的市场。”王坚说,“这很可惜,我们的起步不晚,阿里云提供云服务并实现规模服务的时候,微软还没有找到云计算的发展路径。”

王坚认为,现在海外厂商迎头赶上并与国内拉开差距,其实与国内云计算的发展思路存在偏颇有很大的关系:国内许多号称的“云计算”并不是真正的云计算,很多服务器采用的还是传统的运营方式。

王坚说:“当前国内可能仅仅有20%~30%的服务器,是真正按照云计算的思路来提供服务的,此外还存在大量传统的服务器。”云计算要最大化地发挥作用,就要作为一种公共服务存在,而不是卖服务器。就像Open AI 与微软的关系一样,Open AI需要的,也不是计算板卡,而是微软提供的云服务。

在当前市场需求面前,服务器的系统硬件架构需要发生很大的变化,甚至要重新定义。王坚曾在接受采访时说,要让整个数据中心成为云计算时代的一台计算机,实现严格意义上的云计算。而现在,就是把数据中心变成计算机最好的时候。

产业发展不应该“贩卖焦虑”

“算力”,是云计算“万丈高楼”的起点。有足够的高算力的板卡才有机会做大模型训练等工作。由于地缘政治的种种原因,国内的高算力板卡的存量和增长与国外存在很大的差距。

全球云计算排名第一的头部企业亚马逊云曾透露,亚马逊云服务器上所用的由NVIDIA A100、H100提供的算力有3000E FLOPS,且将每个季度增加1000E。这对于我国的算力储备而言是个天文数字。

虽然从算力储备而言,我国与国外发达 之间存在较大的差距。但王坚认为,不要“泛化焦虑”。因为,相对于我们要做的事情而言,当前算力的“砖”是够用的。他打了个比方,把模型训练比作写小说,把我国具有的算力比作笔记本。“写个长篇小说,一本笔记本是不够用的。但是当前写字的速度还远远没达到笔记本准备的速度。当把一本笔记本用完的时候,新的笔记本也就到了。”王坚说道。

我国的算力,从长远来看存在缺口,但短期来看,是能够满足模型训练所需的。

芯片的先进制程卡脖子?在算力基础设施的储备上,王坚有不同的看法:“当前GPU的发展逻辑本质上还是在堆料,不论是用什么工艺,都是在堆料。既然如此,我们找更有效、可行的方式堆,也是能达到目的的。”

期待创新的应用出现

今年全国两会期间,在2024年全国政协会议的小组会上,王坚再次讲到了米哈游的案例。

这是一家从诞生开始,就把业务建在云上的云原生公司。2022年,米哈游主营业务收入达到273.4亿元,净利润161.45亿元。当谈及米哈游的成功,王坚有掩饰不住的兴奋。因为这是在云计算技术的基础上生长起来的全新业态。

而在云计算基础上的产业创新,是王坚最想看到的。

他时常把云计算与电的出现作比较。一来,他认为云计算应该变得像电一样易得,变成一种公共服务;二来,可以在此基础上衍生出诸多新业态。

他曾经在阿里云栖大会上展示20世纪最伟大的20项工程技术成就,其中排名第一的是电气化,剩余的十九项,多多少少得到了电气化带来的便利。他特别期待着在云计算的基础上,会有多种多样的创新应用衍生出来,在此后十几年,甚至几十年的时间里被发明出来,带来新的增长机会。

“这个世界永远不需要贝多芬第五交响曲,直到贝多芬创作了它,现在我们不能没有它。”这是王坚最喜欢的一句话。

这句话应该理解为:世界上很多东西,对很多人来讲都是不需要的,直到他们被创造出来。

和王坚交流的最后,记者问:下一个“米哈游”何时出现?

“我也很期待。”他说道。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享