在软件称霸世界几十年后,硅谷(Silicon Valley)的“硅”部分重返舞台。事实证明,需要大量的硬核硬件才能够将生成式人工智能的奇迹变为现实,芯片制造商英伟达(Nvidia)凭借其强大的图形处理器抓住了这一机遇,从而登上市场霸主的宝座。
对英伟达的人工智能友好型处理器的需求如此强劲,导致在今年5月,投资者对该公司的股市估值超过了1万亿美元,大致相当于沙特阿拉伯在2022年的国内生产总值(GDP)。在人工智能驱动型经济中,诚然,芯片有可能变得像石油一样重要,但在瞬息万变的科技行业,即便是领头羊,也仍然要常备不懈,是无法依靠已经探明的储量长久稳坐霸主宝座。
对身穿皮夹克的英伟达的首席执行官黄仁勋(Jensen Huang)来说,最严重的威胁来自一家横跨城镇的芯片制造商。这家芯片制造商拥有独特的优势,既有图形处理能力,又有多年来与巨头抗衡所形成的企业形象。在苏姿丰(Lisa Su)的领导下,AMD的目标是在人工智能芯片市场里占据相当大的份额,并且随着人工智能革命拉开帷幕,甚至取代英伟达成为行业领导者。
苏姿丰在今年9月中旬接受《财富》杂志采访时表示:“我认为这是我们书写AMD成长故事新篇章的机会。放眼全球,拥有我们所拥有的(知识产权)和客户群的公司少之又少,坦率地说,我们有机会真正塑造人工智能在全球的应用方式。我认为我们有这样的机会。”
苏姿丰有充分的理由大谈AMD在人工智能芯片市场上的机会,她预测到2027年,人工智能芯片市场的价值将达到1,500亿美元。在个人电脑和服务器微处理器市场上,AMD常年屈居亚军[行业领导者是英特尔(Intel)],但由于该公司在2006年收购了专注于视频游戏加速器的加拿大芯片制造商ATI,目前已经成为全球第二大GPU制造商[这种芯片非常适合训练人工智能模型,例如OpenAI的GPT-4和谷歌(Google)的Bard]。
据估计,英伟达占据了人工智能训练市场90%以上的份额,但该公司却难以满足市场对其最强大的人工智能芯片H100的需求,苏姿丰正准备在本季度推出MI300(H100的竞争对手),对其发起直接攻击。
晨星公司(Morningstar)的科技部门主管布莱恩·科尔洛(Brian Colello)说:“2024年肯定会出现这样的场景(在设想中):英伟达的GPU售罄,客户只能使用AMD的GPU,而AMD仅凭可得性就可以赢得业务。”
“对于英伟达的估值(价值上万亿美元)而言,有两个问题需要解决:一是这个市场有多大,二是英伟达是否能够占据绝对主导地位。”科尔洛表示。如果英伟达可以占据人工智能市场上95%的份额,远远甩开第二位AMD,那是一回事。但他指出,如果是三七分,“那对AMD 就非常有利了。”
至于如何划分市场份额,这就要归结为在性能、灵活性以及(在供应链不确定的情况下)可得性方面的比拼,这些领域都是苏姿丰久经考验的领域。
远房亲戚,势均力敌的竞争者
当开着法拉利(Ferrari)、时而盛气凌人的黄仁勋在经营他一手创立的公司时,苏姿丰——深思熟虑、直言不讳、人情味十足——已经进入她掌管一家老牌公司的第10个年头,人们普遍认为她拯救了这家公司。
苏姿丰在三岁时从中国台湾移民美国,她和黄仁勋都来自台南市,实际上是远房亲戚。苏姿丰后来成为IBM备受推崇的电气工程师,主管新兴产品部门。在担任飞思卡尔半导体公司(Freescale Semiconductor)的首席技术官一段时间后,苏姿丰于2012年加入AMD,担任高级副总裁,两年后出任总裁兼首席执行官。
尽管苏姿丰最初拯救AMD的策略包括将产品线从个人电脑市场扩展到游戏和高性能计算等领域,但公司与英特尔的竞争依旧需要投入大量精力。这也许是不可避免的,但分析人士称,这造就了英伟达如今的优势地位。
英伟达在过去十年里投入了大量资金,通过CUDA接口,让开发人员在构建数据处理应用程序时更容易利用其GPU的并行处理能力,但AMD与英特尔在CPU领域里的竞争意味着“它没有在数据中心GPU的人工智能软件上投入那么多的资金。”Gartner公司的分析师艾伦·普里斯特利(Alan Priestley)说道。
“英伟达的城墙就是它的软件生态系统。”普里斯特利指出。与CUDA相比,AMD的ROCm软件堆栈以漏洞较多、提升难度较大而著称。
人工智能新创企业Lamini的联合创始人、英伟达的前CUDA架构师格雷戈里·戴莫斯(Gregory Diamos)表示,他认为AMD正在缩小差距。戴莫斯说:“AMD已经投入数百名工程师支持通用人工智能计划。”
但即便是苏姿丰也承认还有很多工作要做。“我会毫不犹豫地宣布:我们的硬件是优秀的,我们的软件也在不断改进。”她说。“对于过去编写的一些人工智能应用程序,将它们迁移到AMD确实需要完成一定工作。”不过,苏姿丰认为,ROCm对较新的人工智能工作负载进行了“很好的优化”。
人工智能的下一阶段
人工智能的自然发展可能会给AMD带来巨大的机遇。
人工智能公司之所以青睐GPU,是因为它可以同时执行多项任务。在视频游戏中渲染丰富、快速移动的图形图像所需的计算能力,可以轻松用于训练大型语言模型,比如OpenAI的GPT-4,从而在相对较短的时间内处理大量的原始数据。
但许多分析师认为,占据人工智能市场更大份额的不是训练大型语言模型,而是大型语言模型的应用:随着人工智能成为日常生活的一部分,需要构建相应系统来回答预计会出现的数十亿条查询。这就是所谓的“推理”(因为它涉及人工智能模型利用其训练语料来推断所呈现的新数据),GPU是否仍旧是推理的首选芯片还是一个悬而未决的问题。
Meta和谷歌等所谓的超大规模企业已经在努力开发TPU等内部人工智能芯片,这些大公司最终将需要提供人工智能高效服务的专业芯片。许多人还认为,CPU将在推理市场上扮演重要的角色,这一转变将为AMD发挥传统优势带来机遇。
即将推出的MI300系列数据中心芯片结合了CPU和GPU。苏姿丰表示:“由于在架构方面做出的决策,我们实际上认为自己会成为推理解决方案的行业领导者。”
晨星公司的科尔洛也指出,市场正在不断发展变化,而且这还不包括AMD的劲敌英特尔为挑战英伟达,在推出新的人工智能处理器Gaudi2(用于训练)和Greco(用于推理)上做出的努力。他说:“对所有这些公司来说,自然有足够的动机不受制于英伟达,希望出现更多的竞争者,编写软件,传输模型,并采取一切必要措施,以确保生态系统健康。该生态系统包括英伟达、AMD,可能还有英特尔,以及它们自己正在开发的内部芯片。”
英伟达则表示,它“高度集中于”推理。该公司的GPU推理性能在过去一年里提高了八倍,一位发言人告诉《财富》杂志,英伟达正在“投资推理路线图”。
该公司还表示,它认识到自己不会永远是唯一的选择,客户自然希望货比三家。英伟达的一位发言人说:“竞争性的生态系统对人工智能领域而言是积极的,因为它能够更快、更有效地加速技术发展,我们当然鼓励和欢迎竞争。”
苏姿丰的目标不仅仅是通过云构建具备人工智能功能的数据中心,还要让人工智能直接在个人设备和其他联网的小工具上运行。她对《财富》杂志表示:“成功的关键在于,我们确实占据了人工智能计算使用量的很大一部分。”
当然,英伟达也瞄准了这些细分市场,现在甚至试图通过一款名为Grace的新型“超级芯片”来涉足高性能CPU业务,并把其与H100型号GPU捆绑在一起。科尔洛说:“英伟达依然想占领推理市场,而且他们有可能会这样做。对于任何看好英伟达的投资者来说,他们可能会假设所有类型的人工智能流程都将通过英伟达的芯片和/或网络来运行。”
但是,即使英伟达保持领先地位,科尔洛也认为,AMD稳居第二名的强势地位“非常令人羡慕,并将带来可观的业务。”苏姿丰坚信,她的公司将充分利用人工智能的爆炸式增长。
苏姿丰说:“显而易见的是,随着2022年生成式人工智能的普及,这一(行业)具有以令人难以置信的速度快速增长的空间。我们预计未来五年多的复合年增长率将达到50%,当你谈论数百亿美元的规模时,很少有市场能够做到这一点。”(财富中文网)
译者:Zhy