撰稿 | 言征
出品 | 51CTO技术栈(微信号:blog51cto)
两个月前,软件在巴塞罗那的公司一场圆桌会议中,AMD高管们向外界透露一项惊人的软件变革消息。
AMD正在进行一项重大改变 :重心将从硬件开发转向强调软件开发、公司API 和 AI 体验。软件
AMD执行副总裁兼首席商务官Phil Guido和计算和图形业务组高级副总裁兼总经理Jack Huynh没有拐弯抹角 :
“AMD将软件工程团队规模扩大了三倍,公司并且全力以赴投入软件开发。软件”
此前8月,软件我们报道了AMD豪掷49亿美元收购服务器制造商ZT的公司新闻 ,原因也是软件AMD亟需ZT的1100多名软件工程人员来为其接下来的发展战略来服务 。服务器租用AMD彼时只有500名左右的公司开发人员。从这一变化我们也可以看出一些端倪 ,软件硬件公司AMD不止满足于设计硬件了。公司
这一场“软件团队大扩张” ,软件意味着AMD即将迎来一场员工的角色变革。
这不仅意味着引入更多人 ,更意味着接下来的人员工作内容的变动:“我们将组织中的一些最优秀的人才调动到这些团队中来提供支持 。”当这一转型完成后,该公司将更接近于同行,比如英伟达、云计算英特尔 。
具体如何转变?AMD领导层回应说 ,过去他们“首先是硅,然后才考虑软件开发工具包 、工具链,最后是ISV(软件开发公司)。”
“我们战略上的转变是首先与ISV交谈……了解开发者希望实现什么功能 。”这是创建新处理器方式的根本性变化 。
“过去的AMD只会追求速度和性能 。建站模板之后,AMD将首先关注AI软件,我们(已经)知道如何造硅 。”
从这些谈话可以看出:AMD相信他们现在已经拥有了完整的计算硬件堆栈,从 CPU 到 AI 加速器,到 GPU ,到 FPGA,再到数据处理,甚至服务器架构。目前在接下来的AI时代的“芯片角逐战”拼图中,AMD只剩下一块:软件(及生态) 。
9月10日,Jack Huynh再次给外界一个意外的高防服务器宣布:AMD将自家已有5年历史的图形架构RDNA、计算架构CDNA重新整合在一起 ,推出名为“UDNA”的全新GPU架构 。
早在2019年,AMD大刀一挥,历史悠久的GCN GPU架构宣告终结,从此分为两条路线:RDNA架构面向图形与视频 ,也就是我们熟知的Radeon游戏显卡,而CDNA架构则面向AI 、HPC,也就是免费模板Instinct计算卡,迄今都已经发展了三代。
但今时不同往日 ,游戏 、计算重新回到了二合一 。
Huynh解释道 :(当时)分为两种架构是为了更好地各自优化,包括架构优化、开发优化,但现在统一架构对于开发者来说更轻松,不再需要做选择,尤其是当AMD的数据中心业务越做越大之时。
这也是AMD也与开发者进行了充分的亿华云交流的结果 ,开发者表示非常欢迎统一架构 ,减少了复杂性 。
此外,Huynh承认 ,RDNA架构发展过程中犯了一些错误 ,比如内存一致性、缓存子系统的不断改变,每次都需要重新优化 ,以后不会继续这样了。
当Huynh并没有提及另一个重要的原因:市场收入的表现。近期财务报告显示,AMD目前一半的销售额都来自数据中心产品。
在一场有关UDNA的采访中,Huynh透露 ,此番动作也是想追赶英伟达自家通用CUDA平台的成功 。因此,AMD推出新的架构 ,也是必然。
技术路线的改变背后则是两支研发队伍的整合。“这是一个从云侧到端侧的统一策略 ,两支队伍将合二为一,更加高效,或许会有一些曲折,但相信这是正确的方向。”
也许会有人问 :难道未来的Radeon显卡 、Instinct计算卡都会使用同样的芯片 ?是否会存在功能性上的冗余和浪费?
比如计算卡并不需要图形与视频功能 ,游戏卡也不需要太多的计算功能。
这一点Huynh并没有给出明确的答案。但从他透露的规划——接下来不仅会有RDNA 5、RDNA 6 、RDNA 7 ,也会有UDNA 6 、UDNA 7,至少已经规划好了未来三代 ,RDNA和UDNA至少还会同时存在。
这也不难理解,因为AMD的产品需要稳定、持续的优化 ,并保持完全的前后兼容性。
但三代以后会怎样 ?小编猜测,未来极有可能只剩下UDNA了。因为未来的GPU显卡将成为图形、视频和计算的综合体 ,正如同AI的未来将是多模态一般 。
“要确保AMD做正确的事。”
AMD 唯一的前沿领域是软件,而对于AI领域而言,便是CUDA 。
正如前文所述,AMD把以消费者为中心的 RDNA 和以数据中心为中心的 CDNA 架构统一到一个名为 UDNA 的微架构中,这一招醉翁之意直指气候大成的CUDA生态 。
合并架构的影响很大,AMD通过降低高端游戏显卡的优先级,就可以达成两件目的——
一来 ,AMD对内可以集中力量共同攻坚AMD版的“CUDA”软件,二来,原来游戏显卡和计算显卡的开发者群体迎来大合并 ,这无疑可以加速其开发者市场份额的增长。
野心的獠牙已经亮出 ,那么背后的实力允许吗?
英伟达的CUDA 生态系统已经根深蒂固 ,但并非无懈可击。
首先 ,AMD只是没有将软件当成其主要产品 ,并非完全忽视了软件。AMD暗暗留了一手 :开源。通过GPUOpen和ROCm等举措 ,AMD保持其大部分软件基础为开源 ,这对软件开发人员来说是极好的资源,开发者绝对支持开源。
AMD完全可以借鉴开源的商业打法进一步抢占市场,比如开发出一种能让人们购买其硬件并给开发者带来收入的产品 。
AMD当然也意识到了这一点,并希望“在我们的CPU和RDNA之间创建一个统一的架构,这将使我们能够简化软件的开发”。这看起来与英特尔的OneAPI类似,很有意义,但也将是一个具有挑战性的项目 。
英伟达则在这方面有着天然优势 ,因为这家公司只有一种加速器——运行CUDA的GPU,这是一个所有开发者都可以学习的单一API ,使英伟达能够在价格从200美元到30,000美元的硬件上解决大量的计算挑战。
其次,AMD同样也有一个英伟达不具备的优势。AMD拥有丰富的计算解决方案知识产权组合 ,从经典的CPU和GPU ,到XDNA FPGA芯片(通过收购赛灵思获得) 。现在 ,AMD只需要将这些组合在一起 ,展示一个统一的计算接口,使得在这些核心品类之间战略性地转移工作负载变得容易 ,从而最大限度地提高性能、成本效益或两者兼顾。
这样的能力,将使AMD能够向客户销售由CPU、GPU和专用FPGA(们)等组件组成的单一产品组合加速器系统——就像你购买iPhone ,而不是分别购买屏幕、处理器 、5G调制解调器和电池并自行组合一样。
AMD正在考虑一个三到五年的时间框架,建立自己的软件生态系统 。
围绕这个目标,我们看到了AMD的一些动作。比如 ,AMD豪掷49亿美元 ,大幅增加了其软件工程师的人数。
再比如,AMD还更新了加速硬件开发的计划 :“我们打算每12个月推出一款新的[Radeon] Instinct产品” ,这是一项艰巨的任务,但有助于更快地应对软件市场及其需求的变化 。在CPU方面 ,AMD“现在专门设置了两个CPU团队,一个负责n+1(下一代) ,另一个负责n+2(两代之后)”。
还有 ,今天将游戏GPU、计算GPU统一合并为一种架构UDNA ,亦是其中的一环 。
那么回到当下,AMD到底怎么想的?采访中记者问道:游戏领域,AMD拥有领先地位,难道不会追求旗舰市场吗?Jack Huynh相当坦率:现在的目标是以较低的价格点建立规模和市场份额,而不是“山丘之王”旗舰 GPU,以量取胜 。
“我们现在的首要任务是为 AMD 建立规模。因为现在没有规模,我就无法找到开发人员 。如果我告诉开发者,我只想争取 10% 的市场份额 ,他们只会说,Jack ,我祝你一切顺利,但我们必须与 Nvidia 合作。所以,我必须向他们展示一个计划 ,说 ,嘿,我们可以通过这个策略获得 40% 的市场份额 。然后他们说,我现在和你在一起了 ,Jack’。现在,我将在 AMD 上进行优化 。一旦我们得到它,那么我们就可以追求Top。”
对于昨天的芯片的巨头而言,角逐的焦点更多是光栅化、光线追踪和带宽的竞争 ,然而接下来,生成式AI的爆火已经打乱了原来的布局 ,下一代的挑战不止在于硬件,还在于软件支持,在于软件开发者生态是否足够紧密 。
AMD甚至认为 ,CPU和GPU之间永恒的拉锯战在未来会发生变化:“我们不能将AI视为像USB那样的复选框/花哨功能——AI有可能成为主角。”
有人士曾这样评价AMD和英伟达:
AMD 是一家硬件公司,它生产软件以支持其硬件;而 NVIDIA 是一家软件公司 ,设计硬件以加速其软件 。
不过,这种“刻板印象”即将改变 。AMD正在蓄势转向自己的软件生态。诚如圆桌上AMD发言人所说——
过去的AMD只会追求速度和性能,新的AMD将首先关注AI软件 。