AI正深刻驅(qū)動著各領(lǐng)域的創(chuàng)新浪潮。借助AI的力量,各行各業(yè)能夠顯著提升運(yùn)營效率、降低成本并塑造超高生產(chǎn)力的未來工作模式。不過,AI系統(tǒng)的成功部署與高效運(yùn)行,其核心支撐在于底層基礎(chǔ)設(shè)施——它往往是AI技術(shù)棧中最易被低估,卻又最為關(guān)鍵的一環(huán)。特別是隨著DeepSeek等生成式AI模型的崛起及其應(yīng)用的普及,AI工作負(fù)載變得更加多樣和復(fù)合化,這要求基礎(chǔ)設(shè)施的戰(zhàn)略定位更加清晰、更具落地性。
在剛剛舉辦的AMD Advancing AI 2025大會期間,AMD發(fā)布了全面的端到端AI平臺愿景,并展示了全新的開放、可擴(kuò)展的人工智能基礎(chǔ)設(shè)施產(chǎn)品。其中,EPYC對AMD未來的AI愿景具有非常重要的意義。
18倍增長,EPYC的AI進(jìn)階之路!
EPYC堪稱AMD歷史上最成功的產(chǎn)品系列之一,經(jīng)歷了數(shù)代產(chǎn)品的相繼更迭,EPYC將“CPU的AI進(jìn)化之路”展現(xiàn)在業(yè)界面前。
根據(jù)AMD分享的 EPYC處理器市場份額的增長情況,從2018年2%到2024年36%,實(shí)現(xiàn)了18倍的飆升——四年間從邊緣玩家躍居行業(yè)核心,占據(jù)約三分之一市場份額,這種增幅在寡頭壟斷的服務(wù)器芯片市場堪稱奇跡。頭部客戶名單覆蓋了云服務(wù)巨頭、數(shù)字企業(yè)、企業(yè)和OEM廠商,進(jìn)一步佐證了市場份額的堅實(shí)有力。
回顧EPYC的開疆拓土,特別是在AI領(lǐng)域的發(fā)展,可以說第四、第五代EPYC以通用計算重塑推理效能,對AI發(fā)展和AMD自身的產(chǎn)品迭代都具有重要的意義。面對復(fù)合型AI負(fù)載的挑戰(zhàn),AMD第四代、第五代EPYC處理器展現(xiàn)了出色的適應(yīng)性與效率,成為構(gòu)建務(wù)實(shí)AI基礎(chǔ)設(shè)施的理想選擇。
具體而言,第四代EPYC能夠在AI推理方面脫穎而出,主要得益于其先進(jìn)的架構(gòu)和創(chuàng)新的設(shè)計?;赯en 4架構(gòu)的AMD EPYC處理器“Genoa”,采用了先進(jìn)的5nm工藝,最多可達(dá)到96核心192線程,配備了12通道DDR5內(nèi)存和160條PCIe 5.0總線。更大的內(nèi)存總線,可以令更多數(shù)據(jù)在內(nèi)存中進(jìn)行快速加載,從而有效減少因數(shù)據(jù)傳輸而造成的時延;更多的PCIe總線意味著在單臺服務(wù)器上可以接入更多AI計算板卡,能夠提供更高密度的AI算力。
值得一提的是,第四代AMD EPYC處理器還引入了對AI/ML應(yīng)用程序至關(guān)重要的DDR5內(nèi)存和第五代PCIe,還有3D V-Cache技術(shù)的加持,進(jìn)一步增強(qiáng)了第四代AMD EPYC處理器的多任務(wù)處理能力,并有效降低了延遲?。
正是憑借這種高并發(fā)核心設(shè)計,AMD第四代EPYC全面覆蓋了碎片化的推理場景,成為AI推理服務(wù)器的主流選擇。特別是在金融風(fēng)控、工業(yè)設(shè)備診斷等眾多場景,通過極致能效和專用指令集與架構(gòu)優(yōu)化,凸顯了高并發(fā)處理能力,為用戶提供了良好體驗(yàn)。
如果說第四代EPYC為AI大模型推理應(yīng)用奠定了堅實(shí)的基礎(chǔ),那么第五代EPYC則進(jìn)一步實(shí)現(xiàn)飛躍,能夠幫助用戶實(shí)現(xiàn)更高效的推理,更充分地滿足各類AI工作負(fù)載的需求,并適應(yīng)不同模型大小。
第五代EPYC基于Zen 5架構(gòu),對AI的支撐能力更上一層樓。相比Zen 4,Zen 5核心架構(gòu)不僅提供多達(dá)17%的更高每時鐘指令數(shù)(IPC),還能為AI和HPC提供高達(dá)37%的更高IPC,從而提升了AI部署的洞察時間和部署速度。比如,192核的EPYC可為端到端AI工作負(fù)載提供更高的性能,在Meta Llama 3.1-8B的中小型企業(yè)級生成式AI模型中,其吞吐量性能具有顯著優(yōu)勢。
20倍能效新目標(biāo),AMD EPYC提供核芯動力
在Advancing AI 2025上,AMD宣布已經(jīng)超越了在2021年制定的30x25目標(biāo):即從2020年到2025年將AI訓(xùn)練和高性能計算(HPC)節(jié)點(diǎn)的能效提高30倍。
這意味著,與過去五年(2015-2020年)的行業(yè)趨勢相比,能效提升2.5倍以上。截至 2025 年中,AMD已超越這一目標(biāo),正是通過AMD GPU和第五代AMD EPYC CPU的配置,相較基準(zhǔn)系統(tǒng)實(shí)現(xiàn)38倍的能效提升。與五年前的系統(tǒng)相比,這相當(dāng)于在相同性能下能耗降低97%。
下一步,隨著人工智能規(guī)模的不斷擴(kuò)大,以及邁向真正的端到端的全AI系統(tǒng)設(shè)計,AMD比以往任何時候都更需要繼續(xù)保持在節(jié)能設(shè)計領(lǐng)域的領(lǐng)先地位。
AMD高級副總裁兼企業(yè)院士Samuel Naffziger指出,AMD將目光投向一個大膽的新目標(biāo):以2024年為基準(zhǔn),到2030年,將用于AI訓(xùn)練和推理的機(jī)架級能效提升20倍,使目前需要超過275個機(jī)架的典型AI模型到2030年只需在一個機(jī)架內(nèi)即可完成訓(xùn)練,耗電量減少95%。而結(jié)合軟件和算法方面的進(jìn)步,新的目標(biāo)可使整體能效提升高達(dá)100倍。
根據(jù)AMD最新的設(shè)計和路線圖預(yù)測,這反映了整個機(jī)架的每瓦性能提升,包括 CPU、GPU、內(nèi)存、網(wǎng)絡(luò)、存儲和軟硬件協(xié)同設(shè)計。這種從節(jié)點(diǎn)到機(jī)架的轉(zhuǎn)變,其實(shí)得益于AMD快速發(fā)展的端到端AI戰(zhàn)略,也是以更可持續(xù)的方式擴(kuò)展數(shù)據(jù)中心AI的關(guān)鍵。
Samuel Naffziger強(qiáng)調(diào),隨著工作負(fù)載規(guī)模和需求的持續(xù)增長,節(jié)點(diǎn)級效率提升將無法跟上步伐,最顯著的效率影響可以在系統(tǒng)級實(shí)現(xiàn),而這正是AMD 2030年目標(biāo)的重點(diǎn),也是AMD在AI時代的新目標(biāo)。
EPYC助力構(gòu)建高效、靈活的未來AI基礎(chǔ)設(shè)施
構(gòu)建AI基礎(chǔ)設(shè)施沒有放之四海皆準(zhǔn)的方案,過度依賴昂貴的專用加速器(如某些GPU)可能導(dǎo)致投資浪費(fèi)和利用率低下,尤其當(dāng)許多AI任務(wù)(特別是中小型推理負(fù)載或嵌入業(yè)務(wù)流的功能)完全能在強(qiáng)大的CPU上高效運(yùn)行時,對于能源、效率、成本都是巨大的節(jié)約。
這些都與AMD EPYC 處理器的價值主張相契合,放眼未來,在AMD機(jī)架級的能效目標(biāo)中,新一代以及未來幾代EPYC將繼續(xù)保持能效比(性能/瓦特)優(yōu)勢,助力降低數(shù)據(jù)中心能耗,實(shí)現(xiàn)更綠色、高密度的計算解決方案。
至于企業(yè)如何規(guī)劃、部署未來的AI基礎(chǔ)設(shè)施?IDC給出的建議是:第一,通過替換過時服務(wù)器在數(shù)據(jù)中心騰出空間,因?yàn)殚L遠(yuǎn)來看,改造過時服務(wù)器成本高昂,而新的服務(wù)器通常不僅能力更強(qiáng),而且通常效率更高;第二,采用私有或混合云策略處理虛擬化、容器化和裸機(jī)工作負(fù)載,這有助于確保每個 AI 工作負(fù)載都匹配到合適的基礎(chǔ)設(shè)施堆棧;第三,通過選擇合適類型的處理器 (CPU) 優(yōu)化協(xié)處理器(加速器)投資,可以避免加速器資源利用不足或利用不均的情況。
正因具備強(qiáng)大的通用處理能力、領(lǐng)先的能效比以及對AI加速的優(yōu)化支持,AMD EPYC處理器能夠高效驅(qū)動DeepSeek等大模型的推理負(fù)載, 助力企業(yè)在無需大規(guī)模新建基礎(chǔ)設(shè)施的前提下,高效、靈活地?fù)肀б訢eepSeek等模型為代表的生成式AI趨勢,最大化AI投資價值。