硬件永不止步 ,
互連進無止境......
Samtec China Sr. FAE Manager 胡亞捷在Keysight實驗室開放日第二站——北京站做技術(shù)分享時,不再單純地給出問題,而是給出了他的理解和總結(jié)。
本次活動由Keysight主辦,在上海、北京舉辦開放實驗室主題日活動,攜手Samtec的技術(shù)專家,共同探討確保AI互連穩(wěn)健性的趨勢、挑戰(zhàn)和解決方案。點
北京站分享內(nèi)容較多,涵蓋多個維度,因篇幅有限,本次只總結(jié)其中部分亮點。
【AI促使硬件向互連提出更高要求】
首先,胡亞捷在現(xiàn)場分享了一份來自 NeurIPs(全球頂級 AI 會議)的全球頂級 AI 人才構(gòu)成的分析。該分析數(shù)據(jù)來源于以 NeurIPs發(fā)表論文的作者群體為樣本的研究。結(jié)果顯示,在 AI 本科生培養(yǎng)方面,中國占比 47%,位居全球之首;而在人才吸引力上,美國則更占據(jù)優(yōu)勢。當(dāng)前,市場對 AI 人才的需求依舊極為旺盛,且主要集中于中美這兩大科技強國。
他也強調(diào)了硬件的重要性:
“為了滿足 AI 日益增長的算力需求,各種專門為 AI 工作負載優(yōu)化的處理器不斷涌現(xiàn),如ASIC、FPGA、或定制的?AI 芯片等。這些硬件的創(chuàng)新和發(fā)展,為 AI 的持續(xù)進步提供了源源不斷的動力?!?/p>
作為深耕連接器領(lǐng)域多年的工程師,他是這么看待AI和硬件以及互連之間的關(guān)系的:
“?硬件是 AI 發(fā)展的根基,就如同高樓大廈的地基。沒有強大的硬件支持,AI的各種設(shè)想和應(yīng)用都將成為空中樓閣。完善的基建能為 AI 提供強大的并行計算能力,大大加速了模型的訓(xùn)練和推理過程。
互連則是橋梁,以 AI 數(shù)據(jù)中心為例,大量的服務(wù)器、存儲設(shè)備以及網(wǎng)絡(luò)設(shè)備之間,需要通過硬件互連實現(xiàn)高效的數(shù)據(jù)交互。AI 的訓(xùn)練模型需要海量的數(shù)據(jù)支持,這些數(shù)據(jù)在不同硬件設(shè)備之間的快速、準確傳輸,全依賴于硬件互連。”
是的,如同他所說的那樣,在AI走進千家萬戶的過程中,硬件將承擔(dān)更大的壓力,因此,硬件對于互連的要求越來越“過分”。
“過分”要求的部分拆解
胡亞捷在分享中重點拆解了兩個應(yīng)用:
———Accelerators(加速卡)
胡亞捷認為:“應(yīng)對大型模型是人工智能革命的核心,而提供所需的計算能力則是設(shè)計人員面臨的挑戰(zhàn)。傳統(tǒng)的計算機設(shè)計已有先例。我們熟悉的臺式電腦通過將所需的處理工作移交給專業(yè)設(shè)備來處理數(shù)據(jù)密集型任務(wù)。中央處理器(CPU)負責(zé)核心任務(wù),但將圖形處理或聲音仿真分配給二級專業(yè)模塊。這就形成了今天我們所熟悉的結(jié)構(gòu) - 安裝在CPU主板上的圖形卡和聲卡以及其他專業(yè)組件。在人工智能領(lǐng)域,加速器也執(zhí)行著類似的任務(wù)。中央處理器繼續(xù)為整個系統(tǒng)提供處理能力,而加速器則是專業(yè)硬件,為最新人工智能系統(tǒng)使用的大型模型提供專用計算能力?!?/p>
這里的加速器,通常是GPU。因為CPU 雖然是計算機核心,但面對人工智能大量數(shù)據(jù)并行處理需求,它的架構(gòu)特性使其在這方面相對受限。而 GPU 擁有大量的計算核心,特別適合大規(guī)模并行計算,比如深度學(xué)習(xí)里的卷積運算等矩陣操作,所以成為了常用的人工智能加速器。傳統(tǒng)計算機與單一加速器或GPU的主要區(qū)別在于可擴展性。
中央處理器與加速卡之間不再是一對一的關(guān)系,而是可以在單個中央處理器上安裝大量的加速卡。在這種安排下,高效計算取決于加速卡之間以盡可能低的延遲和盡可能高的信號完整性進行數(shù)據(jù)傳輸。因此,板卡之間的連接對于這些計算機處理所需數(shù)據(jù)起著至關(guān)重要的作用。
Samtec 提供多種解決方案,如?AcceleRate? HD Slim,可實現(xiàn) 32 GT/s PCIe? 5.0 速度,適用于目標 AI - HPC 架構(gòu);其?Twinax Flyover? 系統(tǒng)等高速電纜組件,能簡化板布局并延長信號傳輸距離,滿足加速卡之間高數(shù)據(jù)速率、低延遲的瞬時數(shù)據(jù)結(jié)果傳輸要求,有效提升了加速卡的性能和效率。
——DSAs(特定領(lǐng)域架構(gòu))
首先,DSA是一種專門針對某種特定計算任務(wù)或應(yīng)用進行優(yōu)化的硬件架構(gòu)。與通用計算架構(gòu)相比(比如 x86 或 ARM),通過定制硬件和指令集來提升特定任務(wù)的性能、能效、計算能力和計算效率。通常這種架構(gòu)會針對某一類操作(比如深度學(xué)習(xí)、圖像處理、網(wǎng)絡(luò)處理等)進行硬件定制。
“事實上,各大科技公司都有在搭建類似概念的集群系統(tǒng)架構(gòu)?!焙鷣喗輳娬{(diào)。
胡亞捷認為:“人工智能 (AI) 尤其是自然語言處理 (NLP)、計算機視覺和語音處理領(lǐng)域?qū)Υ擞葹殛P(guān)注。這些數(shù)據(jù)密集型應(yīng)用可從優(yōu)化的信道性能中獲益,從而支持更高的數(shù)據(jù)傳輸速率、更小的占板面積、更長的信號傳輸距離和更低的延遲。
然而,這種“專注化”和“專業(yè)化”需要靈活性和可擴展性的支持,這就需要安裝額外的處理器或改變配置,以實現(xiàn)新功能的演進。而互連就是關(guān)鍵。為了支持極高的數(shù)據(jù)傳輸速率和對靈活配置的需求,Samtec提供了一系列高性能銅纜和光纖布線產(chǎn)品。
【Samtec全方面滿足各類AI需求】
現(xiàn)場,胡亞捷還帶來了Samtec線纜特別解決方案的講解:
“Samtec Flyover? 線纜組件系統(tǒng)可在PCB上方直接傳輸高速數(shù)據(jù),從而簡化電路板布局并擴大信號覆蓋范圍?!?/p>
他介紹到:
“以我們的Eye Speed? 線纜技術(shù)為例,它與Samtec的高性能連接器配合使用,信號通過高速電纜組件傳輸,以提升信號完整性并改善散熱性能,可以讓數(shù)據(jù) “飛躍” PCB進行傳輸。方案支持112Gbps及更高的數(shù)據(jù)傳輸速率,在延長信號傳輸距離的同時,還能為系統(tǒng)架構(gòu)設(shè)計提供靈活性,而且不會增加整個系統(tǒng)的負擔(dān)?!?/p>
而這樣的產(chǎn)品,我們還準備了一整個系列!
是的!Samtec擁有豐富的產(chǎn)品線和強大的技術(shù)研發(fā)能力,能夠為 AI 硬件互連提供全方位的解決方案。我們的產(chǎn)品不僅性能卓越,而且具有高度的靈活性、可靠性和穩(wěn)定性。
【來自是德科技的觀點】
Keysight解決方案部經(jīng)理李凱就當(dāng)前AI互連技術(shù)呈現(xiàn)的趨勢以及測試挑戰(zhàn)進行了闡述:高速接口技術(shù)快速迭代,互連速率從32-64 Gbps向112G、224G甚至448G演進,以滿足GPU和XPU間指數(shù)級增長的數(shù)據(jù)交換需求?,同時光互連技術(shù)的加速落地,以解決銅纜在長距離傳輸中的帶寬和能效瓶頸。
AI大模型的快速發(fā)展顯著推動了高速互聯(lián)產(chǎn)業(yè)的技術(shù)迭代以及市場擴張,同時也推動用于AI服務(wù)器集群構(gòu)建的無源銅纜向更高傳輸速率,更大端口密度的方向發(fā)展。Keysight解決方案工程師孫麗晴詳細介紹了Keysight針對目前高頻、多端口高速銅纜的測試解決方案。
Keysight應(yīng)用工程師于洋介紹了矢量網(wǎng)絡(luò)分析儀的校準方法。測試數(shù)字高速電纜、PCB板等非標準射頻接口時,精確的夾具校準一直是頭疼的問題。于洋著重介紹了矢網(wǎng)測試校準的原由以及最常使用的SOLT校準方法。隨后介紹了通過端口延時、時域門、二級校準的夾具S參數(shù)提取及用戶自定義校準件等基于SOLT校準方法為基礎(chǔ)的夾具補償和去嵌入的方法,同時指出了各種方法的優(yōu)缺點。最后詳細介紹了兩種高精度的非標準接口校準方法:TRL和AFR,其中AFR方法既可以簡化夾具設(shè)計又可以得到和TRL幾乎相同測試精度。
最后,孫麗晴和于洋攜手結(jié)合Samtec產(chǎn)品進行了基于224Gbps無源銅纜的多端口網(wǎng)分實測演示,并回答用戶的現(xiàn)場提問。
AI 時代的幕后支柱:硬件 & 互連
最后還是想鼓勵我們所有的客戶、友商以及工程師伙伴們,硬件&互連是摩爾定律紅利的傳遞者。
在 AI 蓬勃發(fā)展的今天,我們在為 AI 的神奇贊嘆不已時,絕不能忽視硬件以及硬件互連所做出的巨大貢獻。