PCIe over Optics:引領AI互聯(lián)與傳輸?shù)男聲r代

2024/12/13
1148
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

隨著生成式AI技術的蓬勃發(fā)展,我們正步入一個萬物存儲、萬物智能、萬物互聯(lián)的全新時代。在這個時代里,數(shù)據(jù)的洪流如潮水般涌來,對數(shù)據(jù)中心的基礎設施提出了前所未有的挑戰(zhàn)。為了滿足AI模型日益增長的計算需求,大型語言模型(LLM)需要同時處理海量的多模態(tài)數(shù)據(jù)集,包括文本、圖像、音頻和視頻等,這促使AI處理資源的需求急劇上升,并需要在整個數(shù)據(jù)中心內(nèi)實現(xiàn)高效互連。

面對這一挑戰(zhàn),傳統(tǒng)的數(shù)據(jù)互連方式已經(jīng)難以滿足現(xiàn)代AI集群的擴展需求。隨著AI平臺架構(gòu)的多樣化和定制化,以及年度升級節(jié)奏的顯著加快,數(shù)據(jù)中心必須尋找更加高效、可靠的連接解決方案。在這樣的背景下,“PCIe over optics”技術應運而生,為AI基礎設施的擴展和升級提供了全新的可能。

PCIe(Peripheral Component Interconnect Express)接口作為AI加速器和GPU上的原生可用接口,一直扮演著連接數(shù)據(jù)中心內(nèi)部各個組件的重要角色。然而,隨著AI集群規(guī)模的不斷擴大,從最初的幾個機架、數(shù)十個GPU,發(fā)展到跨越多個機架、數(shù)百個GPU的大型pod,互連長度迅速成為制約性能的關鍵因素。在PCIe 5.0數(shù)據(jù)速率下,雖然有源電纜能夠覆蓋到7米的距離,但在更高的數(shù)據(jù)速率下,如PCIe 6.x和PCIe 7.x,傳統(tǒng)的銅纜解決方案已經(jīng)無法滿足跨機架連接的需求。

AI 互聯(lián)挑戰(zhàn)應對之道

自 2017 年起,Astera Labs 致力于釋放 AI 和云基礎設施潛力,其智能連接平臺以 PCIe?、CXL? 和以太網(wǎng)半導體解決方案及 COSMOS 軟件套件為基礎,構(gòu)建可擴展、可定制架構(gòu)。

該平臺能實現(xiàn)遠距離可靠連接,如今借助光學器件實現(xiàn) PCIe 到行的連接,加速 GPU 集群部署;還通過軟件定義架構(gòu)和互操作性測試縮短 AI 平臺部署時間;其深度診斷等功能可提高基礎設施正常運行時間和利用率。

其產(chǎn)品系列豐富,Aries?PCIe?/CXL? 智能 DSP retimer 帶寬高且被廣泛應用,Aries PCIe/CXL 智能電纜模塊(SCM)提供 7 米有源電纜用于機架連接,Taurus 以太網(wǎng)智能電纜模塊(SCM)支持高速以太網(wǎng)連接,Leo CXL? 智能內(nèi)存控制器優(yōu)化內(nèi)存管理。Astera Labs 在技術創(chuàng)新方面表現(xiàn)出色,為大規(guī)模部署先進方案奠定基礎。

開創(chuàng)無縫AI連接的新篇章

隨著AI基礎設施規(guī)模的擴大,傳統(tǒng)無源直接連接電纜(DAC)已難以滿足需求。高數(shù)據(jù)速率下,信號丟失問題加劇,限制了無源方案的有效性。為此,Aries PCIe/CXL? SCM?有源電纜(AEC)應運而生,其7米覆蓋范圍解決了DAC的連接距離限制,為AI加速器集群拓展提供了更多可能,布線可輕松延伸至機架外。但隨數(shù)據(jù)速率提升至PCIe 6.x、7.x等高級別,無源和有源電纜將局限于單機架內(nèi)。此時,PCIe over optics解決方案,特別是有源光纜(AOC),將在機架間連接中發(fā)揮關鍵作用,提供長距離、高穩(wěn)定性能的連接,確保AI集群高效運行。

探索PCIe光連接的未來之路

光纖鏈路已成為高速以太網(wǎng)連接的基石,支持超大規(guī)模數(shù)據(jù)中心內(nèi)的長距離數(shù)據(jù)傳輸。將這一優(yōu)勢融入PCIe連接,通過開發(fā)新型PCIe over optics解決方案(含AOC),相較于銅纜,能顯著擴展PCIe連接至機架集群范圍,并優(yōu)化電纜管理。

PCIe/CXL?在光學器件領域的運用,主要受其相較于以太網(wǎng)更低的延遲需求驅(qū)動,特別是在緩存一致內(nèi)存事務及GPU間并行處理等高負載應用中。此外,這些應用還需借助專用軟件對鏈路實施全面管理,以確保協(xié)議完全兼容及系統(tǒng)高度可靠。

總之,“PCIe over optics”技術的出現(xiàn),為數(shù)據(jù)中心內(nèi)部的數(shù)據(jù)傳輸提供了新的解決方案。它不僅提高了數(shù)據(jù)傳輸?shù)男屎头€(wěn)定性,還降低了運維成本,為AI平臺的加速部署和下一代生成式AI應用程序的快速發(fā)展提供了有力支持。隨著技術的不斷進步和應用場景的不斷拓展,“PCIe over optics”有望成為未來數(shù)據(jù)存儲與傳輸領域的主流技術之一。

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

一名資深通信人,從事于光通信行業(yè)的高新技術企業(yè)。致力于提供光通信傳輸產(chǎn)品解決方案,光網(wǎng)互連方案,通信產(chǎn)品知識,光通信資訊等領域創(chuàng)作內(nèi)容。與諸多行業(yè)專家不斷交流,積極為不同的用戶量身定制符合實際需求、高效率的網(wǎng)絡傳輸整體解決方案。