夢晨 白交 發(fā)自 凹非寺,量子位 | 公眾號 QbitAI
DeepSeek太過火爆,整個國產AI產業(yè)都調動起來了!
春節(jié)沒過完,就已迅速適配多個國產芯片,并在各大云平臺上線,好生熱鬧~
這一系列動向主要聚焦于以下三個方面:
平臺層:像華為云、阿里云、騰訊云等云廠商先后接入DeepSeek相關大模型服務,價格不變甚至有的更便宜、性能與官方相當,直接零門檻部署API開發(fā)各種應用。
算力層:一些國產算力玩家,像昇騰、壁仞等,他們聯(lián)合生態(tài)玩家完成了與模型的適配,也紛紛上線了DeepSeek R1模型服務。
應用層:AI應用廠商、手機助手也在接入和部署國產模型。像我們更日常的手機端,華為小藝助手已接入DeepSeek,只需升級至原生鴻蒙系統(tǒng)就可以體驗。
實際上,國產大模型和國產芯片算力的生態(tài)適配,已經有了成功實踐。
破算力困局:國產AI生態(tài)的生死突圍
為什么DeepSeek的走紅,能夠讓國內AI產業(yè)如此迅速地行動起來?僅僅只是因為模型本身的技術優(yōu)勢嗎?
答案并非如此。
還有一個關鍵因素,是應對國際算力供應鏈的不確定性,面對來自國際的壓力,實現大模型自主可控愈發(fā)緊迫起來。
算力是大模型的基礎,可以按照應用場景分為:訓練算力、推理算力和應用算力。
訓練算力是指用于訓練機器學習模型的計算資源,過程中涉及大量的數據輸入、復雜的數學運算以及反復的迭代優(yōu)化,計算密集、時間長、硬件需求高、數據量也很大。
推理算力是將訓練好的模型應用于實際數據以生成預測或結果的計算資源,過程比訓練簡單,但需求高效且低延遲。
應用算力是指支持整個AI應用系統(tǒng)運行的計算資源,包括數據處理、模型推理、用戶交互、存儲和網絡通信等。
目前,在整個中國的大模型產業(yè)中,大模型算力還是主要依靠海外算力,尤其是在訓練環(huán)節(jié)。
那么為什么要特別強調訓練環(huán)節(jié)呢?因為訓練算力是人工智能模型從無到有的關鍵,大模型的進步依賴于不斷優(yōu)化和迭代模型,而這需要持續(xù)投入。
在訓練階段,強大的算力是優(yōu)化模型參數、提升模型性能的關鍵。當前主流的大模型動輒擁有數百億、上千億個參數,如此巨量的參數空間意味著海量的計算工作量。
只有擁有超大規(guī)模的算力集群,才能支撐起如此復雜的訓練任務。而訓練算法的創(chuàng)新,如更高效的并行化策略、更智能的參數搜索方法等,都對算力水平提出了更高要求。
訓練算力作為AI技術創(chuàng)新的戰(zhàn)略制高點,其自主可控程度直接決定產業(yè)發(fā)展主動權,掌控了大模型的訓練過程,才算掌握了AI技術創(chuàng)新的核心。
在國產算力平臺尚處拓荒期時,多數企業(yè)因技術門檻高、投入風險大而卻步,科大訊飛作為先行者選擇了一條“硬核突圍”之路:
科大訊飛聯(lián)合華為打造的萬卡國產算力平臺“飛星一號”,自2023年10月啟用以來,目前已長穩(wěn)運行,全年平均使用率94%,能支撐萬億參數大模型訓練。
2024年1月,“飛星一號”的首個成果訊飛星火V3.5是首個全國產算力訓練的大模型。
一年過去了,訊飛星火仍然是唯一的一家全國產算力大模型。
為什么是唯一一家?
這既是由于全棧自研的技術處于深水區(qū),從芯片指令集優(yōu)化,到超大規(guī)模集群穩(wěn)定性保障,技術復雜度呈指數級攀升。
也是對長期投入的戰(zhàn)略定力的考驗,全算力國產化需要持續(xù)多年的高強度投入,多數企業(yè)難免更傾向于選用現成方案,這種路徑依賴導致其訓練算力環(huán)節(jié)始終受制于人。
值得一提的是,今年1月15日,科大訊飛發(fā)布了我國首個基于全國產算力訓練的具備深度思考和推理能力的大模型訊飛星火X1,和DeepSeek可以說是異曲同工。
僅用1萬張910B國產算力卡,科大訊飛不僅取得了大模型研發(fā)上的一系列成果,而且做了大量國產算力平臺上的無人區(qū)的適配和效率優(yōu)化,用更少的算力、更小的模型尺寸,在國產算力平臺上實現了業(yè)界一流的深度思考和長文本推理效果。
可以說是真正把國產算力做到了極致效率,這更需要技術實力和戰(zhàn)略勇氣,也標志著國產AI技術在應對復雜認知任務上取得了重要突破。
科大訊飛董事長劉慶峰透露,訊飛團隊正在加緊迭代,有望在未來一個月內推出性能更上一層樓的升級版訊飛星火X1,確保在數學、教育、醫(yī)療一科研等關鍵領域始終處于業(yè)界領先水平。
與此同時,“飛星二號”——科大訊飛、華為、合肥市大數據資產運營有限公司三方聯(lián)合打造的中國國產超大規(guī)模智算平臺,首批算力也將在2025年交付試用。
這種國產AI生態(tài)協(xié)同產生了遠超預期的“化學反應”:華為昇騰系列芯片在真實場景中得到千錘百煉,不斷打磨、迭代出更適配AI應用的特性;訊飛模型通過與硬件深度適配,擺脫了算力瓶頸的桎梏,探索出的創(chuàng)新訓練范式。
當下愈來愈多的企業(yè)加入戰(zhàn)場,國產AI技術體系的獨特性開始顯現——它既非對國際技術的簡單模仿,也非閉門造車的另起爐灶,而是在生態(tài)協(xié)同中進化演繹的全新物種。
科大訊飛董事長劉慶峰說:“都說前人栽樹,后人乘涼。在全國產化大模型的路上,總得有人做那個栽樹人。”市場狂歡背后,先行者的遠見與定力,正在這場AI競賽中顯現出跨越周期的戰(zhàn)略意義。
科大訊飛已經完成了訓練算力、推理算力和應用算力的全部國產化。
從2024年1月至今,訊飛星火大模型已經實現了5次升級,持續(xù)對標GPT-4 Turbo和GPT-4o,還首發(fā)星火多語言大模型,給了世界第二選擇。
在產業(yè)應用上,科大訊飛是少有的GBC三方向都覆蓋的市場參與者,以“GBC聯(lián)動”的方式,推動大模型應用落地。
GBC聯(lián)動,不僅是三大業(yè)務方向都要布局,更是利用好其中的資源共享與協(xié)同效應。
G端建立示范效應,為B端和C端市場的拓展奠定基礎;在B端通過與行業(yè)龍頭企業(yè)的合作,擴大市場影響力,增強C端產品的市場認知度和信任度;同時C端的反饋和市場需求為G端和B端的產品優(yōu)化提供了數據支持。
在這種策略下,具體取得哪些成果呢?
模型迭代層面,2024年的訊飛星火GB端共性能力相對提升25%,長文本效果相對提升50%,行業(yè)圖文效果相對提升60%。
業(yè)務落地層面,截至去年底,科大訊飛已經與中國石油、中國移動、中國海油等央國企及20多個行業(yè)的頭部企業(yè)一起發(fā)布行業(yè)大模型,覆蓋300多個應用場景。
此外值得一提的是,科大訊飛在2024年還奪得“央國企大模型第一”的好成績,中標金額超第2-6名之和,在中標項目數量和金額上都實現斷層領先。
像這樣以模型和算力為底座,以行業(yè)數據為積累,以應用和服務為落腳點,最終建立起”技術優(yōu)勢-商業(yè)回報-數據反哺”的正向循環(huán),才能不斷加深自己的”護城河”,在錯綜復雜的競爭中找到立足點。
這場始于算力突圍的技術革命,終將演變?yōu)樯鷳B(tài)價值的全面釋放——這或許是中國AI給世界的最好答案。
“通用人工智能是一場需要聚精會神的長跑”
而如果將時間繼續(xù)往前推進,能夠看到當前國內大模型發(fā)展,其實來到了重要節(jié)點。
一邊大模型朝著更高智能水平方向演進,另一邊關于AI產業(yè)生態(tài)也進一步深入和夯實,不管是從底座、到模型再到應用,都在向通用人工智能這一最終目標加速行進。
這在各海內外專家的看法中,也進一步得到了印證:雖然AGI實現時間表眾說紛紜,但也的確迎來了關鍵時刻。
奧特曼認為在現有GPU硬件上可以實現通用人工智能。在他的年終總結中能夠看到,OpenAI已經明確AGI如何實現,并且將目標轉向了更遠的超級智能。
而李飛飛聚焦在空間智能的實現上,認為作為AGI的關鍵一步,空間智能能讓AI學習、理解并行動。就在前段時間他們團隊完成了AI模擬世界的雛形:AI可以僅憑一張圖,就能生成可交互的3D世界。
圖靈獎得主LeCun、Hinton則是關注在大模型能力過快迭代背后的安全隱憂之中,探討如何以人為本地發(fā)展人工智能。這本身也是AGI繞不開的問題。
在大家都在探討如何實現、還有多遠的時候,科大訊飛董事長劉慶峰提出了一個獨特的觀點:通用大模型的天花板仍然在被持續(xù)打開。但是,就算再怎么發(fā)展,根基也得在自己手里,自己的大樓決不能建在別人的院子里。
如今在風起云涌的通用人工智能浪潮,劉慶峰認為,有沒有自主可控的國產底座能力做支撐,這決定了我們在這條路上能走多遠,決定了在通用人工智能這一波浪潮中,我們能不能享受這波紅利,能不能成為美國之后全球智慧涌現的第二級。
基于這樣的邏輯,為什么做“飛星一號”?其實就能找到背后的原因。
訊飛不僅走得遠,還走得深。
科大訊飛在其創(chuàng)立第一天起,就一直堅持走國產化路線,立志“技術報國”,要讓“中文語音技術由中國人做到最好,中文語音產業(yè)掌握在中國人自己手中”。這是做中國技術的初心,現在看來,其影響無比深刻。
外在鑒于眾所周知的原因,科大訊飛成為最早被打壓、最早放棄幻想的那一波玩家之一,經過一系列艱難攻關,其核心技術研究和產品開發(fā)平臺逐步實現全面自主可控,才得以有今天生生不息的繁榮生態(tài)。
科大訊飛的選擇,其實不僅適用于科大訊飛,也不僅適用于大模型,也能給整個中國的人工智能產業(yè)帶來一定的啟示。
首先,底座大模型的創(chuàng)新是自主創(chuàng)新的核心驅動力。在當前全球底座模型迭代放緩的趨勢下,以訊飛為代表的玩家還能持續(xù)更新大模型底座。
底座大模型的持續(xù)迭代與升級,不僅決定AI系統(tǒng)能力的上線,還能推動AI技術在各個領域的落地和創(chuàng)新。
隨著AI技術的不斷發(fā)展,產業(yè)分工逐漸優(yōu)化變得清晰,形成了“基礎層專注算力攻堅、應用層聚焦場景創(chuàng)新”新格局。
基礎層的企業(yè)可以專注于提升算力和算法效率,而應用層的企業(yè)則可以基于這些基礎技術,開發(fā)出更多創(chuàng)新的應用場景。
另外,還有更為關鍵的層面,安全邊際的提升是企業(yè)自主創(chuàng)新的重要保障。當前市場環(huán)境波譎云詭,自主可控能為行業(yè)建立“技術冗余空間”,使得企業(yè)在面對外在環(huán)境波動時能夠更加從容應對。
例如,芯片供應緊張時候,擁有自主訓練能力的企業(yè)可以通過優(yōu)化算法和模型,減少對硬件的依賴,從而保持業(yè)務的連續(xù)性。這種技術冗余不僅提升了企業(yè)的抗風險能力,也為整個行業(yè)提供了更多的安全保障。
最后,國產算力平臺的崛起,其實也為更廣更大范圍的企業(yè)提供了便利。
企業(yè)無需重復造輪子,可以直接在國產平臺上進行應用開發(fā)。這不僅降低了技術門檻,還加速了AI技術的普及和應用。
比如,為幫助各行各業(yè)更好地落地大模型,科大訊飛以“通專結合、端云聯(lián)動、軟硬一體”的方式助力更多企業(yè)完成數智化升級,構建了從“建算力、理數據、訓模型”,到“落場景、保安全、精運營”的全套解決方案。目前,訊飛星火已成為央國企大模型的第一選擇。
展望未來,AGI的實現仍然充滿挑戰(zhàn),但也充滿了希望。
在這一過程中,自主創(chuàng)新將成為關鍵。中國企業(yè)必須堅持自主可控的技術路線,不斷提升自身的技術實力,才能在未來的競爭中占據有利位置。同時,產業(yè)分工更加明確,應用場景也將更加豐富,企業(yè)能夠從容應對外在各種不確定性。
隨著技術的不斷進步,AGI不再遙不可及,而是我們共同努力的目標。用科大訊飛董事長劉慶峰的話說,這會是一場需要聚精會神的長跑。