華為日前發布最新算力超節點和集群。這是基于中國可獲得的芯片制造工藝提出的算力解決方案,以解決中國發展人工智能對算力的大量需求,可以說是一條有中國特色的AI算力創新之路。
發展人工智能,算力是關鍵基石。無論是AI模型訓練,還是實時應用場景,都需要海量強大的算力作支撐。近年來,從大模型參數呈指數級增長,到各類AI應用對實時性、穩定性要求的持續攀升,對算力的需求呈井噴式增長。我國AI產業發展迅速,但算力基礎設施受供給不足、成本高企、生態待建等制約,仍存在算力缺口,尤其是高端算力。一個重要原因是算力芯片受制于人,不僅前期開發成本高、研發實力存在差距,而且面臨斷供風險。
芯片制造工藝受限怎么辦?華為給出“數學補物理、非摩爾補摩爾、群計算補單芯片”的辦法。通俗點說,就是單顆芯片的性能可能不如別人,但是“人多力量大”,多顆芯片加起來就可以做到比別人強。這背后的戰略是以系統能力替代單點優勢,以互聯躍遷替代線性趕超。傳統摩爾路徑強調一顆芯片解決所有計算問題,非摩爾路徑更強調整合優勢,對產品開發、軟件工程、芯片設計、網絡架構、能源系統、場景應用等全鏈條打通協作提出了更高要求。
由此可見,AI算力不等于單顆芯片性能。算力是芯片性能、架構設計、資源協同等多方面因素綜合作用的結果。在芯片制造工藝受限的情況下,通過創新架構設計,同樣能實現算力大幅提升。正是基于這個辦法,“超節點+集群”成為應對算力持續增長的重要解決方案。其中,超節點在物理層面是多機柜、多個卡組合而成,但從邏輯上看,它像一臺計算機一樣進行學習、思考與推理。集群則是把多個超節點通過網絡聯結在一起,形成一個大規模的計算群組,再借助軟件來實現高效調度管理。
“超節點+集群”構建起獨特的技術優勢。AI有個重要屬性叫并行計算,是將復雜任務拆分為多個小任務,通過多個計算單元同時處理以提升效率。立足這一屬性,打造數百顆甚至上萬顆芯片的規模組合,再通過網絡聯結形成規模算力池,將持續突破算力供給天花板。這種戰略既發揮了已有的技術積累優勢,包括芯片設計、聯結能力等,規避外部硬件限制,又能通過基礎設施提供算力服務掙錢,最終達成技術突破與市場收益雙贏,為AI算力可持續發展提供了可行路徑。
生態建設是AI算力發展的重要一環。華為為何堅持開源開放戰略?因為開源開放能吸引更多開發者參與生態建設,不斷反饋問題、提出優化建議,形成以用促建的良性循環,讓產品更好用。硬件賣得多了,開源開放的成本自然也就回來了。比如,若是產業鏈上下游企業基于華為開放的靈衢互聯協議技術規范,研發光模塊、交換機、服務器等配套產品,就能逐步構建起完整的自主AI生態體系。這種開放共建模式,將有效增強協同創新,避免重復研發造成的資源浪費,提升我國AI產業整體競爭力。
中國AI算力的創新發展之路,是一條融合架構創新與生態構建的特色之路。憑借在技術創新、基礎設施建設以及產業協同等方面的獨特優勢,中國有望在全球AI算力競爭中占據領先地位,為我國AI產業蓬勃發展、新質生產力培育注入源源不斷的動力。(本文來源:經濟日報 作者:黃鑫)