晶上生成式變結(jié)構(gòu)計(jì)算可為我國打破算力芯片“制程工藝?yán)O房”開辟新路徑,走出一條用“三流材料、二流工藝”達(dá)成“一流能力”的系統(tǒng)工程級創(chuàng)新路線。
今年以來,我國以DeepSeek為代表的大模型企業(yè)通過算法優(yōu)化、有針對性的訓(xùn)練和開源生態(tài)協(xié)作,在使用“縮水版”GPU芯片的情況下,將千億參數(shù)模型訓(xùn)練成本壓縮至同類模型的1/10,走出了一條從粗放式算力堆砌向內(nèi)生式效能提升的新路徑。
在全球驚嘆中國非對稱創(chuàng)新奇跡的同時(shí),也要清醒看到,就人工智能(AI)技術(shù)和產(chǎn)業(yè)自主可持續(xù)發(fā)展而言,我國仍未擺脫對高端乃至“縮水版”智算芯片等物理器件的依賴。在可以預(yù)見的未來,外部環(huán)境可能更趨惡劣,封鎖遏制常態(tài)化、供應(yīng)鏈不確定性等挑戰(zhàn)難以回避。我國亟需在智能算力層面實(shí)現(xiàn)“DeepSeek式突圍”,用超限創(chuàng)新解耦當(dāng)前硬件算力提升與制程工藝進(jìn)步強(qiáng)綁定的關(guān)系。
換言之,我國要在AI領(lǐng)域獲得與競爭對手可博弈的能力,不僅要在算法層面繼續(xù)革命、突破“算力繭房”,而且要在算法與物理層面深度融合上實(shí)現(xiàn)換道超車,破解“制程工藝?yán)O房”。以生成式變結(jié)構(gòu)計(jì)算、軟件定義晶上系統(tǒng)(Software defined System on Wafer,SDSoW)為主要內(nèi)容的晶上生成式體系架構(gòu),為解決算法模型與算力載體失配難題、增強(qiáng)軟硬件協(xié)同算力可持續(xù)發(fā)展提供了新的技術(shù)路徑。
讓計(jì)算架構(gòu)的“鞋”適應(yīng)算法的“腳”
先進(jìn)的芯片制程工藝能夠提供更高的晶體管密度,提升芯片單位面積計(jì)算能力,為大模型訓(xùn)練和推理提供更強(qiáng)大的計(jì)算資源支持。然而,基于還原論的工程設(shè)計(jì)范式,芯片制程工藝艱辛迭代獲得的物理算力提升,很難被大規(guī)模分布式物理系統(tǒng)上運(yùn)行的軟件算法有效利用。芯片峰值計(jì)算能力與算法系統(tǒng)性收益存在結(jié)構(gòu)性錯(cuò)位,加之分布式系統(tǒng)在技術(shù)體制上受“大規(guī)模、低時(shí)延、高帶寬”不可能三角問題制約,靠簡單堆砌千張、萬張乃至十萬張以上GPU卡的方式,難以滿足“規(guī)模定律-Scaling low”驅(qū)動(dòng)的大模型訓(xùn)練之非線性算力增長需求。
簡而言之,由于存算分離體制的馮·諾依曼計(jì)算架構(gòu),硬件系統(tǒng)設(shè)計(jì)(如芯片制程、內(nèi)存帶寬、并發(fā)單元等)與算法模型的運(yùn)算特征(如計(jì)算密度、數(shù)據(jù)流模式、精度需求等)之間存在系統(tǒng)性錯(cuò)位。即便芯片制程工藝有所進(jìn)步,帶來了性能增益,也會由于“逐級插損”的系統(tǒng)工程范式大打折扣。
突破“制程工藝?yán)O房”,在更高維度上尋求問題的解空間,需要變革傳統(tǒng)剛性計(jì)算架構(gòu)及技術(shù)物理實(shí)現(xiàn)范式。
近80年來,傳統(tǒng)計(jì)算架構(gòu)一直沿用運(yùn)算器、控制器、內(nèi)存儲器、輸入輸出設(shè)備幾大件組成的馮·諾依曼計(jì)算架構(gòu)。無論是復(fù)雜的AI算法,還是簡單的數(shù)據(jù)處理任務(wù),都被“硬塞”進(jìn)剛性的計(jì)算架構(gòu)之中,奢望“一勞永逸”地處理千變?nèi)f化的應(yīng)用。這就好比不管你腳多大,都必須穿37碼的鞋才能走路。然而,鞋不合腳就走不快:小腳穿大鞋會絆腳;大腳穿小鞋則會感到疼,結(jié)局往往是“削足適履”。
化解剛性架構(gòu)算力與多樣化算法間結(jié)構(gòu)性矛盾,需要借助物理學(xué)增維求解法則,導(dǎo)入自適應(yīng)計(jì)算架構(gòu)新機(jī)理。
2009年,受“自然界偽裝大師”擬態(tài)章魚啟發(fā),中國科學(xué)家在世界上首次提出領(lǐng)域?qū)S密浻布f(xié)同變結(jié)構(gòu)計(jì)算——擬態(tài)計(jì)算。如同擬態(tài)章魚,可“隨機(jī)應(yīng)變”地隱匿在沙質(zhì)海底或珊瑚礁等環(huán)境之中,擬態(tài)計(jì)算能讓“鞋子”更好地適配穿著它走路的“腳板”。
2018年,計(jì)算機(jī)體系結(jié)構(gòu)大師、圖靈獎(jiǎng)得主大衛(wèi)·帕特森和約翰·軒尼詩預(yù)言,基于軟硬件協(xié)同計(jì)算語言的領(lǐng)域?qū)S密浻布f(xié)同計(jì)算架構(gòu),將成為今后十年計(jì)算機(jī)體系架構(gòu)黃金發(fā)展期的主流發(fā)展方向之一。前不久,特斯拉Dojo超算公布了其計(jì)算范式變革的解決方案,提出硬件架構(gòu)像變形金剛般隨任務(wù)變形,實(shí)現(xiàn)從“算法適應(yīng)硬件”到“算法定義硬件”的范式轉(zhuǎn)換。
用二流零部件構(gòu)建一流系統(tǒng)
生成式變結(jié)構(gòu)計(jì)算的核心在于按算法需求動(dòng)態(tài)重構(gòu)計(jì)算架構(gòu),要求算力的硬件載體能夠?qū)崿F(xiàn)以軟件驅(qū)動(dòng)物理結(jié)構(gòu)變化,大幅度提升特定計(jì)算結(jié)構(gòu)對特定算法的執(zhí)行效能。SDSoW就是要推動(dòng)計(jì)算架構(gòu)從“剛性流水線”向“軟件可塑形”躍遷,打通生成式變結(jié)構(gòu)計(jì)算從理論到技術(shù)物理實(shí)現(xiàn)的閉環(huán),使得基于二流器件或部件構(gòu)建一流系統(tǒng)成為可能。
具體來說,SDSoW具備五大能力。
一是系統(tǒng)破局能力。SDSoW擺脫“核心器件決定論”思維,改變“芯粒、芯片、模組、機(jī)匣、機(jī)架、系統(tǒng)”的逐級堆砌、逐級插損式工程技術(shù)路線,通過晶圓級異構(gòu)集成實(shí)現(xiàn)功能解構(gòu)—晶上重組,達(dá)成功能等價(jià)、系統(tǒng)最優(yōu)的目標(biāo),將制程工藝短板通過系統(tǒng)工程方法轉(zhuǎn)化為非主要矛盾。
二是整體增效能力。借助晶圓級高密度互連、超短距離、異質(zhì)異構(gòu)封裝,獲得高帶寬、低延遲、低功耗的系統(tǒng)增益,SDSoW系統(tǒng)的帶寬可提升一個(gè)數(shù)量級,時(shí)延可縮小一個(gè)數(shù)量級,功耗可降低一個(gè)數(shù)量級,系統(tǒng)效能可提升三個(gè)量級。
三是通專融合能力?;诰A級系統(tǒng)硬件可編程/重定義架構(gòu),可通過軟件實(shí)時(shí)配置或由AI大模型生成SDSoW功能和性能。在同一物理載體上,能根據(jù)不同應(yīng)用需求或使用場景,實(shí)現(xiàn)“一平臺、多樣性”生成式變結(jié)構(gòu)計(jì)算,既可滿足專用場景特殊算力需求,又能兼顧領(lǐng)域內(nèi)相對靈活的通用算力要求。
四是開源協(xié)同能力。通過建立SDSoW開源社區(qū),發(fā)布基礎(chǔ)互連協(xié)議、動(dòng)態(tài)控制器及生成式變結(jié)構(gòu)計(jì)算工具鏈等,SDSoW可構(gòu)建“中國引領(lǐng)、全球參與”的生態(tài)環(huán)境,以開放破壟斷,形成相對Chiplet(小芯片)路線的比較優(yōu)勢。
五是內(nèi)生安全能力。SDSoW可從源頭上應(yīng)對開放生態(tài)帶來的新域新質(zhì)安全挑戰(zhàn),通過引入內(nèi)生安全架構(gòu)實(shí)現(xiàn)開放可控,即便供應(yīng)鏈欠安全,仍能保證開放條件下該系統(tǒng)具有“開箱即用、默認(rèn)安全”的網(wǎng)絡(luò)彈性。
總之,晶上生成式變結(jié)構(gòu)計(jì)算可為我國打破算力芯片“制程工藝?yán)O房”開辟新路徑,走出一條用“三流材料、二流工藝”達(dá)成“一流能力”的系統(tǒng)工程級創(chuàng)新路線。通過應(yīng)用與設(shè)計(jì)、算法與算力的垂直整合,解耦當(dāng)前我國算力基礎(chǔ)設(shè)施產(chǎn)品對芯片先進(jìn)制程工藝的強(qiáng)依賴關(guān)系,最大程度獲取體系結(jié)構(gòu)與工藝進(jìn)步的綜合增益。晶上生成式變結(jié)構(gòu)計(jì)算也能為全球智算普惠提供中國方案。
基于晶圓級集成/封裝的生成式變結(jié)構(gòu)計(jì)算,開辟了算法架構(gòu)突破與物理載體革命、算法工程實(shí)現(xiàn)與計(jì)算范式創(chuàng)新深度耦合的新方向。目前,應(yīng)盡快推動(dòng)根理論突破,重點(diǎn)攻關(guān)晶上熱力學(xué)、異構(gòu)集成理論、可重構(gòu)架構(gòu)數(shù)學(xué)描述等底層理論;持續(xù)加強(qiáng)根技術(shù)攻堅(jiān),突破晶圓級鍵合、3D互連、晶圓級操作系統(tǒng)、生成式結(jié)構(gòu)計(jì)算語言/編譯器等關(guān)鍵技術(shù),實(shí)現(xiàn)從架構(gòu)設(shè)計(jì)、物理實(shí)現(xiàn)到技術(shù)應(yīng)用自主生態(tài);多維推進(jìn)根產(chǎn)業(yè)培育,以智能駕駛、具身智能、工業(yè)數(shù)字孿生、AI一體機(jī)等新興市場需求為牽引,通過“場景開放+體系創(chuàng)新+生態(tài)聚合”三位一體模式,以超限創(chuàng)新、超常規(guī)舉措突破“小院高墻”“遏制封鎖”,蹚出一條中國特色技術(shù)平權(quán)和產(chǎn)業(yè)可持續(xù)發(fā)展之路。
(鄔江興 作者系中國工程院院士)
(責(zé)任編輯:蔡文斌)