2026-04-24 20:07:55
4月24日,DeepSeek發(fā)布并開源全新系列模型V4預覽版,同步推出高性能版和輕量版,首次在官方技術報告中寫入華為昇騰NPU和英偉達GPU。這打破了中國大模型廠商對英偉達的依賴,標志著國產算力替代邏輯的推進。昇騰950超節(jié)點將提升吞吐能力、降低單位Token成本,推動國產算力供給規(guī)?;N騰產業(yè)鏈已成形,服務器整機制造為核心環(huán)節(jié)。
每經記者|王晶 吳澤鵬 每經編輯|陳俊杰
4月24日,AI(人工智能)領域的目光不約而同地聚焦在同一件事上——DeepSeek正式發(fā)布并開源了全新系列模型V4的預覽版本,同步推出高性能版的DeepSeek-V4-Pro,以及輕量版的DeepSeek-V4-Flash。據官方披露,DeepSeek-V4擁有百萬字超長上下文,在Agent(智能體)能力、世界知識和推理性能上均在國內和開源領域保持領先。
人們在討論新模型到底有多強的同時,另一個更具產業(yè)意義的話題也迅速升溫——DeepSeek首次在官方技術報告中,把華為昇騰NPU(神經網絡處理器)和英偉達GPU(圖形處理器)寫進了同一份硬件驗證清單?!拔覀冊谟ミ_GPU和華為昇騰NPU兩個平臺上均驗證了細粒度EP(專家并行)方案?!边@標志著萬億參數(shù)級別的模型首次在正式文檔中完成了對國產AI芯片的“官方認定”。
長期以來,中國大模型廠商的訓練與推理幾乎全部依賴英偉達的GPU和CUDA生態(tài),但DeepSeek-V4的發(fā)布,終于打破了這個局面。
這背后是一條清晰的國產算力替代邏輯:如果DeepSeek這樣一個頂級開源大模型,能夠在華為昇騰生態(tài)上跑出不輸于英偉達平臺的推理性能,那么它將向整個行業(yè)釋放一個信號——在大模型推理側,國產芯片已具備承載實際商業(yè)負載的能力。
在DeepSeek-V4發(fā)布前,市場上便傳出其已提前適配華為昇騰950等國產AI芯片。隨著正式發(fā)布,目前可以確認的是,該模型已經完成了在昇騰NPU平臺上的推理適配(不一定基于昇騰950訓練)。
在以往大模型開發(fā)過程中,早期測試與適配往往優(yōu)先開放給英偉達、AMD等美系芯片廠商。此次DeepSeek在模型階段就推進國產算力適配,也被業(yè)內視為路徑上的重要變化。
昇騰芯片是國產算力陣營中的代表,也是華為整個AI戰(zhàn)略的基礎。2018年10月,華為全聯(lián)接大會正式發(fā)布首款采用華為自研達芬奇架構的AI芯片昇騰910與昇騰310。其中,昇騰310是SoC(系統(tǒng)級芯片)小芯片,和人們的手機芯片差不多,只有指甲蓋那么大;昇騰910是大芯片,和人們的掌心差不多大,主要面向云端高性能計算;2019年昇騰芯片正式投入商用,但此后幾年,昇騰在公開市場的聲量和產品節(jié)奏上都相對低調。
直到2025年9月,華為輪值董事長徐直軍罕見公布昇騰芯片的演進和目標。他表示,未來三年,華為已經規(guī)劃了昇騰多款芯片,包括950PR,950DT以及昇騰960和970。其中,昇騰950系列分為兩個型號——950PR與950DT,兩者共用Ascend 950 Die,但面向不同任務場景。其中,950PR面向推理Prefill階段和推薦業(yè)務場景,規(guī)劃于今年第一季度推出;950DT則更注重推理Decode階段和訓練場景,規(guī)劃將于2026年第四季度推出。
從發(fā)布節(jié)奏來看,昇騰芯片將進入一個快速迭代和性能持續(xù)飆升的周期。不過,由于受限于先進制程的獲取,華為單顆昇騰芯片的算力目前還難以直接與英偉達芯片競爭。為此,華為還選擇了一條不同的技術路徑:通過“超節(jié)點+集群”的算力解決方案,將多顆芯片高效互聯(lián),以集成的方式滿足持續(xù)增長的算力需求。
以芯片制程為例,在摩爾定律放緩的情況下,7納米到3納米,可能每代性能提升不超過20%。而超節(jié)點可以將模型算力利用率從30%提升到45%,相當于提升了50%,通過資源的高效調度,在一定程度上可以彌補芯片工藝代差。目前,國內除了華為,包括阿里、字節(jié)、騰訊、百度、中科曙光、浪潮信息、新華三等多家廠商均推出超節(jié)點方案。
“由于美國‘制裁’,我們不能產出最先進工藝制程的芯片,但我們基于過去三十多年構筑的聯(lián)接技術能力,使得我們能夠做到萬卡級的超節(jié)點,經營萬卡級的超節(jié)點,做到在世界上算力最強?!毙熘避娬f道。
如果說昇騰950解決的是“能不能跑”,那么Atlas 950 SuperPoD解決的則是“能不能跑得更便宜、更大規(guī)?!?。
從價格看,DeepSeek V4-Pro每百萬Tokens(詞元)輸入是1元,輸出是12元,V4-Flash每百萬Tokens輸入是0.2元,輸出是2元。但同時,DeepSeek明確表示:“預計下半年昇騰950超節(jié)點批量上市并部署之后,Pro版本的價格也會大幅度下調?!?/p>
據悉,華為Atlas 950 SuperPoD采用面向大規(guī)模AI訓練場景的超節(jié)點架構設計,該系統(tǒng)由8192張基于950昇騰加速卡構成,總體由128個計算機柜和32個互聯(lián)機柜組成,整套系統(tǒng)共計160個機柜,其上市時間為2026年四季度。相較于英偉達同樣將在下半年上市的NVL144,Atlas 950超節(jié)點卡的規(guī)模是其56.8倍,總算力是其6.7倍,內存容量是其15倍。不過客觀來看,集群也面臨諸如能耗、占地DeepSeek面積大等問題。
從架構上看,DeepSeek-V4屬于典型的MoE模型,總參數(shù)規(guī)模達1.6萬億、激活參數(shù)49B,這對推理集群的規(guī)模和效率提出了極高要求。外界普遍認為,一旦昇騰950超節(jié)點批量上市,理論上將帶來三重變化。
具體來看:首先,吞吐能力顯著提升。 8192卡的超節(jié)點尤其適合MoE架構、上下文并行、專家并行與高并發(fā)推理場景;其次,單位Token成本下降。 高并發(fā)推理的關鍵不在單卡峰值算力,而在單位時間能服務多少請求、生成多少Tokens。吞吐提升后,API價格便有了下調空間;第三,國產算力供給規(guī)?;?。 如果DeepSeek-V4-Pro不再高度依賴稀缺的海外高端GPU,Pro版本就可以走向“大規(guī)模商業(yè)化”,并且適配國產芯片也證明了,AI推理不一定只能依靠最貴的GPU,國產算力同樣可以開辟一條新路。
DeepSeek-V4適配昇騰的消息,也讓國產算力產業(yè)鏈徹底站上了聚光燈下——一顆昇騰芯片背后,是一條從服務器整機到覆銅板的龐大鏈條。在這個鏈條上,最核心的環(huán)節(jié)是什么?哪些上市公司參與了關鍵節(jié)點的產業(yè)分工?市場規(guī)模到底有多大?《每日經濟新聞》記者進行了梳理。
首先,在國產AI芯片格局上,昇騰已實現(xiàn)斷層領先。根據市場研究機構IDC最新發(fā)布的報告,2025年中國AI加速卡市場總出貨量達到約400萬張,其中國產芯片合計出貨約165萬張,市場份額首次突破四成,躍升至41%。英偉達以55%市場份額排名第一,該公司此前市場份額高達95%。
在國產陣營中,梯隊格局已基本成形。華為出貨量達81.2萬張,不僅斷層領跑各大國產廠商,還占據了國產芯片總出貨量的近一半,占全市場約20%的份額。阿里巴巴旗下的平頭哥以約26.5萬張位列第二,百度昆侖芯與寒武紀各約11.6萬張,并列第三。
更重要的是市場趨勢的變化。知名調研機構Bernstein Research發(fā)布報告指出,受外部出口管制持續(xù)加碼等因素影響,2026年以華為昇騰為首的國產AI芯片市占率有望首次超過50%,預計到2028年,中國本土AI芯片產量即可覆蓋國內需求,供應需求比例預計達到104%。
其次,從產業(yè)鏈的價值分布來看,最核心的環(huán)節(jié)是服務器整機制造。AI芯片必須被物理集成到服務器中,才能進入算力中心、云廠商和政企客戶,這一環(huán)節(jié)也最快轉化為訂單和營收。根據中商產業(yè)研究院分析師預測,2026年市場規(guī)模將達到2859億元。
圍繞服務器整機制造,昇騰產業(yè)鏈分為三層:最內層是服務器整機制造商,獲單最為直接;中間層是由CANN架構為核心的軟件生態(tài),決定廠商的生態(tài)黏性;最外層是上游材料和元件供應商,包括覆銅板、交換機、高速銅連接模組等。
在整機制造環(huán)節(jié),目前格局高度集中。華鯤振宇是華為生態(tài)中唯一同時獲得“鯤鵬+昇騰”雙領先級認證、連續(xù)兩年獲評戰(zhàn)略級伙伴的企業(yè),其“天宮”系列AI服務器已量產并進入多個省級智算中心。A股上市公司中,神州數(shù)碼旗下神州鯤泰自有產線是華為昇騰生態(tài)的重要整機硬件伙伴。拓維信息則是華為鯤鵬、昇騰、鴻蒙的全方位合作伙伴。
在上游材料和組件的“賣鏟子”領域,同樣有關鍵企業(yè)深度嵌入昇騰產業(yè)鏈。例如,華豐科技是華為高速背板連接器的核心供應商,作為第一大客戶,在去年貢獻了超60%的收入。
此外,伴隨昇騰芯片從910C向950的升級,超節(jié)點架構對交換芯片、交換機和銅連接等環(huán)節(jié)的需求大幅提升。華泰證券研報判斷2026年為“國產超節(jié)點元年”,并測算到2028年國產超節(jié)點市場空間有望達到3414億元,2026年至2028年的年復合增長率高達194%。
如果說硬件性能的突破是基礎,那么軟件生態(tài)就是昇騰能否長期繁榮的關鍵,CANN作為昇騰的軟件層,其生態(tài)主導權正在演變?yōu)殛P鍵競爭壁壘——歷史上,英偉達正是憑借CUDA生態(tài)奠定了其在AI領域的統(tǒng)治地位。一個重要的信號來自運營商層面:根據中國移動采購與招標網的公示信息,中國移動2026年—2027年人工智能超節(jié)點設備集中采購項目已開標,采購規(guī)模為6208張AI加速卡,總金額約20.6億元,中標文件明確全線采用華為CANN生態(tài)方案,涵蓋華鯤振宇、河南昆侖、長江計算等五家企業(yè)。有分析指出,這是三大運營商在集團層面首次啟動AI超節(jié)點設備集采,標志著運營商級基礎設施正在加速接入國產CANN生態(tài)。
需要說明的是,產業(yè)鏈機遇的背后也有變數(shù)——其中,算力供給瓶頸是最關鍵的不確定性——昇騰芯片的產能能否跟上爆發(fā)式需求,將直接決定整條產業(yè)鏈的訂單能否如期兌現(xiàn)。而這場由DeepSeek與昇騰共同點燃的算力變革,才剛剛拉開序幕。
封面圖片來源:蘭素英
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP