DeepSeek“帶飛”國產(chǎn)算力板塊 寒武紀(jì)市值超5000億元 摩爾線程已支持FP8
DeepSeek-V3.1發(fā)布徹底引燃了國產(chǎn)算力供應(yīng)鏈。
8月22日,國產(chǎn)算力產(chǎn)業(yè)鏈起飛。算力芯片廠商寒武紀(jì)(688256)、海光信息(688041)、云天勵飛(688343)均20CM漲停,其中寒武紀(jì)市值突破5200億元,海光信息市值突破4300億元。
在算力芯片的帶領(lǐng)下,國產(chǎn)算力供應(yīng)鏈集體大漲。芯片代工的中芯國際(688981)大漲近15%。半導(dǎo)體設(shè)備端的北方華創(chuàng)(002371)和中微公司(688012)漲超6%。華為算力供應(yīng)鏈也有極好的表現(xiàn),川潤股份(002272)10%漲停、方正科技(600601)10%漲停。
消息面上,8月21日,DeepSeek正式發(fā)布DeepSeek-V3.1。這款大模型為混合推理架構(gòu),同時支持思考模式與非思考模式。思考效率更高,相比DeepSeek-R1-0528能在更短時間給出答案。此外,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。新模型在智能體能力上實現(xiàn)突破。官方資料顯示,在代碼修復(fù)測評,命令行終端環(huán)境下的復(fù)雜任務(wù)測試中,DeepSeek-V3.1有明顯提高,并在多項搜索評測指標(biāo)上取得較大進(jìn)展。
此外,DeepSeek還表示,DeepSeek-V3.1使用了UE8M0FP8Scale的參數(shù)精度。UE8M0FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計。這也表明未來基于DeepSeek模型的訓(xùn)練與推理有望更多應(yīng)用國產(chǎn)AI芯片,助力國產(chǎn)算力生態(tài)加速建設(shè)。
目前,國產(chǎn)算力芯片供應(yīng)商主要有華為、海光信息、寒武紀(jì)以及沐曦、摩爾線程、燧原、天數(shù)智芯等。今年2月份,這些算力芯片都已經(jīng)對外宣布適配DeepSeek的模型。
不過,澎湃新聞記者最新獲悉,摩爾線程旗艦AI訓(xùn)推產(chǎn)品MTTS5000是國內(nèi)首批原生支持FP8并已大規(guī)模量產(chǎn)的GPU。摩爾線程的MUSA架構(gòu)原生支持硬件FP8張量加速計算,能夠很好地支持UE8M0FP8Scale,利用硬件原生FP8,相對于傳統(tǒng)的FP16計算能夠?qū)崿F(xiàn)兩倍的浮點算力提升、訪存和通信帶寬效率提升和存儲容量利用率提升,同時最優(yōu)化張量表達(dá)精度。
今年2月份,摩爾線程對外披露,自DeepSeek啟動“開源周”以來,已陸續(xù)開源三個代碼庫。摩爾線程基于全新MUSAComputeCapability3.1計算架構(gòu),可提供原生FP8計算能力,同時升級了高性能線性代數(shù)模板庫MUTLASS,快速支持了FlashMLA。不僅如此,摩爾線程還基于MUTLASS在全新GPU架構(gòu)上優(yōu)化實現(xiàn)了FP8矩陣乘法,支持DeepGEMM的相應(yīng)功能,充分展示了摩爾線程MUSA架構(gòu)和全功能GPU在生態(tài)兼容與快速適配上的強大優(yōu)勢。
海光信息之前宣布海光DCU(深度計算單元)已成功完成與DeepSeekV3和R1模型的適配優(yōu)化。DCU是海光信息推出的高性能GPGPU架構(gòu)AI加速卡,致力于為行業(yè)客戶提供自主可控的全精度通用AI加速計算解決方案。DCU已在科教、金融、醫(yī)療、政務(wù)、智算中心等多個領(lǐng)域?qū)崿F(xiàn)規(guī)?;瘧?yīng)用。
一位芯片行業(yè)人士表示,目前最新的FP8,國產(chǎn)芯片都不太支持,接下來會分階段進(jìn)行支持。先是通過軟件兼容,再逐步進(jìn)行硬件原生支持。
針對DeepSeek更新模型,明確支持FP8精度和即將發(fā)布的下一代國產(chǎn)芯片,中信建投研報認(rèn)為,頭部國產(chǎn)開源模型對國產(chǎn)芯片的支持有望推動國產(chǎn)算力生態(tài)加速落地。
中信建投還提到,騰訊在業(yè)績會上表示推理芯片的供應(yīng)渠道側(cè)具備多種選擇,國際供應(yīng)鏈波動背景下國產(chǎn)推理算力芯片有望提供助力。華為昇騰芯片近期陸續(xù)參與政府、金融、運營商等行業(yè)客戶招投標(biāo)產(chǎn)品中,印證國產(chǎn)芯片競爭力持續(xù)提升。
公開信息顯示:8月12日,2025金融AI推理應(yīng)用落地與發(fā)展論壇在上海舉行。華為在本次論壇上推出AI推理創(chuàng)新技術(shù)——UCM推理記憶數(shù)據(jù)管理器,旨在推動AI推理體驗升級,提升推理性價比。
當(dāng)前,人工智能已步入發(fā)展深水區(qū),AI推理正成為下一個爆發(fā)式增長的關(guān)鍵階段。為保障流暢的推理體驗,企業(yè)需持續(xù)加大算力投入,但如何在推理效率與成本之間找到最佳平衡點,成為了全行業(yè)亟待解決的重要課題。
華為推出UCM推理記憶數(shù)據(jù)管理器,包括對接不同引擎與算力的推理引擎插件(Connector)、支持多級KVCache管理及加速算法的功能庫(Accelerator)、高性能KVCache存取適配器(Adapter)三大組件,通過推理框架、算力、存儲三層協(xié)同,實現(xiàn)AI推理“更優(yōu)體驗、更低成本”。
除了DeepSeek加大對國產(chǎn)算力芯片的支持外,還有消息稱,英偉達(dá)已要求部分零部件供應(yīng)商暫停生產(chǎn)H20芯片。
8月22日,外交部發(fā)言人毛寧主持例行記者會。彭博社記者提問,據(jù)報道稱,英偉達(dá)已要求部分零部件供應(yīng)商暫停生產(chǎn)H20芯片。外交部對有關(guān)英偉達(dá)停止H20芯片生產(chǎn)的最新報道有何評論?對此,毛寧表示:“這個問題建議你向中方的主管部門了解。作為原則,我們一貫認(rèn)為各方各國都應(yīng)當(dāng)共同維護(hù)全球產(chǎn)供鏈的穩(wěn)定暢通?!?/p>
(文章來源:澎湃新聞)
來源:東方財富網(wǎng)