DeepSeek R2有望8月下旬發(fā)布??jī)?nèi)部人士:不屬實(shí)
近日有市場(chǎng)傳言稱,國(guó)產(chǎn)大模型公司深度求索旗下DeepSeekR2有望在8月15日至30日期間發(fā)布。
8月13日,DeepSeek內(nèi)部人士向澎湃新聞?dòng)浾弑硎?,上述消息不屬?shí)。
早在今年4月,就有傳言稱,深度求索可能將在5月推出下一代AI大模型DeepSeek-R2。當(dāng)時(shí)有報(bào)道稱,DeepSeek-R2大模型將會(huì)采用一種更先進(jìn)的混合專家模型(MoE),其結(jié)合更加智能的門控網(wǎng)絡(luò)層(GatingNetwork)以優(yōu)化高負(fù)載推理任務(wù)的性能。
不過(guò),上述內(nèi)部人士曾向記者坦言,該傳言真實(shí)度不高。
此后,DeepSeek官宣推出R1新版本,業(yè)內(nèi)普遍認(rèn)為這是取代了R2的發(fā)布。
5月29日,據(jù)DeepSeek公告,DeepSeekR1模型已完成小版本升級(jí),當(dāng)前版本為DeepSeek-R1-0528。用戶通過(guò)官方網(wǎng)站、APP或小程序進(jìn)入對(duì)話界面后,開(kāi)啟“深度思考”功能即可體驗(yàn)最新版本。API也已同步更新,調(diào)用方式不變。
公告指出,DeepSeek-R1-0528使用2024年12月所發(fā)布的DeepSeekV3Base模型作為基座,但在后訓(xùn)練過(guò)程中投入了更多算力,顯著提升模型的思維深度與推理能力。更新后的R1模型在數(shù)學(xué)、編程與通用邏輯等多個(gè)基準(zhǔn)測(cè)評(píng)中取得當(dāng)前國(guó)內(nèi)所有模型中首屈一指的優(yōu)異成績(jī),并且在整體表現(xiàn)上已接近其他國(guó)際頂尖模型,如o3與Gemini-2.5-Pro。
相較于舊版R1,新版模型在復(fù)雜推理任務(wù)中的表現(xiàn)有顯著提升。例如在AIME2025測(cè)試中,新版模型準(zhǔn)確率由舊版的70%提升至87.5%。這一進(jìn)步得益于模型在推理過(guò)程中的思維深度增強(qiáng):在AIME2025測(cè)試集上,舊版模型平均每題使用12Ktokens,而新版模型平均每題使用23Ktokens,表明其在解題過(guò)程中進(jìn)行了更為詳盡和深入的思考。
大模型行業(yè)的內(nèi)卷正在加劇。7月31日,據(jù)國(guó)際開(kāi)源社區(qū)Hugging-Face最新趨勢(shì)熱榜顯示,前十名模型中,有9個(gè)是國(guó)產(chǎn)大模型,其中排名第一的是智譜最新發(fā)布的新一代旗艦大模型GLM-4.5,排名第二的是阿里旗下通義千問(wèn)模型Qwen3,而騰訊混元最新發(fā)布的3D模型則排行第三。
但據(jù)排名數(shù)據(jù)顯示,DeepSeekR1在Hugging-Face趨勢(shì)熱榜中并不靠前,不過(guò)其依然是目前點(diǎn)贊最多的大模型,DeepSeekR1收到了1.25萬(wàn)個(gè)贊(like),遠(yuǎn)超其他國(guó)產(chǎn)大模型。
在年初成為大模型產(chǎn)業(yè)王炸黑馬后,DeepSeek成為國(guó)內(nèi)大模型廠商的集體競(jìng)標(biāo)對(duì)手,包括MiniMax、月之暗面等知名大模型公司或明或暗都提出了對(duì)標(biāo)DeepSeek的目標(biāo),且在更新迭代上進(jìn)展迅速。作為中國(guó)開(kāi)源大模型的“風(fēng)向標(biāo)”,DeepSeek正在面臨更激烈競(jìng)爭(zhēng)。
(文章來(lái)源:澎湃新聞)
來(lái)源:東方財(cái)富網(wǎng)