DeepSeek上線專家模式：國產(chǎn)AI激戰(zhàn)正酣，V4能否復(fù)刻去年春節(jié)炸場？

澎湃新聞記者范佳來

2026-04-08 12:51

來源：澎湃新聞

? 10%公司 >

聽全文

國產(chǎn)大模型DeepSeek再次迎來重要更新。

4月8日，澎湃新聞記者查詢發(fā)現(xiàn)，在最新版本中，DeepSeek輸入框上方新增“快速模式”與“專家模式”，網(wǎng)頁顯示，快速模式適合日常對話，即時響應(yīng)，支持圖片和文件中的文字識別；專家模式擅長復(fù)雜問題，這也是DeepSeek在官網(wǎng)頁面首次引入分層模式。

這也讓DeepSeek更新V4的懸念再度成為大家討論的熱點(diǎn)，綜合外媒報道和社交媒體、多方渠道信息，DeepSeek大概率在今年4月正式上線V4版本。

此前不少消息也透露出端倪：3月29日至31日，DeepSeek官方網(wǎng)站連續(xù)三天出現(xiàn)不同程度異常，涉及網(wǎng)頁對話、App及API等，故障分別持續(xù)約1小時48分、10小時13分和1小時3分。其中，3月29日晚上22點(diǎn)開始，一直到30日早上7點(diǎn)，服務(wù)出現(xiàn)長達(dá)8小時的大規(guī)模訪問異常，大量用戶遭遇頁面卡頓、反復(fù)提示“服務(wù)器繁忙”甚至功能完全中斷。

外界猜測，DeepSeek出現(xiàn)大規(guī)模宕機(jī)的核心原因，是V4更新所導(dǎo)致，對此，DeepSeek內(nèi)部人士沒有回應(yīng)消息的真實(shí)性，而是向澎湃新聞記者表示：非常期待。

今年1月12日，DeepSeek曾發(fā)布一篇新論文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》（基于可擴(kuò)展查找的條件記憶：大語言模型稀疏性的新維度），梁文鋒位列作者名單中，這篇論文為北京大學(xué)和DeepSeek共同完成。據(jù)分析，這篇論文的核心直指當(dāng)前大語言模型存在的記憶力“短板”，提出了“條件記憶”這一概念。

2月13日，澎湃新聞記者曾獨(dú)家獲悉，DeepSeek網(wǎng)頁/ APP正在測試新的長文本模型結(jié)構(gòu)，支持1M上下文。其API服務(wù)不變，仍為V3.2，僅支持128K上下文。大家當(dāng)時也猜測，DeepSeek或?qū)⒃诮衲甏汗?jié)再次“炸場”發(fā)布新模型，復(fù)刻去年春節(jié)現(xiàn)象級轟動。

不過，春節(jié)AI大戰(zhàn)雖然熱鬧，但DeepSeek卻始終靜悄悄，也讓相關(guān)期待一度落空。

據(jù)券商研報顯示，DeepSeek最新的V4模型亮點(diǎn)將聚焦國產(chǎn)化。野村證券分析，作為去年推出DS-V3/R1并攪動全球AI產(chǎn)業(yè)鏈的玩家，DeepSeek的全新技術(shù)布局不僅將推動中國AI產(chǎn)業(yè)鏈創(chuàng)新周期加速，更將通過技術(shù)創(chuàng)新，在算法與工程層面縮小中國與全球大模型產(chǎn)業(yè)的差距。

業(yè)內(nèi)人士普遍認(rèn)為，此次V4發(fā)布，對于DeepSeek來說難度頗大，要復(fù)刻去年春節(jié)期間炸場的轟動性頗有技術(shù)挑戰(zhàn)，因?yàn)閲a(chǎn)大模型已經(jīng)卷入深水戰(zhàn)場，競爭極度激烈。

4月8日，智譜正式發(fā)布GLM-5.1，記者發(fā)現(xiàn)，在年內(nèi)漲價超八成后，智譜GLM再度提價10%。調(diào)價后，GLM-5.1在Coding場景的緩存命中Token價格已接近Anthropic旗下Claude Sonnet4.6水平。

據(jù)悉，這是國產(chǎn)大模型首次在核心場景實(shí)現(xiàn)與海外頭部廠商的價格對齊。一年前，國產(chǎn)大模型廠商還在以降價90%以上爭奪市場份額。這一轉(zhuǎn)折表明國產(chǎn)大模型不再單純依靠大幅降價爭奪市場，而是以性能溢價錨定國際基準(zhǔn)。

數(shù)據(jù)顯示，GLM-5.1在編程能力上繼續(xù)保持領(lǐng)先，在SWE-bench Pro、Terminal-Bench、NL2Repo三大代碼評測基準(zhǔn)的綜合平均分中，取得全球第三、國產(chǎn)第一、開源第一；此外，有別于當(dāng)前以分鐘級交互為主的模型，GLM-5.1能夠在單次任務(wù)中持續(xù)、自主地工作長達(dá)8小時。

3月18日，MiniMax（上海稀宇極智科技有限公司）發(fā)布新一代Agent旗艦大模型M2.7，首次展示“模型自我進(jìn)化”路徑。該模型通過構(gòu)建Agent Harness體系，深度參與自身訓(xùn)練與優(yōu)化流程，在部分研發(fā)場景中可承擔(dān)30%—50%的工作量，并在內(nèi)部評測集上實(shí)現(xiàn)約30%的效果提升。

據(jù)介紹，在核心能力上，M2.7在SWE-bench Pro中取得56.22%的成績，接近國際一線水平；同時在VIBE-Pro、Terminal Bench2等真實(shí)工程測試中表現(xiàn)突出，支持端到端項(xiàng)目交付與復(fù)雜系統(tǒng)理解。辦公場景方面，其在GDPval-AA的ELO得分是1495，為開源模型中最高，并顯著提升Office文檔處理與多輪編輯能力。

截至8日港股午盤，智譜（02513.HK）漲14.06%，報888.5港元，市值3961億港元。MiniMax（0100.HK）漲6.9%，報1015港元，市值3183億港元。

責(zé)任編輯：李躍群

圖片編輯：陳飛燕

澎湃新聞報料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報

#DeepSeek V4 #DeepSeek #V4 #國產(chǎn)大模型競爭 #專家模式