9999精品视频,一区二区色,91福利在线免费播放,人妻在线综合综合网,人妻丰满精品一区,九九九精品九九九精品,久久精品店,国产午夜久久,五月天人妻超碰

  • +1

DeepSeek上線專家模式:國產(chǎn)AI激戰(zhàn)正酣,V4能否復(fù)刻去年春節(jié)炸場?

澎湃新聞記者 范佳來
2026-04-08 12:51
來源:澎湃新聞
? 10%公司 >
聽全文
字號

國產(chǎn)大模型DeepSeek再次迎來重要更新。

4月8日,澎湃新聞記者查詢發(fā)現(xiàn),在最新版本中,DeepSeek輸入框上方新增“快速模式”與“專家模式”,網(wǎng)頁顯示,快速模式適合日常對話,即時響應(yīng),支持圖片和文件中的文字識別;專家模式擅長復(fù)雜問題,這也是DeepSeek在官網(wǎng)頁面首次引入分層模式。

這也讓DeepSeek更新V4的懸念再度成為大家討論的熱點(diǎn),綜合外媒報道和社交媒體、多方渠道信息,DeepSeek大概率在今年4月正式上線V4版本。

此前不少消息也透露出端倪:3月29日至31日,DeepSeek官方網(wǎng)站連續(xù)三天出現(xiàn)不同程度異常,涉及網(wǎng)頁對話、App及API等,故障分別持續(xù)約1小時48分、10小時13分和1小時3分。其中,3月29日晚上22點(diǎn)開始,一直到30日早上7點(diǎn),服務(wù)出現(xiàn)長達(dá)8小時的大規(guī)模訪問異常,大量用戶遭遇頁面卡頓、反復(fù)提示“服務(wù)器繁忙”甚至功能完全中斷。

外界猜測,DeepSeek出現(xiàn)大規(guī)模宕機(jī)的核心原因,是V4更新所導(dǎo)致,對此,DeepSeek內(nèi)部人士沒有回應(yīng)消息的真實(shí)性,而是向澎湃新聞記者表示:非常期待。

今年1月12日,DeepSeek曾發(fā)布一篇新論文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》(基于可擴(kuò)展查找的條件記憶:大語言模型稀疏性的新維度),梁文鋒位列作者名單中,這篇論文為北京大學(xué)和DeepSeek共同完成。據(jù)分析,這篇論文的核心直指當(dāng)前大語言模型存在的記憶力“短板”,提出了“條件記憶”這一概念。

2月13日,澎湃新聞記者曾獨(dú)家獲悉,DeepSeek網(wǎng)頁/ APP正在測試新的長文本模型結(jié)構(gòu),支持1M上下文。其API服務(wù)不變,仍為V3.2,僅支持128K上下文。大家當(dāng)時也猜測,DeepSeek或?qū)⒃诮衲甏汗?jié)再次“炸場”發(fā)布新模型,復(fù)刻去年春節(jié)現(xiàn)象級轟動。

不過,春節(jié)AI大戰(zhàn)雖然熱鬧,但DeepSeek卻始終靜悄悄,也讓相關(guān)期待一度落空。

據(jù)券商研報顯示,DeepSeek最新的V4模型亮點(diǎn)將聚焦國產(chǎn)化。野村證券分析,作為去年推出DS-V3/R1并攪動全球AI產(chǎn)業(yè)鏈的玩家,DeepSeek的全新技術(shù)布局不僅將推動中國AI產(chǎn)業(yè)鏈創(chuàng)新周期加速,更將通過技術(shù)創(chuàng)新,在算法與工程層面縮小中國與全球大模型產(chǎn)業(yè)的差距。

業(yè)內(nèi)人士普遍認(rèn)為,此次V4發(fā)布,對于DeepSeek來說難度頗大,要復(fù)刻去年春節(jié)期間炸場的轟動性頗有技術(shù)挑戰(zhàn),因?yàn)閲a(chǎn)大模型已經(jīng)卷入深水戰(zhàn)場,競爭極度激烈。

4月8日,智譜正式發(fā)布GLM-5.1,記者發(fā)現(xiàn),在年內(nèi)漲價超八成后,智譜GLM再度提價10%。調(diào)價后,GLM-5.1在Coding場景的緩存命中Token價格已接近Anthropic旗下Claude Sonnet4.6水平。

據(jù)悉,這是國產(chǎn)大模型首次在核心場景實(shí)現(xiàn)與海外頭部廠商的價格對齊。一年前,國產(chǎn)大模型廠商還在以降價90%以上爭奪市場份額。這一轉(zhuǎn)折表明國產(chǎn)大模型不再單純依靠大幅降價爭奪市場,而是以性能溢價錨定國際基準(zhǔn)。

數(shù)據(jù)顯示,GLM-5.1在編程能力上繼續(xù)保持領(lǐng)先,在SWE-bench Pro、Terminal-Bench、NL2Repo三大代碼評測基準(zhǔn)的綜合平均分中,取得全球第三、國產(chǎn)第一、開源第一;此外,有別于當(dāng)前以分鐘級交互為主的模型,GLM-5.1能夠在單次任務(wù)中持續(xù)、自主地工作長達(dá)8小時。

3月18日,MiniMax(上海稀宇極智科技有限公司)發(fā)布新一代Agent旗艦大模型M2.7,首次展示“模型自我進(jìn)化”路徑。該模型通過構(gòu)建Agent Harness體系,深度參與自身訓(xùn)練與優(yōu)化流程,在部分研發(fā)場景中可承擔(dān)30%—50%的工作量,并在內(nèi)部評測集上實(shí)現(xiàn)約30%的效果提升。

據(jù)介紹,在核心能力上,M2.7在SWE-bench Pro中取得56.22%的成績,接近國際一線水平;同時在VIBE-Pro、Terminal Bench2等真實(shí)工程測試中表現(xiàn)突出,支持端到端項(xiàng)目交付與復(fù)雜系統(tǒng)理解。辦公場景方面,其在GDPval-AA的ELO得分是1495,為開源模型中最高,并顯著提升Office文檔處理與多輪編輯能力。

截至8日港股午盤,智譜(02513.HK)漲14.06%,報888.5港元,市值3961億港元。MiniMax(0100.HK)漲6.9%,報1015港元,市值3183億港元。

    責(zé)任編輯:李躍群
    圖片編輯:陳飛燕
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司

            临城县| 黑河市| 台东市| 潞城市| 岳普湖县| 安义县| 潍坊市| 东阳市| 双江| 商洛市| 黄石市| 鹤岗市| 汉沽区| 兴业县| 西华县| 北川| 安化县| 邹平县| 清河县| 兴义市| 呼和浩特市| 温州市| 横山县| 开封市| 南皮县| 剑川县| 福清市| 丰都县| 木兰县| 恩平市| 焉耆| 卢湾区| 通江县| 图片| 桂东县| 宁强县| 遂平县| 花莲市| 五常市| 陆川县| 台北市|