- +1
席卷全球AI圈!DeepSeek-V4成OpenClaw默認模型
全球Agent(智能體)風(fēng)向標OpenClaw官宣接入DeepSeek-V4。
4月26日,澎湃新聞記者獲悉,OpenClaw(龍蝦)正式官宣,已經(jīng)全面接入DeepSeek-V4(Flash和Pro雙版本),其中V4 Flash成為默認大模型,V4 Pro也已上線模型庫。
據(jù)OpenClaw披露,最新的4.24版本更新包括:實時語音通話全面打通;DeepSeek-V4-Flash和Pro加入模型庫;瀏覽器自動化增加了坐標點擊和更好的恢復(fù)機制;Telegram、Slack、MCP、會話和TTS修復(fù)。
如今在龍蝦里配置DeepSeek API,默認模型將不再是Deepseek-Chat,而是Deepseek-V4-Flash了。
“好奇DeepSeek-V4表現(xiàn)如何!”消息一出,在社交媒體上引發(fā)網(wǎng)友熱議。此次龍蝦迅速接入DeepSeek-V4,也是在全球?qū)用嫔蠈τ趪a(chǎn)大模型DeepSeek的模型能力表達認可。
DeepSeek此次新模型發(fā)布,已經(jīng)迅速引發(fā)AI圈關(guān)注。4月24日,DeepSeek-V4的預(yù)覽版本正式上線并同步開源。DeepSeek-V4擁有百萬字超長上下文,在Agent能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先,DeepSeek-V4以1.6萬億總參數(shù)和49B激活參數(shù),成為全球最大的開源模型,而V4-Flash則以284B總參數(shù)和13B激活參數(shù),提供更小、更快、更便宜的解決方案,推理能力在Max模式下幾乎追平Pro版本。
相比前代模型,DeepSeek-V4-Pro的Agent能力顯著增強。在AgenticCoding評測中,V4-Pro已達到當前開源模型最佳水平,并在其他Agent相關(guān)評測中同樣表現(xiàn)優(yōu)異。
據(jù)了解,DeepSeek-V4開創(chuàng)一種全新的注意力機制,在Token維度進行壓縮,結(jié)合DSA稀疏注意力(DeepSeekSparseAttention),實現(xiàn)全球領(lǐng)先的長上下文能力,并且相比于傳統(tǒng)方法大幅降低了對計算和顯存的需求,未來1M(一百萬)上下文將是DeepSeek所有官方服務(wù)的標配。
此次DeepSeek在全球范圍內(nèi)再次廣受關(guān)注,除了創(chuàng)新性的技術(shù)架構(gòu),核心在于對于國產(chǎn)芯片的全面適配,實現(xiàn)國產(chǎn)AI算力的快速崛起。華為計算發(fā)布信息稱,昇騰超節(jié)點產(chǎn)品全面支持DeepSeek-V4。本次通過雙方芯模技術(shù)緊密協(xié)同,實現(xiàn)昇騰超節(jié)點全系列產(chǎn)品支持DeepSeek-V4系列模型。
在DeepSeek-V4發(fā)布后,寒武紀也在第一時間宣布,基于vLLM推理框架完成了對此次DeepSeek-V4-flash和DeepSeek-V4-Pro兩個版本的Day 0適配,適配代碼已開源到GitHub社區(qū)。
其中,昇騰950通過融合kernel和多流并行技術(shù)降低Attention計算和訪存開銷,大幅提升推理性能,結(jié)合多種量化算法,實現(xiàn)了高吞吐、低時延的DeepSeek-V4模型推理部署。昇騰A3超節(jié)點系列產(chǎn)品也全面適配,同時為便于用戶快速微調(diào),提供了基于昇騰A3超節(jié)點的訓(xùn)練參考實現(xiàn)。
值得注意的是,DeepSeek也在持續(xù)推動AI“降價”浪潮。4月26日,DeepSeek宣布旗下V4-Pro模型API開啟2.5折價格特惠,輸入(緩存命中)價格為0.25元/百萬Tokens,輸入(緩存未命中)價格為3元/百萬Tokens,輸出價格為6元/百萬Tokens,優(yōu)惠期截至5月5日。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




