9999精品视频,一区二区色,91福利在线免费播放,人妻在线综合综合网,人妻丰满精品一区,九九九精品九九九精品,久久精品店,国产午夜久久,五月天人妻超碰

  • +1

AI智能體下的CPU,或重回“黃金時(shí)代”

2026-04-15 07:09
來(lái)源:澎湃新聞·澎湃號(hào)·湃客
聽(tīng)全文
字號(hào)

如果AI只是一問(wèn)一答的聊天機(jī)器,算力的答案確實(shí)很簡(jiǎn)單——有多少GPU,就有多少想象力。在那段以對(duì)話模型為主角的周期里,CPU更像一位低調(diào)的調(diào)度員,負(fù)責(zé)數(shù)據(jù)的迎來(lái)送往,而非決定反應(yīng)快慢的核心角色。然而,當(dāng)AI從對(duì)話框里走出來(lái),開(kāi)始調(diào)用工具、讀寫(xiě)代碼、編排任務(wù),變身真正的“數(shù)字代理人”時(shí),算力游戲規(guī)則變了。分支指令的暴增讓擅長(zhǎng)矩陣乘法的GPU一時(shí)“水土不服”,而那位退居幕后的CPU,卻恰好站上了控制流與記憶體風(fēng)暴的中央。

在對(duì)話大模型時(shí)代,CPU一度退居幕后

在AI的上一程里,行業(yè)幾乎被一條邏輯完全主導(dǎo):算力決定上限,GPU就是算力的核心。無(wú)論是千億參數(shù)模型的訓(xùn)練,還是大模型的實(shí)時(shí)推理,核心計(jì)算都落在矩陣乘法之上——而這恰恰是GPU架構(gòu)設(shè)計(jì)的絕對(duì)主場(chǎng)。在這種范式下,CPU退居幕后,負(fù)責(zé)數(shù)據(jù)預(yù)處理、任務(wù)調(diào)度和結(jié)果后處理等“總指揮”式的工作,其性能高低似乎并不直接決定用戶體驗(yàn)。

但走到2026年,AI產(chǎn)業(yè)完成了一次關(guān)鍵范式切換。AI不再只是一“回答問(wèn)題的對(duì)話機(jī)器,它開(kāi)始真正走進(jìn)現(xiàn)實(shí)世界“執(zhí)行任務(wù)”。這個(gè)轉(zhuǎn)變帶來(lái)的不僅是能力的躍遷,更是一場(chǎng)算力需求的底層重構(gòu)。大模型訓(xùn)練曾是AI算力消耗的主體,而到了2025年下半年,AI推理的支出正式超過(guò)了訓(xùn)練,行業(yè)迎來(lái)所謂推理翻轉(zhuǎn)。當(dāng)重心從訓(xùn)練轉(zhuǎn)向推理和規(guī)?;涞兀懔Φ脑u(píng)判標(biāo)準(zhǔn)也隨之改變——不再是誰(shuí)的GPU更強(qiáng),而是整個(gè)系統(tǒng)能不能跑起來(lái)。

在對(duì)話模型時(shí)代,一個(gè)用戶請(qǐng)求的處理鏈路相對(duì)簡(jiǎn)單:CPU將文本轉(zhuǎn)換為token,GPU運(yùn)行模型生成響應(yīng),CPU再將token轉(zhuǎn)換回文本。在這個(gè)往返中,GPU的計(jì)算時(shí)間主導(dǎo)了總延遲,CPU幾乎不在性能的考量范圍內(nèi)。但當(dāng)工作負(fù)載變成智能體,情況就截然不同了。一個(gè)典型的Agent任務(wù)需要執(zhí)行多步推理、調(diào)用API、讀寫(xiě)數(shù)據(jù)庫(kù)、運(yùn)行代碼、解析文檔,然后將所有中間結(jié)果編排成最終輸出。

4月8日,知名半導(dǎo)體分析機(jī)構(gòu)SemiAnalysis首席分析師Dylan Patel在一次深度訪談中指出,由于AI工作負(fù)載的范式正在從簡(jiǎn)單的文本生成向復(fù)雜的“智能體(Agents)”和“強(qiáng)化學(xué)習(xí)(RL)”演進(jìn),CPU正面臨極其嚴(yán)重的產(chǎn)能短缺。

Agent的工作機(jī)制,助力CPU價(jià)值重估

為什么智能體對(duì)CPU的依賴如此之大?答案藏在Agent的工作機(jī)制里。

傳統(tǒng)對(duì)話模型的分支極少,一次推理就是一次推理。但智能體的行動(dòng)階段充滿了if/else判斷和系統(tǒng)調(diào)用。以Manus為代表的主流Agent架構(gòu),會(huì)為每個(gè)任務(wù)分配一個(gè)隔離的云端沙箱虛擬機(jī),任務(wù)之間可以并行但控制流完全不同——有的在瀏覽網(wǎng)頁(yè),有的在修改代碼,有的在部署環(huán)境。這類分支類任務(wù)如果放在GPU上執(zhí)行,控制流發(fā)散會(huì)直接導(dǎo)致算力利用率急劇下降。而分支預(yù)測(cè)和處理恰恰是CPU微架構(gòu)幾十年來(lái)持續(xù)優(yōu)化的核心能力。這正是東吳證券所說(shuō)的“執(zhí)行控制流CPU化”。

與此同時(shí),智能體的記憶體系也在發(fā)生遷移。在長(zhǎng)上下文場(chǎng)景下,大模型推理會(huì)產(chǎn)生巨大的KV Cache,其占用隨對(duì)話輪次和上下文長(zhǎng)度線性增長(zhǎng),很快就會(huì)耗盡GPU寶貴的HBM容量。業(yè)界普遍采用的解決方案是將KV Cache遷移到CPU內(nèi)存——通過(guò)KV Cache Offload技術(shù),搭配大容量DDR5/LPDDR5內(nèi)存和CXL擴(kuò)展,CPU成為兼顧吞吐、擴(kuò)展性和成本效率的KV Cache最優(yōu)容器。東吳證券將這種現(xiàn)象概括為“記憶體系去GPU化”,這意味著CPU的角色已經(jīng)從單純的調(diào)度中樞,擴(kuò)展為同時(shí)承載控制和部分存儲(chǔ)功能的核心資源池。

值得注意的是,智能體工作負(fù)載不僅在質(zhì)上挑戰(zhàn)CPU,在量上也形成了空前的壓力。與標(biāo)準(zhǔn)生成式AI相比,代理式AI部署的token消耗量增加了20到30倍。每一次用戶交互背后都包含著多步推理、工具調(diào)用和跨Agent協(xié)調(diào),這個(gè)過(guò)程的token消耗遠(yuǎn)遠(yuǎn)超過(guò)單次問(wèn)答。Gartner甚至預(yù)測(cè),到2027年將有40%的代理項(xiàng)目因基礎(chǔ)設(shè)施成本超支而被取消。高昂的成本不僅來(lái)自GPU推理,相當(dāng)一部分正來(lái)自CPU端的持續(xù)開(kāi)銷。

海外大廠開(kāi)始“堆核競(jìng)賽”,行業(yè)有望重回高增長(zhǎng)

就在這種CPU需求量激增但產(chǎn)能受限的臨界點(diǎn)上,行業(yè)巨頭的動(dòng)向往往最先泄露天機(jī)

2026年初,英偉達(dá)做了兩件看似偏離主業(yè)的事:一是掏出20億美元追加認(rèn)購(gòu)CoreWeave股票,并在其平臺(tái)上部署專為代理式推理設(shè)計(jì)的Vera CPU;二是在下一代Rubin架構(gòu)中大幅提升CPU核心數(shù),并開(kāi)放NVL72機(jī)柜對(duì)x86 CPU的支持。

與此同時(shí),傳統(tǒng)CPU廠商正在Agent的驅(qū)動(dòng)下集體向超多核架構(gòu)沖刺。AMD推出的Turin最高可達(dá)192核;英特爾的Sierra Forest采用純能效核設(shè)計(jì),核心數(shù)可達(dá)144甚至288核。超多核CPU以更高的并行度和更低的單位功耗,支撐大規(guī)模、長(zhǎng)期運(yùn)行的Agent執(zhí)行環(huán)境。隨著Agent商業(yè)化的推進(jìn),廠商必須持續(xù)壓低每次任務(wù)的執(zhí)行成本——在這個(gè)目標(biāo)下,核數(shù)越多,單位成本越低,CPU的堆核競(jìng)賽或許才剛剛開(kāi)始。

從投資視角來(lái)看,IDC 預(yù)計(jì) Agent 年執(zhí)行任務(wù)數(shù)將從 2025 年的 440 億次快速增加至 2030 年的 415 萬(wàn)億次,對(duì)應(yīng)年復(fù)合增長(zhǎng)率達(dá) 524%,Agentic AI 發(fā)展正驅(qū)動(dòng) CPU 迎來(lái)新一輪成長(zhǎng)機(jī)遇。

在A股相關(guān)公司方面,東吳證券研報(bào)指出 CPU:瀾起科技、海光信息、廣合科技、龍芯中科、中國(guó)長(zhǎng)城等。 數(shù)據(jù)庫(kù):星環(huán)科技(基于ARM 優(yōu)化,與NV-GPU-GraceCPU 適配)。

結(jié)語(yǔ):CPU有望重回“黃金時(shí)代”

從對(duì)話模型的GPU中心主義,到智能體時(shí)代的CPU價(jià)值回歸,算力版圖的位移折射出AI應(yīng)用形態(tài)的深刻進(jìn)化。當(dāng)推理支出超越訓(xùn)練,當(dāng)Agent的token消耗量數(shù)十倍于單次問(wèn)答,基礎(chǔ)設(shè)施的效率命題就不再只是誰(shuí)的GPU更強(qiáng),而是整個(gè)系統(tǒng)能否以可持續(xù)的成本跑起來(lái)。CPU憑借其在分支預(yù)測(cè)、內(nèi)存擴(kuò)展和并發(fā)控制上的架構(gòu)優(yōu)勢(shì),從單純的調(diào)度中樞躍升為承載控制邏輯與記憶體系的核心資源池。

海外大廠的堆核競(jìng)賽只是這場(chǎng)變局的外顯征兆。其共同指向一個(gè)清晰方向:面向大規(guī)模、長(zhǎng)周期運(yùn)行的代理式AI負(fù)載,超多核CPU正成為成本與能效的關(guān)鍵平衡點(diǎn)。可以預(yù)見(jiàn),隨著Agent商業(yè)化的深入,算力體系的評(píng)判標(biāo)準(zhǔn)將被部分改寫(xiě)——異構(gòu)計(jì)算的天平不再一味向GPU傾斜,CPU正以更加主動(dòng)的姿態(tài),參與定義下一代AI基礎(chǔ)設(shè)施的形態(tài)與邊界。

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司

            台中市| 敦煌市| 华宁县| 旬阳县| 普定县| 洪江市| 徐州市| 黔东| 康马县| 贵港市| 普陀区| 轮台县| 文昌市| 潜山县| 古浪县| 蒙阴县| 木里| 镇平县| 井陉县| 阳新县| 绥中县| 新津县| 本溪市| 英德市| 河北省| 来凤县| 新疆| 抚顺县| 嵩明县| 昌黎县| 通城县| 尖扎县| 松原市| 邵阳市| 民勤县| 呼伦贝尔市| 叶城县| 富阳市| 宜章县| 桑日县| 鸡泽县|