9999精品视频,一区二区色,91福利在线免费播放,人妻在线综合综合网,人妻丰满精品一区,九九九精品九九九精品,久久精品店,国产午夜久久,五月天人妻超碰

  • +1

HBM,挑戰(zhàn)加倍

2025-08-20 16:34
來源:澎湃新聞·澎湃號·湃客
聽全文
字號

高帶寬內(nèi)存(HBM)作為下一代動(dòng)態(tài)隨機(jī)存取存儲器(DRAM)技術(shù),其核心創(chuàng)新在于獨(dú)特的 3D 堆疊結(jié)構(gòu) —— 通過先進(jìn)封裝技術(shù)將多個(gè) DRAM 芯片(通常為 4 層、8 層甚至 12 層)垂直堆疊。這種結(jié)構(gòu)使 HBM 的帶寬(數(shù)據(jù)傳輸速率)遠(yuǎn)高于 GDDR 等傳統(tǒng)內(nèi)存解決方案。

憑借高帶寬、低延遲的特性,HBM 已成為 AI 大模型訓(xùn)練與推理的關(guān)鍵組件。在 AI 芯片中,它扮演著 “L4 緩存” 的角色,能夠顯著提升數(shù)據(jù)讀寫效率,有效緩解內(nèi)存帶寬瓶頸,進(jìn)而大幅增強(qiáng) AI 模型的運(yùn)算能力。

01

HBM市場,SK海力士獨(dú)領(lǐng)風(fēng)騷

依托 HBM 技術(shù)的領(lǐng)先優(yōu)勢,SK 海力士在行業(yè)中的地位持續(xù)攀升。市場數(shù)據(jù)顯示,自 2024 年第二季度起,美光與 SK 海力士的 DRAM 市場份額持續(xù)增長,三星則逐步下滑;而在 HBM 領(lǐng)域,原本與三星近乎平分秋色的格局被打破,截至今年第一季度,兩者份額差距已擴(kuò)大至兩倍以上。

更具標(biāo)志性的是,今年第二季度,SK 海力士以約 21.8 萬億韓元的 DRAM 及 NAND 銷售額,首次超越三星電子(約 21.2 萬億韓元),登頂全球存儲銷售額榜首。這一突破很大程度上得益于其 HBM 產(chǎn)品的強(qiáng)勢表現(xiàn) —— 作為英偉達(dá)的主要獨(dú)家供應(yīng)商,SK 海力士早期雖未在 HBM 市場脫穎而出,但隨著全球 AI 開發(fā)熱潮興起,其高性能、高效率的產(chǎn)品需求激增,增長顯著。

其中,第五代高帶寬內(nèi)存HBM3E是關(guān)鍵推手。該產(chǎn)品具備高帶寬、低功耗優(yōu)勢,廣泛應(yīng)用于AI服務(wù)器、GPU等高性能計(jì)算領(lǐng)域,2023至2024年間吸引了 AMD、英偉達(dá)、微軟、亞馬遜等科技巨頭競相采購,而SK海力士是全球唯一大規(guī)模生產(chǎn)HBM3E的廠商,其2025年的8層及12層HBM3E產(chǎn)能已全部售罄。

反觀三星電子,因向英偉達(dá)交付延遲錯(cuò)失良機(jī),尤其在AI市場應(yīng)用最廣的 HBM3E 領(lǐng)域,去年和今年均大幅落后于 SK 海力士,市場份額從去年第二季度的 41% 暴跌至今年第二季度的 17%,甚至有報(bào)道稱其未通過英偉達(dá)第三次 HBM3E 認(rèn)證。

對于未來,光大證券預(yù)計(jì) HBM 市場需求將持續(xù)增長,帶動(dòng)存儲產(chǎn)業(yè)鏈發(fā)展;花旗證券則預(yù)測,SK 海力士將繼續(xù)主導(dǎo) HBM 市場。顯然,SK海力士有望在 AI 時(shí)代成為 “存儲器恐龍”。

02

存儲廠商開發(fā)HBM替代方案

面對SK海力士的強(qiáng)勢表現(xiàn),行業(yè)內(nèi)其他廠商紛紛加速技術(shù)創(chuàng)新,探索HBM的替代方案。

三星重啟Z-NAND

三星電子在擱置七年后,決定重啟 Z-NAND 內(nèi)存技術(shù),并將其定位為滿足人工智能(AI)工作負(fù)載增長需求的高性能解決方案。這一消息于 2025 年美國未來內(nèi)存與存儲(FMS)論壇上正式公布,標(biāo)志著三星重新進(jìn)軍高端企業(yè)存儲領(lǐng)域。

三星內(nèi)存業(yè)務(wù)執(zhí)行副總裁 Hwaseok Oh 在活動(dòng)中表示,公司正全力重新開發(fā) Z-NAND,目標(biāo)是將其性能提升至傳統(tǒng) NAND 閃存的 15 倍,同時(shí)把功耗降低多達(dá) 80%。即將推出的新一代 Z-NAND 將搭載 GPU 發(fā)起的直接存儲訪問(GIDS)技術(shù),讓 GPU 可直接從存儲器獲取數(shù)據(jù),無需經(jīng)過 CPU 或 DRAM。該架構(gòu)旨在最大限度降低延遲,加速大型 AI 模型的訓(xùn)練與推理進(jìn)程。

Z-NAND 的復(fù)蘇,折射出行業(yè)正發(fā)生廣泛轉(zhuǎn)變 —— 快速擴(kuò)展的 AI 模型已逐漸超越傳統(tǒng)存儲基礎(chǔ)設(shè)施的承載能力。在當(dāng)前系統(tǒng)中,數(shù)據(jù)需從 SSD 經(jīng) CPU 傳至 DRAM,再送達(dá) GPU,這一過程形成嚴(yán)重瓶頸,既導(dǎo)致性能下降,又增加了能耗。而三星支持 GIDS 的架構(gòu),可消除這些瓶頸,允許 GPU 將大型數(shù)據(jù)集從存儲器直接加載到 VRAM 中。Oh 指出,這種直接集成能顯著縮短大型語言模型(LLM)及其他計(jì)算密集型 AI 應(yīng)用的訓(xùn)練周期。

事實(shí)上,三星早在 2018 年就首次推出 Z-NAND 技術(shù),并發(fā)布了面向企業(yè)級和高性能計(jì)算(HPC)應(yīng)用的 SZ985 Z-SSD。這款 800GB 固態(tài)硬盤基于 48 層 V-NAND 和超低延遲控制器,順序讀取速度高達(dá) 3200MB/s,隨機(jī)讀取性能達(dá) 750K IOPS、寫入速度達(dá) 170K IOPS,延遲均低于 20 微秒,性能較現(xiàn)有 SSD 高出五倍以上,讀取速度更是比傳統(tǒng) 3 位 V-NAND 快十倍以上。此外,SZ985 配備 1.5GB 節(jié)能 LPDDR4 DRAM,額定寫入容量高達(dá) 42PB(相當(dāng)于可存儲全高清電影 840 萬次),并憑借 200 萬小時(shí)的平均故障間隔時(shí)間(MTBF)保障可靠性。

X-HBM 架構(gòu)重磅登場

NEO Semiconductor 則重磅推出全球首款適用于 AI 芯片的超高帶寬內(nèi)存(X-HBM)架構(gòu)。該架構(gòu)基于其自研的 3D X-DRAM 技術(shù),成功突破傳統(tǒng) HBM 在帶寬與容量上的固有瓶頸,其發(fā)布或?qū)⒁I(lǐng)內(nèi)存產(chǎn)業(yè)邁入 AI 時(shí)代的 “超級內(nèi)存” 新階段。

相比之下,目前仍處于開發(fā)階段、預(yù)計(jì) 2030 年左右上市的 HBM5,僅支持 4K 位數(shù)據(jù)總線和每芯片 40Gbit 的容量;韓國科學(xué)技術(shù)院(KAIST)的最新研究預(yù)測,即便是預(yù)計(jì) 2040 年左右推出的 HBM8,也僅能實(shí)現(xiàn) 16K 位總線和每芯片 80Gbit 的容量。

而 X-HBM 卻憑借 32K 位總線和每芯片 512Gbit 的容量,可讓 AI 芯片設(shè)計(jì)人員直接繞過傳統(tǒng) HBM 技術(shù)需耗時(shí)十年才能逐步突破的性能瓶頸。據(jù)介紹,X-HBM 的帶寬達(dá)到現(xiàn)有內(nèi)存技術(shù)的 16 倍,密度為現(xiàn)有技術(shù)的 10 倍 —— 其 32Kbit 數(shù)據(jù)總線與單芯片最高 512Gbit 的存儲容量所帶來的卓越性能,能顯著打破傳統(tǒng) HBM 的局限性,精準(zhǔn)滿足生成式 AI 與高性能計(jì)算日益增長的需求。

Saimemory開發(fā)堆疊式DRAM

由軟銀、英特爾與東京大學(xué)聯(lián)合創(chuàng)立的 Saimemory,正研發(fā)全新堆疊式 DRAM 架構(gòu),目標(biāo)是成為 HBM 的直接替代方案,甚至實(shí)現(xiàn)性能超越。

這家新公司的技術(shù)路徑聚焦于 3D 堆疊架構(gòu)優(yōu)化:通過垂直堆疊多顆 DRAM 芯片,并改進(jìn)芯片間互連技術(shù)(例如采用英特爾的嵌入式多芯片互連橋接技術(shù) EMIB),在提升存儲容量的同時(shí)降低數(shù)據(jù)傳輸功耗。根據(jù)規(guī)劃,其目標(biāo)產(chǎn)品將實(shí)現(xiàn)容量較傳統(tǒng) DRAM 提升至少一倍,功耗較 HBM 降低 40%-50%,且成本顯著低于現(xiàn)有 HBM 方案。

這一技術(shù)路線與三星、NEO Semiconductor 等企業(yè)形成差異化 —— 后者聚焦容量提升,目標(biāo)實(shí)現(xiàn)單模塊 512GB 容量;而 Saimemory 更側(cè)重解決 AI 數(shù)據(jù)中心的電力消耗痛點(diǎn),契合當(dāng)前綠色計(jì)算的行業(yè)趨勢。

在技術(shù)合作層面,英特爾提供先進(jìn)封裝技術(shù)積累,東京大學(xué)等日本學(xué)術(shù)機(jī)構(gòu)貢獻(xiàn)存儲架構(gòu)專利,軟銀則以 30 億日元注資成為最大股東。初期 150 億日元研發(fā)資金將用于 2027 年前完成原型設(shè)計(jì)及量產(chǎn)評估,計(jì)劃 2030 年實(shí)現(xiàn)商業(yè)化落地。

閃迪聯(lián)手SK海力士推進(jìn)HBF高帶寬閃存

閃迪與 SK 海力士近日宣布簽署諒解備忘錄,雙方將聯(lián)合制定高帶寬閃存(High Bandwidth Flash,HBF)規(guī)范。這一合作源于閃迪今年 2 月首次提出的 HBF 概念 —— 一種專為 AI 領(lǐng)域設(shè)計(jì)的新型存儲架構(gòu),其核心是融合 3D NAND 閃存與高帶寬存儲器(HBM)的技術(shù)特性。按計(jì)劃,閃迪將于 2026 年下半年推出首批 HBF 內(nèi)存樣品,采用該技術(shù)的 AI 推理設(shè)備樣品則預(yù)計(jì)在 2027 年初上市。

作為基于 NAND 閃存的內(nèi)存技術(shù),HBF 創(chuàng)新性地采用類 HBM 封裝形式,相較成本高昂的傳統(tǒng) HBM,能顯著提升存儲容量并降低成本,同時(shí)具備數(shù)據(jù)斷電保留的非易失性優(yōu)勢。這一突破標(biāo)志著業(yè)界首次將閃存的存儲特性與類 DRAM 的高帶寬性能整合到單一堆棧中,有望重塑 AI 模型大規(guī)模數(shù)據(jù)訪問與處理的模式。

與完全依賴 DRAM 的傳統(tǒng) HBM 相比,HBF 通過用 NAND 閃存替代部分內(nèi)存堆棧,在適度犧牲原始延遲的前提下,可在成本與帶寬接近 DRAM 型 HBM 的基礎(chǔ)上,將容量提升至后者的 8-16 倍。此外,不同于需持續(xù)供電以保存數(shù)據(jù)的 DRAM,NAND 的非易失性讓 HBF 能以更低能耗實(shí)現(xiàn)持久存儲。

03

多維度架構(gòu)創(chuàng)新降低HBM依賴

除了在存儲技術(shù)上持續(xù)創(chuàng)新,廠商們也在積極探索 AI 領(lǐng)域的架構(gòu)革新,以期降低對 HBM 的依賴。

存算一體架構(gòu)

上世紀(jì) 40 年代,隨著現(xiàn)代史上第一臺計(jì)算機(jī)的誕生,基于 “存儲 - 計(jì)算分離” 原理的馮?諾依曼架構(gòu)應(yīng)運(yùn)而生,此后的芯片設(shè)計(jì)也基本沿用這一架構(gòu)。在近 70 年的現(xiàn)代芯片行業(yè)發(fā)展中,技術(shù)進(jìn)步多集中于軟件與硬件的優(yōu)化設(shè)計(jì),計(jì)算機(jī)的底層架構(gòu)始終未發(fā)生根本性改變。

存算一體(Processing-In-Memory, PIM 或 Compute-in-Memory, CIM)正是在這一背景下被提出的創(chuàng)新架構(gòu)。其核心理念是在存儲器本體或鄰近位置集成計(jì)算功能,從而規(guī)避傳統(tǒng)架構(gòu)中 “計(jì)算 — 存儲 — 數(shù)據(jù)搬運(yùn)” 的固有瓶頸。通過在存儲單元內(nèi)部直接部署運(yùn)算單元,物理上縮短數(shù)據(jù)傳輸距離,存算一體架構(gòu)能夠整合計(jì)算與存儲單元,優(yōu)化數(shù)據(jù)傳輸路徑,突破傳統(tǒng)芯片的算力天花板。這不僅能縮短系統(tǒng)響應(yīng)時(shí)間,更能使能效比實(shí)現(xiàn)數(shù)量級提升。一旦技術(shù)成熟,有望將對高帶寬內(nèi)存的依賴度降低一個(gè)數(shù)量級,部分替代 HBM 的功能。

華為的 AI 突破性技術(shù)成果

華為近期發(fā)布的 UCM(推理記憶數(shù)據(jù)管理器),是一款以 KV Cache(鍵值緩存)為核心的推理加速套件。它融合了多種緩存加速算法工具,可對推理過程中產(chǎn)生的 KV Cache 記憶數(shù)據(jù)進(jìn)行分級管理,有效擴(kuò)大推理上下文窗口,從而實(shí)現(xiàn)高吞吐、低時(shí)延的推理體驗(yàn),降低每個(gè) Token(詞元)的推理成本。通過這一創(chuàng)新架構(gòu)設(shè)計(jì),UCM 能夠減少對高帶寬內(nèi)存(HBM)的依賴,同時(shí)顯著提升國產(chǎn)大模型的推理性能。

04

未來將是多層級架構(gòu)的時(shí)代

無論是訓(xùn)練還是推理場景,算力與存儲都是率先受益的領(lǐng)域,二者將成為決定未來十年AI競爭格局的關(guān)鍵因素。

與 GPGPU 產(chǎn)品類似,HBM(尤其是 HBM3 及以上規(guī)格)需求旺盛,且長期被國外廠商壟斷。2025 年初,HBM3 芯片現(xiàn)貨價(jià)格較 2024 年初暴漲 300%,而單臺 AI 服務(wù)器的 DRAM 用量更是達(dá)到傳統(tǒng)服務(wù)器的 8 倍。從市場格局看,海外廠商仍占據(jù)主導(dǎo)地位:SK 海力士以 53% 的份額領(lǐng)先,且率先實(shí)現(xiàn) HBM3E 量產(chǎn);三星電子占比 38%,計(jì)劃 2025 年將 HBM 供應(yīng)量提升至去年的兩倍;美光科技目前份額為 10%,目標(biāo)是 2025 年將市占率提升至 20% 以上。

盡管 HBM 憑借卓越性能在高端 AI 應(yīng)用領(lǐng)域站穩(wěn)腳跟,但隨著其他內(nèi)存技術(shù)在成本控制、性能提升及功耗優(yōu)化等方面的持續(xù)突破,其未來或?qū)⒚媾R新興技術(shù)的競爭壓力。不過從短期來看,HBM 仍是高帶寬需求場景的首選方案。

從長期發(fā)展趨勢看,市場將隨技術(shù)演進(jìn)與應(yīng)用需求變化不斷調(diào)整優(yōu)化。未來 AI 內(nèi)存市場并非簡單的 “替代與被替代” 關(guān)系,HBM 替代方案的創(chuàng)新呈現(xiàn)出 “架構(gòu)哲學(xué)的多樣性”,而非單一技術(shù)迭代??梢灶A(yù)見,AI 計(jì)算與內(nèi)存領(lǐng)域不會出現(xiàn)全面取代 HBM 的 “唯一贏家”,取而代之的將是更復(fù)雜、分散化且貼合具體場景的內(nèi)存層級結(jié)構(gòu) —— 單一內(nèi)存解決方案主導(dǎo)高性能計(jì)算的時(shí)代正在落幕。

未來的 AI 內(nèi)存版圖將是異構(gòu)多元的層級體系:HBM 聚焦訓(xùn)練場景,PIM 內(nèi)存服務(wù)于高能效推理,專用片上內(nèi)存架構(gòu)適配超低延遲應(yīng)用,新型堆疊 DRAM 與光子互連等技術(shù)也將在系統(tǒng)中占據(jù)一席之地。各類技術(shù)針對特定工作負(fù)載實(shí)現(xiàn)精準(zhǔn)優(yōu)化,共同構(gòu)成 AI 時(shí)代的內(nèi)存生態(tài)。

    本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司

            将乐县| 顺昌县| 永康市| 高青县| 河池市| 和平县| 望城县| 芦溪县| 望江县| 霞浦县| 衡水市| 观塘区| 洛扎县| 衡阳市| 松阳县| 卢龙县| 都匀市| 栖霞市| 灵石县| 堆龙德庆县| 高碑店市| 阿拉善盟| 白银市| 石棉县| 宝应县| 定兴县| 奉节县| 白山市| 鲁甸县| 来安县| 梁平县| 望奎县| 龙门县| 芷江| 上杭县| 洛川县| 北安市| 涟源市| 桃园市| 建湖县| 方城县|