9999精品视频,一区二区色,91福利在线免费播放,人妻在线综合综合网,人妻丰满精品一区,九九九精品九九九精品,久久精品店,国产午夜久久,五月天人妻超碰

  • +1

邊緣AI“下沉”,TI將AI推理能力“裝進”MCU

2026-03-25 12:17
來源:澎湃新聞·澎湃號·湃客
聽全文
字號

作者:毛爍

傳統(tǒng)基礎控制器邁向“高效智能賦能器”,正在成為嵌入式工程師必須正面應對的一道核心技術(shù)門檻。如何在極其有限的功耗與成本制約下,引入可用的AI推理能力,是工程師需要在算力、能效與實時性之間尋找的新的平衡點。

近日,德州儀器(TI)宣布推出兩類具備邊緣AI能力的新型 MCU,包括通用型 MSPM0G5187以及面向?qū)崟r電機控制的AM13Ex 系列。有關(guān)器件集成了TI自有的 TinyEngine神經(jīng)處理單元(NPU),可在主CPU之外并行執(zhí)行神經(jīng)網(wǎng)絡推理任務,從而降低邊緣側(cè) AI 推理時延并提升能效。

01  CPU+NPU“雙路并行” 打破MCU“不可能三角”

其實,將AI算力下沉至邊緣側(cè),本身就具備四個幾乎不可替代的優(yōu)勢——毫秒級、無網(wǎng)絡依賴的實時響應;顯著降低數(shù)據(jù)傳輸帶來的功耗與帶寬成本;數(shù)據(jù)始終留在本地所帶來的隱私與安全性;以及在斷網(wǎng)場景下依然可用的系統(tǒng)可靠性。

 

但真正落地到邊緣系統(tǒng)時,工程師很快會發(fā)現(xiàn),底層硬件架構(gòu)本身已經(jīng)成為天花板。

首先,是算力、功耗與存儲之間的“不可能三角”。一般來說,MCU大多通過內(nèi)置CPU來執(zhí)行標量指令,而機器學習的本質(zhì)卻是大規(guī)模乘加(MAC)的張量計算。用通用CPU去“硬算”神經(jīng)網(wǎng)絡,計算效率低下,而且會迅速吞噬本就有限的Flash空間。

更關(guān)鍵的是功耗問題——推理時間被拉長,意味著系統(tǒng)需要長時間運行在高頻狀態(tài),功耗會進一步升高。這對于依賴電池供電的邊緣節(jié)點而言,是不能接受的。

第二個痛點,則出現(xiàn)在實時控制系統(tǒng)的內(nèi)部——調(diào)度沖突與系統(tǒng)抖動。在工業(yè)自動化、白電場景中,電機控制是絕對核心,系統(tǒng)需要嚴格的確定性。所以,控制環(huán)路必須在微秒級時間窗口內(nèi)完成采樣、計算與輸出。

而一旦引入自適應控制、振動檢測等AI能力,系統(tǒng)復雜度就會迅速上升。在傳統(tǒng)MCU架構(gòu)下,單一CPU需要同時處理實時控制中斷與AI推理,兩類負載在同一執(zhí)行路徑上直接沖突。結(jié)果就是調(diào)度失衡、控制節(jié)拍被打斷,控制環(huán)路產(chǎn)生抖動,系統(tǒng)確定性被破壞,嚴重時甚至導致電機失步或失控。

面對這些痛點,單純提高CPU的主頻并不能完全解決問題。所以,TI給出的技術(shù)解法是底層架構(gòu)的異構(gòu)化創(chuàng)新——引入TinyEngine神經(jīng)處理單元(NPU)。TinyEngine NPU是專為深度學習推理運算而設計的硬件加速IP,目前已被深度集成到TI的MSPM0G5187 MCU中。

從技術(shù)指標來看,該NPU可提供高達2.56 GOPS(每秒千兆次操作)的計算性能,并且支持8位、4位、2位以及混合精度配置。這種多精度支持能夠在硬件層面上直接完成本地的量化計算,極大地壓縮了神經(jīng)網(wǎng)絡對靜態(tài)存儲器(SRAM)和閃存空間的占用。

同時,該加速器在設計上支持通用卷積、深度卷積、逐點卷積、轉(zhuǎn)置卷積,以及全連接、池化和批歸一化(Batch Normalization)等常見算子,可更好適配端側(cè)模型部署需求,并兼顧推理效率與精度。

值得注意的是,這項異構(gòu)架構(gòu)最核心的優(yōu)勢在于“雙路并行處理”。TinyEngine NPU被設計為可與運行應用程序代碼的主CPU并行工作。

這代表著,CPU負責實時控制與系統(tǒng)任務,NPU獨立處理AI推理,兩類負載徹底解耦。實測數(shù)據(jù)顯示,與未配置加速器的同類純CPU架構(gòu)MCU相比,集成了TinyEngine NPU的MCU在進行單次AI推理時,延遲最高可降低90倍,而單次推理的能耗更是可降低120倍以上。

這種異構(gòu)的策略,為邊緣AI的大規(guī)模下沉,掃清了硬件障礙。

02  從低功耗感知到實時控制,邊緣AI MCU“雙路徑”落地

明確了TinyEngineNPU的底層邏輯后,就可以更清晰地看到TI如何基于該能力沉淀成一套可復用、可規(guī)模化落地的技術(shù)體系。

在硬件落地層面,TI圍繞TinyEngine NPU 形成了兩條邊緣 AI MCU路徑:一條面向低功耗感知,代表器件是基于 Arm Cortex-M0+的 MSPM0G5187;另一條面向?qū)崟r電機控制,代表產(chǎn)品是基于 Arm Cortex-M33的AM13Ex系列。

針對功耗和成本這兩個長期卡住邊緣AI落地的問題,基于Arm Cortex-M0+內(nèi)核的MSPM0G5187,直接把NPU(神經(jīng)網(wǎng)絡加速單元,專門用于運行AI模型的小型計算單元)集成進MCU。這意味著,神經(jīng)網(wǎng)絡推理能力可以進入最基礎的控制器層,使極低成本的設備也能直接部署AI功能。

芯片規(guī)格方面,MSPM0G5187主頻為80MHz,集成128KB Flash、32KB SRAM,并提供USB 2.0全速接口和I2S。

功耗控制層面,待機電流低于1.5μA。實際效果上有利于支持常開型感知場景下的低功耗運行。

在語音這類常開感知場景中,TinyEngine NPU直接承擔輕量神經(jīng)網(wǎng)絡的推理任務。典型鏈路是:麥克風采集聲音,經(jīng)模擬前端(AFE,負責放大和濾波)處理后轉(zhuǎn)換為數(shù)字信號,通過音頻接口送入MCU,再由NPU完成識別。

具體來說,以喚醒詞檢測為例,常用的是1D CNN(一維卷積神經(jīng)網(wǎng)絡,適合處理音頻這種時間序列數(shù)據(jù)),用于做特征提取和匹配判斷。在這類任務中,引入NPU后,推理延遲可以降低到原來的一個數(shù)量級以內(nèi),單次推理的能耗也同步大幅下降。結(jié)果是設備可以長期保持“常開監(jiān)聽”,同時把整體功耗控制在電池可接受范圍內(nèi)。

信號進入MCU后,TinyEngine NPU即可運行1D CNN(一維卷積神經(jīng)網(wǎng)絡,適合處理音頻這種時間序列數(shù)據(jù)),完成特征提取和匹配判斷。與未集成加速器的同類 MCU 相比,TinyEngine NPU可將推理時延最高降低90倍,并將單次推理能耗降低了120倍以上。

如果說MSPM0G5187對應的是低功耗感知路徑,那么AM13Ex系列面向的則是實時電機控制場景。

這類系統(tǒng)的應用場景包括工廠自動化、人形機器人、高端家電,其核心要求是“控制周期固定、響應可預測”。控制一旦抖動,系統(tǒng)就會不穩(wěn)定。

然而,AM13Ex內(nèi)部做了任務分離,采用Arm Cortex-M33 內(nèi)核,其主要產(chǎn)品AM13E23019的主頻為200MHz,CoreMark為800。

在控制任務穩(wěn)定跑起來之后,系統(tǒng)的計算壓力就集中在電機控制本身。尤其是 Park/逆Park 變換、三角函數(shù)計算、SVPWM 調(diào)制以及觀測器相關(guān)處理。

AM13Ex把這部分直接做成了硬件加速單元。三角函數(shù)由專用電路完成,不再占用CPU時間。相比傳統(tǒng)用CORDIC算法逐步計算,速度可以提升一個數(shù)量級,控制周期可以壓得更短。

外圍資源也圍繞多電機控制展開。芯片提供最多30路PWM用于電機驅(qū)動,同時配有高速ADC實時采樣電流和電壓信號。一顆芯片就可以完成多電機閉環(huán)控制,比如同時管理PFC電機和主驅(qū)動電機,也可以擴展到四電機系統(tǒng)。

在這個基礎上,芯片內(nèi)部的任務劃分是固定的。Arm Cortex-M33負責按周期執(zhí)行控制任務,包括PWM刷新和PID計算;TinyEngine NPU在另一條路徑上持續(xù)處理電流、振動等數(shù)據(jù),運行神經(jīng)網(wǎng)絡模型。

兩部分在硬件分開,互不影響,控制周期也就不會被打斷。

這種結(jié)構(gòu)可以直接下沉到設備末端使用。在人形機器人中,每個關(guān)節(jié)都可以部署一顆AM13Ex,傳感數(shù)據(jù)在本地完成處理,控制參數(shù)在本地調(diào)整,只把必要的信息上傳。這樣可以減少通信延遲,同時降低中央系統(tǒng)的算力壓力。

同樣的方式也適用于光伏系統(tǒng)。端側(cè)NPU可以持續(xù)分析電流的高頻特征,用于電弧檢測。傳統(tǒng)方法在復雜工況下準確率大約在85%左右,引入AI后可以超過99%,并且能夠更早發(fā)現(xiàn)異常。

03 AI接管MCU開發(fā),TI補齊工具鏈

當算力、控制路徑都在芯片內(nèi)部被固定下來之后,開發(fā)問題就集中在模型如何高效落到設備側(cè),以及工程團隊能不能快速用起來。

圍繞這一點,TI提供了完整的開發(fā)生態(tài)系統(tǒng)以及工具——CCStudio Edge AI Studio,覆蓋模型訓練對接、量化、編譯和部署的全流程。模型從訓練完成到運行在設備側(cè),不需要拆分流程、更換工具。

CCStudio Edge AI Studio直接兼容主流框架,包括PyTorch、TensorFlow和ONNX。常規(guī)流程是在PC或云端完成模型訓練,然后通過工具鏈完成量化(將浮點模型轉(zhuǎn)換為整數(shù)模型,降低計算量和存儲占用),再由神經(jīng)網(wǎng)絡編譯器轉(zhuǎn)換為適配NPU的執(zhí)行格式,最后部署到設備側(cè)。整個過程是連續(xù)的,不需要手動修改模型結(jié)構(gòu)、重寫推理代碼。

針對沒有數(shù)據(jù)科學背景的團隊,工具鏈內(nèi)置了大量可直接使用的模型和Demo。目前提供超過60種已經(jīng)過底層優(yōu)化的預訓練模型(如電弧故障檢測、電機軸承故障診斷),并配套超過1000種數(shù)據(jù)預處理組合。工程師只需導入自己的數(shù)據(jù)進行微調(diào)(Fine-tuning,即在已有模型基礎上繼續(xù)訓練以適配新數(shù)據(jù)),通常幾天內(nèi)就可以完成端側(cè)模型落地。

在開發(fā)環(huán)節(jié),CCStudio更是引入了生成式AI能力(通過Cloud Code接口),主要解決底層代碼編寫效率的問題。

其實,在嵌入式開發(fā)中,大量時間消耗在寄存器、時鐘樹和外設配置上,這些內(nèi)容通常需要對照數(shù)據(jù)手冊逐項完成,過程繁瑣且容易出錯。接入該能力后,這一部分工作可以直接用自然語言完成。工程師只需描述需求,例如生成無傳感器電機控制的初始化代碼并配置ADC觸發(fā),系統(tǒng)會自動生成對應的C語言代碼。

生成結(jié)果上,也包含完整的底層配置和基礎應用框架,代碼可以直接運行并部署到MCU側(cè)。開發(fā)過程從“手動搭建底層代碼”,轉(zhuǎn)為“在生成代碼基礎上調(diào)整功能邏輯”,底層調(diào)試工作明顯減少。

04 寫在最后

技術(shù)的價值最終需要通過商業(yè)化落地來檢驗。

目前,TI也明確了其AI MCU產(chǎn)品矩陣的量產(chǎn)與供貨節(jié)點,為客戶的供應鏈規(guī)劃提供了堅實保障。

MSPM0G5187(超低功耗通用型MCU)已于2026年3月正式發(fā)布,目前其量產(chǎn)版本現(xiàn)已上線供貨。

AM13E23019 同樣于 2026年3月正式發(fā)布,目前已提供預量產(chǎn)版本供工程師進行早期開發(fā)與驗證。該系列的其他封裝和存儲器型號,計劃將于2026年底前 陸續(xù)發(fā)布并全面推向市場。

TMS320F28P550SJ(C2000系列實時MCU)作為TI AI矩陣的先行者,這款集成神經(jīng)網(wǎng)絡單元的DSP內(nèi)核MCU實際上已于2024年11月發(fā)布。目前它已在市場投入使用超過一年,在太陽能電弧檢測、電機軸承故障檢測等工業(yè)領域積累了大量成功的量產(chǎn)落地案例,充分驗證了TI“實時控制+NPU”架構(gòu)的可靠性。

    本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務許可證:31120170006

            增值電信業(yè)務經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司

            盱眙县| 怀安县| 若羌县| 图木舒克市| 开封县| 云霄县| 察哈| 正安县| 乳山市| 汪清县| 东宁县| 华亭县| 周口市| 紫云| 惠东县| 晋江市| 迭部县| 泉州市| 乃东县| 扬中市| 名山县| 敦化市| 萨迦县| 乌兰浩特市| 综艺| 西林县| 维西| 修水县| 祥云县| 吴桥县| 建瓯市| 阳东县| 久治县| 阿巴嘎旗| 河源市| 琼中| 来安县| 阳春市| 加查县| 唐海县| 林口县|