9999精品视频,一区二区色,91福利在线免费播放,人妻在线综合综合网,人妻丰满精品一区,九九九精品九九九精品,久久精品店,国产午夜久久,五月天人妻超碰

  • +1

豆包深入手機,千問押注眼鏡,誰能爭奪Agent的“開機鍵”?

2026-04-22 13:55
來源:澎湃新聞·澎湃號·湃客
聽全文
字號

“工具在使用者手中時才成為工具?!焙5赂駹柕倪@段話,今天用來理解AI硬件同樣貼切。

問題在于,大模型這只“手”伸出來的時候,用戶究竟愿意把它握在掌心里(手機),還是架在鼻梁上(眼鏡),亦或是讓它一直貼耳傾聽(耳機)?

據(jù)《Z Finance》獨家報道,字節(jié)跳動內(nèi)部決定暫停豆包AI眼鏡項目。想要理解這場選擇,需要先回答一個更基礎(chǔ)的問題:大模型公司為什么要做硬件?

據(jù)《晚點LatePost》的報道,火山引擎豆包大模型日均調(diào)用量已超過120萬億Token,半年增長4倍。國家數(shù)據(jù)局的數(shù)據(jù)顯示,中國日均Token消耗量在一年半內(nèi)增長約300倍。黃仁勛在GTC 2026的舞臺上說,Token將是未來數(shù)字世界最核心的大宗商品。

但Token消耗的暴漲,反而掩蓋了一個更根本的問題,即這些Token從哪里被觸發(fā),通過什么界面進(jìn)入用戶的生活?

過去兩年,這個問題的答案是手機屏幕和對話框。OpenClaw的爆火將Agent從開發(fā)者工具推向大眾用戶,直接推高了對“隨時隨地觸發(fā)AI執(zhí)行”這一能力的需求密度。當(dāng)大模型的競爭從生成式問答轉(zhuǎn)向執(zhí)行任務(wù),執(zhí)行鏈路就需要一個更靠近用戶身體的物理錨點。

豆包選擇的落點是操作系統(tǒng),以“操作系統(tǒng)級合作”模式切入AI手機賽道,通過與手機廠商在系統(tǒng)層面合作,獲得識別屏幕UI元素、模擬人工操作的核心權(quán)限;千問選擇的是眼鏡,千問AI眼鏡上線首批“AI辦事”能力后,支持話費充值、掃碼騎車、停車?yán)U費、語音點外賣。這些功能的共同特征是,AI開始在真實世界里把事情做完。

兩條路徑的本質(zhì),是兩家公司對同一個問題給出的不同工程答案:究竟改

由誰來做Agent執(zhí)行鏈路的物理接口。

兩種優(yōu)勢的兩種延伸

大模型公司做硬件,實際上是在回答一個從Token經(jīng)濟(jì)學(xué)中衍生出來的問題。

過去兩年的AI競爭,核心戰(zhàn)場在模型能力和價格。價格戰(zhàn)把Token單價從三年前的高點壓低了約300倍。但單價的崩塌沒有讓AI支出變得可預(yù)測,原因很簡單:Agent類應(yīng)用讓單次任務(wù)的Token消耗從普通對話的幾十倍起跳。據(jù)騰訊科技報道,亞太區(qū)電商技術(shù)公司Branch8的6人團(tuán)隊,啟用Claude Code第一個月花了2400美元,經(jīng)過八周密集優(yōu)化才勉強降到680美元。Token支出管理本身已經(jīng)變成了一項需要專門技能的工作。

這個成本結(jié)構(gòu),在源頭上改寫了很多AI產(chǎn)品的競爭邏輯。誰掌握了Agent的觸發(fā)入口,誰就掌握了Token消耗的源頭。而觸發(fā)入口的密度,取決于設(shè)備離用戶有多近、啟動摩擦力有多低。這是豆包和千問同時轉(zhuǎn)向硬件的真實驅(qū)動力:在Token消耗鏈路的最前端建立一個物理節(jié)點。

千問AI眼鏡的團(tuán)隊跟蹤了一個指標(biāo)——用戶交互輪次,即AI幫助用戶完成事項的頻率??淇搜坨RS1上線后,用戶交互數(shù)對比第三方手機AI助手應(yīng)用提升了約6倍。戴在臉上的AI之所以被調(diào)用得更頻繁,原因在于感知始終在線、啟動摩擦力趨近于零。

對于Agent而言,這種持續(xù)在場的交互密度,意味著更豐富的上下文積累,也意味著更多執(zhí)行任務(wù)的觸發(fā)機會。

2026年4月,千問AI眼鏡首次OTA升級后上線了“AI辦事”能力,通過接入淘寶閃購、支付寶,支持話費充值、掃碼騎車、停車?yán)U費、語音點外賣。產(chǎn)品定義由此發(fā)生轉(zhuǎn)移:AI從回答問題,變成了把事情辦完。

豆包確定的路徑同樣深入,只是方向不同。去年12月,豆包AI手機助手以“操作系統(tǒng)級合作”模式進(jìn)入AI手機賽道,通過與手機廠商在系統(tǒng)層面合作,獲得識別屏幕UI元素、模擬人工操作的核心權(quán)限。

實測顯示,“比價肯德基套餐并下單發(fā)送截圖”這一涉及三個應(yīng)用、十二步手動操作的任務(wù),豆包可在后臺自動完成,僅支付環(huán)節(jié)需人工介入,全程耗時較人工操作縮短72%。

目前,Agent在大眾用戶中真正形成使用習(xí)慣還需要一段時間。豆包和千問現(xiàn)在的硬件投入,是在為一個尚未到來的需求峰值提前卡位。這是典型的平臺邏輯:先占住感知節(jié)點,等Agent成熟之后,數(shù)據(jù)流和調(diào)用量自然會從這個節(jié)點涌入。

但平臺邏輯有一個前提,設(shè)備必須在需求到來之前就已經(jīng)在用戶身上。這也解釋了為什么千問要在眼鏡之外再布局指環(huán)和耳機,畢竟單一形態(tài)覆蓋不了全天候的感知需求,矩陣才能。

豆包與千問的硬件路徑,都是從自身核心優(yōu)勢出發(fā)延伸的結(jié)果,只是各自優(yōu)勢所對應(yīng)的最優(yōu)形態(tài)不同。

豆包AI眼鏡的項目暫停,內(nèi)部給出的核心判斷也很合理,大框、拍攝、語音、翻譯,主流范式已被Ray-Ban Meta統(tǒng)一。2025年,Meta智能眼鏡全年銷量超過700萬副,全球市場份額達(dá)85.2%。在這個格局下,“能不能做”早已不是問題。

千問的選擇,出發(fā)點同樣清晰。阿里的應(yīng)用生態(tài)中,話費充值、外賣點單、停車?yán)U費,這些淘寶、支付寶的既有能力可以直接接入Agent執(zhí)行鏈路,通過眼鏡重新封裝成AI原生交互形態(tài)。對于沒有這套生態(tài)底座的公司,眼鏡只是一個戴在臉上的語音助手;對阿里來說,眼鏡是打通已有應(yīng)用、建立新型觸點的現(xiàn)實節(jié)點。

豆包深入手機操作系統(tǒng),是在自己的流量分發(fā)能力地帶建立Agent入口。千問押注可穿戴設(shè)備矩陣,是在把阿里的應(yīng)用生態(tài)重新封裝成AI原生交互形態(tài)。

把時間線拉長來看,今天產(chǎn)品發(fā)得多驚艷、銷量跑得多猛,其實都決定不了終局。兩年后,當(dāng)Agent像網(wǎng)絡(luò)一樣融進(jìn)工作流,唯一的護(hù)城河只有一條:用戶習(xí)慣了從哪個入口觸發(fā)它。

端側(cè)推理如何改變成本結(jié)構(gòu)

硬件入口的競爭,最終會回到一個更基礎(chǔ)的問題上:Token從哪里來,到哪里去,誰來付賬。

Token的價格是透明的,但Token里裝了多少“智力”,用戶無從得知。4月,AMD AI戰(zhàn)略總監(jiān)Stella Laurenzo基于6852個Claude Code會話的分析顯示,從今年2月下旬開始,Claude Opus 4.6的推理深度大幅下降,騰訊科技也報道,“每次代碼編輯前的文件閱讀次數(shù)”從6.6驟降至2.0,降幅約70%。

這些改變沒有在任何顯著位置通知用戶,大量開發(fā)者是在代碼質(zhì)量明顯下降之后才開始懷疑“模型是不是變笨了”。

更隱蔽的是緩存命中率對實際成本的影響。一位開發(fā)者對Claude Code一周數(shù)據(jù)的追蹤顯示,正常情況下91%的Token來自緩存命中,緩存命中價格只有標(biāo)準(zhǔn)輸入價格的十分之一。如果緩存全部失效,Input成本會暴漲到原來的5.7倍。

這個成本結(jié)構(gòu),是端側(cè)模型價值主張的核心依據(jù)之一。端側(cè)推理一次性部署后,邊際成本趨近于零,沒有緩存命中率的不確定性,也沒有云端峰值定價的波動。對于頻繁觸發(fā)Agent任務(wù)的硬件設(shè)備,這個優(yōu)勢會隨使用密度的增加而持續(xù)放大。

谷歌DeepMind 4月發(fā)布的Gemma 4,重新劃定了端側(cè)模型的能力邊界。其E2B和E4B模型推理時激活的有效參數(shù)量分別僅為20億和40億,在LiteRT-LM框架下,可在3秒內(nèi)處理跨越兩個獨立技能的4000個輸入Token;E2B與E4B原生支持函數(shù)調(diào)用,覆蓋Agent工作流所需的核心推理路徑。上下文窗口達(dá)128K Token,在不足1.5GB的內(nèi)存占用下可以完成運行。

這意味著一個可以調(diào)用外部工具、執(zhí)行多步驟規(guī)劃的端側(cè)Agent,其硬件門檻已降至現(xiàn)代中端手機的內(nèi)存余量之內(nèi)。

千問目前采用的云端大模型加本地輕量智能體的混合架構(gòu),是在當(dāng)前端側(cè)算力約束下的一個不錯的解。據(jù)36氪報道,千問在2026年規(guī)劃的硬件形態(tài)除AI眼鏡還包括AI指環(huán)、AI耳機,三種形態(tài)覆蓋視覺交互、無感佩戴和音頻交互三個不同維度,形成全天候的感知矩陣。

這個矩陣的核心價值在于眼鏡捕獲第一視角的行為數(shù)據(jù)流,這些數(shù)據(jù)反哺千問大模型迭代,模型能力提升后又優(yōu)化硬件體驗,形成閉環(huán)。

但Gemma 4這類模型的出現(xiàn),正在縮短這個“當(dāng)前”的有效期。當(dāng)端側(cè)模型可以在本地獨立完成越來越多的Agent任務(wù),云端兜底的必要性在高頻輕量場景中會持續(xù)下降,Token的消耗路徑也會隨之改變。

這會對當(dāng)前AI硬件的主流云端模式,其一,端側(cè)能力的提升會降低硬件設(shè)備對云端的依賴,讓設(shè)備端AI從成本結(jié)構(gòu)上更具競爭力;其二,當(dāng)用戶的Agent任務(wù)越來越多地在本地完成,依賴數(shù)據(jù)回流云端來驅(qū)動模型迭代的商業(yè)閉環(huán),也需要重新設(shè)計數(shù)據(jù)獲取路徑。

有多少增量留在云端、有多少轉(zhuǎn)移至本地,將成為整個MaaS商業(yè)模式需要提前應(yīng)對的結(jié)構(gòu)性問題。

寫在最后

當(dāng)Token消耗從對話層遷移到執(zhí)行層,Agent開始代替人操作應(yīng)用,這些任務(wù)是在云端計費還是在端側(cè)本地完成?這個問題的答案,會決定Token的消耗結(jié)構(gòu),進(jìn)而影響MaaS業(yè)務(wù)的收入模型。

火山引擎超百億元的MaaS業(yè)務(wù)收入目標(biāo)已隨著Seed 2.0、Seedance 2.0等模型發(fā)布、OpenClaw爆火上調(diào)被提高。阿里成立了ATH事業(yè)群,兩家公司在云端的Token戰(zhàn)爭和在硬件端的入口爭奪,是同一場競爭的兩個戰(zhàn)場。誰能在硬件側(cè)建立足夠高頻的Agent使用習(xí)慣,誰就在云端MaaS的下一輪增長中占據(jù)了需求端的主動權(quán)。

2026年的AI硬件競爭,表面上看是眼鏡和手機的形態(tài)之爭,實質(zhì)上是對Agent時代Token消耗入口的提前卡位。這場競爭沒有快速的結(jié)論,因為Agent在大眾用戶中的真實使用習(xí)慣還在形成,端側(cè)模型的能力邊界還在被Gemma 4這類模型持續(xù)推進(jìn),云端Token的成本結(jié)構(gòu)還在被緩存命中率、推理深度和定價策略悄悄改變。

《新立場》認(rèn)為,決定勝負(fù)的是誰擁有足夠密度和足夠高頻的應(yīng)用場景,能讓Agent在真實使用中持續(xù)積累上下文、優(yōu)化執(zhí)行能力,形成對用戶的理解深度。

這個變量,更多由生態(tài)底座決定。千問和豆包的硬件分歧,是兩個不同生態(tài)底座在同一個技術(shù)拐點上做出的不同押注,各自都在最擅長的地方尋找答案。

*題圖及文中配圖來源于網(wǎng)絡(luò)。

    本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司

            宁夏| 玛沁县| 鹤峰县| 麻江县| 榕江县| 错那县| 邛崃市| 微山县| 东乌珠穆沁旗| 揭西县| 来宾市| 浠水县| 嘉荫县| 富蕴县| 耒阳市| 大城县| 镇远县| 漳浦县| 皋兰县| 济阳县| 鄯善县| 恩施市| 迁安市| 花垣县| 法库县| 凭祥市| 鲜城| 武鸣县| 时尚| 龙南县| 沾益县| 惠安县| 贵定县| 昌黎县| 漳平市| 乡城县| 彩票| 金溪县| 都匀市| 安平县| 桐乡市|