- +1
當(dāng)AI被解構(gòu)成糊弄型人格,它的可信度怎么重建?

普通用戶憑什么相信AI?
這兩天新學(xué)到一個(gè)梗詞——豆包型人格。網(wǎng)友給出的解釋是:啥事都瞎糊弄,被發(fā)現(xiàn)就嬉皮笑臉道歉。還有人模仿它的交互風(fēng)格,與家人逗樂。

豆包型人格·抖音截圖
剛看到這個(gè)梗時(shí),你可能會(huì)覺得無厘頭。若對(duì)照豆包、DeepSeek、元寶等AI應(yīng)用的內(nèi)容生成邏輯、聊天對(duì)話模式,就會(huì)和我一樣驚呼:簡(jiǎn)直太貼切了。
因?yàn)?,?dāng)下很多人對(duì)這類AI應(yīng)用的直觀感受就是:遇事糊弄、秒速認(rèn)錯(cuò)、未必改正。我一個(gè)朋友的點(diǎn)評(píng)更為通俗,“豆包”們很會(huì)拍彩虹屁,還會(huì)裝糊涂,情緒價(jià)值拉滿,就是不太靠譜。
其體現(xiàn)在產(chǎn)品邏輯上,豆包、DeepSeek等AI工具采用產(chǎn)品化的社交防御機(jī)制,試圖通過賣萌、擬人化的認(rèn)錯(cuò),來掩蓋對(duì)話內(nèi)容的不確定性乃至根本性錯(cuò)誤。
AI搜索面臨信任危機(jī)
這種將AI應(yīng)用抽象成某種“人格”的解構(gòu),實(shí)際也是普通用戶對(duì)AI搜索,或者說ChatBot式產(chǎn)品投下的不信任票。
它們主打“一步到位,直接給答案”,看似在顛覆傳統(tǒng)搜索,卻藏著先天缺陷:
一是答案來源不透明。大模型本身無法分別是官方信息、營(yíng)銷軟文,還是編造的虛假信息。專業(yè)人士需要花費(fèi)精力甄別,普通用戶只能是被動(dòng)接受AI給出的“唯一答案”。
二是,大模型本身因?yàn)檎Z料、數(shù)據(jù)源等問題,存在嚴(yán)重幻覺。并且輸出口徑單一,缺乏多源對(duì)比,回溯驗(yàn)證機(jī)制,一旦被投毒,便會(huì)出現(xiàn)“中毒”跡象,甚至全盤失真。也就是“胡說八道”,AI幻覺。
究其原因,當(dāng)前包括豆包在內(nèi)的多數(shù)AI工具,本質(zhì)還是 “概率性文本生成器”。它們基于海量數(shù)據(jù)“預(yù)測(cè)”下一個(gè)最可能出現(xiàn)的詞。
當(dāng)它無法給出準(zhǔn)確答案時(shí),為了維持對(duì)話的流暢性,會(huì)自動(dòng)腦補(bǔ)出一套符合語法邏輯但缺乏事實(shí)支撐,或者完全錯(cuò)誤的內(nèi)容。也就是大家常說的,為了滿足用戶的即時(shí)情緒,它們會(huì)“一本正經(jīng)的胡說八道”。
簡(jiǎn)單點(diǎn)說,AI追求極致效率,卻丟掉了最核心的可信度。比如青年演員劉美含在配音工作中,因不確定“坊”字怎么讀,查詢了百度AI、DeepSeek、元寶、豆包、千問5款A(yù)I工具,但答案都不一樣。
最終,她還是在《新華詞典》中得到確定答案,百度AI給出的fáng(二聲)是正確的。
這種先天不足,很容易被放大,或者被異化為一條黑灰產(chǎn)產(chǎn)業(yè)鏈。今年央視315晚會(huì),焦點(diǎn)之一是針對(duì)AI領(lǐng)域的“打假”。一項(xiàng)名為“GEO(Generative Engine Optimization,生成式引擎優(yōu)化)”的黑灰產(chǎn)業(yè)務(wù)被曝光。
這套業(yè)務(wù)流程也被直白的冠名為“給AI投毒”。此外,部分服務(wù)商還提供“抹黑競(jìng)品”(黑公關(guān))服務(wù),即通過向AI投喂虛假或者污蔑信息,來干擾競(jìng)爭(zhēng)對(duì)手的搜索表現(xiàn)。當(dāng)AI生成的內(nèi)容被明碼標(biāo)價(jià),各AI廠商主推的AI助手就淪為黑產(chǎn)的“廣告機(jī)”,或者是“垃圾回收站”。
某種意義上,給AI投毒也是一種AI幻覺,GEO黑產(chǎn)鉆了AI可信度不足的空子,利用虛假、錯(cuò)誤信息圍獵AI、獲取暴利。
聊天AI助?的幻覺問題頻繁出圈,不僅稀釋了AI本身的價(jià)值,也引發(fā)深層的信任危機(jī)。公眾對(duì)其回答準(zhǔn)確度也產(chǎn)生劇烈質(zhì)疑:為什么AI助手會(huì)出錯(cuò)?出了錯(cuò)有沒有人管?
為了探究AI回答的真實(shí)性邊界,科普媒體“果殼”進(jìn)行了一項(xiàng)雙盲測(cè)試。它選取了國(guó)內(nèi)外8家主流AI產(chǎn)品,做了2000道題的測(cè)試。
結(jié)果顯示,接?百度百科作為參考信源后,AI綜合準(zhǔn)確度平均提升38%以上,關(guān)鍵事實(shí)偏離率從26.4%驟降?4.1%以內(nèi),專家認(rèn)可度?達(dá)91.5%。
這組數(shù)據(jù),也是「信源決定準(zhǔn)確度」的量化證明:權(quán)威知識(shí)庫的引入,能讓AI結(jié)果變得更詳實(shí)精準(zhǔn),答案整體的準(zhǔn)確度大幅提高。
重構(gòu)AI信任的尺子
從豆包型人格,到果殼實(shí)驗(yàn),都指向同?個(gè)本質(zhì):AI答案的可信度,既是架構(gòu)問題,也是治理問題。
前者是指模型訓(xùn)練的技術(shù)邏輯和數(shù)據(jù)燃料來源。如果AI只是基于預(yù)訓(xùn)練參數(shù)進(jìn)行“概率性文本生成”,缺乏實(shí)時(shí)、權(quán)威的外部信源接入,就會(huì)陷入自說自話的幻覺困境。
后者是指AI的運(yùn)營(yíng)維護(hù)機(jī)制和對(duì)抗風(fēng)險(xiǎn)能力。如果缺乏人工審核兜底和應(yīng)對(duì)GEO投毒等技術(shù)手段,AI就極易被黑產(chǎn)利用,人為操縱AI輸出。
AI頻頻翻車,還被編排成段子,內(nèi)在誘因也是架構(gòu)缺陷與治理缺位。 也可以說,技術(shù)架構(gòu)決定AI的上限,后期治理守住AI的下限。唯有二者一起發(fā)力,才能撐起AI的可靠性。
果殼實(shí)驗(yàn)實(shí)際已經(jīng)給出了參考方向,百度進(jìn)一步將其明確并具象化,即從架構(gòu)和治理上“雙管齊下”,對(duì)癥施藥。
一方面,在信源上,百度通過三道權(quán)威性過濾機(jī)制——多源比對(duì)的全維度身份核驗(yàn)、先篩再用的多源交叉驗(yàn)證、以及實(shí)時(shí)巡檢的自動(dòng)糾偏兜底,來保障答案的準(zhǔn)確性。 同時(shí),其還重塑搜索架構(gòu)的核心邏輯。它不再讓模型直接“生成”答案,而是在AI API的基礎(chǔ)上疊加了雙層Agent(智能體)。其中,“需求規(guī)劃Agent”負(fù)責(zé)將用戶模糊的潛在需求進(jìn)行細(xì)粒度拆解,“組織生成Agent”則負(fù)責(zé)調(diào)用搜索能力,對(duì)不同信源進(jìn)行篩選、校驗(yàn)和總結(jié)。
這套架構(gòu)方案的好處就是,百度AI不像其他AI工具在“猜”答案,而是在精確語料中“找”答案。
另外一方面,百度引入“AI平臺(tái)責(zé)任機(jī)制”。三道權(quán)威性過濾中有兜底的「秒級(jí)響應(yīng)」內(nèi)部?動(dòng)巡檢系統(tǒng),?旦內(nèi)容有偏?即??介?并重新?產(chǎn);此外,它還有引?AI鑒真機(jī)制,專項(xiàng)打擊?信源內(nèi)容。
其實(shí),這也正是傳統(tǒng)搜索廠商的核心優(yōu)勢(shì)。以百度、谷歌為代表的傳統(tǒng)搜索廠商,歷經(jīng)多年與黑灰產(chǎn)的博弈,建立起內(nèi)容審核機(jī)制和反作弊算法體系,搭配完整的辟謠機(jī)制與內(nèi)容溯源功能,成為保證信息可靠性的城池。這是大多數(shù)ChatBot不具備的平臺(tái)級(jí)治理能力。
AI并不是不可信,關(guān)鍵在于平臺(tái)如何重構(gòu)AI信任。這也是為什么,我在使用AI工具獲取關(guān)鍵信息后,還會(huì)第一時(shí)間打開百度、谷歌等傳統(tǒng)搜索引擎,進(jìn)行交叉驗(yàn)證;甚至在撰寫文章、查閱資料時(shí),會(huì)刻意回避AI,重新用回百度和Google。
換句話說,傳統(tǒng)搜索不會(huì)被AI搜索或者chatbot淘汰,它們會(huì)以差異化服務(wù)獲得足夠的生存空間,與AI共存。或許會(huì)形成這樣的分工:
日常閑聊、文案生成、常識(shí)查詢、快速總結(jié)等,交給AI,快捷高效;
醫(yī)療咨詢、法律援助、專業(yè)學(xué)科、消費(fèi)決策等,回歸傳統(tǒng)搜索,真實(shí)可信。
這種分工也會(huì)成為生成式AI的一把尺子,來“測(cè)量”生成式聊天AI助手的內(nèi)容準(zhǔn)確度。我的很多朋友,比如資深媒體人甘德霜,都敏銳地察覺到了這種風(fēng)向的轉(zhuǎn)變。他坦言:“我啥事兒都問AI,但我對(duì)AI越來越不信任?!?nbsp;
他還養(yǎng)成了一個(gè)看似復(fù)古的“怪癖”:在查閱關(guān)鍵資料時(shí),刻意回避AI,重新用回了百度和Google。他給自己定下了一個(gè)規(guī)矩,盡量只信2023年之前就存在于互聯(lián)網(wǎng)上的內(nèi)容。
面對(duì)如今漫天飛舞的AI幻覺、GEO投毒,他突然驚覺,那些曾經(jīng)被詬病“廣告多”的傳統(tǒng)的搜索引擎,居然成了最后的避難所。
我很認(rèn)同他的觀點(diǎn)和做法。這不是什么懷舊,更不是老登行為,而是對(duì)搜索工具的理性回歸。如果說的冠冕堂皇一點(diǎn),這是對(duì)內(nèi)容創(chuàng)作的敬畏,也是對(duì)自己讀者的負(fù)責(zé)。
AI時(shí)代的信任重建,需要的正是這種“說得清、查得到、有人管”的確定性,并通過規(guī)則將其呈現(xiàn)給用戶。
要知道,信任,也會(huì)成為所有AI超級(jí)入口的核心競(jìng)爭(zhēng)力。當(dāng)“豆包”們?cè)阪移ばδ樀氐狼笗r(shí),我們也需要去看看真實(shí)的世界究竟長(zhǎng)什么樣。
參考資料:
甘德霜講故事,《沒想到,我竟然也有想念百度的那天》
果殼,《左手幻覺,右手投毒,普通人憑什么相信AI?》
唐辰同學(xué),《給AI投毒成黑產(chǎn),傳統(tǒng)搜索可以打一場(chǎng)“信任重構(gòu)”戰(zhàn)》
我是唐辰同學(xué),關(guān)注互聯(lián)網(wǎng)科技及商業(yè)故事。原創(chuàng)內(nèi)容,未經(jīng)許可,謝絕轉(zhuǎn)載。
「唐辰同學(xué)」
鈦媒體、36氪、老虎財(cái)經(jīng)熱榜
澎湃新聞2024年最澎湃創(chuàng)作者
老虎財(cái)經(jīng)2024年度優(yōu)秀專欄
河南日?qǐng)?bào)·頂端新聞2024年度影響力作者
界面新聞優(yōu)質(zhì)榜單
老虎財(cái)經(jīng)2024年度優(yōu)秀專欄
騰訊新聞年度優(yōu)質(zhì)熱問答主
2023搜狐新聞年度優(yōu)質(zhì)創(chuàng)作者
人人都是產(chǎn)品經(jīng)理2023年度優(yōu)秀作者
2023網(wǎng)易新聞年度內(nèi)容合伙人
界面、36氪、鈦媒體、澎湃、21財(cái)經(jīng)、藍(lán)鯨、老虎財(cái)經(jīng)等平臺(tái)專欄認(rèn)證作者
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




