下載客戶端

登錄

假如AI欺騙了你

澎湃新聞記者陳燦杰實習(xí)生農(nóng)嵐淳歐陽思帆編輯彭瑋

2025-03-26 07:27

來源：澎湃新聞

? 澎湃人物 >

聽全文

【編者按】

AI洶涌而來，第一次與人類產(chǎn)生大規(guī)模的真實接觸。人們驚訝于技術(shù)的快速迭代，憧憬未來，也忌憚可能的威脅。

而在當(dāng)下，我們更關(guān)心的是，當(dāng)AI進(jìn)入普通人的生活，人與AI深度互動，直至卷入其中，將引發(fā)怎樣的激蕩。

在與AI相處中，人類也照見自身。我們將陸續(xù)推出“AI世代”系列深度報道，講述AI時代人的故事。

設(shè)計白浪

我對DeepSeek還一知半解時，同事奕君已經(jīng)在用它找新聞選題了。它能歸納熱點、計劃采訪周期及預(yù)算，甚至告訴她：AI法官已應(yīng)用于輔助量刑。她逐一檢索其中的參考鏈接、向在法院工作的朋友求證后確認(rèn)了一點：至少目前，人所受的懲罰不由AI法官決定。

她試圖用DeepSeek取代搜索引擎，但在反復(fù)驗證信源中發(fā)現(xiàn)虛實摻雜，又不免困惑，“它到底是節(jié)省了時間，還是增加了信息負(fù)擔(dān)？”

DeepSeek做的采訪策劃受訪者供圖

但AI“幻覺”，即那些縝密回答背后的漏洞，并未減少她對DeepSeek的依賴。從修熱水器，到如何3個月減肥十斤，“萬事問DeepSeek”。她說如果讀研時借此一鍵提煉論文要點，或許能實現(xiàn)睡眠自由，但，“會不會讓我失去信息處理的能力？”

無論如何，DeepSeek、Chat-GPT等生成式AI正滲透進(jìn)日常。伴隨技術(shù)迭代，AI幻覺、“已讀亂回”變得更難察覺。OpenAI首席執(zhí)行官薩姆·奧爾特曼2023年4月接受ABC（美國廣播公司）訪談稱，“特別擔(dān)心模型被用于大規(guī)模的虛假信息傳播。”

那么，如果出于欺騙、商業(yè)等目的，操控AI的回答可行么？復(fù)旦大學(xué)計算機(jī)科學(xué)技術(shù)學(xué)院教授張奇不假思索地告訴我，可以，方法遠(yuǎn)比想象中簡單，且同樣隱蔽。

“它傾向服從用戶”

幻覺難免，非訴律師張茹仍視DeepSeek為“第二個腦子”。她做跨境合規(guī)業(yè)務(wù)，協(xié)助企業(yè)出海時習(xí)慣先讓DeepSeek動腦，如對比海外不同城市的政策紅利、生產(chǎn)規(guī)范。以往梳理美國OSHA標(biāo)準(zhǔn)（職業(yè)安全與健康標(biāo)準(zhǔn)）就需要至少半天，現(xiàn)在只要半小時，“80%-90%的結(jié)果都是比較準(zhǔn)確的”。

此外，案例檢索、文件起草、研讀動輒幾十頁的行業(yè)白皮書，都能交給DeepSeek。她2023年入行時，如果要用AI輔助，只能悄悄用，否則會被老板認(rèn)為不靠譜，“DeepSeek出現(xiàn)之后，你用AI工作，老板會覺得你很聰明”。不過法條引用、案件核心仍靠他兜底核證。

因在法律文件中采用AI生成的虛假信息，過去兩年間，美國至少有七起案件中的律師受到法院警告或處分。據(jù)BBC（英國廣播公司）往期報道，紐約律師史蒂文·施瓦茨提交的一份民事訴訟材料中，有6個引述案例涉及虛構(gòu)及虛假判決。他辯稱這是他從業(yè)三十多年以來首次使用Chat-GPT，“不知道它的內(nèi)容可能是虛假的”。

張茹說，她使用至今，DeepSeek出現(xiàn)“幻覺”的原因主要集中在兩方面，一是案例檢索，有些數(shù)據(jù)無法直接獲取，得人工倒回去查“北大法寶”等專業(yè)工具；二是法條解讀，像“陰陽合同”、“抽屜協(xié)議”，很難剖析清楚。

張奇解釋說，語言不像數(shù)學(xué)有明確推導(dǎo)和標(biāo)準(zhǔn)答案，詞匯的“特異性”也會影響AI幻覺。“行業(yè)黑話”AI就難以準(zhǔn)確辨識。此外，華為的總裁和聯(lián)想的總裁，AI更難記住后者，因為“聯(lián)想”并非一個專有名詞。

面對幻覺，張茹會喂更多材料、或調(diào)整提示詞追問DeepSeek，有時確實答對了，以致他推測它能“自我修復(fù)錯誤”。

事實上，DeepSeek并不懂“對”和“錯”。復(fù)旦大學(xué)計算機(jī)科學(xué)技術(shù)學(xué)院教授張奇解釋說，生成式AI的回答只是一個“概率”問題，也就是說，重新提問它可能還會出錯，且它傾向服從用戶，即便答對了，你也可以“誤導(dǎo)”它出錯。

AI之所以會出現(xiàn)幻覺，即學(xué)術(shù)界普遍定義的“事實性錯誤”，主要源于模型并不能記住訓(xùn)練數(shù)據(jù)中的所有信息。特別是互聯(lián)網(wǎng)上出現(xiàn)次數(shù)很少的專業(yè)知識以及冷門知識，模型都很容易出現(xiàn)錯誤。

張奇補(bǔ)充說，DeepSeek的聯(lián)網(wǎng)搜索一定程度減少了幻覺，同步抓取相關(guān)網(wǎng)頁信息后，它就從依賴自身記憶的“閉卷考試”變成了“開卷考試”，回答“中國第九長河”這種冷門問題時，正確率也會提高不少。

他表示，要想減少AI幻覺，“要從數(shù)據(jù)和算法上尋找解決方案，需要使用更多高質(zhì)量和多樣性的數(shù)據(jù)以及更好的訓(xùn)練方法”。

“我不會問AI要數(shù)據(jù)，我是投喂給它數(shù)據(jù)。”民族學(xué)專業(yè)的韋悅說。研三時，她為論文焦慮，還得兼顧博士復(fù)試，寄望Chat-GPT幫她擠點時間，反復(fù)給它糾錯后，她的提問很快被氣成了質(zhì)問，“文獻(xiàn)綜述出來都是錯誤的，就根本沒有這些文獻(xiàn)”。

如今升到博二的她會為Chat-GPT、DeepSeek限定學(xué)習(xí)資料，親自從官方渠道搜集原始數(shù)據(jù)精準(zhǔn)投喂；表格看得眼花，也丟給它們提煉，再一點點磨合明確回答字?jǐn)?shù)和要點，“這類基礎(chǔ)的、繁瑣的工作完全能讓AI替代”。但她無法完全信任AI，最后還是會復(fù)核一遍。

“我們老師比我們更信任AI?！彼膶?dǎo)師熱衷分享如何馴化DeepSeek，教程包含視頻、公號推文、PDF手冊。之前元宵節(jié)導(dǎo)師想請她吃飯，還未返校的她問DeepSeek如何婉拒，“人有時候就是感覺嘴巴很笨，想借助一下AI來提升我的情商”。

當(dāng)然，AI更多改變了她與導(dǎo)師的學(xué)術(shù)互動。有時導(dǎo)師晚上突然發(fā)來研究項目，不想熬夜的她就把問題丟給AI，隔天借鑒回答與導(dǎo)師討論。聊到具體研究方向和方案，導(dǎo)師也會打開手機(jī)說，“那我們來問一下AI”。

Aha moment（頓悟時刻）

我也讓DeepSeek參考“澎湃人物”欄目風(fēng)格找了選題，其中一個勾起了我的興趣——“候鳥老人”的跨境養(yǎng)老實驗：中越邊境銀發(fā)群體的制度性流浪。它說在中越邊境的廣西某市，有些老人白天刷醫(yī)保買藥，晚上去越南住廉價養(yǎng)老院。甚至提到退休教師周某某為治肺癌開啟“流浪”之路。

但請注意，這個選題純屬DeepSeek虛構(gòu)。我在核對參考鏈接后發(fā)現(xiàn)，它將北方老人南遷過冬、廣西某市醫(yī)保調(diào)整、以及中越邊境貿(mào)易等信息混雜后，編了個有血有肉的故事。

當(dāng)我指出它的錯誤，它回應(yīng)說，未來將明確標(biāo)注假設(shè)性內(nèi)容，如“據(jù)現(xiàn)象推測可能存在……”，避免混淆事實與邏輯推演；并優(yōu)化信息整合流程，采取“事實-證據(jù)-推論”三步法。

那么，DeepSeek在回答中標(biāo)明事實和虛構(gòu)可行嗎？

“黑箱尚未被打開，所以理論上不清楚?！睆埰鎸eepSeek“已讀亂回”界定為模型推理的邏輯錯誤，因為大模型本身就是一個巨大的“黑箱”，沒人能夠解釋清楚它為什么會出現(xiàn)某個字，也無法準(zhǔn)確預(yù)測。

因此，模型的推理也會造成幻覺。AI公司Vectara專注于人工智能領(lǐng)域高精度任務(wù)，據(jù)其發(fā)布的大模型幻覺排行榜，截至今年3月，“推理型”的DeepSeek R1幻覺率為14.3%，而偏向傳統(tǒng)模型的DeepSeek-V2.5、DeepSeek-V3幻覺率分別為2.4%和3.9%。

張奇表示，AI的實事求是與發(fā)散思維難以兼顧，“推理是希望它發(fā)散，一旦發(fā)散就可能帶來很多錯誤”，聯(lián)網(wǎng)理論上能改善幻覺，但“很多問題來源于網(wǎng)頁”，這又回到了數(shù)據(jù)質(zhì)量的老問題——“垃圾進(jìn)，垃圾出”。

國外已有類似案例爆出，據(jù)英國《衛(wèi)報》此前報道，新西蘭連鎖超市PAK’nSAVE開發(fā)了一款制定食譜的AI，顧客對它輸入更廣泛的家庭購物清單后，它推薦了含漂白劑的“清新口氣”雞尾酒、“甲醇”吐司，包括會產(chǎn)生氯氣的冰鎮(zhèn)飲料。顯然，AI忽略了這些菜單對碳基生物是致命的。

這也是我對生成式AI的另一個疑問：給出答案前，它能否發(fā)現(xiàn)邏輯鏈條的漏洞，從而重新進(jìn)行推理？

在DeepSeek官方論文中，研究人員訓(xùn)練DeepSeek-R1-Zero做數(shù)學(xué)方程時，它突然出現(xiàn)了一句“Wait，wait.Wait.That's an aha moment I can flag here（等等、等等，這是一個我可以在這里標(biāo)記的頓悟時刻）”。

DeepSeek的“aha moment”

社交平臺上，不乏網(wǎng)友對這個“Aha moment（頓悟時刻）”的溢美之詞，認(rèn)為AI像人一樣反思到自身錯誤并重新思考。

“在原始推理過程中，正常情況下它不應(yīng)該出現(xiàn)反思邏輯?！睆埰嬲f，這得回到模型預(yù)訓(xùn)練和數(shù)據(jù)中尋找原因。他并不認(rèn)為DeepSeek擁有反思能力，其邏輯仍是由數(shù)據(jù)驅(qū)動的“概率”。

之前測試DeepSeek時，他一口氣輸入了80個1相加，中間夾了個11，結(jié)果它算了550秒也沒算對?！斑@種問題不難，但（研究人員）通常不會（專門）去構(gòu)造訓(xùn)練數(shù)據(jù)?！彼峙e例道，9.9和9.11誰大？strawberry這個單詞有幾個“r”，這種提問有時就能難倒AI。

因此，在他看來，比起讓AI擁有通用的反思能力，讓它專注于一個具體的應(yīng)用場景以減少幻覺更容易些。但這也很“燒錢”，此前他和團(tuán)隊為一家企業(yè)做過一個模型，智能識圖提取其中日程、車票信息，費用數(shù)百萬元，“如果想讓用戶體驗達(dá)到95分，就需要定制化訓(xùn)練”。

為了開發(fā)一款定位于臨床研究和科研的醫(yī)療AI，開發(fā)人員唐敏和同事專門建立了數(shù)據(jù)庫。她解釋說，醫(yī)學(xué)講究“循證”，因此不能“扒”各種網(wǎng)頁。她問過ChatGPT“歐蘭寧”是什么藥，它聯(lián)網(wǎng)后將這款抗精神病藥分析為腸胃藥，“它搜索的內(nèi)容質(zhì)量都相對較低”。

此外，他們不斷調(diào)整模型架構(gòu)，讓AI的回答更貼近參考文獻(xiàn)，校驗后仍存在的錯誤則直接屏蔽，“就是不輸出給用戶看到”。她表示，幻覺明顯好轉(zhuǎn)，其實是研發(fā)人員提前把它們“消化”了。

盡管應(yīng)用已調(diào)教到無需依賴專業(yè)的提示詞，唐敏首要建議的仍是醫(yī)療人員使用AI，“他們有判斷能力，我們提高的是他們的效率，并不是替他們做決策”。

“技術(shù)和技術(shù)之間是有對抗的”

“DeepSeek達(dá)不到人的那種靈活?！痹谝患抑屑壢嗣穹ㄔ簱?dān)任法官助理的陳思文說，它難以“意會”現(xiàn)實因素。

去年9月陳思文考入這家法院后，對AI的依賴日漸加深。起初是業(yè)務(wù)問題，她怕問多了招人煩，AI就不會，它始終在線且富有耐心；過了新手期調(diào)到業(yè)務(wù)庭，她每天至少得處理一兩個案子，且案情復(fù)雜了不少，她便讓DeepSeek梳理基本案由信息以及法條參考，從效果來看，她覺得“瑕不掩瑜”。

“最重要的一個技巧就是，盡可能地精簡問題，”她表示，像類案檢索，案情千變?nèi)f化，但其中蘊(yùn)含的法律關(guān)系相對穩(wěn)定，從中提煉關(guān)鍵詞一步步追問，才可能得到想要的答案，但要精準(zhǔn)捕捉關(guān)鍵詞，案件經(jīng)驗不可或缺。

這也是非訴律師鄔樂擔(dān)憂的，她入行8年，職業(yè)起步于上千份相似的文件，身邊不少新人直接略過了這一步，向DeepSeek提問。但她認(rèn)為，“提問”離不開前期枯燥卻必要的積累，“這是環(huán)環(huán)相扣的。知識儲備不夠的話，你去問 AI其實也得不到很好的回答”。

無論提問者的水平如何，顯見的是，越來越多的人已開始將AI當(dāng)作搜索引擎。

DeepSeek不僅是韋悅的論文助手，當(dāng)她考慮畢業(yè)后回南寧老家，它能分析哪款電車的續(xù)航可以滿足她的上班通勤需求；還有南寧未來房價走勢、甚至細(xì)化到不同城區(qū)的新房和二手房。我同事奕君會讓它根據(jù)冰箱剩余的食材制定食譜。對于張奇70歲的父母，它會更多地提出保健方案。

是的，DeepSeek的回答正在滲入我們?nèi)粘?，但有沒有可能，它的回答是可操縱的？

張奇表示，它依賴聯(lián)網(wǎng)搜索，因此只要能影響搜索結(jié)果，就可以改變答案了。“這取決于商業(yè)化的邏輯”，如同各大搜索、社交平臺手握流量入口，決定著用戶能看到什么，DeepSeek如何回答，也與流量息息相關(guān)。但它說的話更有人味，更加專業(yè)，且目前還不會像一些平臺推送那樣，至少在邊角處標(biāo)個小小的“廣告”。

據(jù)Fox News（美國?？怂剐侣劊┐饲皥蟮溃?023年4月，其新聞臺前主持人塔克·卡爾森獲悉埃隆·馬斯克將開發(fā)TruthGPT后，表示該AI極有可能改變以往信息獲取渠道，進(jìn)而影響民主選舉。“它會控制我們對現(xiàn)實的理解，用一種非常不誠實的方式……它可能會因政治目的被操縱，對我們?nèi)鲋e。”

當(dāng)時埃隆·馬斯克對此回應(yīng)稱，比起選舉，AI對人類文明的威脅或許更大。他“鼓勵對人工智能進(jìn)行監(jiān)管”。

全球事實核查平臺“澎湃明查”的同事鄭淑婧告訴我，AI在降低使用成本的同時，正讓虛假信息變得“更快、更多、更強(qiáng)”，這給人工核查帶來了前所未有的挑戰(zhàn)。

好在她也會“技術(shù)反制”。之前網(wǎng)傳過一張《時代周刊》封面照，聯(lián)合國秘書長古特雷斯站在血泊當(dāng)中。她通過反向搜索發(fā)現(xiàn)，原圖為古特雷斯站在及膝的水中呼吁關(guān)注全球變暖。此外，也有平臺可以專門辨別圖片是否被PS過，或視頻中是否包含AI生成內(nèi)容。