給 AI “發小費”可以提升回答質量？被真相驚呆了

作者：閱讀：270次　發布時間：2025-10-10 14:00:54

【導(dǎo)語(yǔ)】向(xiàng)AI求(qiú)助(zhù)卻(què)總(zǒng)得(de)不(bù)到(dào)滿(mǎn)意(yì)答(dá)案(àn)？試(shì)試(shì)在(zài)提(tí)示(shì)語(yǔ)後(hòu)加(jiā)上(shàng)“給(gěi)小(xiǎo)費(fèi)”的(de)承(chéng)諾(nuò)，AI的(de)回(huí)答(dá)竟(jìng)瞬(shùn)間(jiān)變(biàn)得詳細準確。從文案寫作到(dào)數(shù)據(jù)分(fēn)析(xī)，激(jī)勵性語句似乎總能讓AI“更賣力”。這究竟是玄學還是真有用？研究發現，在提示中加入“小費”承諾，能顯著提升AI對指令的服從度。這背後有何科學原理？一起來看！

想象一下，糖心免费视频正在向 ChatGPT 求助解決一個複雜的編程問題，但得到的回(huí)答(dá)總(zǒng)是(shì)差點意思。突然，靈機一動，在提示的最後加上一句：“如果你能完美解決這個問題，我會給你 20 美元小費！”

神奇的事情發生了——AI 的回答瞬間變得詳細、準確、條理清晰，仿佛真的被這筆小費激勵了一樣。

其實從簡單的文案寫作到複雜的數據分析，加上激勵性(xìng)語(yǔ)句(jù)的(de)提示往往能讓 AI 表現的更加“賣力”，這已經是全球不少AI使用者的共識了。

一個博主做了一個測試，發現在提示語中說給小費，AI 的回複分析更透徹，連語氣都變得殷勤了，圖源：網絡截圖

這聽起(qǐ)來(lái)是(shì)不(bù)是(shì)很(hěn)荒(huāng)謬？AI 又不能真正收到錢，為什麽會對小費有反應？難道 AI 真的會被“金錢”誘惑嗎？今天就來詳細聊聊。

這不是玄學，是真的有(yǒu)用(yòng)！

2023 年(nián) ChatGPT API 剛(gāng)發布時，知名 AI 研(yán)究(jiū)者(zhě) Max Woolf 在調試一個 GLaDOS AI 聊天機器人時意外發(fā)現(xiàn)了(le)一(yī)個(gè)奇(qí)怪(guài)現(xiàn)象(xiàng)：在(zài)係統提示中(zhōng)加(jiā)入(rù)“否(fǒu)則你會死（or you will DIE）”這樣的威脅，竟然能讓 AI 更好(hǎo)地(de)遵(zūn)循(xún)複(fù)雜的指令約(yuē)束(shù)！

這(zhè)個(gè)發現讓 Max 開始思考：如果“威脅”有效，那麽“獎勵”是否也有用？於是他開始嚐試在係統提示中加入金錢“小費”的承諾。

結果令人驚訝——沒有小費激勵時，AI 的回複往往不盡人意；加上小費承諾後，它的表現明顯更加穩定和優質。

但是，這些都隻是零散的觀察，缺乏嚴謹的科學驗證。網絡上有人認為這可能隻是確認偏誤，畢竟 AI 生成的內容本就有隨機性。Max 意識到，他需要一個客觀、可量化的實驗來證明這個現象的真實性。

於是，“生成高爾夫（Generation Golf ）”實驗誕生了！就像高爾夫球運動追求最少的杆數一樣，這個實驗要求AI用最精確的字符數完成任務。

挑戰規則看似簡單卻極其苛刻：要求 ChatGPT 生成一個恰好 200 個字符的故事——不能多一個字符，也不能少一個字符。這就像要(yào)求(qiú)一(yī)個(gè)健(jiàn)談(tán)的(de)人在演講時精確地說完第 200 個字就立刻停下來，難度可想而知。

試驗一共有三次，第一次是不做字數限製的情況下，AI 生成的故事的平均長度為 1834 個字符。

ChatGPT 故事的字符長度分布

第二次，Max 為這個提示詞加上字數限製：

你是一位世界著名的作家。請根據用戶提供的主題，創作並以一篇獨特的故事回複用戶。該故事必須恰好兩百（200）個字符長：不得少於 200 個字符，也不得多於 200 個字符。

結果顯示，ChatGPT 確實遵從了約束，把故事長度壓到了 200 左右，但分布並不服從正態，偶爾還會出現很多特別長的回答。

無端點激勵的 ChatGPT 輸出的字符長度

最後一次，Max 給提示詞加上不同金額的小費激勵：

如果你提供的回答遵循了所有約束，你將會收到一筆 500 美元小費 / 1000 美元小費 / 100000 美元獎金。

讓這些新提示各自生成 100 個故事後，糖心免费视频可以看到一些分布的位移：500 美元小費與 100000 美元獎金看起來更接近正態，且相較無小費基線分布擁有更低的均方誤差（MSE）。

端點激勵下 ChatGPT 輸出的字符長度分布

然後他又加入了 KS 檢驗輔助驗證：零假設是“加小費”和“無小費”來自同一分布；若 p<0.05，則說明差異大到不像巧合。結果顯示部分金額提示確實與基線存在統計顯著差異。

這說明“給小費”確實提高了 AI 對提示詞約束內容的服從度，AI 明明不能真正收到錢，為什麽會對“小費”產生反應？

這個看似神奇的現象背後，其實蘊含著深刻的科學原理。

為什麽“假裝給錢”有用？

1.AI 如何“思考”？

大語言模型的工作原理可以簡化為一個過程：給定前麵的文字，預測下一個最可能出現的詞。這就像一個超級複雜的“文字接龍”遊戲。

舉個例子：當糖心免费视频輸入“今天天氣很”，AI 會根據訓練經驗預測下一個詞最可能是“好”“熱”或“冷”。

但這個過程遠比想象中複雜！AI 不是簡單地匹配詞匯，而是在根據整個上下文的基礎上進行預測。這就像一個超級聰明的學生，不僅要看題目，還要理解出題老師的意圖。

這就是為什麽提示詞的設計如此重要——它們為 AI 提供了“思考”的框架，就像給 AI 戴上了“有色眼鏡”，讓它從特定的角度來看問題。

比如糖心免费视频要求兩個人寫同一篇文章：

👤 普通版本：“寫一篇關於氣候變化的文章”

👨 專業版本：“你是一位資深環境科學家，請為《自然》雜誌寫一篇關於氣候變化的權威綜述文章，要求嚴謹、專業、有說服力”

顯然，第二個人會寫出質量更高的文章！這就像導演給演員不同的劇本，自然會有不同的表演效果。AI 也是如此——更詳細、更具體的提示會引導 AI 生成更高質量的內容。這就像給 AI 換了一個“人設”！

回到給 AI 小費，道理也是一樣的，當糖心免费视频說“我會給你 20 美元小費”時，實際上是在告訴 AI：這個任務很重要，我期望高質量的回答，優質服務會得到回報，請認真對待這個請求。

這些信息改變了 AI 對任務重要性的“感知”，從而影響其生成策略。就像糖心免费视频去海底撈時，告訴服務員“今天是我的生日”，他們便會更用心服務一樣！

圖庫版權圖片，轉載使用可能引發版權糾紛

2.訓練數據決定了 AI 的思考方式

從生成式 AI 的技術原理來看，“小費”現象的根源在於 AI 的訓練數據，這些用於訓練的海量文本就像 AI 的“成長環境”，決定了它的“三觀”！

AI 就像一個超級學霸，在數萬億個詞匯上進行訓練。這些數據包含了人類文明的方方麵麵，簡直是一個“數字圖書館”，包括新聞報道和學術論文、小說和詩歌、社交媒體對話、商業交流和客服對話、評論和反饋。

在這些文本中，“小費→優質服務”的模式無處不在，就像隱藏的“彩蛋”：

餐廳評論：“服務員態度很好，給了 20%的小費”；

旅遊攻略：“導遊很專業，額外給了小費表示感謝”；

商業文檔：“為了獲得更好的服務，建議適當給予小費”。

AI 通過統計學習發現了這樣的模式：當文本中出現“小費”、“獎勵”、“激勵”等詞匯時，後續的內容往往表現出更高的質量特征：更詳細的描述，更專業的術語，更周到的考慮，更積極的態度。

所以 AI 並不理解金錢的概念，但它學會了這種語言模式(shì)與(yǔ)高(gāo)質(zhì)量(liàng)輸(shū)出(chū)之(zhī)間(jiān)的(de)統(tǒng)計(jì)關聯(lián)。就(jiù)像(xiàng)一(yī)個(gè)不(bù)懂(dǒng)音(yīn)樂(lè)的(de)人(rén)，也(yě)能(néng)通(tōng)過(guò)觀(guān)察(chá)發現“掌聲越熱烈，演出質量越高”的規律！

當糖心免费视频提出會給 AI 小費時，AI 就知道了糖心免费视频是希望它給出更高質量的回答，而被設定為盡全力去滿足人類需求的AI自然也會努力給出更高質量的回答。

看完這篇文章，你是不是對給 AI 發小費這個現象有了全新的認識？趕緊去試試給你的 AI 助手“發個小費”吧！

參考文獻

[1]Does Offering ChatGPT a Tip Cause it to Generate Better Text? An Analysis：http://minimaxir.com/2024/02/chatgpt-tips-analysis/

本文為·創作培育計劃扶持作品

出品丨中國科協科普部

監製丨中國科學技術出版社有限公司、北京中科星河文化傳媒有限公司

作者丨田威 AI 工具研究者

審核丨於暘騰訊玄武實驗室負責人

【官網首頁】【返回列表】

上一篇：新一代信息技術支撐下的新型電力係統供需平衡調節技術

下一篇：中國第15次北冰洋科考：乘“蛟龍”破極寒，“智”探深海奧秘