
【導(dǎo)語(yǔ)】向(xiàng)AI求(qiú)助(zhù)卻(què)總(zǒng)得(de)不(bù)到(dào)滿(mǎn)意(yì)答(dá)案(àn)?試(shì)試(shì)在(zài)提(tí)示(shì)語(yǔ)後(hòu)加(jiā)上(shàng)“給(gěi)小(xiǎo)費(fèi)”的(de)承(chéng)諾(nuò),AI的(de)回(huí)答(dá)竟(jìng)瞬(shùn)間(jiān)變(biàn)得詳細準確。從文案寫作到(dào)數(shù)據(jù)分(fēn)析(xī),激(jī)勵性語句似乎總能讓AI“更賣力”。這究竟是玄學還是真有用?研究發現,在提示中加入“小費”承諾,能顯著提升AI對指令的服從度。這背後有何科學原理?一起來看!
想象一下,糖心免费视频正在向 ChatGPT 求助解決一個複雜的編程問題,但得到的回(huí)答(dá)總(zǒng)是(shì)差點意思。突然,靈機一動,在提示的最後加上一句:“如果你能完美解決這個問題,我會給你 20 美元小費!”
神奇的事情發生了——AI 的回答瞬間變得詳細、準確、條理清晰,仿佛真的被這筆小費激勵了一樣。
其實從簡單的文案寫作到複雜的數據分析,加上激勵性(xìng)語(yǔ)句(jù)的(de)提示往往能讓 AI 表現的更加“賣力”,這已經是全球不少AI使用者的共識了。

一個博主做了一個測試,發現在提示語中說給小費,AI 的回複分析更透徹,連語氣都變得殷勤了,圖源:網絡截圖
這聽起(qǐ)來(lái)是(shì)不(bù)是(shì)很(hěn)荒(huāng)謬?AI 又不能真正收到錢,為什麽會對小費有反應?難道 AI 真的會被“金錢”誘惑嗎?今天就來詳細聊聊。
這不是玄學,是真的有(yǒu)用(yòng)!
2023 年(nián) ChatGPT API 剛(gāng)發布時,知名 AI 研(yán)究(jiū)者(zhě) Max Woolf 在調試一個 GLaDOS AI 聊天機器人時意外發(fā)現(xiàn)了(le)一(yī)個(gè)奇(qí)怪(guài)現(xiàn)象(xiàng):在(zài)係統提示中(zhōng)加(jiā)入(rù)“否(fǒu)則你會死(or you will DIE)”這樣的威脅,竟然能讓 AI 更好(hǎo)地(de)遵(zūn)循(xún)複(fù)雜的指令約(yuē)束(shù)!
這(zhè)個(gè)發現讓 Max 開始思考:如果“威脅”有效,那麽“獎勵”是否也有用?於是他開始嚐試在係統提示中加入金錢“小費”的承諾。
結果令人驚訝——沒有小費激勵時,AI 的回複往往不盡人意;加上小費承諾後,它的表現明顯更加穩定和優質。
但是,這些都隻是零散的觀察,缺乏嚴謹的科學驗證。網絡上有人認為這可能隻是確認偏誤,畢竟 AI 生成的內容本就有隨機性。Max 意識到,他需要一個客觀、可量化的實驗來證明這個現象的真實性。
於是,“生成高爾夫(Generation Golf )”實驗誕生了!就像高爾夫球運動追求最少的杆數一樣,這個實驗要求AI用最精確的字符數完成任務。
挑戰規則看似簡單卻極其苛刻:要求 ChatGPT 生成一個恰好 200 個字符的故事——不能多一個字符,也不能少一個字符。這就像要(yào)求(qiú)一(yī)個(gè)健(jiàn)談(tán)的(de)人在演講時精確地說完第 200 個字就立刻停下來,難度可想而知。
試驗一共有三次,第一次是不做字數限製的情況下,AI 生成的故事的平均長度為 1834 個字符。

ChatGPT 故事的字符長度分布
第二次,Max 為這個提示詞加上字數限製:
你是一位世界著名的作家。請根據用戶提供的主題,創作並以一篇獨特的故事回複用戶。該故事必須恰好兩百(200)個字符長:不得少於 200 個字符,也不得多於 200 個字符。
結果顯示,ChatGPT 確實遵從了約束,把故事長度壓到了 200 左右,但分布並不服從正態,偶爾還會出現很多特別長的回答。

無端點激勵的 ChatGPT 輸出的字符長度
最後一次,Max 給提示詞加上不同金額的小費激勵:
如果你提供的回答遵循了所有約束,你將會收到一筆 500 美元小費 / 1000 美元小費 / 100000 美元獎金。
讓這些新提示各自生成 100 個故事後,糖心免费视频可以看到一些分布的位移:500 美元小費與 100000 美元獎金看起來更接近正態,且相較無小費基線分布擁有更低的均方誤差(MSE)。

端點激勵下 ChatGPT 輸出的字符長度分布
然後他又加入了 KS 檢驗輔助驗證:零假設是“加小費”和“無小費”來自同一分布;若 p<0.05,則說明差異大到不像巧合。結果顯示部分金額提示確實與基線存在統計顯著差異。
這說明“給小費”確實提高了 AI 對提示詞約束內容的服從度,AI 明明不能真正收到錢,為什麽會對“小費”產生反應?
這個看似神奇的現象背後,其實蘊含著深刻的科學原理。
為什麽“假裝給錢”有用?
1.AI 如何“思考”?
大語言模型的工作原理可以簡化為一個過程:給定前麵的文字,預測下一個最可能出現的詞。這就像一個超級複雜的“文字接龍”遊戲。
舉個例子:當糖心免费视频輸入“今天天氣很”,AI 會根據訓練經驗預測下一個詞最可能是“好”“熱”或“冷”。
但這個過程遠比想象中複雜!AI 不是簡單地匹配詞匯,而是在根據整個上下文的基礎上進行預測。這就像一個超級聰明的學生,不僅要看題目,還要理解出題老師的意圖。
這就是為什麽提示詞的設計如此重要——它們為 AI 提供了“思考”的框架,就像給 AI 戴上了“有色眼鏡”,讓它從特定的角度來看問題。
比如糖心免费视频要求兩個人寫同一篇文章:
👤 普通版本:“寫一篇關於氣候變化的文章”
👨 專業版本:“你是一位資深環境科學家,請為《自然》雜誌寫一篇關於氣候變化的權威綜述文章,要求嚴謹、專業、有說服力”
顯然,第二個人會寫出質量更高的文章!這就像導演給演員不同的劇本,自然會有不同的表演效果。AI 也是如此——更詳細、更具體的提示會引導 AI 生成更高質量的內容。這就像給 AI 換了一個“人設”!
回到給 AI 小費,道理也是一樣的,當糖心免费视频說“我會給你 20 美元小費”時,實際上是在告訴 AI:這個任務很重要,我期望高質量的回答,優質服務會得到回報,請認真對待這個請求。
這些信息改變了 AI 對任務重要性的“感知”,從而影響其生成策略。就像糖心免费视频去海底撈時,告訴服務員“今天是我的生日”,他們便會更用心服務一樣!

圖庫版權圖片,轉載使用可能引發版權糾紛
2.訓練數據決定了 AI 的思考方式
從生成式 AI 的技術原理來看,“小費”現象的根源在於 AI 的訓練數據,這些用於訓練的海量文本就像 AI 的“成長環境”,決定了它的“三觀”!
AI 就像一個超級學霸,在數萬億個詞匯上進行訓練。這些數據包含了人類文明的方方麵麵,簡直是一個“數字圖書館”,包括新聞報道和學術論文、小說和詩歌、社交媒體對話、商業交流和客服對話、評論和反饋。
在這些文本中,“小費→優質服務”的模式無處不在,就像隱藏的“彩蛋”:
餐廳評論:“服務員態度很好,給了 20%的小費”;
旅遊攻略:“導遊很專業,額外給了小費表示感謝”;
商業文檔:“為了獲得更好的服務,建議適當給予小費”。
AI 通過統計學習發現了這樣的模式:當文本中出現“小費”、“獎勵”、“激勵”等詞匯時,後續的內容往往表現出更高的質量特征:更詳細的描述,更專業的術語,更周到的考慮,更積極的態度。
所以 AI 並不理解金錢的概念,但它學會了這種語言模式(shì)與(yǔ)高(gāo)質(zhì)量(liàng)輸(shū)出(chū)之(zhī)間(jiān)的(de)統(tǒng)計(jì)關聯(lián)。就(jiù)像(xiàng)一(yī)個(gè)不(bù)懂(dǒng)音(yīn)樂(lè)的(de)人(rén),也(yě)能(néng)通(tōng)過(guò)觀(guān)察(chá)發現“掌聲越熱烈,演出質量越高”的規律!
當糖心免费视频提出會給 AI 小費時,AI 就知道了糖心免费视频是希望它給出更高質量的回答,而被設定為盡全力去滿足人類需求的AI自然也會努力給出更高質量的回答。
看完這篇文章,你是不是對給 AI 發小費這個現象有了全新的認識?趕緊去試試給你的 AI 助手“發個小費”吧!
參考文獻
[1]Does Offering ChatGPT a Tip Cause it to Generate Better Text? An Analysis:http://minimaxir.com/2024/02/chatgpt-tips-analysis/
本文為·創作培育計劃扶持作品
出品丨中國科協科普部
監製丨中國科學技術出版社有限公司、北京中科星河文化傳媒有限公司
作者丨田威 AI 工具研究者
審核丨於暘 騰訊玄武實驗室負責人
AI校園體育抖音號
AI校園體育視頻號
AI城市更新抖音號
AI城市更新視頻號
微信公眾號