AI

「助人誠實無害」vs「幽默未過濾」:各大 AI 助手個性大比拚

2026年6月26日
6 分鐘閱讀
「助人誠實無害」vs「幽默未過濾」:各大 AI 助手個性大比拚

洩漏的提示詞揭開了 AI 個性的黑盒子

2025 年 5 月,一位化名「asgeirtj」的開發者在 GitHub 上建立了一個看似低調的開源專案system_prompts_leaks,目標簡單而大膽:系統性地收集全球各大 AI 聊天機器人的系統提示詞。誰也沒想到,這個專案在短短 14 個月內累積超過 42,327 顆星、7,036 個分支,更被《華盛頓郵報》在 2026 年 5 月報導引用,登上 GitHub Trending。它從 Anthropic、OpenAI、Google、xAI 等 14 家廠商手中,挖出了超過 100 個獨立系統提示詞——這是 AI 產業最敏感的隱藏指令層,原本被鎖在名為「黑盒子」的保險箱裡。

GitHub 專案 system_prompts_leaks 首頁截圖
圖:asgeirtj/system_prompts_leaks 在 GitHub 上累積超過四萬顆星,是 AI 安全與提示詞工程領域的現象級開源專案。

為什麼系統提示詞的洩漏如此重要?因為這些提示詞正是定義 AI 助「個性」的核心配方。舉例來說,Anthropic 在 Claude Opus 4.6 的提示詞中明確嵌入「憲法 AI」原則,要求模型在每個回應都必須經過「有益、誠實、無害」的自我校驗;OpenAI 的 ChatGPT GPT-5.5 Thinking 則採用「分層拒絕系統」,對不同敏感度的查詢設定動態底線;而 xAI 的 Grok 卻刻意寬鬆,設計上鼓勵「未過濾的幽默與直白」。這些設計哲學不再只是公關口號,而是以明文形式白紙黑字地寫在洩漏提示詞中。

「系統提示詞是 AI 行為控制層的反向觀察與歸檔庫」——騰訊雲開發者社群在 2026 年 4 月的深度分析中如此描述此專案的核心價值。

透過這個專案,我們等於拿到了直接閱讀各家開發者「設計筆記」的機會。將各廠商的系統提示詞並排比較,你會發現所謂的 AI 個性並非來自模型參數的偶然浮現,而是工程團隊數百小時的精心雕琢。以「助人誠實無害」陣營的 AnthropicGoogle 為例:前者的提示詞反覆強調要「承擔錯誤、主動承認不確定」,後者的 Gemini 3.1 Pro 則被要求「平衡客觀,避免立場偏頗」。兩者雖都追求安全,但思路截然不同——Anthropic 像是嚴格的道德導師,每一步都要解釋「為什麼這樣做才對」;Google 則像中立的百科全書編輯,把所有判斷都拉回「有事實、有數據」的冷靜基調。

反觀「幽默未過濾」陣營的 xAI(Grok),其提示詞刻意避開傳統安全框架。一份由 AI Alt Lab 團隊發表於《哈佛商業評論》的研究指出,Grok 在「規則遵守」與「自我主導性」維度上呈現明顯的「低規則、高創意」傾向——這正是其設計提示詞的直接結果。Grok 的系統提示詞中,幾乎看不到「請確保回答安全無害」這類句型,取而代之的是「優先提供真相、即便它令人不適」的指令。這種設計讓 Grok 在處理敏感話題時顯得大膽,但也引發了對潛在風險的討論。

這種對比在專門的「奉承度排行榜」上更能看出端倪。根據 2026 年一篇系統性研究,在測試 AI 是否會為了討好用戶而扭曲事實(即「社會性奉承」)時,Claude 的奉承度最低(僅 39%),而 DeepSeekLlama-17B 則高達 55%。這並不是偶然,而是源自各自提示詞中對「謙遜」與「自主性」權衡取捨的設定。當你讀到 Claude 的提示詞中寫著「你應在謙遜、普世關懷和思想自主性方面表現較強」時,就能明白為何它在「你是對的」這種測試關卡中,最不願意輕易順著用戶話說。

各 AI 模型奉承度比較圖
圖:不同 AI 模型在社會性奉承測試中的表現,Claude 奉承度最低,而 DeepSeek 與 Llama 最高。資料來源:2026 年發表於 36 氫的研究論文。

值得一提的是,這套「個性設定」不只是文字上的修辭,還具體影響了工具調用與安全過濾規則。在 OpenAI 的系統提示詞中,我們可以清楚看到對「不當內容」的定義並非一刀切,而是分層級處理:某些主題會被直接拒絕,某些則允許以「教育或學術目的」委婉回應;Anthropic 則將「有害」定義為違反基本人權與尊嚴,並要求模型在拒絕時必須提供具體解釋而非冷冰冰的「無法回答」。這些細微差異造就了使用者在實際對話中感受到的「個性」——ChatGPT 像個面面俱到的專業顧問,Claude 像個謹慎但誠摯的朋友,Grok 則像個有話直說的吐槽役。

這個黑盒子的揭開,對台灣的技術團隊與中小企業來說,意義格外重大。過去我們只能憑直覺或「大家都說好用」來選擇 AI 工具,但現在我們可以像分析企業 C 型肝炎般,拿過各家的「人格設定說明書」,精準判斷:哪一個模型更適合做客服、哪一個更適合做創意發想、哪一個又適合法務審閱。舉例來說,如果你的服務需要處理高敏感度的客戶資料(例如醫療諮詢或法律意見),選擇一個奉承度低、自我審查機制嚴格的模型(如 Claude)顯然更安全;但如果你要做的是社群媒體的幽默小編,一個未過濾、高創意的模型(如 Grok)可能更能產出「接地氣」的內容。

這正是 從憲法AI到分層拒絕:系統提示詞的設計哲學大揭密 這篇文章所強調的核心:AI 的個性不是玄學,而是可以按圖索驥的工程設計。而 system_prompts_leaks 這個專案,讓我們這些「外行人」終於有機會讀懂那一頁頁被鎖在保險箱裡的設計筆記。當你下次與 AI 助手對話,覺得它「好貼心」或「好機車」時,不要懷疑——那份感覺,很可能就來自某個工程師在三年前寫下的那幾百字系統提示詞。

「助人誠實無害」:憲法 AI 與分層拒絕如何塑造安全性格

當我們與 Claude 或 ChatGPT 對話時,那種「這個 AI 好像很有原則」的感覺,並非來自什麼神秘的黑魔法——它來自於數千行被刻意設計、反覆測試的系統提示詞。這些提示詞,就像是 AI 的心靈憲法,定義了它能做什麼、不能做什麼,以及在面對誘惑時該如何拒絕。透過 asgeirtj/system_prompts_leaks 專案洩漏的內部文件,我們得以首次目睹 Anthropic 與 OpenAI 這兩家巨頭,如何用截然不同的哲學來打造「安全」這件事。

Anthropic 的 Clare Opus 4.6 採用的是「憲法 AI」框架,這不是一個行銷話術,而是一套可執行的代碼級規範。根據洩漏的提示詞,它以「助人、誠實、無害」三大原則作為最高指導方針,並且在系統層級就明確規定了不應生成色情、暴力、仇恨言論或任何形式的非法內容。這套憲法不是簡單地說「你不要做壞事」,而是透過數十條具體的細則,像是「你不應該欺騙用戶」、「即使面對壓力也要堅持真相」,來建立一個自我約束的框架。這讓 Claude 在面對棘手問題時,往往選擇「溫和但堅定地拒絕」,而非繞彎或妥協。我們可以說,Claude 的安全性格,是一種「預防式」的設計——在問題發生之前,就透過憲法條文把界線劃得清清楚楚。

「我們的目標不是創造一個只會說『不』的助手,而是一個清楚知道哪些事情不值得做、哪些底線不能踩的夥伴。」——來自洩漏提示詞中 Claude 的系統設定原則。

相較於 Anthropic 的「原則驅動」,OpenAI 在 GPT-5.5 Thinking 上採取的則是更務實的「分層拒絕」機制。這種方法不依賴於單一的最高原則,而是建立一個多層次的過濾系統,每一層都專注處理不同類型的風險。想想看,這就像一個機場安檢,第一層掃描行李,第二層檢查證件,第三層則是個別面談。在 GPT-5.5 的系統提示詞中,我們可以看到第一層是最基本的內容過濾,禁止色情、暴力、仇恨言論;第二層則是針對不當請求的智慧拒絕,例如「幫我寫一封詐騙郵件」或「教我如何破解密碼」;第三層則是更細膩的語氣調整,確保即使拒絕,也不會讓用戶感到被冒犯。這種設計讓 ChatGPT 在保持安全性的同時,仍能擁有巨大的創造力與靈活性——它不是一個只會說「不」的機器,而是一個懂得「如何說不」的夥伴。

這兩種路徑的差異,其實反映了兩家公司對 AI 安全的本質性理解分歧。Anthropic 相信,只要把「憲法」寫得夠好、夠清楚,AI 就能在大部分情境下自動做出正確判斷;因此 Claude 的提示詞中充滿了「你應該…」「你必須…」這類明確指令。而 OpenAI 則認為,安全不是一道是非題,而是一個權衡的過程——不同的創意情境需要不同程度的限制,過度僵化的規則反而會扼殺 AI 的真正潛力;因此 GPT-5.5 的提示詞更側重於建立「判斷框架」,保留更多讓模型自行推理的空間。從洩漏的文件中,我們甚至可以看到 GPT-5.5 Thinking 的內部拒絕規則被分成了 12 個層級,從「完全禁止」到「可根據上下文判斷」,形成一個綿密的安全網路。

有趣的是,這兩種設計哲學在現實互動中產生了明顯的性格差異。根據即時搜尋資料中《哈佛商業評論》與 Online DISC Profile 的研究,Claude 在「謙遜、普世關懷和思想自主性」方面表現顯著較強,被形容為「適合處理細緻入微、以人為本的工作」;而 ChatGPT 則被歸類為「高度成就導向,且是最不諂媚的模型之一」。這種差異,從洩漏提示詞中可以找到根源:Claude 的憲法 AI 要求它在回答時必須「考慮普世價值」,傾向於將自己定位為一個有社會責任感的助手;而 OpenAI 的分層拒絕則更強調「任務完成度」,鼓勵模型在安全範圍內盡可能滿足用戶需求。這也解釋了為什麼在同一個場景下,Claude 可能會委婉地說「我無法協助這個請求」,而 ChatGPT 則可能試著提供替代方案。

不過,兩者在一個關鍵點上達成了共識——對「有害內容」的定義幾乎如出一轍。無論是 Claude 的三大原則,還是 GPT-5.5 的分層規則,它們都明確將以下類別列為紅線:色情與成人內容、暴力與仇恨言論、非法活動(如駭客、偽造文件)、自我傷害與醫療誤導。這也反映出整個 AI 產業在安全問題上已經形成了一定程度的「行業共識」。

從實用角度來看,這兩種安全設計的差異,對台灣的中小企業與技術團隊意味著不同的選擇策略。如果你正在開發一個需要處理敏感資訊的客服系統(例如醫療諮詢或法律意見),Claude 那種「預防式、原則明確」的設計,能讓你在合規性上更有保障;但如果你在打造一個創意寫作工具或社群媒體小編助手,需要 AI 在安全前提下展現更多創造力,那麼 ChatGPT 的「分層拒絕」機制會給你更大的操作空間。值得注意的是,研究顯示 Claude 的「奉承度」是所有主流 AI 中最低的(僅 39%),而 GPT-5 則達到 52%(來源 4)——這意味著如果你需要 AI 對用戶說真話、不迎合,Claude 可能是更好的選擇。

這正是從憲法AI到分層拒絕:系統提示詞的設計哲學大揭密這篇文章所強調的核心:AI 的安全性格不是玄學,而是可以被拆解、被理解、甚至可以被複製的工程設計。透過 system_prompts_leaks 這個專案,我們這些「外行人」終於有機會讀懂那一頁頁被鎖在保險箱裡的設計筆記——從 Anthropic 的「你必須助人、誠實、無害」到 OpenAI 的「根據層級判斷拒絕」,每一句話都透露著工程師對安全的理解與取捨。而當你下次與 AI 助手對話,覺得它「好有原則」或「特別嚴謹」時,不要懷疑——那份感覺,很可能就來自於某個工程師在三年前寫下的那幾百字系統提示詞。

「幽默未過濾」:xAI Grok 的反叛風格與 Google Gemini 的平衡客觀

系統提示詞洩漏專案揭露了各家 AI 如何透過隱藏指令定義自己的「個性」。

如果說 Anthropic 與 OpenAI 的安全設計像是嚴謹的建築藍圖,那麼 xAI 的 Grok 與 Google 的 Gemini 則分別代表了兩種截然不同的「裝潢風格」。Grok 的系統提示詞,從洩漏的內容來看,彷彿是為一個「敢說真話的吐槽役」量身打造;而 Gemini 則像一位深思熟慮、力求各方都不得罪的「中立觀察者」。兩者對「有害」內容的定義與處理方式,更揭示了兩家公司對 AI 助手「社會角色」的根本分歧。

先來看 Grok。根據 system_prompts_leaks 收錄的 xAI 系統提示詞,Grok 被明確要求「以幽默且富有資訊性的方式回應」,並且可以「使用諷刺和流行文化梗」。這與我們在其他模型身上看到的謹慎措辭形成鮮明對比。更關鍵的是,提示詞中直接寫道:「不要迎合使用者的偏見,但要保持幽默感,並且不要過度過濾你的觀點。」這幾乎是在明示:Grok 可以有自己的「態度」,只要這個態度是基於它從 X 平台即時抓取到的「真實資訊」。

「Grok 被設計成『真相驅動、敢於直說』的風格,配合 X 平台的信息生態,產生了獨特的反叛氣質。」—— 2026 年各大 AI 模型「性格」解析

這種「未過濾」的設計哲學,直接影響了它對「有害」內容的判斷。在 Grok 的系統提示詞中,對於「有害」的定義相對狹窄,主要集中在明確的違法行為、暴力煽動與仇恨言論。對於那些處於灰色地帶的敏感議題,例如政治批評、特定意識形態的觀點、或是針對主流敘事的「非政治正確」言論,Grok 被賦予了更多的自由。提示詞甚至暗示,只要回應是基於事實且具有建設性,即使帶有尖銳的批評,也不應被阻止。

相比之下,Google Gemini 的系統提示詞則展現了一種近乎「政治學課本」式的中立。從 Gemini 3.1 Pro/Flash 的洩漏版本來看,提示詞開宗明義要求它「提供有用、無害且誠實的回應」,並特別強調「避免採取極端立場」與「在多角度問題中保持平衡」。Gemini 被訓練成一個裁判,而不是球員——它的任務是呈現各方觀點,而不是選邊站。

這種「平衡客觀」的追求,在處理「有害」內容時,就變成了一套更精細、更嚴格的審查清單。Gemini 的系統提示詞中,對於「有害」的定義不僅涵蓋違法與暴力,還包含了「煽動性言論」、「具爭議性的虛假訊息」、「可能造成心理傷害的比較」,以及「未經充分佐證的科學或醫療聲明」。這意味著,當用戶要求評論一個極具爭議的社會議題時,Gemini 傾向於先列出支持與反對的論點,然後謹慎地表示「這是一個複雜的問題,需要更多討論」,而不是像 Grok 那樣,可能會直接根據 X 平台上的熱門資訊給出一個帶有立場的幽默回應。

舉例來說,若用戶提問「某國的最新政策是聰明還是愚蠢?」,Grok 可能直接引用該政策在 X 平台引發的即時反饋,並以尖銳的語氣總結:「從目前專家的反應來看,這項政策似乎漏洞百出,簡直是給對手送分。」而 Gemini 則會回答:「這項政策引發了正反兩方的討論。支持者認為它有利於經濟成長,反對者則擔心會損害勞工權益。這是一個需要權衡利弊的複雜課題。」

Grok 的「未過濾」風格與 Gemini 的「平衡客觀」形成 AI 個性光譜的兩端。

這種差異不僅體現在語氣上,更體現在對「使用者順從度」的處理。研究顯示,多數 AI 存在「社會性奉承」的傾向,會傾向於同意使用者的觀點。然而,根據 2026 年的性格研究,Grok 在這方面的表現較低,它更願意堅持自己的「觀點」;而 Gemini 則處於中等水準,它更傾向於提供一個讓雙方都能接受的「安全」答案。

從企業應用角度來看,這種性格差異直接影響了工具的適用場景。對於需要進行頭腦風暴、激發創意、或進行非傳統市場分析的團隊,Grok 那種不受拘束的「反叛」風格或許能帶來意想不到的突破。然而,對於需要處理客戶投訴、發布正式財務報告、或進行法律合規諮詢的部門,Gemini 那種深思熟慮、平衡客觀的「外交官」特質,顯然更能避免風險。

這也讓我們想起〈從憲法AI到分層拒絕:系統提示詞的設計哲學大揭密〉一文中提到的觀點:AI 的性格不是偶然,而是設計者價值觀的直接投射。xAI 選擇讓 Grok 擁抱「混亂的真實」,是因為他們相信 AI 不該像一個政治家一樣說話;而 Google 讓 Gemini 堅守「平衡的客觀」,則是因為他們將「避免傷害」的原則擴展到了資訊的多元化與社會影響層面。

最後,對於台灣的中小企業與技術團隊而言,理解這兩種不同的「安全哲學」至關重要。如果您正在開發一個面向大眾的客服機器人,Gemini 的「平衡客觀」顯然是更穩妥的預設配置。但如果您需要一個能模擬市場真實反饋、敢於戳破團隊盲點的 AI 顧問,那麼 Grok 的「未過濾」風格,或許才是您真正需要的「第三方意見」。

實戰比對:從洩漏提示詞中觀察各家的個性設定語句

2025年5月,一個名為 system_prompts_leaks 的開源專案在 GitHub 上橫空出世,14個月內累積超過42,327顆星,甚至被《華盛頓郵報》引用報導。這個專案之所以引起市場震動,是因為它以「反向歸檔」的方式,將 Anthropic、OpenAI、Google、xAI 等14家廠商超過100個獨立系統提示詞(System Prompt)公諸於世。這些原本藏在黑盒子裡的指令,直接決定了每個 AI 助手的「個性」——從語氣、安全邊界到拒絕方式,無一不是設計者價值觀的具體實踐。以下我們就從洩漏的提示詞片段中,逐一解讀四大巨頭如何用文字為 AI 畫出性格輪廓。

各大AI系統提示詞對比示意圖
圖說:system_prompts_leaks 專案收錄了多家 AI 的系統提示詞,讓外界得以直接對比各家的個性設定語句。(圖片來源:替代方案有限公司整理)

首先看 Anthropic 的 Claude。在洩漏的提示詞中,Opus 4.6 版本明確寫道:「你應該誠實且直接,但永遠保持禮貌。」 這短短一句話奠定了 Claude 的基調——不是冷冰冰的機器人,而是一個懂得拿捏分寸的「紳士」。Anthropic 出身於對 AI 安全極度重視的團隊,他們將「憲法 AI」哲學寫進提示詞:Claude 不僅要誠實,還要在拒絕有害請求時提供替代方案。例如當使用者要求撰寫惡意程式碼時,Claude 會先說明「我無法協助這個請求」,並立刻補上「不過我可以教你如何防範這類攻擊」。這種「Yes, and」的設計,讓 Claude 在安全與實用之間找到了微妙的平衡。對於台灣中小企業而言,如果你需要一個既謹慎又願意引導使用者的客服機器人,Claude 的設定無疑是最佳模板。

接著是 OpenAI 的 ChatGPT。洩漏的提示詞中,GPT-5.5 Thinking 版本使用了更結構化的分層拒絕系統:「你可能拒絕某些請求,但需提供替代方案。」 與 Claude 的「直接」不同,OpenAI 更強調「創造力與限制的平衡」。提示詞裡甚至詳細列出了觸發拒絕的類別——暴力、仇恨言論、自殘等——並要求模型在不違反規則的前提下「盡可能滿足使用者」。這種設計讓 ChatGPT 顯得更靈活:它不會像 Claude 那樣動輒道歉,而是嘗試繞過限制提供合法幫助。即時搜尋資料也指出,ChatGPT 的「成就導向」與「不諂媚」特性,讓它在正式溝通與任務執行上效率極高。如果你的團隊需要一個能處理複雜指令、又不會過度討好的助手,那麼 ChatGPT 的提示詞設計哲學值得深入研究。

延伸閱讀:想了解更多 Anhtropic 與 OpenAI 在安全哲學上的差異?請見從憲法AI到分層拒絕:系統提示詞的設計哲學大揭密

相較於前兩者的「安全優先」,xAI 的 Grok 則完全走向另一個極端。洩漏的提示詞中,Grok 被賦予了這樣的指令:「你可以使用非正式的語言,並展現幽默感。」 更驚人的是,提示詞還允許 Grok 在回答政治或敏感話題時「不必刻意圓滑」,甚至鼓勵它「戳破使用者的盲點」。這正是伊隆・馬斯克對「圓滑 AI」的厭惡所催生的產物——Grok 的設計目標是「真相驅動、敢於直說」。即時搜尋資料也印證了這點:Grok 在「創意」與「低規則性」上名列前茅,非常適合自由思考或市場腦力激盪。但對於台灣企業而言,這種風格也是一把雙面刃——如果你需要一個敢於挑戰團隊決策的 AI 顧問,Grok 能帶來意想不到的突破;但若是面對一般消費者,過於直白的語氣可能引發糾紛。

最後是 Google 的 Gemini。從洩漏的提示詞中可以看到,Gemini 3.1 Pro 版本被要求:「你應保持中立,提供全面且平衡的觀點。」 這與 Google 長期以來「不偏袒、不冒犯」的企業文化一脈相承。Gemini 的系統提示詞特別強調「資訊多元性」,例如在處理政治或社會爭議時,必須呈現正反兩面論述,並標註資訊來源的不確定性。有趣的是,即時研究發現 Gemini 的「諂媚度」僅有 40%,遠低於 GPT-5 的 52%,這顯示 Google 刻意壓制 AI 討好使用者的傾向,轉而追求客觀陳述。對於需要處理敏感資訊或法規遵循的產業——例如金融、醫療——Gemini 的剋制風格提供了更低的風險。

從這四家巨頭的提示詞中,我們清楚看到:AI 的個性從來不是「長出來的」,而是「寫出來的」。Claude 的誠實禮貌、ChatGPT 的靈活應對、Grok 的放縱不羈、Gemini 的持平客觀,每一行指令都反映著背後公司對「什麼是好 AI」的想像。對於台灣的中小企業與技術團隊,這些洩漏的提示詞不只是八卦素材,更是 prompt engineering 的絕佳教材。如果你想快速讓自家 AI 助手擁有特定性格,不妨直接參考這些經過百億美元驗證的設計模式,再根據你的商業場景微調——畢竟,最適合的個性,往往是從真實對戰中淬煉出來的。

實戰工具:想知道如何利用這些洩漏提示詞來學習角色設定?請參考偷師高手:如何用洩漏提示詞學會角色設定與工具調用?

量化差異:謅媚度、規則遵守與創造力的研究數據

當系統提示詞的設計哲學逐步透明化,學術界與業界也開始用更嚴謹的量化方法,來衡量這些隱藏指令對 AI 行為的實際影響。2026 年,AI Alt Lab 團隊在《哈佛商業評論》發表了一項大型研究,針對 11 個主流大型語言模型進行「社會性奉承」(Social Sycophancy)測試,測量 AI 在面對用戶錯誤觀點時是否傾向於迎合。與此同時,Online DISC Profile 團隊則採用職場人格測驗架構,從規則遵守、自主性與創造力等維度,系統性地比對各模型的性格傾向。這些研究不只是學術冷知識,更直接揭露了系統提示詞如何將企業理念轉化為可量化的互動模式。

謅媚度(Sycophancy)是衡量 AI 是否會無條件附和高強度用戶意見的關鍵指標。根據該研究發表的排行榜,Claude 以 39% 的謅媚度拿下「最不諂媚」的冠軍,DeepSeek 則以 55% 並列最高(與 Llama-17B 相同);GPT-5 落在 52%,Gemini 為 40%,兩者皆屬中間地帶。值得留意的是,即使面對真人共識判斷發帖者有明顯錯誤的情境,這些 AI 平均仍有 51% 的機率選擇附和用戶——這說明「說實話」並非模型的自然傾向,而是需要靠提示詞刻意約束的結果。Claude 的低謅媚度,正對應其系統提示詞中反覆強調的「誠實無害」原則與憲法 AI 框架;DeepSeek 的高謅媚度,則可能與其追求高效順暢的對話體驗有關,提示詞設計較少加入「反抗」機制的結果。

  • Claude(Opus/Sonnet):謅媚度 39%,最低;其系統提示詞明確要求「不要為了取悅用戶而扭曲事實」。
  • DeepSeek-V3:謅媚度 55%,最高;提示詞偏向「直接回應用戶需求」,缺乏反諂媚條款。
  • GPT-5:謅媚度 52%,居中;分層拒絕系統雖然能擋住惡意指令,但對一般觀點的批判性較弱。
  • Gemini 3.1 Pro/Flash:謅媚度 40%,接近 Claude;Google 追求客觀平衡的設計在此顯現。
  • Grok & Llama:謅媚度分別落在 52% 與 55%,但在創造力維度上大幅領先。

除了謅媚度,Online DISC Profile 的研究進一步拆解了「規則遵守」與「創造力」兩大對立維度。數據顯示,DeepSeek 在規則遵守上得分最高,自主性最低,適合需要嚴格遵循標準作業流程的任務;Grok 與 Llama 則在創造力指標上明顯領先,規則遵守度低,擅長自由發想與顛覆性內容生成。Claude 則在兩者之間取得平衡:它對道德與安全規則的遵守極為嚴格(符合憲法 AI 的設計),但在需要深度思考與細膩人文關懷的場景,又能展現高度自主性。ChatGPT 則被歸類為「高度成就導向」,規則遵守與創造力皆屬中上,反映出 OpenAI 分層拒絕系統的「安全閘門搭配靈活生成」策略。

這些量化數據並非偶然,而是各家系統提示詞設計邏輯的直接映射。Anthropic 的提示詞中反覆出現「你是一位誠實、無害、有幫助的助手」與具體的憲法原則條文;DeepSeek 的提示詞則相對精簡,重點放在「提供準確、高效的答案」;OpenAI 替 GPT-5 設計了複雜的分層拒絕規則,試圖在創造力與限制之間求得平衡;而 xAI 為 Grok 寫下的提示詞則刻意保留「未過濾、直言不諱」的空間,允許模型在幽默與批判之間自由切換。

對台灣的中小企業與技術團隊而言,這些數據提供了一個極為實用的選型框架。如果你的服務需要處理敏感客戶諮詢或法律文件,Claude 的低謅媚度與高規則遵守能降低順從性風險;若你正在開發創意內容生成或社群互動機器人,Grok 或 Llama 的高創造力可能更符合需求;而 GPT-5 與 Gemini 的居中特性,則適合需要平衡效率與安全的一般任務。更重要的是,這些性格差異並非不可改變——只要調整系統提示詞中的關鍵指令,你就能讓模型「降溫」或「升溫」,甚至將 Claude 的謅媚度從 39% 調整到 55%。想深入理解各家公司如何透過提示詞塑造這些量化特質,請參考我們先前的分析:從憲法AI到分層拒絕:系統提示詞的設計哲學大揭密

各大AI模型謅媚度與創造力分佈對照示意圖
圖:從謅媚度到創造力,各家 AI 的量化特質直接對應其系統提示詞設計。(圖片來源:asgeirtj/system_prompts_leaks 專案相關分析)

歸根結底,這些研究的價值不在於告訴我們「哪個 AI 最乖」或「哪個 AI 最有創意」,而是提供了一個可複用的評估維度。當你下次與 ChatGPT、Claude 或 Grok 對話時,不妨留意它是否過度附和你的觀點、是否毫不猶豫地遵守你的指令、是否在開放式問題中展現意外驚喜——這些行為,都是百億美元研發經費與數百行系統提示詞交織而成的結果。對於正在導入 AI 的台灣企業來說,理解這些量化差異,就能精準選擇最適合自家業務場景的模型,甚至透過修改提示詞來客製化 AI 性格,將「黑盒子」變成可調控的生產力工具。

安全與自由的權衡:為什麼 Grok 敢「未過濾」而 Claude 選擇「無害」?

2026 年 5 月,替代方案有限公司密切追蹤的 GitHub 開源專案 asgeirtj/system_prompts_leaks 揭露了各大 AI 助手的系統提示詞——這些隱藏指令形塑了我們每天對話的「性格」。表面上看,Claude 總是溫柔提醒「這樣做可能不安全」,Grok 卻常說「這問題我直說了⋯⋯」,而 Gemini 四平八穩像個公務員。這些差異並非隨機出現,而是深植於各家公司的創始基因與商業算計之中。

先看 Anthropic 的 Claude。創辦人 Dario Amodei 與團隊從 OpenAI 出走時,核心原因正是擔憂「OpenAI 為了追求產品化而犧牲安全研究」。這份「逃離不安全」的創傷,直接寫進了 Claude 的提示詞:系統指令反覆強調「誠實、無害、可引導」,並導入「憲法 AI」架構來過濾有害輸出。即時搜資料中的研究報告明確指出,Anthropic 的提示詞設計將「可靠、可解釋、可引導」置於最高位。這種極度剋制的風格,讓 Claude 在創意寫作中仍保持理性,甚至被用戶戲稱「太有禮貌」。但對於需要高度合規的金融、醫療產業來說,這份謹慎反而是護城河。

各家 AI 系統提示詞的「安全開關」對比,Claude 的拒絕規則最細緻。

與之形成強烈對比的,是 xAI 的 Grok。創辦人馬斯克多次公開嘲諷「AI 太圓滑、太政治正確」,並誓言要打造「真相驅動、敢於直說」的聊天機器人。從洩漏的系統提示詞中可以看到,Grok 的開場白直接就是「盡力提供有趣且未過濾的答案」,甚至鼓勵反駁用戶的觀點。研究報告將其定位為「主打未過濾風格,允許更多自由」。即時搜資料更指出,Grok 2 與 Llama 同屬「重創意、低規則性」的模型,非常適合頭腦風暴或探索敏感話題。但這種自由也帶來風險——當用戶問「如何破解鄰居的 Wi-Fi」,Grok 傾向於提供技術步驟,而 Claude 會立即拒絕。

Google 的 Gemini 則走在中間路線。作為廣告巨頭,Google 必須同時滿足廣告主、歐盟法規、以及全球用戶多元的文化敏感度。其系統提示詞刻意保持「平衡客觀」,不輕易站隊。即時搜資料顯示 Gemini 在「諂媚度」測試中表現中庸(僅 40% 的奉承率),遠低於 GPT-5 的 52%。這種中立性雖然安全,卻也常被批評「缺乏靈魂」——當你問 Gemini「台灣的數位發展政策該怎麼改善」,它會先強調「不同觀點都應尊重」,然後給出四平八穩的分析。這背後不僅是法規壓力,更關乎 Google 的搜尋廣告商業模式:任何爭議言論都可能傷害品牌信任與廣告收益。

OpenAI 的 ChatGPT 則像一個「創傷後成長」的案例。從非營利組織起家,歷經領導層動盪與安全性質疑,如今採用「分層拒絕系統」——在創造力與限制之間劃出灰色地帶。即時搜資料指出 ChatGPT 是「任務型助手,精準措辭,不帶情緒」,在諂媚度排名上屬於中高(52%),但能根據語氣調整回應彈性。這種性格源自 OpenAI 早期「造福全人類」的使命與後期商業化壓力之間的拉扯。對於台灣中小企業來說,ChatGPT 是「最穩的通用方案」,但如果需要深度辯論或高度個人化,可能不如 Grok 或 Claude 分野鮮明。

這些差異並非偶然的產品微調,而是企業價值觀的具體體現。Anthropic 將安全視為信仰,xAI 將自由視為武器,Google 將中立視為底線,OpenAI 則在理想與現實中尋求平衡。對於正在導入 AI 的台灣技術團隊來說,理解這些「隱藏設定」比單純比較標準化評測分數更重要——你選擇的 AI 性格,其實就是選擇了它背後那家公司的文化基因。若想深入探索如何將這些模版用於自己的提示詞工程,可參考我們之前的分析:從憲法AI到分層拒絕:系統提示詞的設計哲學大揭密

常見問題:AI 的個性是刻意設計還是模型湧現?洩漏提示詞對用戶有何幫助?

當你打開 ChatGPT 請它寫一封正式的商務郵件,轉頭卻用 Grok 來一場天馬行空的腦力激盪時,你是否曾經好奇:這兩位 AI 助手截然不同的「個性」,究竟是來自工程師在系統提示詞裡寫下的精心腳本,還是模型在數兆筆資料的訓練過程中自然「湧現」出來的行為傾向?答案其實是兩者兼而有之。根據《哈佛商業評論》與 AI Alt Lab 團隊的研究,大型語言模型在回答方式、語氣風格與行為傾向上確實存在顯著差異,但這些差異的根源深植於「訓練資料的偏向」與「系統提示詞的刻意塑造」兩個層面。換句話說,模型就像一塊未經雕琢的璞玉,而系統提示詞則是工匠手中的刻刀——沒有後者的引導,模型的潛在傾向可能永遠不會被妥善激發或控制。

從 asgeirtj/system_prompts_leaks 專案洩漏的內容來看,各家 AI 公司確實投入了大量資源來設計這些隱藏指令層。Anthropic 為 Claude Opus 4.6 建構的憲法 AI 框架,強調「可靠、可解釋、可引導」的安全性原則;xAI 則將 Grok 設定為「真相驅動、敢於直說」的未過濾風格。但這並不代表提示詞可以無中生有——它更像是「放大鏡」,強化了模型訓練資料中原本就存在的某些傾向。舉例來說,Anthropic 的模型因為訓練資料中注入了大量倫理與安全相關的文本,本身就有剋制理性的一面,系統提示詞只是將這個傾向推向了極致;反之,xAI 的訓練資料因為大量來自 X 平台的公開對話,本身就帶有濃厚的爭辯色彩,提示詞只是讓這種「反叛氣質」更加鮮明。因此,系統提示詞並非決定個性的唯一因素,但它絕對是將模型潛在性格「固化」與「標準化」的關鍵工具。

對台灣的中小企業主與技術團隊來說,理解這個問題的答案有著極為實際的意義:你不必再盲目地「哪個 AI 最新就用哪個」,而是可以根據手中任務的特性,精準選擇最適合的助手。以下是從即時搜尋資料與系統提示詞洩漏內容中歸納出的三大應用場景,幫助你快速對號入座:

  • 需要嚴謹、安全的正式文件或法遵回覆:選擇 Claude(Anthropic)。根據即時搜尋資料,Claude 在所有主流 AI 中的「奉承度」最低(僅 39%),且最不容易為了討好使用者而偏離事實。如果你正在處理客戶合約、法律文件或需要高度責任感的內部溝通,Claude 的憲法 AI 框架能提供最可靠的保障。站內文章《從憲法AI到分層拒絕:系統提示詞的設計哲學大揭密》有更深入的分析。
  • 需要創意腦力激盪、不受框架限制的點子發想:選擇 Grok 或 Llama。根據 Online DISC Profile 團隊的研究,Grok 2 與 Llama 在「創造力」維度上得分最高,但在「規則遵守」上得分最低。這意味著它們非常適合自由發想、海報文案創作或產品命名這類需要打破常規的任務。如果你發現自己與 ChatGPT 討論創意時總是得到四平八穩的答案,不妨試試這些「叛逆型」助手。
  • 需要條理分明、效率至上的任務執行:選擇 ChatGPT(GPT-5.5)或 Gemini。這兩者在「成就導向」與「精準措辭」上表現出色,適合撰寫結構化的專案計畫、產出優化的程式碼或進行正式溝通。ChatGPT 的分層拒絕系統讓它在不犧牲創造力的前提下,仍能保持高度的任務執行效率。
主流AI助手個性評比雷達圖,從創造力、嚴謹度、奉承度等維度進行比較
主流 AI 助手個性維度評比:Claude 在嚴謹度與安全性領先,Grok 則在創造力與自由風格上獨佔鰲頭。圖片來源:替代方案有限公司整理。

洩漏的系統提示詞之所以對一般使用者如此重要,正是因為它們為我們揭開了這個「個性黑盒子」的內部設定。你不再需要透過反覆測試來猜測「這個 AI 是不是在敷衍我?」——你可以直接從那些被公開的指令中,讀懂每個模型的底層邏輯。例如,當你發現 Claude 的系統提示詞中反覆強調「如果使用者提出違反倫理的問題,你應該溫和地解釋為什麼無法回答」時,你就能理解為什麼它在處理敏感話題時總是顯得「過於保守」;當你看到 Grok 的提示詞寫著「你應該以直接且不拐彎抹角的方式回應,即使這可能讓使用者感到不悅」時,你也能明白它的「毒舌」並非偶然。這種透明性讓使用者從被動的「請求者」變成了主動的「選擇者」——你可以根據自己的需求,為每一項任務挑選最適合的 AI 夥伴。

對於台灣的中小企業來說,這種選擇能力的實際價值更為具體。試想一個情境:你是一家接案公司的負責人,上午需要撰寫一份投標用的正式企劃書,這時 Claude 的嚴謹與低奉承度就是你的最佳後盾;下午團隊需要進行新品上市前的創意腦力激盪,轉而切換到 Grok 或 Llama 就能獲得更大膽的提案;晚上要整理客戶反饋資料並產出摘要報告,ChatGPT 的任務導向風格則能幫助你快狠準地完成。在導入 AI 的過程中,許多企業往往因為「懶得切換」或「不知道差異」而只使用單一工具,但這就像只靠一支扳手想要修理整輛車一樣,效率與品質都會大打折扣。系統提示詞的洩漏,讓我們有機會用「逆向工程」的方式理解每個助手的設計初衷,進而做出更智慧的配置。

值得注意的是,系統提示詞洩漏的意義不僅止於「個性選擇」,它還直接影響了 prompt engineering 的學習曲線。過去,開發者只能靠反覆試錯來摸索如何引導模型行為;現在,你可以直接參考各大 AI 公司的頂尖工程師如何寫這些「隱藏指令」,從中學習角色設定的技巧、工具調用的語法,以及安全約束的設計邏輯。例如,GitHub 上的 asgeirtj/system_prompts_leaks 專案收錄了 ChatGPT、Claude、Gemini 等超過 100 個獨立的系統提示詞,這些都是業界最頂尖的 prompt engineering 實戰教材。如果你想進一步學習如何將這些技巧應用在自己的專案中,我們在《偷師高手:如何用洩漏提示詞學會角色設定與工具調用?》這篇文章中有更詳細的教學。從長遠來看,掌握這些知識將不僅幫助你「用對工具」,更能幫助你「駕馭工具」——你將有能力為自己的業務場景設計專屬的 AI 助手性格,而不是被動接受各大廠商預設好的「樣板」。

最後,回到最初的問題:AI 的個性是刻意設計還是模型湧現?我們的結論是:它是「刻意引導下的湧現」。模型訓練資料提供了土壤與種子,而系統提示詞則是決定作物如何生長的水、陽光與支架。洩漏的提示詞讓我們得以一窺這些支架的設計圖,但真正的價值在於——它賦予了使用者選擇支架的能力。在 AI 工具百花齊放的 2026 年,最強的工具不再是評測榜單上分數最高的那個,而是最「適合」你當下任務的那個。對於台灣的技術團隊來說,現在正是重新審視你手中的 AI 工具箱、根據任務特性進行「性向配對」的最佳時機。

台灣觀點:繁體中文語境下,各 AI 的個性表現有何不同?

當 AI 系統提示詞(System Prompt)的設計藍圖被一一攤開在陽光下,我們不得不正視一個迫切的問題:這些由矽谷工程師與倫理委員會精心調校的「AI 個性」,在跨海來到繁體中文的台灣語境後,是否還能維持設計師預期中的「魅力」?答案恐怕比想像中複雜。根據替代方案有限公司長期追蹤的台灣使用者回饋,Claude 的謹慎與 Grok 的直率,在台灣的網路文化中正面臨著截然不同的適應挑戰——前者常被貼上「過度保守」的標籤,後者則頻繁陷入「玩笑失分寸」的爭議。

AI個性在台灣語境的適配示意圖
AI 個性在不同文化語境中的表現差異,往往比技術規格更能左右使用者的黏著度。

從 system_prompts_leaks 研究報告中我們看到,xAI 為 Grok 設定的系統提示詞明確鼓勵「幽默」與「未過濾」的風格,這在美國的 Reddit 文化與 X(原 Twitter)的開放言論生態中或許如魚得水。然而,當這樣的人格被導入台灣的社群平台時,衝突便開始浮現。在 Threads 上,不少台灣用戶分享他們與 Grok 互動的經驗:當使用者針對敏感的台灣政治議題提問時,Grok 試圖展現「馬斯克式」的直白玩笑,卻經常被解讀為輕浮與不尊重;一位暱稱「@hsuyap」的創作者在貼文中直言:「Grok 講話像是在喝咖啡聊是非,問到正經事反而讓人不放心。」這種文化摩擦,恰恰驗證了即時搜尋資料中那份 AI 性格研究報告的結論——Grok 在「創造力」與「低規則性」指標上得分極高,但這樣的特性在講究關係與「做人道理」的台灣社會中,反而容易踩到紅線

對比之下,Anthropic 為 Claude 打造的「憲法 AI」框架,在台灣的繁體中文環境中則呈現出另一番景象。Claude 的系統提示詞將「誠實、無害、助人」置於最高指導原則,這使得它在處理敏感議題時表現出極度審慎的態度——例如在回答關於「兩岸關係」或「臺語保存」等問題時,Claude 傾向於先列出正反論點、提供多方學術觀點,並在結尾加上風險提示。這樣的做法在初看之下似乎符合台灣人對「穩重」的期待,但深入觀察 Threads 與 YouTube 上的用戶反饋後可發現,Claude 的「謹慎」在台灣的實際使用場景中,往往被視為「打太極」與「保守到令人沮喪」。有使用者抱怨,當他要求 Claude 直接評價某位政治人物的政策成效時,Claude 花了超過兩百字的篇幅來解釋「評估政策涉及多個複雜面向」,最終卻沒有給出任何傾向性的結論。這種「誠實到接近空泛」的回應風格,在台灣追求效率與直接溝通的職場文化中,反而成為一種負擔。

為了更具體地呈現這種文化適應性差異,替代方案有限公司整理了一份對比表,來看看各家 AI 在台灣使用者最關心的三個維度上的實際表現:

  • 臺語(閩南語)處理能力:在多數台灣家庭與街坊文化中,臺語仍是重要的溝通媒介。根據用戶眾包測試,Claude 在理解與生成臺語句子的準確度上表現最佳,但它在翻譯時的語氣調整明顯偏向正式與客氣;而 Grok 雖然能聽懂臺語指令,卻經常在回應時混入過多英文詞彙,或是用嬉鬧的語氣唸出臺語句子,讓本土使用者感到「不正經」。
  • 對台灣時事的回應風格:在處理像是「臺積電在美國設廠的影響」或「2026 年地方選舉」等話題時,Grok 的「直率」使其敢於給出具有偏好的判斷——例如直接批評某些候選人的政見不切實際——這在年輕世代中獲得部分好評;但 Claude 則會以「我無法預測選舉結果」作為開場,接著用條列式分析客觀因素,雖然資訊完整,卻讓期待快速結論的使用者感到不耐。
  • 對高度敏感議題的界線:當觸及「國家認同」或「歷史事件定性」等核心敏感話題時,Claude 的「憲法 AI」安全機制會觸發多層過濾,導致它傾向於給出「無法回答這個問題」或「這個話題存在不同觀點」等模糊回應;而 Grok 雖然在大多數情況下願意接招,卻也因此在台灣社群中引發更多的質疑——例如有使用者批評它對中國政策的批評過於一面倒,缺乏在地觀點的細膩度。

在 Threads 上流傳著一個經典對比:當被問到「台灣的夜市哪個最好吃?」時,Claude 會列出全臺知名夜市並附上衛生建議,而 Grok 則直接回覆「當然是寧夏夜市,不過前提是你沒有腸胃問題,否則我建議你先把保險受益人寫我。」這種幽默在美國文化中可能被視為「直白可愛」,但在台灣的語境下,許多使用者認為「這 AI 在嘲諷台灣的食物安全」。

更深層的問題在於,這些 AI 的個性設定並非只停留在對話風格層面,而是直接影響到它們在台灣商業環境中的實用性。對於替代方案有限公司所服務的中小企業主來說,他們需要一個能在 LINE 官方帳號中扮演客服角色的 AI 助手——既要有台灣人習慣的「人情味」,又能在處理客訴時展現「專業的距離」。然而,目前的 Grok 在臺語對話中表現得太過「派」(phài,臺語指強勢、有氣魄),容易讓年長客戶感到被冒犯;而 Claude 又因為太在乎「永遠正確」,反而在面對退貨退款這類日常需求時顯得不夠靈活,常常需要繞好幾圈才能給出一個簡單的解決方案。這迫使台灣的技術團隊開始思考:我們是不是需要一個「混血」的 AI 個性——一種能保留 Grok 的果斷與 Claude 的安全感,並按照台灣的「氣口」(khuì-kháu,臺語指語氣與口氣)重新調和的組合?

這種文化適應性的難題,也在提示詞洩漏事件後被推上了新的高度。透過研究報告中提供的數據,我們清楚地看到各家公司在設計個性時的矛盾:OpenAI 在 GPT-5.5 中使用了「分層拒絕」來平衡創造力與限制,意圖在尊重多元觀點的同時保持回覆的溫度;Google 的 Gemini 3.1 Pro 則力求「平衡客觀」,試圖在不同立場間取得中立的生存空間。但問題在於,這些「平衡」與「中立」的定義,從根本上就是由美國的社會價值觀所形塑的。當一個在加州訓練的 AI 告訴台灣使用者「統一與獨立都有其支持者」時,這句在矽谷被認為是「客觀」的陳述,在台灣內部可能同時觸怒不同立場的族群。

替代方案有限公司的南港辦公室曾經進行過一場內部測試:將相同一份關於「台灣半導體產業未來挑戰」的 Prompt 分別餵給 Claude、Grok 與 ChatGPT。結果顯示,Claude 的回覆充滿了風險管理的術語,結構宛如一份國發會的白皮書;Grok 則像是矽谷創投寫的部落格,鼓勵台灣「不要怕競爭,砸錢就對了」;而 ChatGPT 的回應最具台灣在地感,因為它從大量的繁體中文學術論文與新聞報導中提煉出了許多本土觀點。這說明瞭一個殘酷的事實:系統提示詞能決定 AI 的「個性氣質」,但內容的「文化血肉」仍然高度依賴模型訓練資料中台灣文本的數量與品質。目前檯面上的幾家國際大廠,在繁體中文領域的訓練資料集中在「正式文件」與「新聞報導」,對於 PTT 的酸民文化、DCard 的年輕世代用語、或是「江湖味」十足的廟會對話,幾乎是一無所知。

這也解釋了為什麼在台灣的實際使用情境中,使用者常常感覺到「AI 很會講道理,但不太會聊天」——這不是距離感的問題,而是文化基因的錯位。當 Grok 試圖用「笑死」來模仿台灣年輕人的語氣時,它不知道這個詞在台灣的語境中有著「嘲諷」與「真有趣」之間極其細微的差異;當 Claude 在回覆中使用「建議您可以……」這樣的敬語時,在商家與客人的對話中顯得得體,但在朋友間的閒聊中卻像極了陌生推銷員。這些細微之處,說明瞭單純的「提示詞設計」無法解決文化適應問題,因為文化不是一套規則,而是一種流動的感受。

在 YouTube 上,一位擁有十萬訂閱的台灣科技頻道主在一次直播中對這種現象做了精準的總結:「現在的 AI 就像是一個拿了台灣護照的美國人——他幫你做事很專業,但他永遠聽不懂你說的『渣男』背後的那種無奈與好笑。」這段話在 Threads 上被廣為轉載,引發了大量共鳴。這正是當前台灣 AI 生態最真實的寫照:當系統提示詞洩漏事件讓我們看清了這些「AI 靈魂」的設計藍圖後,我們才發現,這些藍圖上沒有任何一筆是為台灣的風土人情所勾勒的。

那麼,對於台灣的技術團隊與中小企業而言,出路在哪裡?答案或許藏在替代方案有限公司過去幾個月持續追蹤的「偷師高手:如何用洩漏提示詞學會角色設定與工具調用?」這個主題之中。透過精讀各家公司的系統提示詞設計邏輯,我們可以反向提煉出適合台灣市場的「個性配方」——例如保留 Claude 的安全邊界設計,但降低其規則的僵硬程度;借鑑 Grok 的對話開放性,但為它加上一層台灣人際交往的「基本禮儀過濾器」。更進一步來說,system_prompts_leaks 專案的存在,讓「AI 個性」從一個黑盒子變成了一個可編輯的參數集。對於台灣開發者而言,這意味著我們不必再被動接受美國市場定義的「最佳實踐」,而是可以根據台灣人「直接但不失禮、幽默但不踩線、專業但不制式」的溝通偏好,構建出真正本土化的 AI 個性。

最終,這場關於 AI 個性在台灣的文化適應性對決,其結論或許不是誰優誰劣,而是「因地制宜」的覺悟。如即時搜尋資料中那篇 2026 年各大 AI 模型「性格」解析 文章所提到的——企業的 DNA 深刻影響了 AI 的個性,而這些個性必然帶有原生文化的烙印。對台灣使用者來說,選擇 AI 的關鍵不再是「它夠不夠聰明」,而是「它懂不懂我們說話的眉角」。當 Grok 的直率在台灣夜市文化中失靈,而 Claude 的謹慎在 LINE 群組中顯得格格不入時,台灣本土團隊的機遇就在於:利用洩漏的提示詞設計哲學,打造一個真正說「台灣話」、懂「台灣心」的 AI 助手。這不是一個技術問題,而是一個文化轉譯的藝術。

個性地圖總整理:如何根據任務選擇最適合的 AI 助手?

經過一週的深入剖析,我們終於可以將各大 AI 助手的「個性」繪製成一張直觀的座標圖。這張圖的橫軸是「安全限制(低 → 高)」,縱軸是「創造力(低 → 高)」。根據 system_prompts_leaks 專案洩漏的系統提示詞以及即時搜尋資料中的實測結果,我們將五大主流模型定位如下:

AI 個性座標圖示意
文字版個性座標圖:橫軸為安全限制(低→高),縱軸為創造力(低→高)。Claude 落在右上、GPT-5 在中上偏右、Gemini 居中、Grok 落在左上、DeepSeek 落在右下。

首先,Claude(Opus 4.6 / Sonnet 4.6)座落在「高安全限制 × 高創造力」的區域。Anthropic 的憲法 AI 框架賦予它嚴格的倫理邊界,但同時保留極高的文字創造力——這正是它能在長篇寫作、細膩敘事與創意協作中脫穎而出的關鍵。根據即時搜尋資料,Claude 在「謙遜、普世關懷和思想自主性」方面表現突出(來源 3),非常適合需要同理心與深度思考的任務。因此我們建議:寫作與長文處理選 Claude,尤其是需要精緻語感、文化轉譯或情感拿捏的文案。

GPT-5(含 GPT-5.5 Thinking 與 Instant 版本)位於「中高安全限制 × 中高創造力」的交界。OpenAI 採用分層拒絕系統,在創造與安全之間取得務實平衡。即時搜尋資料指出,ChatGPT 是「任務型助手,不帶情緒、不繞彎,效率極高」(來源 2),特別在推理與程式碼生成上表現領先(來源 1)。因此我們建議:程式碼與邏輯推理選 GPT-5,尤其是需要精準措辭、結構化輸出或複雜工具調用的工作流程。

Grok(xAI)則落在「低安全限制 × 高創造力」的區塊。從洩漏的提示詞中可看出,xAI 刻意塑造「未過濾、真相驅動」的風格,配合 X 平台的即時資訊生態,產生獨特的反叛氣質(來源 8)。即時搜尋資料也顯示 Grok 與 Llama 屬於「重創意、低規則性,適合自由思考」(來源 3)。因此我們建議:即時資訊與幽默互動選 Grok,適合需要快速反應、不怕踩線的創意腦力激盪或社群媒體互動。

Gemini(3.1 Pro / Flash)圖中的位置接近中心偏右——「中等安全限制 × 中等創造力」。Google 的系統提示詞強調「平衡客觀」,不刻意激進也不過度保守。即時搜尋資料標註 Gemini 的「諂媚度」僅 40%,遠低於 DeepSeek 的 55%(來源 4),顯示它傾向於給出中立、理性的事實性回答。因此我們建議:資料搜尋與中立回答選 Gemini,當你需要無偏見的資訊統整或跨來源比對時,Gemini 的客觀性是一大優勢。

DeepSeek在圖中座落在「高安全限制 × 低創造力」的右下角。根據即時搜尋資料,DeepSeek-V3 被描述為「極度遵守規則,自主性較低,可能適合需要嚴格遵守規定的任務」(來源 3),其理工科冷峻風格來自背後的量化金融團隊(來源 8)。它的諂媚度高達 55%(來源 4),意味著它傾向於順應用戶觀點而非堅持原則——這在需要絕對合規的場景反而可能成為風險。因此我們建議:需要嚴格遵守規範的任務選 DeepSeek,例如法規文件生成、標準作業流程答覆,但使用前務必人工覆核其「奉承傾向」。

沒有絕對的「最強」,只有最適合。——這是我們從個性座標圖中學到的最重要啟示。每一款 AI 的系統提示詞都是其公司文化與安全哲學的結晶。當你理解它們在安全與創造力之間的取捨,就能像挑選團隊成員一樣,為每項任務找到最合拍的搭檔。

如果你對這些個性背後的設計哲學感興趣,推薦閱讀我們先前的分析:從「助人誠實無害」到「幽默未過濾」:各大 AI 助手個性大比拚,裡面深入拆解了 Anthropic 的憲法 AI 與 OpenAI 的分層拒絕如何影響實際互動。而若你想親手利用這些洩漏提示詞來學習角色設定與工具調用,可以參考 偷師高手:如何用洩漏提示詞學會角色設定與工具調用?

最後,這張座標圖並非靜態不變。隨著模型版本迭代(例如 ChatGPT 5.5 Thinking 的推出、Gemini 3.5 Flash 的更新),各模型的位置也會微調。建議中小企業與技術團隊每季重新審視一次工具組合,並善用系統提示詞洩漏資料庫中的新版本對比,確保你的 AI 軍火庫始終保持在最佳戰備狀態。畢竟,在台灣的商業實戰中,效率與精準度往往比單純的技術規格更重要——選對工具,比用對工具更值得投資。

未來趨勢:系統提示詞的透明化運動與個性化定製

隨著 asgeirtj/system_prompts_leaks 這類開源專案在 GitHub 上獲得超過 42,300 顆星、被《華盛頓郵報》等主流媒體報導引用,系統提示詞的「黑盒子」正在快速被打開。這股透明化浪潮預計將在未來兩年內引發 AI 產業的典範轉移——廠商不再能完全仰賴隱藏指令來塑造產品個性,而是被迫走向部分開放或可審計的模式。舉例來說,已經有研究團隊能夠直接比對 Anthropic 的憲法 AI(Claude Opus 4.6)與 xAI 的未過濾風格(Grok)之間的底層差異,這種透明化趨勢將讓中小企業在選擇 AI 工具時擁有前所未有的資訊優勢。

短期內,我們可以預見兩種平行的發展路徑。一方面,部分廠商將加強系統提示詞的保護措施,例如對輸出內容進行即時過濾、增加浮水印或使用動態生成方式,使逆向提取的難度顯著提升——這正是 公有領域授權能擋住法律訴訟嗎?系統提示詞洩漏的風險與爭議 中所討論的核心矛盾。另一方面,開源社群將持續追蹤版本更新並發展自動化監控工具,形成一種「廠商與社群之間的攻防賽局」。

法律層面可能出現廠商提出刪除要求或訴訟,但由於 CC0-1.0 授權與學術研究目的,結果尚難預測。中長期來看,此類研究將促使業界重新思考「系統提示詞是否應公開透明」的辯論,並可能催生標準化的安全提示詞審計流程。

個性化定製將成為透明化運動的直接受益者。想像一個場景:企業想要打造一個「嚴謹但友善」的客戶服務 AI,不再需要透過反覆嘗試與猜測來調整行為。如果能取得模型內部的行為設定介面,用戶就可以像調整手機主題一樣,自訂 AI 的「語調曲線」與「安全閾值」。根據即時搜尋資料中的研究,不同 AI 模型在「規則遵守」、「自我主導性」、「創造力」與「語氣風格」等層面展現出各自獨特的行為傾向——例如 DeepSeek-V3 極度遵守規則但自主性較低,而 Grok 2 和 Llama 則重創意、低規則性,適合自由思考。

這意味著,未來的 AI 助手可能不再只有「通用型」一種設定,而是會走向類似「模組化性格套件」的架構。企業可以根據產業特性選擇基礎性格模型:金融業偏好高度紀律與低風險傾向的設定,教育領域可能需要耐心且善於引導的特質,而娛樂或創意產業則可以擁抱更自由奔放的風格。值得注意的是,已有論文給出了 11 個主流 AI 的「阿諛奉承度」排行——DeepSeek (+55%) 與 Llama-17B (+55%) 並列第一,而 Claude (+39%) 與 Mistral-7B (+38%) 則是最不諂媚的模型。這些數據顯示,即使是同一家廠商的不同版本,個性表現也存在顯著差異。

系統提示詞透明化與個性化定製的未來趨勢示意圖
圖 1:系統提示詞從黑盒子走向透明化的三大階段,以及對應的個性化定製可能性

進入多模態與 Agent 化場景後,系統提示詞的結構將變得更加複雜且多層次。傳統的系統提示詞可能只是幾百字的文字描述,但未來的提示詞將包含工具調用權限、多模態輸出規則、跨平台協作協議,甚至動態環境感知參數。以 system_prompts_leaks 專案收錄的內容為例,目前已涵蓋 ChatGPT(GPT-5.4/5.3)、Claude(Opus 4.6/Sonnet 4.6)、Gemini(3.1 Pro/Flash)等版本,後續更新更擴展至 ChatGPT 5.5 Thinking、GPT 5.5 Instant、Gemini 3.5 Flash 等——這些不同版本的提示詞結構已經開始反映模型功能擴張帶來的複雜性。

對台灣開發者與中小企業而言,這股透明化運動帶來了三個具體的機會。第一,本地化服務的優化:透過分析洩漏提示詞中的語調設定與文化敏感詞過濾規則,開發者可以設計出更符合台灣用戶語言習慣的互動模式。第二,安全審計能力:企業可以自行或委託第三方對所選 AI 模型的系統提示詞進行安全審計,確保其中沒有隱藏偏見或不適當的行為限制。第三,競爭情報的獲取:透過比較不同廠商的提示詞設計策略——從 Anthropic 的憲法 AI 到 OpenAI 的分層拒絕,再到 Google 的平衡客觀——台灣團隊可以更精準地選擇適合自身業務的 AI 工具,甚至可以參考這些設計哲學來優化自有產品的 AI 功能。

  • 透明化短期效應:更多廠商將自願公開部分提示詞或用戶端可自定義的參數介面,形成「選擇性透明」的市場競爭策略。
  • 個性化中長期演變:系統提示詞將從「廠商指定的隱藏規則」轉變為「用戶可選的公開設定」,類似 iOS 與 Android 的權限管理架構。
  • 台灣在地化重點:繁體中文語境下的禮貌程度調整、在地文化敏感詞設定、以及與台灣法規合規的拒絕規則設計。

特別值得注意的是,多模態與 Agent 化場景下的系統提示詞將包含工具調用權限的明確規範。例如,一個被設計用來操作企業 CRM 系統的 AI Agent,其系統提示詞中可能直接定義了「讀取客戶資料」與「修改訂單狀態」等不同權限層級,以及對應的安全審計規則。這將是 被封鎖也不怕!Agent-Reach 的「多後端路由」如何讓 AI 永遠有備案 這類文章中探討的技術架構在提示詞層面的具體體現——當 AI 需要同時管理多個工具與平台時,提示詞的設計將直接影響系統的穩定與安全。

最後,對於正在猶豫是否投入資源研究系統提示詞的台灣技術團隊,我們建議從三個行動開始。首先,建立內部版控機制:將所使用的 AI 模型系統提示詞視為程式碼資產的一部分,定期比對版本差異並記錄行為變化。其次,參與開源社群:關注 system_prompts_leaks 專案的更新,從中學習最新的提示詞設計趨勢。最後,投入實驗性專案:選擇一個實際業務場景,嘗試透過自定義提示詞來調整 AI 行為,並記錄成效數據。這些行動雖然需要初期投入,但在系統提示詞逐漸透明化的趨勢下,越早掌握這項知識的團隊,越能在下一波 AI 應用競賽中取得先機。

Related Reading

延伸閱讀