提示詞重複技術：零成本將LLM準確率從21%提升至97%的工程實踐

在大語言模型的實際應用中，一個看似簡單到不可思議的技巧正在引起研究界的關注：將同一個提示詞重複輸入兩次，就能讓非推理型LLM的表現產生質的飛躍。在覆蓋70項基準測試的大規模實驗中，這一方法在47項任務上顯著超越了基線表現，其中部分任務的準確率從21%飆升至97%。該技術適用於Gemini、GPT-4o、Claude、DeepSeek等主流模型，且不增加任何計算成本。其原理與因果語言模型的自迴歸特性密切相關——重複的提示爲模型提供了"回看"信息的第二次機會。結合同期提出的"先驗證再回答"策略，這類輕量級提示工程方法正在重塑我們對LLM優化的認知。

爲什麼"重複"有效？

大語言模型本質上是自迴歸系統：生成每個token時只能看到它前面的內容。這意味着當模型處理一個長問題時，問題開頭的關鍵信息在生成答案時可能已經"衰減"。

將提示詞重複一次，等效於讓模型獲得了一次"回看"機會。第二份副本中的每個token都能完整關聯第一份副本的全部信息，相當於在不修改模型架構、不增加推理步驟的前提下，擴展了模型的有效注意力範圍。

實驗覆蓋與關鍵數據

實驗橫跨7個主流模型和70項基準任務，結果一致且顯著：

| 指標 | 數據 |

|------|------|

| 測試模型 | Gemini 2.0 Flash/Lite, GPT-4o/Mini, Claude 3 Haiku/Sonnet, DeepSeek V3 |

| 基準任務 | ARC Challenge, OpenBookQA, GSM8K, MMLU-Pro, MATH 等70項 |

| 超越基線任務數 | 47/70（67%） |

| 最大提升幅度 | 21.33% → 97.33%（提升76個百分點） |

| 額外計算成本 | 零 |

值得注意的是，該方法在所有測試中均未出現性能退化——即使不產生提升，也不會造成損害。

互補策略：先驗證再回答

另一項來自學術界的研究提出了"先驗證"（Verification-First）策略，同樣以極低成本獲得了顯著效果。其核心思路是：在讓模型回答之前，先提供一個可能錯誤的候選答案，要求模型先驗證其正確性。

即使候選答案完全隨機，這種"先質疑"的機制也能讓模型推理準確率提升10-15%。兩種方法可以疊加使用，形成"重複提示 + 先驗證"的複合提示策略。

行業趨勢關聯

這些發現對Agentic AI系統設計具有直接啓示。在構建多步驟AI Agent時，每一輪與LLM的交互都可以低成本地應用這些技巧來提升可靠性。對於AI Coding場景，開發者在調用API時只需簡單修改提示模板就能獲得顯著的質量提升。這也印證了Self-Improving AI的一個核心洞察：模型能力的釋放不僅靠擴大參數規模，更在於精巧的工程設計。