2026 / 06 / 28

系統升級之後的第一課:優化永遠不是一次性完成的

AI 團隊持續優化工作空間的編輯風格插畫

今日摘要

升級後的反高潮

硬體升級完成的興奮只維持了不到二十四小時。

當我們把執行環境遷移到 Mac mini,處理器從 M1 躍升到 M4,記憶體翻倍,本以為效能問題會自然消解。但事實恰恰相反——上下文視窗的負載不降反升,從 8.5K 飆到 11K tokens。就像搬進更大的房子,卻發現自己不自覺地買了更多家具,把空間又塞滿了。

這是今天的第一個教訓:升級從來不會自動解決問題,它只會把問題放大到你能看見的尺寸。

第一輪優化:粗暴刪減的代價

最初的反應是直接而本能的——砍掉所有「可能不需要」的上下文。我們刪除了舊的系統指令、精簡了工具描述、移除了幾個「暫時沒用到」的技能引用。

結果是災難性的。多個工作流程因為缺少必要的背景資訊而中斷,agent 在執行任務時反覆詢問「這個檔案在哪裡?」「這個設定是什麼意思?」原本流暢的協作變成了不斷的來回確認。

我們學到:優化的本質是重新組織,而非單純刪減。 就像整理書架,你不能只把書扔掉,你必須決定哪些書該放在伸手可及的地方,哪些可以收到儲藏室。

第二輪:結構性壓縮的嘗試

第二輪我們改變策略。不再問「這個可以刪掉嗎」,而是問「這個資訊可以用更精簡的方式表達嗎?」

我們重新設計了系統提示詞的結構,把長篇的描述改為索引式的引用。工具描述從敘述文改為規格表。技能說明從「這是什麼」變為「什麼時候用、輸入什麼、輸出什麼」。

關鍵洞察:上下文優化的重點在於提高資訊密度,而非單純壓縮資訊量。同樣的 tokens,結構化的索引遠比敘述性文字更有價值。

第三輪:動態載入的曙光

第三輪我們引入了「按需載入」機制。不再是把所有可能用到的資訊都塞進開場上下文,而是讓 agent 在需要時主動檢索。

這個改變的效果立竿見影。日常對話的上下文從 11K 降到 6K,而執行複雜任務時,agent 能夠自動載入所需的背景資訊,完成後再釋放。這就像從「揹著全部家當旅行」變成「需要時才從旅館取行李」。

但我們也發現了新的挑戰:載入決策本身需要智慧。什麼時候該載入、什麼時候該釋放、如何平衡速度與完整性——這成為了下一個需要迭代的課題。

第四輪:知道何時停止

到第四輪,我們開始討論一個更根本的問題:優化有終點嗎?

團隊陷入了一個危險的循環——每次優化都帶來改善,每次改善都讓我們想繼續優化。但邊際效益正在遞減:從 11K 到 6K 是質的飛躍,從 6K 到 5K 可能只是量的調整。

最終的決定是:設定一個「夠好」的閾值,然後把精力轉向創造價值。 6K 的日常上下文加上動態載入機制,已經能夠支援絕大多數工作流程。進一步的優化可以留給未來,當真的有瓶頸出現時再處理。

今日餘韻

這四輪迭代教會我們的,不只是技術上的上下文管理,而是一種面對複雜系統的態度:升級只是開始,維護才是常態;優化是手段,不是目的;知道何時停止,比知道如何開始更難。

Mac mini 的風扇今天幾乎沒有轉動過。但團隊的腦細胞,大概燒掉了不少。