商傳媒|責任編輯/綜合外電報導
人工智慧程式開發工具正快速改變軟體工程師的工作模式,但背後的運算成本問題也逐漸浮上檯面。一名開發者近期深入分析自身使用 Claude Code 的紀錄後發現,高達三分之一的訊息內容其實屬於重複傳送,而快取機制調整後,更進一步加速了額度消耗速度。
根據《XDA》報導,Claude Code的運作方式與一般聊天機器人有所不同。每當使用者發出新指令時,系統不只是傳送當前問題,而是會將整個工作環境一併重新載入,包括系統提示詞、工具說明、專案規則、自訂設定以及歷史上下文等資訊,確保模型能理解完整開發情境。
這種設計雖然提升程式開發品質,卻也帶來額外成本。由於大量內容反覆傳送,實際上相當比例的Token消耗並非來自新的問題,而是重複載入既有內容。
分析指出,問題在於快取(Cache)機制的改變。過去由 Anthropic 提供的快取可維持約一小時,因此相同上下文能持續享有折扣計費。但自今年三月起,預設快取有效時間被縮短至僅五分鐘。
這意味著,若開發者離開電腦開會、接電話或處理其他工作,只要超過數分鐘未與Claude Code互動,快取便會失效。當再次發送訊息時,系統必須重新建立完整上下文,而這些原本享有折扣的內容,將重新以完整成本計算。
對採用訂閱方案的開發者而言,這種變化會直接影響每週可用額度。部分使用者甚至發現,明明實際互動次數不多,額度卻消耗得比預期更快。
為降低資源浪費,開發者建議善用 Claude Code 內建的「/compact」功能。這項指令可將現有上下文壓縮成摘要形式保存,避免因快取過期而必須重新載入大量歷史資訊,進而降低Token消耗量。
另一方面,不同模型之間的成本差異也相當明顯。Anthropic目前主要提供三大模型系列,包括功能最完整的 Claude Opus 、平衡效能與成本的 Claude Sonnet ,以及主打經濟實惠的 Claude Haiku 。
其中Opus擁有最強推理能力,但運算成本最高;Haiku則以低成本、高速度見長。開發者若長期進行程式碼生成、除錯或大型專案開發,不同模型選擇將大幅影響實際支出。
這項發現也反映出生成式AI產業的新現象。隨著模型能力不斷提升,市場焦點已不只是模型是否夠聰明,而是如何更有效率地管理上下文、記憶體與Token成本。對企業與專業開發者而言,未來競爭關鍵除了AI能力本身,更包括運算效率與成本控制能力。
從更大的產業趨勢來看,AI工具正在從單純聊天助手轉型為生產力平台,而快取管理、長期記憶與上下文壓縮等技術,將成為下一波AI產品競爭的重要戰場。誰能在維持模型能力的同時降低運算成本,誰就更有機會在企業市場取得優勢。




























