Question 1

如果我超過上下文限制會怎樣？

Accepted Answer

工具將顯示「超過限制」警告。超出上下文限制會導致回應被截斷或出錯。減少內容長度或選擇具有更大上下文窗口的模型。

Question 2

Token 估算有多準確？

Accepted Answer

自動估算使用模型特定的分詞技術，精度很高（通常與實際 Token 數量誤差在 5% 以內）。為了精確規劃，建議添加 10% 的緩衝區。

Question 3

我應該始終使用最大上下文窗口嗎？

Accepted Answer

不一定。更大的上下文成本更高且處理更慢。使用滿足您需求的最小上下文。可視化圖表有助於優化空間使用。

Question 4

輸入 Token 和輸出 Token 有什麼區別？

Accepted Answer

輸入 Token 包括您的系統提示和對話歷史。輸出 Token 為模型的回應預留。兩者都計入總上下文窗口。

Question 5

我可以保存我的上下文規劃嗎？

Accepted Answer

該工具在您的瀏覽器中運行。複製您的內容以本地保存。未來版本可能包含上下文規劃的保存/導出功能。

Question 6

支持哪些模型？

Accepted Answer

主要模型包括 GPT-4、GPT-4 Turbo、Claude 3 Opus/Sonnet、Gemini Pro 和 Llama 2，以及它們各自的上下文窗口。

上下文窗口规划器

關於上下文窗口規劃器