上下文窗口规划器
免费在线上下文窗口规划器,无需安装。在LLM的上下文窗口中可视化提示的使用情况
關於上下文窗口規劃器
上下文窗口規劃器幫助您通過可視化 Token 使用情況來優化大型語言模型的提示。它確保您的提示符合模型上下文限制,同時最大化模型的回應空間。
了解上下文窗口
每個 LLM 都有最大上下文窗口(例如,GPT-4 為 128K,Claude 為 200K)。這包括您的系統提示、對話歷史、預期輸出的緩衝區。規劃有助於避免截斷的回應或浪費 Token。
使用方法
選擇您的目標模型。輸入系統提示、對話歷史和預期輸出長度。可視化圖表顯示上下文空間的使用情況。調整內容以符合限制,同時為回應預留空間。
Token 估算
點擊「自動估算」以自動計算您內容的 Token 數量。該工具使用每個模型的準確分詞。查看使用信息以查看精確的 Token 數量和剩餘容量。
▶如果我超過上下文限制會怎樣?
工具將顯示「超過限制」警告。超出上下文限制會導致回應被截斷或出錯。減少內容長度或選擇具有更大上下文窗口的模型。
▶Token 估算有多準確?
自動估算使用模型特定的分詞技術,精度很高(通常與實際 Token 數量誤差在 5% 以內)。為了精確規劃,建議添加 10% 的緩衝區。
▶我應該始終使用最大上下文窗口嗎?
不一定。更大的上下文成本更高且處理更慢。使用滿足您需求的最小上下文。可視化圖表有助於優化空間使用。
▶輸入 Token 和輸出 Token 有什麼區別?
輸入 Token 包括您的系統提示和對話歷史。輸出 Token 為模型的回應預留。兩者都計入總上下文窗口。
▶我可以保存我的上下文規劃嗎?
該工具在您的瀏覽器中運行。複製您的內容以本地保存。未來版本可能包含上下文規劃的保存/導出功能。
▶支持哪些模型?
主要模型包括 GPT-4、GPT-4 Turbo、Claude 3 Opus/Sonnet、Gemini Pro 和 Llama 2,以及它們各自的上下文窗口。
如果这个工具对你有帮助,请考虑请我喝杯咖啡。
請幫我買杯咖啡吧。