Question 1

如果超出上下文限制会怎样？

Accepted Answer

工具会显示「超出限制」警告。超出上下文限制会导致回应被截断或出现错误。请减少内容长度或选择具有更大上下文窗口的模型。

Question 2

Token 估算有多准确？

Accepted Answer

自动估算使用针对特定模型的分词技术，精度很高（通常与实际 Token 数量误差在 5% 以内）。为精确规划，建议预留 10% 的缓冲区。

Question 3

我应该始终使用最大的上下文窗口吗？

Accepted Answer

不一定。更大的上下文成本更高且处理更慢。请使用满足您需求的最小上下文。可视化图表有助于优化空间使用。

Question 4

输入 Token 和输出 Token 有什么区别？

Accepted Answer

输入 Token 包括您的系统提示和对话历史。输出 Token 为模型的回应预留。两者都计入总上下文窗口。

Question 5

我可以保存我的上下文规划吗？

Accepted Answer

该工具在您的浏览器中运行。请复制您的内容以本地保存。未来版本可能包含上下文规划的保存/导出功能。

Question 6

支持哪些模型？

Accepted Answer

主要模型包括 GPT-4、GPT-4 Turbo、Claude 3 Opus/Sonnet、Gemini Pro 和 Llama 2，以及它们各自的上下文窗口。

上下文窗口规划器

关于上下文窗口规划器