对话模拟器
免费在线对话模拟器,无需安装。估算多轮对话的 Token 使用量和 API 成本
关于对话模拟器
对话模拟器可模拟与 LLM 的多轮对话,让你直观看到 token 和成本如何逐轮累积。添加用户和助手消息,选择模型,随着对话增长即时观察上下文窗口使用量和累计成本的攀升。
使用方法
1. 选择一个模型,可选地设置系统提示词 2. 点击「添加用户」或「添加助手」插入消息 3. 输入每条消息的内容 4. 观察摘要更新:输入 token、输出 token、剩余上下文和估算成本 5. 进度条显示上下文窗口已用多少
提示与最佳实践
token 约按每 3.5 个字符 1 个 token 估算,这在各语言中都较为准确。由于每一轮都会将整个历史作为输入重新发送,成本增长比看起来更快——模拟器会展示这种累积效应。可借助它规划何时总结或拆分长对话。
▶token 是如何估算的?
将每条消息的字符数除以约 3.5。这是一种近似方法,对英语和许多其他语言都相当准确,尽管分词器的实际计数可能略有差异。
▶为什么成本上升这么快?
在对话中,每条新消息都会连同之前的整个对话作为输入发送。因此每一轮都会对所有先前的输入再次计费,再加上新输出——模拟器会逐轮展示这种累积增长。
▶进度条代表什么?
它显示所选模型的上下文窗口中,系统提示词加上所有消息占了多少。超过 50% 变为琥珀色,超过 80% 变为红色,警告剩余空间不足。
▶模型价格准确吗?
它们反映了工具构建时各模型列出的定价。提供商经常更新费率,因此请将估算成本视为参考,并到官方定价页面查询准确数字。
▶这会调用任何 API 吗?
不会。所有内容——token 估算、上下文计算和成本——都在浏览器本地计算,消息不会发送到任何地方。
如果这个工具对你有帮助的话,请考虑请我喝杯咖啡。
请给我买杯咖啡吧。