Tokens in Python

About 50 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › question
vllm内部怎么根据max_model_len自动计算max_num_batched_tokens？
VLLM内部根据 max_model_len 计算 max_num_batched_tokens 的过程是通过定义模型的最大序列长度和批处理大小，然后计算每个批次的总Token数。这一过程确保了模型在硬件资源限制内高效运行。 …
zhihu.com
https://www.zhihu.com › question
Qwen1.5-72B-Chat-GPTQ-Int4 上下文长度是 32768 tokens 不对吗？
Qwen1.5-72B-Chat-GPTQ-Int4 模型，我输入的prompt_tokens数量远小于支持的最大上下文长度是 32768 token…
zhihu.com
https://www.zhihu.com › question
ChatGPT如何计算token数？ - 知乎
OpenAI 使用的分词方法，特别是针对汉字，的确有时会导致一个汉字被计算为多个 tokens。这不是将汉字拆成 Unicode 码来处理，而是因为 GPT-3 使用的 Byte-Pair Encoding (BPE) 分词方法会将某些字 …
zhihu.com
https://www.zhihu.com › pin
火山引擎这个月有数据协作计划，每款模型每天送 50 万 tokens | 指 …
第一次开通单个模型会给 50 万 tokens（企业账号 500 万），然后当天使用的 tokens 第二天会返还等额的资源包。模型余量和资源包情况可以在费用中心 - 资源包查看。活动持续到这个月底，如果用于 …
zhihu.com
https://www.zhihu.com › question
NLP领域中的token和tokenization到底指的是什么？ - 知乎
NLP领域中的token和tokenization到底指的是什么？
zhihu.com
https://www.zhihu.com › question
现在AI编程成本越来越氪金，tokens越充越少，你有什么方法可以降低 …
Nov 16, 2025 · 很多人tokens烧得快，其实是因为每次交互都让AI重新理解整个项目，这完全可以避免。尤其是vibe code，需要多轮对话token烧的飞快。 3、混用不同模型：简单任务用便宜的模型，复杂 …
zhihu.com
https://www.zhihu.com › question
使用OpenClaw消耗Tokens非常快怎么办？ - 知乎
使用OpenClaw消耗Tokens非常快怎么办？最近在使用OpenClaw大龙虾，尝试配置了智谱GLM和通义千问Qwen大模型，感觉消耗Tokens比较大，有没有什么安全、可靠、有效的办法可以降低T… 显示全 …
zhihu.com
https://www.zhihu.com › question
如何在国内合法、安全地使用上 Claude Code? - 知乎
费用（美元）= 输入 tokens × 输入单价输出 tokens × 输出单价缓存写入 tokens × 单价缓存读取 tokens × 单价也就是说，你在终端或者 IDE 里让 claude code 帮你完成一次编程任务，本质上就是在消耗这 …
zhihu.com
https://www.zhihu.com › question
大模型的token究竟是什么？如何通俗易懂地解释？ - 知乎
说实话，煮啵第一次看到token这个词，还以为是令牌，哈哈哈哈。以为就是那种游乐场的代币，投进去才能玩的那种。后来发现不是，但也没人好好解释过，就这么模模糊糊地用着。直到有一次煮啵跑 …
zhihu.com
https://www.zhihu.com › question
如何看待智谱新发布的全球首个 OpenClaw 「龙虾」模型 GLM-5 …
Mar 16, 2026 · Claw体验月卡，3500万Tokens，39元/张； Claw进阶月卡，1亿Tokens，99元/张。说实话，对于高频养虾户来说，1亿Tokens可能不太够。之前GLM模型就一直供不应求，我估计这个龙 …

Pagination
- 1
- 2
- 3
- Next