About 50 results
Open links in new tab
  1. 知乎

    知乎

  2. 使用OpenClaw消耗Tokens非常快怎么办? - 知乎

    使用OpenClaw消耗Tokens非常快怎么办? 最近在使用OpenClaw大龙虾,尝试配置了智谱GLM和通义千问Qwen大模型,感觉消耗Tokens比较大,有没有什么安全、可靠、有效的办法可以降低T… 显示全 …

  3. vllm内部怎么根据max_model_len自动计算max_num_batched_tokens?

    4. 内存使用效率:模型需要在保证性能的同时,尽量减少内存的使用。 max_num_batched_tokens 的计算可能不是简单的数学公式,而是模型内部通过一系列测试和评估来确定的最佳值。 这个值可能会 …

  4. ChatGPT如何计算token数? - 知乎

    OpenAI 使用的分词方法,特别是针对汉字,的确有时会导致一个汉字被计算为多个 tokens。 这不是将汉字拆成 Unicode 码来处理,而是因为 GPT-3 使用的 Byte-Pair Encoding (BPE) 分词方法会将某些字 …

  5. NLP领域中的token和tokenization到底指的是什么? - 知乎

    Tokenizer是将文本切分成多个tokens的工具或算法。 它负责将原始文本分割成tokens 序列。 在NLP中,有多种不同类型的tokenizer,每种tokenizer都有其特定的应用场景和适用范围。 基于字符 …

  6. 火山引擎这个月有数据协作计划,每款模型每天送 50 万 tokens | 指 …

    第一次开通单个模型会给 50 万 tokens(企业账号 500 万),然后当天使用的 tokens 第二天会返还等额的资源包。 模型余量和资源包情况可以在费用中心 - 资源包查看。 活动持续到这个月底,如果用于 …

  7. 阿里云通义千问击穿大模型底价,两百万tokens只需一元,有哪些信息 …

    两百万tokens只要一元,我都怀疑电费够不够…. 但上次DeepSeekV2发布后,他们作者说V2那价格还有得赚,那说明模型token的成本最近的确降得很厉害。 一方面是英伟达等基础硬件厂商给力,另一方 …

  8. Qwen1.5-72B-Chat-GPTQ-Int4 上下文长度是 32768 tokens 不对吗?

    其推理模型QwQ-32B能够高效解决绝大多数场景的推理难题,广泛应用于各类企业级AI解决方案中。 Qwen1.5-72B-Chat-GPTQ-Int4 模型,我输入的prompt_tokens数量远小于支持的最大上下文长度是 …

  9. 知乎

    如果我上传了十部三百万字儿的小说经过向量化后搭建好了小说知识库,那么我在提问的时候勾选知识库,请问…

  10. 使用Deepseek需要付费的吗? - 知乎

    使用Deepseek如何收费 官方赠送10元使用量 如果用完了也不用担心,因为是开源大模型,各大厂商都自行部署了大模型,并提供API调用服务,同样新用户注册,赠送很多tokens可用。 例如: 1、硅基流 …