Inference Cards

About 28,000,000 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › question
机器学习中Inference 和predict的区别是什么?
Inference: You want to understand how ozone levels are influenced by temperature, solar radiation, and wind. Since you assume that the residuals are normally distributed, you use a linear regression model.
zhihu.com
https://www.zhihu.com › question
为什么 2024 年以后 MMDiT 模块成为了大规模文生视频或者文生图片 …
也可能是我的偏见。但是似乎SD3 paper发表以后很多开源工作/技术报告都不约而同的使用了这个架构，抛弃了…
zhihu.com
https://www.zhihu.com › question › answers › updated
机器学习中Inference 和predict的区别是什么? - 知乎
机器学习中Inference 和predict的区别是什么? 为什么传统机器学习，都会用predict表示预测，而深度学习中往往用inference这个词，他们意义有什么不同吗显示全部关注者 61
zhihu.com
https://www.zhihu.com › question
如何简单易懂地理解变分推断 (variational inference)？
笔者在入门VAE（Variational Autoencoder）的时候，发现几乎所有博客都会提到变分推断（Variational Inference）和 ELBO （证据下界，Evidence Lower Bound），但是总是搞不明白具体是什么意思， …
zhihu.com
https://www.zhihu.com › tardis › bd › art
因果推断综述解析|A Survey on Causal Inference (1)
二、正文解析摘要首先文章说明了因果推断的重要性，ZZ不再赘述。然后介绍了一下本文的主要内容和贡献：在本研究中，作者提供了关于“潜在结果框架”的完备介绍，那么这个“潜在结果框架”是一个著 …
zhihu.com
https://www.zhihu.com › question
LLM的pad策略，为啥训练时是right，预测是left？ - 知乎
Dec 10, 2024 · 上面这俩在训练时是等效的。关键还是 padding 方向和 ignore_label 的设置方式要匹配。 position_ids 的影响也不大，目前像 Hugging Face 这种库可以自行处理。如下例中是 batch size 为 2 …
zhihu.com
https://www.zhihu.com › question
有没有大佬帮我解释一下AI infra到底是干啥的？ - 知乎
三者共同构成 “计算 - 通信 - 存储” 一体化硬件体系，直接决定 AI Infra 的综合能力上限。 1.2 软件层软件层是 AI Infra 的 “神经中枢”，借鉴云计算三层架构，不仅实现硬件资源管控，更重点解决存储资源的 …
zhihu.com
https://www.zhihu.com › question
PyTorch如何量化模型（int8）并使用GPU（训练/Inference）？
或者是否可以通过将PyTorch模型转化成TensorRT进行int8的GPU Inference?
zhihu.com
https://www.zhihu.com › question
为什么2025年左右，主流的moe模型逐渐开始采用更稀疏小而多的专家 …
而稀疏激活的MoE在推理的时候只激活一小部分参数，这就意味着虽然模型total size很大，但单次inference的计算量和延迟都能控制住。对商业化来说这个太重要了，你不可能让用户等半天才出个 …
zhihu.com
https://www.zhihu.com › question
如何看待Qwen推出的新Scaling Law ——Parallel Scaling？
二是扩展推理思考的时间（Inference-time Scaling），让模型思考更长时间，得出更智能的结果。然而，更大的参数量导致模型对显存需求“爆炸式”增长，更长的推理时间在需要更多算力的同时也大大增 …

Pagination
- 1
- 2
- 3
- Next