
- 机器学习中Inference 和predict的区别是什么? - 知乎- Inference: You want to understand how ozone levels are influenced by temperature, solar radiation, and wind. Since you assume that the residuals are normally distributed, you use a … 
- LLM的pad策略,为啥训练时是right,预测是left? - 知乎- Dec 10, 2024 · 上面这俩在训练时是等效的。 关键还是 padding 方向和 ignore_label 的设置方式要匹配。 position_ids 的影响也不大,目前像 Hugging Face 这种库可以自行处理。如下例中是 … 
- 什么是「推理」 (Reasoning)? - 知乎- 在哲学逻辑学、心理学、认知科学、(通用)人工智能等领域,如何对推理进行定义?Reasoning和Inference有… 
- 如何简单易懂地理解变分推断 (variational inference)? - 知乎- How can we perform efficient inference and learning in directed probabilistic models, in the presence of continuous latent variables with intractable posterior distributions, and large … 
- 为什么 2024 年以后 MMDiT 模块成为了大规模文生视频或者文生 …- 也可能是我的偏见。但是似乎SD3 paper发表以后很多开源工作/技术报告都不约而同的使用了这个架构,抛弃了… 
- 机器学习中Inference 和predict的区别是什么? - 知乎- 机器学习中Inference 和predict的区别是什么? 为什么传统机器学习,都会用predict表示预测,而深度学习中往往用inference这个词,他们意义有什么不同吗 显示全部 关注者 61 
- 如何看待尤洋对 DeepSeek 成本文章的回应以及开团硅基流动?- 20250301 DeepSeek:DeepSeek-V3 / R1 推理系统概览尤洋:关于DeepSeek MaaS成本尤洋:坑人的硅基流动随… 
- PyTorch如何量化模型(int8)并使用GPU(训练/Inference)?- 或者是否可以通过将PyTorch模型转化成TensorRT进行int8的GPU Inference? 
- 如何看待Qwen推出的新Scaling Law ——Parallel Scaling? - 知乎- 代码: GitHub - QwenLM/ParScale: Parallel Scaling Law for Language Model — Beyond Parameter and Inference Time Scaling 我们都知道,除了拓展数据量以外,现在有两条主流的 … 
- 统计学2020年以后的研究趋势是哪些? - 知乎- 因为大部分人的反应可能只是“So what?”。统计的核心就是数据。从方法论上讲, 统计的“核心”, 如果非要有的话,应该一直是在更新迭代的,从而能一直为数据服务。不可否认, statistical …