Question 1

在 NVIDIA GeForce RTX 4080 Mobile 上可以运行哪些大语言模型？

Accepted Answer

凭借 12 GB 显存，你可以运行需要约 11 GB 显存的模型（为上下文处理留出余量）。通常包括 Q4 量化下最高约 18B 参数的模型，或 Q8 量化下约 9B 参数的模型。请参阅本页的兼容模型列表获取具体推荐。

Question 2

NVIDIA GeForce RTX 4080 Mobile 适合本地 LLM 推理吗？

Accepted Answer

NVIDIA GeForce RTX 4080 Mobile 是一款 中端 GPU。它在成本和能力之间提供了良好的平衡，适合爱好者和开发者进行本地 LLM 推理。

Question 3

我应该从 NVIDIA GeForce RTX 4080 Mobile 升级以获得更好的 LLM 性能吗？

Accepted Answer

如果你想运行更大的模型或需要更快的推理速度，可以考虑升级到下一个性能级别。每次升级都会解锁更多兼容模型和更好的 token 生成速度。

NVIDIA GeForce RTX 4080 Mobile

技术规格