Question 1

在 NVIDIA GeForce RTX 5090 上可以运行哪些大语言模型？

Accepted Answer

凭借 32 GB 显存，你可以运行需要约 29 GB 显存的模型（为上下文处理留出余量）。通常包括 Q4 量化下最高约 48B 参数的模型，或 Q8 量化下约 24B 参数的模型。请参阅本页的兼容模型列表获取具体推荐。

Question 2

NVIDIA GeForce RTX 5090 适合本地 LLM 推理吗？

Accepted Answer

NVIDIA GeForce RTX 5090 是一款 旗舰级 GPU。它是消费级 GPU 中本地 LLM 推理的顶级选择之一，能够快速运行大模型。

Question 3

我应该从 NVIDIA GeForce RTX 5090 升级以获得更好的 LLM 性能吗？

Accepted Answer

你已经在顶级了。除非你需要更多显存来运行超大模型（700 亿参数以上），否则 NVIDIA GeForce RTX 5090 在可预见的未来都能很好地满足你的需求。

NVIDIA GeForce RTX 5090

技术规格