CloudRift 表示,在一些配备 RTX 5090 和 RTX PRO 6000 显卡的节点上,这些显卡偶尔会完全无响应 —— 通常在使用虚拟机几天后,或在启动 / 关闭过程中看似随机的时间点。一旦发生这种情况,显卡就无法重新分配。唯一的解决办法是重启整个节点。
CloudRift 已经排除了大多数常见问题:IOMMU 的 quirks、内核版本、驱动绑定以及 libvirt 的配置错误。该公司的 H100s、B200s 和较旧的 RTX 4090 都在运行稳定,但这些较新的 RTX 显卡给他们带来了大麻烦。
据 Tom's Hardware 昨日报道,Proxmox 论坛和 Level1Techs 上的用户也报告了类似的问题。在其中一个案例中,Windows 虚拟机关闭后系统挂起,即使操作系统重启后 GPU 也无法重新初始化。另一位用户描述了 Linux 虚拟机关闭时 FLR 超时后主机 CPU 软锁,切换 PCIe ASPM 或 ACS 设置等尝试未能解决问题。
译者注:原文发表于露天看台,作者为Dan Favale,文中数据均截至原文发稿时(当地时间9月5日),所涉及日期和时间均为当...
2025-09-08以赛为媒——屈原故里燃动“篮球战歌”9月7日晚,2025赛季超三联赛屈原故里秭归争霸赛在屈原故里文化旅游区圆...
2025-09-08篮球资讯09月08日宣 征战海外联赛的余嘉豪近日在个人社媒中更新了自己的播客节目《豪友记》。节目中他谈到...
2025-09-08