Telegram Group & Telegram Channel
服务器 GPU 配备太多的显存会导致 Linux 系统休眠出现问题

2025-06-30 23:11 by 海底两万里

大模型时代,越来越多的数据中心安装了专用 GPU 加速器,而这些加速器配备了数百 GB 容量的显存(VRAM)。在特定的情况下,如果服务器系统内存容量太少,休眠功能可能会出现问题,从休眠中恢复可能需要多达 1 个小时。AMD 工程师 Samuel Zhang 递交了补丁修复了该问题。他解释说,如果一台 Linux 服务器有 2 TB 系统内存,配了 8 个 AMD Instinct 加速器,每个加速器显存 192GB 共 1,536GB。休眠时所有 VRAM 显存都迁移到 GTT 或 shmem。在这两种情况下,它都在系统内存中,内核会尝试将复制页到休眠镜像。在最糟糕的情况下,这会导致系统内存中有 2 个 VRAM 副本,1,536GB * 2 = 3TB > 2 TB,系统内存不够用了。

www.phoronix.com/news/AMD-Too-Much-vRAM-RAM-Hibernate

#Linux



tg-me.com/solidot/27438
Create:
Last Update:

服务器 GPU 配备太多的显存会导致 Linux 系统休眠出现问题

2025-06-30 23:11 by 海底两万里

大模型时代,越来越多的数据中心安装了专用 GPU 加速器,而这些加速器配备了数百 GB 容量的显存(VRAM)。在特定的情况下,如果服务器系统内存容量太少,休眠功能可能会出现问题,从休眠中恢复可能需要多达 1 个小时。AMD 工程师 Samuel Zhang 递交了补丁修复了该问题。他解释说,如果一台 Linux 服务器有 2 TB 系统内存,配了 8 个 AMD Instinct 加速器,每个加速器显存 192GB 共 1,536GB。休眠时所有 VRAM 显存都迁移到 GTT 或 shmem。在这两种情况下,它都在系统内存中,内核会尝试将复制页到休眠镜像。在最糟糕的情况下,这会导致系统内存中有 2 个 VRAM 副本,1,536GB * 2 = 3TB > 2 TB,系统内存不够用了。

www.phoronix.com/news/AMD-Too-Much-vRAM-RAM-Hibernate

#Linux

BY Solidot


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/solidot/27438

View MORE
Open in Telegram


Solidot Telegram | DID YOU KNOW?

Date: |

However, analysts are positive on the stock now. “We have seen a huge downside movement in the stock due to the central electricity regulatory commission’s (CERC) order that seems to be negative from 2014-15 onwards but we cannot take a linear negative view on the stock and further downside movement on the stock is unlikely. Currently stock is underpriced. Investors can bet on it for a longer horizon," said Vivek Gupta, director research at CapitalVia Global Research.

Solidot from us


Telegram Solidot
FROM USA