第4世代 AMD EPYC 9B14 96-Core Processor x2 384Threads 768GB TAITAN RTX CT1000T710SSD8 1TB(PCIe 5.0 )で構成されたRed Hat Enterprise Linux release 10.1 へ CUDA-toolkit 13.1 をInstall して nvidia-smi nvcc -V cat /etc/os-release lsmem sensors nvme list nvme-smart-log /dev/nvme0n1 lscpuを設定した


サーバー外観

サーバーのBIOSを最新にしたら不具合連発で困っていましたが、古いのに戻したら一発で解決しました.
BIOS関連
[chibi@rhel10 ~]$ sudo dmidecode -q
[sudo] chibi のパスワード:
BIOS Information
Vendor: GIGABYTE
Version: R19_F40
Release Date: 05/12/2025
Address: 0xF0000
Runtime Size: 64 kB
ROM Size: 16 MB
Characteristics:
desktop

nvidia-smi nvcc -V cat /etc/redhat-release lsmem 768GB

sensors

nvme list nvme-smart-log /dev/nvme0n1

lscpu AMD EPYC 9B14 96-Core Processor x2 384Threads

カテゴリー: 2 Sockets, nvidia, rhel10 パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です