2GPU: HPCDIY-ERMGPU8R4S に NVIDIA A100 を2枚実装してGPU100%での消費電力と温度

HPCDIY-ERMGPU8R4S(こちら)にGeForce NVIDIA A100 PCIe 40GB を枚実装し、gpu_burn(こちら)を実行して、消費電力と温度が定常状態になるまでを nvidia-smi -l で監視してみました。

Share
2GPU: HPCDIY-ERMGPU8R4S に NVIDIA A100 を2枚実装してGPU100%での消費電力と温度

HPCDIY-ERMGPU8R4S(こちら)にGeForce NVIDIA A100 PCIe 40GB を枚実装し、gpu_burn(こちら)を実行して、消費電力と温度が定常状態になるまでを nvidia-smi -l で監視してみました。

消費電力はそれぞれ約250W、温度はMAXで72°Cと非常に優秀な結果になりました。

2xa100-gpu-burn

Read more

ローカルLLMはAllegro/NeQUIPの学習設定YAMLを作れるのか:Nemotronでmetadata-only preflightを検証

ローカルLLMはAllegro/NeQUIPの学習設定YAMLを作れるのか:Nemotronでmetadata-only preflightを検証 これは性能ベンチマークではありません。A100x4上のローカルLLMで、Allegro / NeQUIPの学習設定YAMLをどこまで安全に作り、実行前に確認できるかを調べた機能検証です。 結論から言うと、NemotronはAllegro / NeQUIPのtraining YAML候補を生成できました。既存SIF内で torch / nequip / allegro のimport、A100x4のCUDA可視

By Kenetsu Hanabusa