GPUサーバー GLM-5.2 2bitはGPUサーバー運用AIに使えるか? A100×4でDS4/Qwen3-14Bと比較 A100 80GB×4でGLM-5.2 2bit GGUFをロード・生成・OpenAI互換API応答まで確認。さらにDS4/Qwen3-14Bと、Slurm導入前判断、NVIDIA driver再インストール要求、vLLM OOMなど6つのGPUサーバー運用タスクで比較しました。