legacy-server-blog
RTX4090をDeepLearningで並列動作可能にさせるcuda-driversのversion
GeForce RTX 4090をDeepLearningなどで並列動作させようとした場合、driverのバージョンを限定(525.105.17)しないとうまく動作しません。
legacy-server-blog
GeForce RTX 4090をDeepLearningなどで並列動作させようとした場合、driverのバージョンを限定(525.105.17)しないとうまく動作しません。
legacy-server-blog
GeForce RTX 4090を1, 2, 4 GPU 使い、batch size を64, 128, 256, 512と変化させてtf_cnn_benchmarks での学習速度を計測しました。RTX3090との比較も掲載してあります。 modelは、resnet50, inception3, vgg16,...
legacy-server-blog
AMDの最新CPU、Genoaを搭載する2台のサーバーに200GbpsのInfinibandカードを搭載し、Infinibandクラスターを構築した。Infiniband Driverをインストールし、Subnet...
legacy-server-blog
Virtual HPC Cluster USBを第28回計算工学講演会(つくば国際会議場)でアンケート記入で無料プレゼントします。
legacy-server-blog
VirtualboxのhostOSとguestOs間でCopy&Pasteができるように設定する方法を解説します。GuestOSはubuntu 20.04です。
legacy-server-blog
これまでHPC Clusterの構築方法と簡単な使い方を解説してきましたが、Virtualbox上でのことでした。Virtualboxでは所詮1台のコンピュータ上で仮想のクラスターをシミュレーションしているので、性能などには限界があります。Real...
legacy-server-blog
MPIプログラムを複数ノードを使って実行させる場合、hostfileの作成や、またどのノードが何コア空いているかを調べたりするのに、手間と時間がかかり、思いついてパッと実行することができません。しかし、ジョブスケジューラを使えば、準備やチェックが全く不要で、直ぐにジョブの投入が可能です。今回は姫野ベンチのMPIバージョ
legacy-server-blog
これまでの連載でhpcクラスターを構成するために必要なソフトウェアのインストールと設定は全て終わりました。 現在のところhpcクラスターを構成するノードはhpc01とhpc02の2台だけですが、hpc02をクローンして幾つかのファイルを修正すれば、ノードを増やすことができます。 ...
legacy-server-blog
ジョブスケジューラのインストールと設定を行います。クラスターがバラバラのPC/サーバに比べて非常に便利な点に、ジョブスケジューラが使えることがあります。プログラムのパラメータや入力ファイルを少しづつ変えて、たくさん流してその結果を比較したい場合など、プログラムを多数実行したい場合は多々あります。以下では、それらのプログ
legacy-server-blog
1台のコンピュータではプログラムの実行速度が遅い場合、複数台のコンピュータを使って、実行速度を速くできます。そのために使われる標準的な方法がMPI(Message Passing...
legacy-server-blog
ログインノード(hpc01)でユーザー登録すれば、クラスターの全ノードでそのユーザーが有効になるように設定を行います。
legacy-server-blog
クラスター構築の方針ですが、まず最小構成(hpc01とhpc02)のクラスターを完成させます。その後、hpc02をコピーしてhpc03, hpc04と作っていきます。 今回は hpc01の/homeをNFSでexportして/hpc02で読み書きできるようにします。...