- 2017 年 2 月 11 日
- ヴァシリス・ヴリニオティス
- 。 6コメント
dstat Linuxボックスのリソース統計を取得できる素晴らしい小さなツールです。 それはあなたが追加のプラグインを開発することを可能にし、それが使いやすいモジュラーアーキテクチャを持っています。 最近、KerasとTensorflowで開発されたディープラーニングパイプラインをプロファイリングしていて、CPU、ハードディスク、GPUの使用状況に関する詳細な統計が必要でした。 最初のXNUMXつはすぐに使用できるdstatで利用できますが、NVIDIAグラフィックカードのGPU使用状況を監視するプラグインがないことがわかっています。
ありがたいことに、dstat用のpythonプラグインを作成するのは非常に簡単です。 私はすでに公式リポジトリでプルリクエストを送信しましたが、新しいバージョンがリリースされることはめったにないので、ここに設定する方法に関するいくつかの指示があります dstat NVIDIA GPU使用プラグイン あなたの箱に。
インストール
次のコマンドはUbuntu 16.04でテストされており、dstat、Python NVIDIA Management Library、および私のdstat nvidiaプラグインのインストールに役立ちます。
sudo apt-get install dstat #install dstat sudo pip install nvidia-ml-py #install Python NVIDIA Management Library wget https://raw.githubusercontent.com/datumbox/dstat/master/plugins/dstat_nvidia_gpu.py sudo mv dstat_nvidia_gpu.py /usr/share/dstat/ #move file to the plugins directory of dstat
GPU使用率(パーセンテージ)とともにすべてのデフォルト統計を取得するには、次のコマンドを入力します。
dstat -a --nvidia-gpu ----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system-- gpu-u usr sys idl wai hiq siq| read writ| recv send| in out | int csw |total 2 1 96 0 0 0|5816k 15M| 0 0 | 0 0 | 45k 98k| 68 0 1 98 0 0 0| 57M 128k| 104B 902B| 0 0 | 42k 85k| 50 8 7 84 1 0 0| 152M 0 | 292B 448B| 0 0 | 52k 93k| 39 1 1 97 1 0 0| 111M 0 | 52B 374B| 0 0 | 51k 116k| 62 0 1 98 1 0 0| 129M 0 | 80B 416B| 0 0 | 43k 85k| 92 0 2 98 0 0 0| 0 0 | 52B 374B| 0 0 | 41k 83k| 81
各GPUのすべての使用統計を取得するには、次のコマンドを使用します。
dstat --nvidia-gpu -f -------------------------------------------gpu-usage-nvidia------------------------------------------ total gpu0 gpu1 gpu2 gpu3 gpu4 gpu5 gpu6 gpu7 gpu8 gpu9 gpu10 gpu11 gpu12 gpu13 gpu14 gpu15 19 23 22 21 21 20 22 23 25 15 18 16 16 16 18 16 14 18 21 20 18 22 21 21 22 21 15 15 14 14 14 15 16 13 10 14 9 13 8 9 11 9 12 9 9 10 10 8 7 9 9 18 20 22 19 21 20 21 21 22 14 15 14 15 14 15 15 15 20 24 22 23 24 25 22 22 22 16 16 16 16 16 16 18 16 15 21 18 19 18 17 17 16 18 14 13 13 14 13 12 11 11 20 24 22 22 24 25 23 24 22 16 18 16 14 17 17 17 15 19 29 18 23 21 22 21 20 21 18 16 16 18 14 14 17 17
機能
プラグインは、システムで使用可能なGPUの数をフェッチし、各GPUの使用率メトリックの10倍のサンプルを取得します。 複数回サンプリングすると、単一の測定を取得するよりもスムーズなメトリックが返されることが期待されます。 その後、すべてのGPUの使用量を平均化し、結果をユーザーに返します。 プラグインのソースコードが利用可能です こちら.
あなたがそれを楽しんでくれることを願っています、幸せなGPUプログラミング! 🙂