Linux dstat ツール PlatoBlockchain Data Intelligence を使用して、NVIDIA カードの GPU 使用率を取得します。垂直検索。あい。

Linux dstatツールでNVIDIAカードのGPU使用状況を取得する

  dstat Linuxボックスのリソース統計を取得できる素晴らしい小さなツールです。 それはあなたが追加のプラグインを開発することを可能にし、それが使いやすいモジュラーアーキテクチャを持っています。 最近、KerasとTensorflowで開発されたディープラーニングパイプラインをプロファイリングしていて、CPU、ハードディスク、GPUの使用状況に関する詳細な統計が必要でした。 最初のXNUMXつはすぐに使用できるdstatで利用できますが、NVIDIAグラフィックカードのGPU使用状況を監視するプラグインがないことがわかっています。

ありがたいことに、dstat用のpythonプラグインを作成するのは非常に簡単です。 私はすでに公式リポジトリでプルリクエストを送信しましたが、新しいバージョンがリリースされることはめったにないので、ここに設定する方法に関するいくつかの指示があります dstat NVIDIA GPU使用プラグイン あなたの箱に。

インストール

次のコマンドはUbuntu 16.04でテストされており、dstat、Python NVIDIA Management Library、および私のdstat nvidiaプラグインのインストールに役立ちます。

sudo apt-get install dstat #install dstat
sudo pip install nvidia-ml-py #install Python NVIDIA Management Library
wget https://raw.githubusercontent.com/datumbox/dstat/master/plugins/dstat_nvidia_gpu.py
sudo mv dstat_nvidia_gpu.py /usr/share/dstat/ #move file to the plugins directory of dstat

GPU使用率(パーセンテージ)とともにすべてのデフォルト統計を取得するには、次のコマンドを入力します。

dstat -a --nvidia-gpu

----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system-- gpu-u
usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw |total
  2   1  96   0   0   0|5816k   15M|   0     0 |   0     0 |  45k   98k|   68
  0   1  98   0   0   0|  57M  128k| 104B  902B|   0     0 |  42k   85k|   50
  8   7  84   1   0   0| 152M    0 | 292B  448B|   0     0 |  52k   93k|   39
  1   1  97   1   0   0| 111M    0 |  52B  374B|   0     0 |  51k  116k|   62
  0   1  98   1   0   0| 129M    0 |  80B  416B|   0     0 |  43k   85k|   92
  0   2  98   0   0   0|   0     0 |  52B  374B|   0     0 |  41k   83k|   81

各GPUのすべての使用統計を取得するには、次のコマンドを使用します。

dstat --nvidia-gpu -f
-------------------------------------------gpu-usage-nvidia------------------------------------------
total  gpu0  gpu1  gpu2  gpu3  gpu4  gpu5  gpu6  gpu7  gpu8  gpu9 gpu10 gpu11 gpu12 gpu13 gpu14 gpu15
   19    23    22    21    21    20    22    23    25    15    18    16    16    16    18    16    14
   18    21    20    18    22    21    21    22    21    15    15    14    14    14    15    16    13
   10    14     9    13     8     9    11     9    12     9     9    10    10     8     7     9     9
   18    20    22    19    21    20    21    21    22    14    15    14    15    14    15    15    15
   20    24    22    23    24    25    22    22    22    16    16    16    16    16    16    18    16
   15    21    18    19    18    17    17    16    18    14    13    13    14    13    12    11    11
   20    24    22    22    24    25    23    24    22    16    18    16    14    17    17    17    15
   19    29    18    23    21    22    21    20    21    18    16    16    18    14    14    17    17

機能

プラグインは、システムで使用可能なGPUの数をフェッチし、各GPUの使用率メト​​リックの10倍のサンプルを取得します。 複数回サンプリングすると、単一の測定を取得するよりもスムーズなメトリックが返されることが期待されます。 その後、すべてのGPUの使用量を平均化し、結果をユーザーに返します。 プラグインのソースコードが利用可能です こちら.

あなたがそれを楽しんでくれることを願っています、幸せなGPUプログラミング! 🙂

タイムスタンプ:

より多くの データムボックス