使用 Linux dstat 工具 PlatoBlockchain Data Intelligence 获取 NVIDIA 卡的 GPU 使用情况。垂直搜索。人工智能。

使用Linux dstat工具获取NVIDIA卡的GPU使用情况

dstat 是一个很棒的小工具,可让您获取Linux机器的资源统计信息。 它具有模块化架构,可让您开发其他插件,并且易于使用。 最近,我正在分析由Keras和Tensorflow开发的深度学习管道,我需要有关CPU,硬盘和GPU使用情况的详细统计信息。 据我所知,前两个可以由dstat即时使用,据我所知,没有插件可以监视NVIDIA图形卡的GPU使用情况。

幸运的是,为dstat编写python插件非常容易。 我已经发送了关于正式回购的请求请求,但是由于新版本的发布相对较少,因此以下是一些有关如何设置 dstat NVIDIA GPU使用插件 在你的盒子上。

装置

以下命令已在Ubuntu 16.04上进行了测试,它们将帮助您安装dstat,Python NVIDIA Management Library和我的dstat nvidia插件:

sudo apt-get install dstat #install dstat
sudo pip install nvidia-ml-py #install Python NVIDIA Management Library
wget https://raw.githubusercontent.com/datumbox/dstat/master/plugins/dstat_nvidia_gpu.py
sudo mv dstat_nvidia_gpu.py /usr/share/dstat/ #move file to the plugins directory of dstat

要获取所有默认统计信息以及GPU使用率(百分比),请输入以下命令:

dstat -a --nvidia-gpu

----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system-- gpu-u
usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw |total
  2   1  96   0   0   0|5816k   15M|   0     0 |   0     0 |  45k   98k|   68
  0   1  98   0   0   0|  57M  128k| 104B  902B|   0     0 |  42k   85k|   50
  8   7  84   1   0   0| 152M    0 | 292B  448B|   0     0 |  52k   93k|   39
  1   1  97   1   0   0| 111M    0 |  52B  374B|   0     0 |  51k  116k|   62
  0   1  98   1   0   0| 129M    0 |  80B  416B|   0     0 |  43k   85k|   92
  0   2  98   0   0   0|   0     0 |  52B  374B|   0     0 |  41k   83k|   81

要获取每个GPU的所有使用情况统计信息,请使用以下命令:

dstat --nvidia-gpu -f
-------------------------------------------gpu-usage-nvidia------------------------------------------
total  gpu0  gpu1  gpu2  gpu3  gpu4  gpu5  gpu6  gpu7  gpu8  gpu9 gpu10 gpu11 gpu12 gpu13 gpu14 gpu15
   19    23    22    21    21    20    22    23    25    15    18    16    16    16    18    16    14
   18    21    20    18    22    21    21    22    21    15    15    14    14    14    15    16    13
   10    14     9    13     8     9    11     9    12     9     9    10    10     8     7     9     9
   18    20    22    19    21    20    21    21    22    14    15    14    15    14    15    15    15
   20    24    22    23    24    25    22    22    22    16    16    16    16    16    16    18    16
   15    21    18    19    18    17    17    16    18    14    13    13    14    13    12    11    11
   20    24    22    22    24    25    23    24    22    16    18    16    14    17    17    17    15
   19    29    18    23    21    22    21    20    21    18    16    16    18    14    14    17    17

产品思路

该插件获取系统上可用GPU的数量,并采样每个GPU使用率10倍的样本。 希望进行多次采样将比获得单次测量返回更平滑的指标。 之后,它将平均所有GPU的使用情况,并将结果返回给用户。 该插件的源代码可用 点击此处.

希望您喜欢它,快乐的GPU编程! 🙂

时间戳记:

更多来自 基准框