- 2017 年 2 月 11 日
- 瓦西利斯·弗里尼奥提斯(Vasilis Vryniotis)
- 。 6条留言
dstat 是一个很棒的小工具,可让您获取Linux机器的资源统计信息。 它具有模块化架构,可让您开发其他插件,并且易于使用。 最近,我正在分析由Keras和Tensorflow开发的深度学习管道,我需要有关CPU,硬盘和GPU使用情况的详细统计信息。 据我所知,前两个可以由dstat即时使用,据我所知,没有插件可以监视NVIDIA图形卡的GPU使用情况。
幸运的是,为dstat编写python插件非常容易。 我已经发送了关于正式回购的请求请求,但是由于新版本的发布相对较少,因此以下是一些有关如何设置 dstat NVIDIA GPU使用插件 在你的盒子上。
装置
以下命令已在Ubuntu 16.04上进行了测试,它们将帮助您安装dstat,Python NVIDIA Management Library和我的dstat nvidia插件:
sudo apt-get install dstat #install dstat sudo pip install nvidia-ml-py #install Python NVIDIA Management Library wget https://raw.githubusercontent.com/datumbox/dstat/master/plugins/dstat_nvidia_gpu.py sudo mv dstat_nvidia_gpu.py /usr/share/dstat/ #move file to the plugins directory of dstat
要获取所有默认统计信息以及GPU使用率(百分比),请输入以下命令:
dstat -a --nvidia-gpu ----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system-- gpu-u usr sys idl wai hiq siq| read writ| recv send| in out | int csw |total 2 1 96 0 0 0|5816k 15M| 0 0 | 0 0 | 45k 98k| 68 0 1 98 0 0 0| 57M 128k| 104B 902B| 0 0 | 42k 85k| 50 8 7 84 1 0 0| 152M 0 | 292B 448B| 0 0 | 52k 93k| 39 1 1 97 1 0 0| 111M 0 | 52B 374B| 0 0 | 51k 116k| 62 0 1 98 1 0 0| 129M 0 | 80B 416B| 0 0 | 43k 85k| 92 0 2 98 0 0 0| 0 0 | 52B 374B| 0 0 | 41k 83k| 81
要获取每个GPU的所有使用情况统计信息,请使用以下命令:
dstat --nvidia-gpu -f -------------------------------------------gpu-usage-nvidia------------------------------------------ total gpu0 gpu1 gpu2 gpu3 gpu4 gpu5 gpu6 gpu7 gpu8 gpu9 gpu10 gpu11 gpu12 gpu13 gpu14 gpu15 19 23 22 21 21 20 22 23 25 15 18 16 16 16 18 16 14 18 21 20 18 22 21 21 22 21 15 15 14 14 14 15 16 13 10 14 9 13 8 9 11 9 12 9 9 10 10 8 7 9 9 18 20 22 19 21 20 21 21 22 14 15 14 15 14 15 15 15 20 24 22 23 24 25 22 22 22 16 16 16 16 16 16 18 16 15 21 18 19 18 17 17 16 18 14 13 13 14 13 12 11 11 20 24 22 22 24 25 23 24 22 16 18 16 14 17 17 17 15 19 29 18 23 21 22 21 20 21 18 16 16 18 14 14 17 17
产品思路
该插件获取系统上可用GPU的数量,并采样每个GPU使用率10倍的样本。 希望进行多次采样将比获得单次测量返回更平滑的指标。 之后,它将平均所有GPU的使用情况,并将结果返回给用户。 该插件的源代码可用 点击此处.
希望您喜欢它,快乐的GPU编程! 🙂