NVIDIA Nsight Systems 简介
NVIDIA Nsight Systems 是一个低开销的系统级性能分析器。它的核心设计目标是回答一个关键问题:“我的应用程序在运行过程中,时间到底花在了哪里?”
它不同于之前讨论的监控工具(如
、
gpustat
),后者主要关注硬件资源的实时状态(如利用率、温度)。Nsight Systems 则专注于应用程序的行为,它通过收集代码在CPU和GPU上的执行细节,生成一个跨整个系统的时间线视图,让开发者能够清晰地看到线程活动、GPU内核执行、内存拷贝、API调用等事件之间的因果关系和时序关系。
DCGM
核心功能与特性
跨平台、跨硬件的时间线分析
全局视野:它不是孤立地看CPU或GPU,而是将CPU、GPU、内存拷贝等多个硬件单元的活动整合在同一个时间轴上。这让你能一眼看出是CPU准备数据慢,还是GPU计算慢,或者是数据传输(PCIe)成为了瓶颈。
低开销:其设计目标是尽可能少地影响被分析的应用程序,从而得到更真实的性能数据,尤其适合分析大型生产级应用。
深入的GPU分析
GPU内核(Kernel)分析:精确显示每个CUDA内核的启动时间、执行时长、所在的流(Stream),以及是哪个CPU线程发起的。
GPU利用率:显示SM(流多处理器)的实际利用率,区分是计算密集型还是内存访问密集型。</
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...