Asight Compute快速入门
1. 概述
Asight Compute是一款用于PPU应用程序的Kernel分析器,支持收集Kernel运行期间的Metrics并展示,可以对Kernel的性能进行优化。Asight Compute分为两个工具:
acu命令行工具:用于采集Kernel的Metrics,并生成报告。运行在Linux平台。
Asight Compute GUI工具:用于展示报告。支持Windows和Mac平台。Asight Compute GUI提供多种视图展示Metrics,如Roofline Chart,Bar Chart,Memory Table等,并且支持Baseline比对功能,操作简单,易于使用。
Asight Compute工具的使用流程为:
用acu命令行工具跟踪目标程序,生成报告。
用Asight Compute GUI打开报告,进行分析。
2. 获取与安装
如果您使用官方镜像,镜像中已预置该工具,无需安装。
2.1 配置acu命令行工具
配置环境变量
进入PPU SDK目录,通过脚本配置所需环境变量:
source envsetup.sh检查运行环境
若希望查看acu使用帮助,执行:
acu -hTips:直接输入acu,不带任何参数,也可以查看acu帮助文档
此外,若希望查看当前安装的acu的版本信息,执行:
acu -v
2.2 获取Asight Compute GUI工具
Asight Compute GUI工具支持以下操作系统版本:
Windows10,Windows11
macOS10.15及以上版本
请点击下载链接前往下载页面,选择需要的版本,Windows操作系统机器请下载msi安装包,macOS操作系统机器请下载dmg安装包。
下载软件包需要账号和密码,请联系您的客户经理(PDSA)获取。
3. 快速入门
在本文中,将运行PPU程序的设备称为目标机(Target),将查看报告的设备称为主机(Host)。Asight Compute使用流程:用acu命令行工具在目标机采集报告,用Asight Compute GUI工具在主机打开由acu生成的报告,进行查看和分析。
3.1 使用acu工具采集报告
使用acu命令工具来启动目标应用程序,采集目标应用的性能数据。在应用程序结束后,acu会输出报告文件。
acu的使用方式为: acu [options] <application> [application args]
例如,要采集目标程序所有kernel启动的性能数据,可使用以下命令:
acu -o test_report -f python test_linear.py-o test_report指定输出报告名称(不需要指定后缀名)。-f为强制覆盖原有文件。python test_linear.py运行应用程序。
在应用程序运行结束后,acu会生成对应的报告文件,本例中为test_report.acurep。

acu提供选项用于指定采集哪些kernel数据。-c,--launch-count可以限制采集的kernel启动次数,-s,--launch-skip在数据采集开始之前跳过指定数量的kernel,-k,--kernal-name允许通过名称的正则表达式匹配来过滤kernel。详情请参见过滤Kernel。
要限制每次kernel启动采集的内容,可以使用--set指定采集的set。默认情况下,采集默认set关联的section。使用--list-sets查看当前可用set的列表。请使用--section通过标识符指定确切的*.section文件。使用--list-sections查看当前可用section的列表。可以使用--metrics收集一组单独的metrics。可以使用--query-metrics查询可用metrics。详情请参见指定采集的metric集合。
acu还支持多种replay模式,详情请参见指定Replay模式。
除了将结果保存在报告文件中,acu还支持使用不同的页面打印结果。这些页面对应于用户界面报告中的相应页面。如果没有-o显式指定输出文件,默认情况下会打印details页面。要选择不同的页面,或者在结果保存到文件的同时打印,请使用--page=<Page>命令。目前,支持以下页面:details,raw。
3.2 查看报告
acu采集的报告后缀名为.acurep,可以在Asight Compute GUI中查看报告内容。GUI工具支持的文件打开方式有:
主菜单打开:File->Open...
将文件Drag&Drop到Asight Compute GUI主窗口打开
右键菜单打开:Project Explorer空白区域点击鼠标右键->Open...
通过GUI工具的命令行打开,如
acu-uireport.acurep
报告文件(.acurep)是独立的,可以与其他用户共享。但使用的Asight Compute套件版本不应低于采集报告时的版本,当GUI工具打开高版本的命令行工具采集的报告时,会有提示。