0_adump_args【免费下载链接】runtime本项目提供CANN运行时组件和维测功能组件。项目地址: https://gitcode.com/cann/runtime描述本用例展示了单算子执行场景下如何管理Dump算子信息并将算子信息文件输出到path参数指定的目录主线程中设置Device一个shape对应一个算子信息文件文件中包含算子类型、算子属性、算子输入输出的format/数据类型/shape等信息。产品支持情况本样例支持以下产品产品是否支持Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A2 训练系列产品/Atlas A2 推理系列产品√编译运行环境安装详情以及运行详情请见example目录下的README。运行步骤如下# ${install_root} 替换为 CANN 安装根目录默认安装在/usr/local/Ascend目录 source ${install_root}/cann/set_env.sh export ASCEND_INSTALL_PATH${install_root}/cann # ${ascend_name} 替换为昇腾AI处理器的型号可通过 npu-smi info 查看 Name 字段并去掉空格获得例如 ascend910b3 export SOC_VERSION${ascend_name} # 部分样例中涉及调用AscendC算子需配置AscendC编译器ascendc.cmake所在的路径如 ${install_root}/cann/aarch64-linux/tikcpp/ascendc_kernel_cmake # 可在CANN包安装路径下查找ascendc_kernel_cmake例如find ./ -name ascendc_kernel_cmake并将${cmake_path}替换为ascendc_kernel_cmake所在路径 export ASCENDC_CMAKE_DIR${cmake_path} # 编译运行 bash run.shCANN RUNTIME API在该sample中涉及的关键功能点及其关键接口如下所示初始化调用aclInit接口初始化AscendCL配置。调用aclopStartDumpArgs接口使能Dump算子信息。调用acldumpGetPath接口查询当前Dump输出路径。调用aclopStopDumpArgs接口去使能Dump算子信息。调用aclFinalize接口实现AscendCL去初始化。Device管理调用aclrtSetDevice接口指定用于运算的Device。调用aclrtSynchronizeDevice接口阻塞等待正在运算中的Device完成运算。调用aclrtResetDeviceForce接口强制复位当前运算的Device回收Device上的资源。Stream管理调用aclrtCreateStream接口创建Stream。调用aclrtSynchronizeStream接口阻塞等待Stream上任务的完成。调用aclrtDestroyStream接口销毁Stream。内存管理调用aclrtMalloc接口申请Device上的内存。调用aclrtFree接口释放Device上的内存。数据传输调用aclrtMemcpy接口通过内存复制的方式实现数据传输。本示例新增覆盖acldumpGetPath查询当前Dump输出路径便于确认Dump结果的落盘目录。已知issue暂无【免费下载链接】runtime本项目提供CANN运行时组件和维测功能组件。项目地址: https://gitcode.com/cann/runtime创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考