版本:下一个
启用 Ascend 共享
Ascend 设备插件为 HAMi 提供 NPU 切片支持,支持两种模式:
1. 基于模板的硬切片(vNPU)
基于虚拟化模板支持显存切片,自动使用最小可用模板。有关详细信息,请查看设备模板。
2. 基于运行时拦截的软切片(hami-vnpu-core)
该模式基于 libvnpu.so 拦截和 limiter 令牌调度实现软切片机制,支持细粒度的资源共享。
备注
hami-vnpu-core目前仅支持 ARM 平台。hami-vnpu-core目前仅支持 HAMi 调度器。
先决条件
- Ascend 设备类型:910B, 910A, 310P
- Ascend docker 运行时
软切片(hami-vnpu-core)的额外要求:
- Ascend 驱动版本:≥ 25.5
- 芯片模式:需在 Ascend 芯片上启用
device-share模式以支持虚拟化
启用 device-share 模式,运行以下命令:
npu-smi set -t device-share -i <id> -d <value>
| 参数 | 说明 |
|---|---|
id | 设备 ID,通过运行 npu-smi info -l 命令获取的 NPU ID 即为设备 ID。 |
value | 容器启用状态:0(禁用,默认值)或 1(启用)。 |
启用 Ascend-sharing 支持
由于与 HAMi 的依赖关系,你需要在 HAMi 安装期间设置以下参数:
devices.ascend.enabled=true
有关更多详细信息,参阅 values.yaml 中的 devices 部分:
devices:
ascend:
enabled: true
image: "ascend-device-plugin:master"
imagePullPolicy: IfNotPresent
extraArgs: []
nodeSelector:
ascend: "on"
tolerations: []
resources:
- huawei.com/Ascend910A
- huawei.com/Ascend910A-memory
- huawei.com/Ascend910B
- huawei.com/Ascend910B-memory
- huawei.com/Ascend310P
- huawei.com/Ascend310P-memory
如果你希望 HAMi 自动将 runtimeClassName 配置添加到请求 Ascend 资源的 Pod(默认禁用),请在 HAMi 的 values.yaml 中将 devices.ascend.runtimeClassName 设置为非空字符串,并确保其与 RuntimeClass 资源的名称匹配:
devices:
ascend:
runtimeClassName: ascend