新版NVIDIA vGPU许可证服务器(DLS/CLS)搭建

新版NVIDIA vGPU许可证服务器(DLS/CLS)搭建

在早期,写过一篇NVIDIA vGPU License服务器安装过程,当时基于传统版本的vGPU许可服务器(legacy server)搭建的,但是传统版本的vGPU授权软件生命周期即将结束(截至到2023年7月底),新版本的NVIDIA 许可证服务器提供两种License 服务形式来授权vGPU,一种是CLS(Cloud License Service),基于公网环境授权,借助NVIDIA官方CLS服务器授权;另一种是DLS(Delegated License Service),基于企业私网环境授权。(注意:新版NVIDIA许可服务器需要vGPU 版本13.0及以上。)

本章节重点介绍DLS部署过程。

一、授权服务器端的的配置

1、从nvidia企业门户网站下载DLS虚拟机映像。以vSphere平台为例。

2、将下载后的DLS镜像文件包导入到vSphere平台。

将下载后的nls-2.0.1-bios-ESXi.zip解压缩后,nls-2.0.1-bios.ova,ovf导入过程就不介绍了。

按照提示设置IP,网关,掩码,DNS,等待部署完成后开机。

3、打开浏览器,访问DLS的IP,选择全新安装。

保存好该字符串,在后续忘记密码重置密码的时候可以用到。

下载tok文件并保存好。

4、返回到NVIDIA官网获取License文件。

注意:Create legacy server不能勾选,这一项为之前基于OS和软件的许可服务器。
Express CLS Installation也不能勾选,勾选此选项为基于公网许可服务器。

上传从本地DLS下载的tok文件,上传后状态为Pending,Actions选项中可以将状态更新为Registered。

返回List servers,对已经创建的License Server和上传的DLS绑定。

绑定成功后,可以下载到一个以license开头的bin文件。

5、将bin授权文件上传到本地DLS平台。

上传后,点击Install server ,提示安装成功。并在右侧Actions内配置好NTP服务器。

这个步骤完成后,本地DLS即获得License授权能力,就可以给vGPU授权了。

二、vGPU客户端的配置

1、登录DLS控制台,生成适用于客户端的tok文件。(之前版本使用IP和端口来配置授权服务器,新版使用tok文件来验证授权。)

下载后得到一个client开头的tok文件。

2、从NVIDIA门户网站,下载vGPU对应的虚拟机驱动,注意一定要13.x版本以上才支持DLS/CLS授权服务器。(目前13.x的最新版为13.4)

以上标注了各文件的用途。一定要注意宿主机驱动版本和虚拟机驱动版本的兼容。

3、Linux虚拟机安装注意事项

1)安装和宿主机相同版本的对应虚拟机的vGPU驱动程序;
2)cd /etc/nvidia, 复制gridd.conf.template为gridd.conf。并编辑gridd.conf, 设置FeatureType值为请求的类型;
3)将下载的client开头的tok文件复制到/etc/nvidia/ClientConfigToken目录中,重启nvidia-gridd服务systemctl restart nvidia-gridd ;
4)用nvidia-smi -q 查询授权状态。

4、Windows虚拟机安装注意事项

1)安装和宿主机相同版本的对应虚拟机的vGPU驱动程序;
2)将下载的client开头的tok文件复制到C:\Program Files\NVIDIA Corporation\vGPULicensing\ClientConfigToken ;
3)重启NVIDIA Display Container LS 服务;
4)用C:\ProgramFiles\NVIDIA Corporation\NVSMI\nvidia-smi.exe -q查询授权状态。

如上图,在虚拟机内查询状态,状态显示Licensed,表示许可已经授权激活成功。

附:ESXi上的安装和配置,可以参考:VMware ESXi安装NVIDIA GPU显卡硬件驱动和配置vGPU

dinghui.org

关注虚拟化及IT技术发展!

7条评论

Randi 发布于06:39 - 2022年11月9日

This iis my fikrst time pay a visit at here annd i
aam truly haply to read all aat alone place.

canghai 发布于13:34 - 2022年10月21日

Tesla P4 搭配Esxi 7.0,官方11.9驱动,esxi上安装显示都正常,但虚拟机不管是win7还是win10 装驱动就蓝屏

    dinghui.org 发布于22:34 - 2022年10月21日

    P4搭载ESXi7在其他项目上实施过,版本没有11.9这么高,验证过是没问题的;你可以参考NVIDIA官网文档,注意查一下服务器和P4的兼容性,尽量保持虚拟机和宿主机的gpu驱动版本一致,或者降低vGPU版本尝试安装,祝你好运。

      canghai 发布于23:38 - 2022年10月21日

      谢谢,我是从最新14.2到14.1到11.9到11.2测试下去的,目前怀疑是主板兼容问题,测试的是nuc系列还有普通tuf的z690主板都不行。
      虚拟机和宿主机的驱动版本都是一致的,也尝试过降级。
      工作站和服务器的主板还没有测试,机器都在跑就没动它
      pve目前测试通过。

        dinghui.org 发布于10:33 - 2022年10月22日

        生产环境下建议使用兼容列表的服务器。NVIDIA vGPU 认证的服务器兼容列表供参考:https://www.nvidia.cn/data-center/resources/vgpu-certified-servers/

阿改 发布于19:53 - 2022年10月4日

感觉比旧版的麻烦,且使用也不方便尼

    dinghui.org 发布于20:25 - 2022年10月11日

    哈哈,这个没得选,只能跟着NVIDIA厂家的步伐走。

发表评论