VMware ESXi DirectPath I/O 直通GPU卡给虚拟机使用

VMware ESXi DirectPath I/O 直通GPU卡给虚拟机使用

在虚拟机中使用 GPU 主要有三种设置:DirectPath I/O、NVIDIA vGPU、vSphere Bitfusion,几个月前,已经介绍了NVIDIA vGPU部署步骤,参考:VMware ESXi安装NVIDIA GPU显卡硬件驱动和配置

有些时候,虚拟机需要独享GPU资源,那么就需要用到DirectPath I/O (直通),ESXi hypervisor 把 GPU 设备直接映射成虚机中的 GPU 设备,供应用使用。DirectPath I/O 方法通常用于高性能计算方案中,是在虚机中使用 GPU 能够达到最高性能的一种方法。(缺点:虚拟机不支持vMotion和快照)

环境:ESXi 6.7U3;NVIDIA Tesla V100 PCIe 32G。

1、登录ESXi主机,管理,硬件,PCI设备,勾选GPU卡,切换直通,会提示要求重启主机,重启主机之后,该GPU设备直通一栏显示为“活动”。

2、按常规方式新建虚拟机,添加PCI设备,选中对应GPU卡。注意,内存注意一定要勾选预留,否则开机后报错如下:无法打开虚拟机 win10 的电源。内存设置无效: 内存预留 (sched.mem.min) 应该等于内存大小 (32768)。 单击此处了解更多详细信息。

解决办法:预留所有客户机内存(全部锁定)

3、再次开机,继续报错:打开虚拟机的电源。模块“DevicePowerOn”打开电源失败。 单击此处了解更多详细信息。

解决办法:

1)先确认虚拟机是否EFI引导:编辑虚拟机 – 虚拟机选项 – 引导选项 – 固件 – EFI;

2)编辑虚拟机 – 虚拟机选项 – 高级 – 配置参数 – 编辑配置:添加以下2条;

pciPassthru.use64bitMMIO=”TRUE”

pciPassthru.64bitMMIOSizeGB=64

备注:MMIOSize设置为虚拟机分配的所有GPU显存大小的两倍

4、虚拟机安装操作系统和NVIDIA驱动之后,在虚拟机设备管理器已经能看到V100显卡了。

dinghui.org

关注虚拟化及IT技术发展!

11条评论

LIchun 发布于13:49 - 2023年08月3日

配置和型号一样,设备管理器里面也显示驱动安装成功了。但是任务管理器中一直看不到GPU的信息。望大佬指点一二,不胜感激。

    dinghui.org 发布于20:16 - 2023年08月3日

    经排查,你的ESXi 6.7版本较低,建议升级到最新补丁或者U3以上再尝试。

gpu passthrough(gpu直通)与gpu partitioning – Note 发布于09:14 - 2023年06月6日

[…] VMware ESXi DirectPath I/O 直通GPU卡给虚拟机使用 […]

hqshi 发布于10:44 - 2022年12月12日

我也遇上过类似问题,解决方法是移除另一张消费级显卡并取消直通P4,我的系统是ESXi8.0.希望能提供帮助

Beasx 发布于14:44 - 2022年12月2日

大佬,请问能指教一下吗?我在esxi7.0 u3安装P4显卡一直未能成功。在nvidia看到很多个版本的驱动,不知道选哪 一个,试了很多个都能安装但驱动不了。能否指点一下呢?

    dinghui.org 发布于15:49 - 2022年12月2日

    您是准备将P4显卡,用于vGPU,还是说用于直通,直通参考本文档,vGPU参考另外的文档,你搜一下之前的文档,有写vGPU安装驱动注意事项。

      Beasx 发布于10:25 - 2022年12月4日

      用于vgpu,按照文档安装驱动,但一直提示
      [root@localhost:~] nvidia-smi
      NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
      试过很多个版本的驱动都一样,也将esxi重装6.7、7、8几个版本尝试,都是不行。机器是gen10p.感觉到处无解。有方式直接跟您联系吗?

        dinghui.org 发布于10:53 - 2022年12月4日

        BIOS中检查一下VT-D/IOMMU,SR-IOV等是否开启。底下有联系电话,电话也是微信。

        hqshi 发布于10:43 - 2022年12月12日

        我也遇上过类似问题,解决方法是移除另一张消费级显卡并取消直通P4,我的系统是ESXi8.0.希望能提供帮助

鲁汀 发布于00:08 - 2021年12月20日

丁辉大大您好:
我在虚拟机下直通显卡并添加了配置参数hypervisor.cpuid.v0=FALSE
在虚拟机第一次启动时显卡可以正常驱动,虚拟机关机在开机显卡报错43
重启主机可以解决问题
ESXI7.0U2
SERVER2012R2
NVDIA T400

    dinghui.org 发布于08:35 - 2021年12月20日

    我刚查了一下VMware的Virtual Dedicated Graphics Acceleration (vDGA)兼容列表,NVIDIA T400没在兼容列表。

回复 hqshi 取消回复


The reCAPTCHA verification period has expired. Please reload the page.