Planejar a aceleração de GPU no Windows Server

Artigo
11/02/2024
Aplica-se a:

✅ Windows Server 2025, ✅ Windows Server 2022, ✅ Windows Server 2019, ✅ Windows Server 2016, ✅ Azure Stack HCI, versions 23H2 and 22H2

Este artigo apresenta os recursos de virtualização de gráficos disponíveis no Windows Server.

Quando usar a aceleração de GPU

Dependendo da sua carga de trabalho, convém considerar a aceleração da GPU. Veja o que você deve considerar antes de escolher a aceleração de GPU:

Cargas de trabalho de comunicação remota de aplicativos e áreas de trabalho (VDI/DaaS): se você estiver criando um serviço de comunicação remoto de aplicativo ou área de trabalho com o Windows Server, considere o catálogo de aplicativos que você espera que seus usuários executem. Alguns tipos de aplicativos, como aplicativos CAD/CAM, aplicativos de simulação, jogos e aplicativos de renderização/visualização, dependem muito da renderização 3D para oferecer uma interatividade suave e responsiva. A maioria dos clientes considera as GPUs uma necessidade para uma experiência razoável do usuário com esses tipos de aplicativos.
Cargas de trabalho de renderização, codificação e visualização remotas: essas cargas de trabalho orientadas a gráficos tendem a depender muito dos recursos especializados de uma GPU, como renderização 3D eficiente e codificação/decodificação de quadros, a fim de atingir metas de custo e taxa de transferência. Para esse tipo de carga de trabalho, uma única máquina virtual (VM) habilitada para GPU pode ser capaz de corresponder à taxa de transferência de muitas VMs somente de CPU.
Cargas de trabalho de HPC e ML: para cargas de trabalho computacionais altamente paralelas a dados, como treinamento ou inferência de modelo de machine learning e computação de alto desempenho, as GPUs podem reduzir drasticamente o tempo de resultado, o tempo de inferência e o tempo de treinamento. Como alternativa, eles podem oferecer melhor custo-benefício do que uma arquitetura somente de CPU em um nível de desempenho comparável. Muitas estruturas de computação de alto desempenho (HPC) e machine learning podem usar aceleração de GPU; considere se a aceleração da GPU pode beneficiar sua carga de trabalho específica.

Virtualização de GPU no Windows Server

As tecnologias de virtualização de GPU permitem a aceleração de GPU em um ambiente virtualizado, normalmente em máquinas virtuais. Se sua carga de trabalho for virtualizada com o Hyper-V, você precisará empregar a virtualização gráfica para fornecer aceleração de GPU da GPU física para seus aplicativos ou serviços virtualizados. No entanto, se a carga de trabalho for executada diretamente em hosts físicos do Windows Server, você não precisará da virtualização gráfica; seus aplicativos e serviços já têm acesso aos recursos de GPU e às APIs com suporte nativo no Windows Server.

As seguintes tecnologias de virtualização gráfica estão disponíveis para VMs do Hyper-V no Windows Server:

DDA (Atribuição de dispositivo discreto)
GPU-P (particionamento de GPU)

Além das cargas de trabalho de VM, o Windows Server também dá suporte à aceleração de GPU de cargas de trabalho conteinerizadas em contêineres do Windows. Para obter mais informações, consulte Aceleração de GPU em contêineres do Windows.

DDA (Atribuição de dispositivo discreto)

A DDA (Atribuição de Dispositivo Discreto) permite que você dedique uma ou mais GPUs físicas a uma máquina virtual. Em uma implantação de DDA, cargas de trabalho virtualizadas são executadas no driver nativo e normalmente têm acesso total à funcionalidade da GPU. O DDA oferece o nível mais alto de compatibilidade do aplicativo e potencial de desempenho. O DDA também pode fornecer aceleração de GPU para VMs Linux, sujeitas a suporte.

Uma implantação de DDA pode acelerar apenas um número limitado de máquinas virtuais, pois cada GPU física pode fornecer aceleração para no máximo uma VM. Se você estiver desenvolvendo um serviço cuja arquitetura dá suporte a máquinas virtuais compartilhadas, considere hospedar várias cargas de trabalho aceleradas por VM. Por exemplo, se você estiver criando uma solução de Serviços de Área de Trabalho Remota, poderá melhorar a escala do usuário usando os recursos de várias sessões do Windows Server para hospedar várias áreas de trabalho de usuário em cada VM. Esses usuários compartilham os benefícios da aceleração da GPU.

Para obter mais informações, confira estes tópicos:

GPU-P (particionamento de GPU)

A partir do Windows Server 2025, o particionamento de GPU permite que você compartilhe um dispositivo de GPU físico com várias máquinas virtuais (VMs). Com o particionamento de GPU ou a virtualização de GPU, cada VM obtém uma fração dedicada da GPU em vez de toda a GPU.

O particionamento de GPU usa a interface SR-IOV (Virtualização de E/S de Raiz Única), que oferece um limite de segurança com suporte de hardware com desempenho previsível para cada VM. Cada VM pode acessar apenas os recursos de GPU dedicados a elas e o particionamento de hardware seguro impede o acesso não autorizado por outras VMs.

Para saber mais sobre particionamento de GPU, consulte estes artigos:

Comparando o particionamento de DDA e GPU

Considere a seguinte funcionalidade e as diferenças de suporte entre as tecnologias de virtualização gráfica ao planejar sua implantação:

Descrição	Atribuição de dispositivo discreto	Particionamento de GPU
Modelo de recurso da GPU	Somente dedicado	Partitioned
Densidade da VM	Baixa (uma ou mais GPUs para uma VM)	Alta (uma ou mais GPUs para muitas VMs)
Compatibilidade do aplicativo	Todas as funcionalidades de GPU oferecidas pelo fornecedor (DX 12, OpenGL, CUDA)	Todas as funcionalidades de GPU oferecidas pelo fornecedor (DX 12, OpenGL, CUDA)
AVC444	Disponível por meio da Política de Grupo	Disponível por meio da Política de Grupo
VRAM da GPU	Até o limite de VRAM compatível com a GPU	Até o limite de VRAM compatível com a GPU por partição
Driver da GPU no convidado	Driver do fornecedor da GPU (NVIDIA, AMD, Intel)	Driver do fornecedor da GPU (NVIDIA, AMD, Intel)

Compartilhar via