Gestão persistente do estado de funcionamento da memória

Aplica-se a: Azure Stack HCI, versões 22H2 e 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016 Windows 10

Este artigo fornece informações sobre o processamento de erros e a gestão do estado de funcionamento específicos de dispositivos de memória persistente (PMem), muitas vezes denominados memória da classe de armazenamento (SCM), que é um tipo de suporte de dados não volátil que pode ser utilizado como armazenamento de primeira camada.

Estes breves vídeos fornecem uma descrição geral do suporte do Windows para memória persistente:

Veja também Compreender e implementar a memória persistente.

Os dispositivos de memória persistente são suportados com controladores nativos a partir de Windows Server 2016 e Windows 10 (versão 1607). Embora os dispositivos de memória persistente se comportem de forma semelhante a outros discos (HDDs e SSDs), existem algumas diferenças.

Um caso de utilização comum é onde dois módulos de memória persistente são utilizados como uma cache de write-back espelhada num espaço de armazenamento. Para definir tal configuração, veja Configuring Storage Spaces with a NVDIMM-N write-back cache (Configurar Espaços de Armazenamento com uma cache de write-back do NVDIMM-N).

No Windows Server 2016, a GUI do Espaços de Armazenamento mostra o tipo de barramento NVDIMM-N como DESCONHECIDO. Não tem nenhuma perda de funcionalidade ou incapacidade na criação do Agrupamento, VD de Armazenamento. Pode verificar o tipo de barramento ao executar o seguinte cmdlet:

Get-PhysicalDisk | fl

O parâmetro BusType na saída mostrará corretamente o tipo de barramento como SCM.

Ver estado de funcionamento da memória persistente

Esta secção descreve como ver o estado de funcionamento dos módulos de memória persistente. Quando utiliza memória persistente, existem algumas diferenças na experiência de monitorização:

  • A memória persistente não cria contadores de desempenho do Disco Físico, pelo que não a verá em gráficos no Windows Admin Center.
  • A memória persistente não cria dados do Storport 505, pelo que não obterá a deteção proativa de valores atípicos.

Caso contrário, a experiência de monitorização é igual a qualquer outro disco físico.

Pode consultar o estado de funcionamento de um disco de memória persistente ao executar os seguintes cmdlets:

Get-PmemDisk

DiskNumber Size   HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ----   ------------ ------------- ------------ ----------------- -------------------
2          252 GB Unhealthy    None          True         {20, 120}         2
3          252 GB Healthy      None          True         {1020, 1120}      0

Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

SerialNumber               HealthStatus OperationalStatus  OperationalDetails
------------               ------------ ------------------ ------------------
802c-01-1602-117cb5fc      Healthy      OK
802c-01-1602-117cb64f      Warning      Predictive Failure {Threshold Exceeded,NVDIMM_N Error}

Vale a pena notar que pode obter as mesmas informações com o Get-PhysicalDisk cmdlet e especificar o BusType como SCM:

Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

Nota

Para localizar a localização física de um dispositivo de memória persistente especificado num evento, no separador Detalhes do evento no Visualizador de Eventos, aceda a EventData>Location. Tenha em atenção que Windows Server 2016 lista a localização incorreta dos dispositivos de memória persistente, mas esta situação foi corrigida no Windows Server, versão 1709.

HealthStatus mostra se o disco de memória persistente está em bom estado de funcionamento.

O valor UnsafeshutdownCount controla o número de encerramentos que podem causar perda de dados neste disco lógico. É a soma das contagens de encerramento não seguras de todos os dispositivos de memória persistente subjacentes deste disco. Para obter mais informações sobre o estado de funcionamento, utilize o Get-PmemPhysicalDevice cmdlet para encontrar informações como OperationalStatus.

Get-PmemPhysicalDevice

DeviceId DeviceType           HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ----------           ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_C1     102005310        126 GB                 0 GB
1120     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_F1     102005310        126 GB                 0 GB
120      Intel INVDIMM device Healthy      {Ok}              CPU1_DIMM_F1     102005310        126 GB                 0 GB
20       Intel INVDIMM device Unhealthy    {HardwareError}   CPU1_DIMM_C1     102005310        126 GB                 0 GB

Este cmdlet mostra que dispositivo de memória persistente está em mau estado de funcionamento. O dispositivo em mau estado de funcionamento (DeviceId 20) corresponde ao caso no exemplo anterior. O PhysicalLocation no BIOS pode ajudar a identificar que dispositivo de memória persistente está num estado com falhas.

Para ajudar a compreender as várias condições de estado de funcionamento, veja as secções seguintes.

Estado de Funcionamento do Aviso

Esta condição está presente quando verifica o estado de funcionamento de um dispositivo de memória persistente e vê que o respetivo Estado de Funcionamento está listado como Aviso, conforme mostrado neste exemplo de saída:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Bom estado de funcionamento OK
802c-01-1602-117cb64f Aviso Falha Preditiva {Limiar Excedido NVDIMM_N Erro}

A tabela seguinte lista algumas informações sobre esta condição.

Cabeçalho Description
Condição provável Limiar de aviso violado
Causa Raiz Os dispositivos de memória persistente controlam vários limiares, como a temperatura, a duração da NVM e/ou a duração da origem de energia. Quando um desses limiares é excedido, o sistema operativo é notificado.
Comportamento geral O dispositivo permanece totalmente operacional. Este é um aviso, não um erro.
Comportamento de Espaços de Armazenamento O dispositivo permanece totalmente operacional. Este é um aviso, não um erro.
Mais informações Campo OperationalStatus do objeto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operacional
O que fazer Consoante o limiar de aviso violado, pode ser prudente substituir o dispositivo de memória persistente.

As escritas num dispositivo de memória persistente falham

Esta condição está presente quando verifica o estado de funcionamento de um dispositivo de memória persistente e vê o Estado de Funcionamento listado como Mau Estado de Funcionamento e o Estado Operacional menciona um Erro de E/S, conforme mostrado neste exemplo de saída:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Bom estado de funcionamento OK
802c-01-1602-117cb64f Mau estado de funcionamento {Metadados Obsoletos, Erro de E/S, Erro Transitório} {Persistência de Dados Perdidos, Dados Perdidos, NV…}

A tabela seguinte lista algumas informações sobre esta condição.

Cabeçalho Description
Condição provável Perda de persistência/energia de cópia de segurança
Causa Raiz Os dispositivos de memória persistente dependem de uma fonte de energia de cópia de segurança para a sua persistência, normalmente uma bateria ou uma super-tampa. Se esta energia de reserva estiver indisponível ou se o dispositivo não puder, por qualquer motivo, realizar uma cópia de segurança (Erro de Controlador/Flash), os dados estarão em risco e o Windows impedirá qualquer escrita adicional nos dispositivos afetados. As leituras ainda são possíveis para evacuar dados.
Comportamento geral O volume NTFS será desmontado.
O campo Estado de Funcionamento do PhysicalDisk mostrará "Mau estado de funcionamento" para todos os dispositivos NVDIMM-N afetados.
Comportamento de Espaços de Armazenamento O Espaço de Armazenamento permanecerá operacional, desde que apenas um módulo de memória persistente seja afetado. Se forem afetados vários dispositivos, a escrita no Espaço de Armazenamento falhará.
O campo Estado de Funcionamento do PhysicalDisk mostrará "Mau estado de funcionamento" para todos os dispositivos de memória persistente afetados.
Mais informações Campo OperationalStatus do objeto PhysicalDisk.
EventLog – Microsoft-Windows-ScmDisk0101/Operacional
O que fazer Recomendamos a cópia de segurança dos dados do PMem afetados. Para obter acesso de leitura, pode colocar o disco online manualmente (este aparecerá como volume NTFS só de leitura).

Para limpar totalmente esta condição, a causa raiz tem de ser resolvida (ou seja, a fonte de alimentação do serviço ou substituir o módulo de memória persistente, consoante o problema) e o volume no módulo tem de ser colocado offline e colocado online novamente ou o sistema tem de ser reiniciado.

Para tornar o módulo de memória persistente utilizável no Espaços de Armazenamento novamente, utilize o Reset-PhysicalDisk cmdlet, que reintegra o dispositivo e inicia o processo de reparação.

O dispositivo é apresentado com uma capacidade de bytes "0" ou como um "Disco Físico Genérico"

Esta condição está presente quando um dispositivo de memória persistente é apresentado com uma capacidade de 0 bytes e não pode ser inicializado ou é exposto como um objeto "Disco Físico Genérico" sem número de série que apresente um Estado Operacional de Comunicação Perdida, conforme mostrado neste exemplo de saída:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Bom estado de funcionamento OK
Aviso Comunicação Perdida

A tabela seguinte lista algumas informações sobre esta condição.

Cabeçalho Description
Condição provável O BIOS não expôs o módulo de memória persistente ao SO
Causa Raiz Os dispositivos de memória persistentes são baseados em DRAM. Quando um endereço DRAM danificado é referenciado, a maioria das CPUs iniciará uma verificação do computador e reiniciará o servidor. Em seguida, algumas plataformas de servidor anulam o módulo de memória persistente, impedindo o SO de aceder ao mesmo e causando potencialmente outra verificação do computador. Isto também pode ocorrer se o BIOS detetar que o módulo de memória persistente falhou e precisa de ser substituído.
Comportamento geral O módulo de memória persistente é apresentado como não hinitializado, com uma capacidade de 0 bytes e não pode ser lido ou escrito.
Comportamento de Espaços de Armazenamento O Espaço de Armazenamento permanece operacional (desde que apenas um módulo de memória persistente seja afetado).
O objeto PMem PhysicalDisk é apresentado com um Estado de Funcionamento de Aviso e como um "Disco Físico Geral"
Mais informações Campo OperationalStatus do objeto PhysicalDisk.
EventLog – Microsoft-Windows-ScmDisk0101/Operacional
O que fazer O dispositivo de memória persistente tem de ser substituído ou desinstado, de modo a que a plataforma do servidor o exponha novamente ao SO anfitrião. É recomendada a substituição do dispositivo, uma vez que podem ocorrer erros mais incorríveis. A adição de um dispositivo de substituição a uma configuração de espaços de armazenamento pode ser obtida com o Add-PhysicalDisk cmdlet.

O dispositivo é apresentado como um disco RAW ou vazio após um reinício

Esta condição está presente quando verifica o estado de funcionamento de um dispositivo de memória persistente e vê um Estado de Funcionamento em Mau Estado de Funcionamento e Estado Operacional de Metadados Não Reconhecidos, conforme mostrado neste exemplo de saída:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Bom estado de funcionamento OK {Desconhecido}
802c-01-1602-117cb64f Mau estado de funcionamento {Metadados Não Reconhecidos, Metadados Obsoletos} {Desconhecido}

A tabela seguinte lista algumas informações sobre esta condição.

Cabeçalho Description
Condição provável Falha de Cópia de Segurança/Restauro
Causa raiz Uma falha no procedimento de cópia de segurança ou restauro resultará provavelmente na perda de todos os dados no módulo de memória persistente. Quando o sistema operativo é carregado, será apresentado como um novo dispositivo de memória persistente sem uma partição ou sistema de ficheiros e o surface como RAW, o que significa que não tem um sistema de ficheiros.
Comportamento geral A memória persistente estará no modo só de leitura. É necessária uma ação do utilizador explícita para começar a utilizá-lo novamente.
Comportamento de Espaços de Armazenamento Espaços de Armazenamento permanecer operacional se apenas um módulo de memória persistente for afetado).
O objeto de disco físico PMem será apresentado com o Estado de Funcionamento "Em Mau Estado de Funcionamento" e não será utilizado pelo Espaços de Armazenamento.
Mais informações Campo OperationalStatus do objeto PhysicalDisk.
EventLog – Microsoft-Windows-ScmDisk0101/Operacional
O que fazer Se o utilizador não quiser substituir o dispositivo afetado, pode utilizar o Reset-PhysicalDisk cmdlet para limpar a condição só de leitura no módulo de memória persistente afetado. Em ambientes Espaços de Armazenamento, esta ação também tentará reintegrar o módulo de memória persistente no Espaços de Armazenamento e iniciar o processo de reparação.

Passos seguintes

Para obter informações relacionadas, consulte também: