Gestão persistente do estado de funcionamento da memória
Aplica-se a: Azure Stack HCI, versões 22H2 e 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016 Windows 10
Este artigo fornece informações sobre o processamento de erros e a gestão do estado de funcionamento específicos de dispositivos de memória persistente (PMem), muitas vezes denominados memória da classe de armazenamento (SCM), que é um tipo de suporte de dados não volátil que pode ser utilizado como armazenamento de primeira camada.
Estes breves vídeos fornecem uma descrição geral do suporte do Windows para memória persistente:
- Utilizar Memória Não Volátil (NVDIMM-N) como Armazenamento de Blocos no Windows Server 2016
- Utilizar Memória Não Volátil (NVDIMM-N) como Armazenamento Byte-Addressable no Windows Server 2016
Veja também Compreender e implementar a memória persistente.
Os dispositivos de memória persistente são suportados com controladores nativos a partir de Windows Server 2016 e Windows 10 (versão 1607). Embora os dispositivos de memória persistente se comportem de forma semelhante a outros discos (HDDs e SSDs), existem algumas diferenças.
Um caso de utilização comum é onde dois módulos de memória persistente são utilizados como uma cache de write-back espelhada num espaço de armazenamento. Para definir tal configuração, veja Configuring Storage Spaces with a NVDIMM-N write-back cache (Configurar Espaços de Armazenamento com uma cache de write-back do NVDIMM-N).
No Windows Server 2016, a GUI do Espaços de Armazenamento mostra o tipo de barramento NVDIMM-N como DESCONHECIDO. Não tem nenhuma perda de funcionalidade ou incapacidade na criação do Agrupamento, VD de Armazenamento. Pode verificar o tipo de barramento ao executar o seguinte cmdlet:
Get-PhysicalDisk | fl
O parâmetro BusType na saída mostrará corretamente o tipo de barramento como SCM.
Ver estado de funcionamento da memória persistente
Esta secção descreve como ver o estado de funcionamento dos módulos de memória persistente. Quando utiliza memória persistente, existem algumas diferenças na experiência de monitorização:
- A memória persistente não cria contadores de desempenho do Disco Físico, pelo que não a verá em gráficos no Windows Admin Center.
- A memória persistente não cria dados do Storport 505, pelo que não obterá a deteção proativa de valores atípicos.
Caso contrário, a experiência de monitorização é igual a qualquer outro disco físico.
Pode consultar o estado de funcionamento de um disco de memória persistente ao executar os seguintes cmdlets:
Get-PmemDisk
DiskNumber Size HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ---- ------------ ------------- ------------ ----------------- -------------------
2 252 GB Unhealthy None True {20, 120} 2
3 252 GB Healthy None True {1020, 1120} 0
Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails
SerialNumber HealthStatus OperationalStatus OperationalDetails
------------ ------------ ------------------ ------------------
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Warning Predictive Failure {Threshold Exceeded,NVDIMM_N Error}
Vale a pena notar que pode obter as mesmas informações com o Get-PhysicalDisk
cmdlet e especificar o BusType como SCM:
Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails
Nota
Para localizar a localização física de um dispositivo de memória persistente especificado num evento, no separador Detalhes do evento no Visualizador de Eventos, aceda a EventData>Location. Tenha em atenção que Windows Server 2016 lista a localização incorreta dos dispositivos de memória persistente, mas esta situação foi corrigida no Windows Server, versão 1709.
HealthStatus mostra se o disco de memória persistente está em bom estado de funcionamento.
O valor UnsafeshutdownCount controla o número de encerramentos que podem causar perda de dados neste disco lógico. É a soma das contagens de encerramento não seguras de todos os dispositivos de memória persistente subjacentes deste disco. Para obter mais informações sobre o estado de funcionamento, utilize o Get-PmemPhysicalDevice
cmdlet para encontrar informações como OperationalStatus.
Get-PmemPhysicalDevice
DeviceId DeviceType HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ---------- ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020 Intel INVDIMM device Healthy {Ok} CPU2_DIMM_C1 102005310 126 GB 0 GB
1120 Intel INVDIMM device Healthy {Ok} CPU2_DIMM_F1 102005310 126 GB 0 GB
120 Intel INVDIMM device Healthy {Ok} CPU1_DIMM_F1 102005310 126 GB 0 GB
20 Intel INVDIMM device Unhealthy {HardwareError} CPU1_DIMM_C1 102005310 126 GB 0 GB
Este cmdlet mostra que dispositivo de memória persistente está em mau estado de funcionamento. O dispositivo em mau estado de funcionamento (DeviceId 20) corresponde ao caso no exemplo anterior. O PhysicalLocation no BIOS pode ajudar a identificar que dispositivo de memória persistente está num estado com falhas.
Para ajudar a compreender as várias condições de estado de funcionamento, veja as secções seguintes.
Estado de Funcionamento do Aviso
Esta condição está presente quando verifica o estado de funcionamento de um dispositivo de memória persistente e vê que o respetivo Estado de Funcionamento está listado como Aviso, conforme mostrado neste exemplo de saída:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Bom estado de funcionamento | OK | |
802c-01-1602-117cb64f | Aviso | Falha Preditiva | {Limiar Excedido NVDIMM_N Erro} |
A tabela seguinte lista algumas informações sobre esta condição.
Cabeçalho | Description |
---|---|
Condição provável | Limiar de aviso violado |
Causa Raiz | Os dispositivos de memória persistente controlam vários limiares, como a temperatura, a duração da NVM e/ou a duração da origem de energia. Quando um desses limiares é excedido, o sistema operativo é notificado. |
Comportamento geral | O dispositivo permanece totalmente operacional. Este é um aviso, não um erro. |
Comportamento de Espaços de Armazenamento | O dispositivo permanece totalmente operacional. Este é um aviso, não um erro. |
Mais informações | Campo OperationalStatus do objeto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operacional |
O que fazer | Consoante o limiar de aviso violado, pode ser prudente substituir o dispositivo de memória persistente. |
As escritas num dispositivo de memória persistente falham
Esta condição está presente quando verifica o estado de funcionamento de um dispositivo de memória persistente e vê o Estado de Funcionamento listado como Mau Estado de Funcionamento e o Estado Operacional menciona um Erro de E/S, conforme mostrado neste exemplo de saída:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Bom estado de funcionamento | OK | |
802c-01-1602-117cb64f | Mau estado de funcionamento | {Metadados Obsoletos, Erro de E/S, Erro Transitório} | {Persistência de Dados Perdidos, Dados Perdidos, NV…} |
A tabela seguinte lista algumas informações sobre esta condição.
Cabeçalho | Description |
---|---|
Condição provável | Perda de persistência/energia de cópia de segurança |
Causa Raiz | Os dispositivos de memória persistente dependem de uma fonte de energia de cópia de segurança para a sua persistência, normalmente uma bateria ou uma super-tampa. Se esta energia de reserva estiver indisponível ou se o dispositivo não puder, por qualquer motivo, realizar uma cópia de segurança (Erro de Controlador/Flash), os dados estarão em risco e o Windows impedirá qualquer escrita adicional nos dispositivos afetados. As leituras ainda são possíveis para evacuar dados. |
Comportamento geral | O volume NTFS será desmontado. O campo Estado de Funcionamento do PhysicalDisk mostrará "Mau estado de funcionamento" para todos os dispositivos NVDIMM-N afetados. |
Comportamento de Espaços de Armazenamento | O Espaço de Armazenamento permanecerá operacional, desde que apenas um módulo de memória persistente seja afetado. Se forem afetados vários dispositivos, a escrita no Espaço de Armazenamento falhará. O campo Estado de Funcionamento do PhysicalDisk mostrará "Mau estado de funcionamento" para todos os dispositivos de memória persistente afetados. |
Mais informações | Campo OperationalStatus do objeto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operacional |
O que fazer | Recomendamos a cópia de segurança dos dados do PMem afetados. Para obter acesso de leitura, pode colocar o disco online manualmente (este aparecerá como volume NTFS só de leitura). Para limpar totalmente esta condição, a causa raiz tem de ser resolvida (ou seja, a fonte de alimentação do serviço ou substituir o módulo de memória persistente, consoante o problema) e o volume no módulo tem de ser colocado offline e colocado online novamente ou o sistema tem de ser reiniciado. Para tornar o módulo de memória persistente utilizável no Espaços de Armazenamento novamente, utilize o Reset-PhysicalDisk cmdlet, que reintegra o dispositivo e inicia o processo de reparação. |
O dispositivo é apresentado com uma capacidade de bytes "0" ou como um "Disco Físico Genérico"
Esta condição está presente quando um dispositivo de memória persistente é apresentado com uma capacidade de 0 bytes e não pode ser inicializado ou é exposto como um objeto "Disco Físico Genérico" sem número de série que apresente um Estado Operacional de Comunicação Perdida, conforme mostrado neste exemplo de saída:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Bom estado de funcionamento | OK | |
Aviso | Comunicação Perdida |
A tabela seguinte lista algumas informações sobre esta condição.
Cabeçalho | Description |
---|---|
Condição provável | O BIOS não expôs o módulo de memória persistente ao SO |
Causa Raiz | Os dispositivos de memória persistentes são baseados em DRAM. Quando um endereço DRAM danificado é referenciado, a maioria das CPUs iniciará uma verificação do computador e reiniciará o servidor. Em seguida, algumas plataformas de servidor anulam o módulo de memória persistente, impedindo o SO de aceder ao mesmo e causando potencialmente outra verificação do computador. Isto também pode ocorrer se o BIOS detetar que o módulo de memória persistente falhou e precisa de ser substituído. |
Comportamento geral | O módulo de memória persistente é apresentado como não hinitializado, com uma capacidade de 0 bytes e não pode ser lido ou escrito. |
Comportamento de Espaços de Armazenamento | O Espaço de Armazenamento permanece operacional (desde que apenas um módulo de memória persistente seja afetado). O objeto PMem PhysicalDisk é apresentado com um Estado de Funcionamento de Aviso e como um "Disco Físico Geral" |
Mais informações | Campo OperationalStatus do objeto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operacional |
O que fazer | O dispositivo de memória persistente tem de ser substituído ou desinstado, de modo a que a plataforma do servidor o exponha novamente ao SO anfitrião. É recomendada a substituição do dispositivo, uma vez que podem ocorrer erros mais incorríveis. A adição de um dispositivo de substituição a uma configuração de espaços de armazenamento pode ser obtida com o Add-PhysicalDisk cmdlet. |
O dispositivo é apresentado como um disco RAW ou vazio após um reinício
Esta condição está presente quando verifica o estado de funcionamento de um dispositivo de memória persistente e vê um Estado de Funcionamento em Mau Estado de Funcionamento e Estado Operacional de Metadados Não Reconhecidos, conforme mostrado neste exemplo de saída:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Bom estado de funcionamento | OK | {Desconhecido} |
802c-01-1602-117cb64f | Mau estado de funcionamento | {Metadados Não Reconhecidos, Metadados Obsoletos} | {Desconhecido} |
A tabela seguinte lista algumas informações sobre esta condição.
Cabeçalho | Description |
---|---|
Condição provável | Falha de Cópia de Segurança/Restauro |
Causa raiz | Uma falha no procedimento de cópia de segurança ou restauro resultará provavelmente na perda de todos os dados no módulo de memória persistente. Quando o sistema operativo é carregado, será apresentado como um novo dispositivo de memória persistente sem uma partição ou sistema de ficheiros e o surface como RAW, o que significa que não tem um sistema de ficheiros. |
Comportamento geral | A memória persistente estará no modo só de leitura. É necessária uma ação do utilizador explícita para começar a utilizá-lo novamente. |
Comportamento de Espaços de Armazenamento | Espaços de Armazenamento permanecer operacional se apenas um módulo de memória persistente for afetado). O objeto de disco físico PMem será apresentado com o Estado de Funcionamento "Em Mau Estado de Funcionamento" e não será utilizado pelo Espaços de Armazenamento. |
Mais informações | Campo OperationalStatus do objeto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operacional |
O que fazer | Se o utilizador não quiser substituir o dispositivo afetado, pode utilizar o Reset-PhysicalDisk cmdlet para limpar a condição só de leitura no módulo de memória persistente afetado. Em ambientes Espaços de Armazenamento, esta ação também tentará reintegrar o módulo de memória persistente no Espaços de Armazenamento e iniciar o processo de reparação. |
Passos seguintes
Para obter informações relacionadas, consulte também: