Administración del estado de PMEM

Se aplica a: Azure Stack HCI, versiones 22H2 y 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016, Windows 10

En este artículo se proporciona información sobre el control de errores y la administración del mantenimiento específicos de los dispositivos de memoria persistente (PMem), a menudo denominados de memoria de clase de almacenamiento (SCM), que es un tipo de medios no volátiles que se pueden usar como almacenamiento de nivel superior.

Estos breves vídeos proporcionan información general sobre la compatibilidad de Windows con la memoria persistente:

Consulte también Descripción e implementación de memoria persistente.

Los dispositivos de memoria persistente se admiten con controladores nativos a partir de Windows Server 2016 y Windows 10 (versión 1607). Aunque los dispositivos de memoria persistente se comportan de forma similar a otros discos (unidades de disco duro y SSD), hay algunas diferencias.

Un caso de uso común es cuando dos módulos de memoria persistente se usan como caché de escritura diferida reflejada en un espacio de almacenamiento. Para establecer este tipo de configuración, consulte Configuración de espacios de almacenamiento con una caché con reescritura de NVDIMM-N.

En Windows Server 2016, la GUI de Espacios de almacenamiento muestra el tipo de bus NVDIMM-N como DESCONOCIDO. No conlleva ninguna pérdida de funcionalidad o incapacidad en la creación de grupo, VD de almacenamiento. Puede comprobar el tipo de bus ejecutando el siguiente cmdlet:

Get-PhysicalDisk | fl

El parámetro de tipo de bus de la salida mostrará correctamente el tipo de bus como SCM.

Visualización del estado de mantenimiento de la memoria persistente

En esta sección se describe cómo ver el estado de mantenimiento de los módulos de memoria persistente. Al usar la memoria persistente, hay algunas diferencias en la experiencia de la supervisión:

  • La memoria persistente no crea contadores de rendimiento de disco físico, por lo que no aparecerá en los gráficos de Windows Admin Center.
  • La memoria persistente no crea datos de Storport 505, por lo que no obtendrá detección proactiva de valores atípicos.

Por lo demás, la experiencia de supervisión es la misma que para cualquier otro disco físico.

Puede consultar el mantenimiento de un disco de memoria persistente mediante la ejecución de los siguientes cmdlets:

Get-PmemDisk

DiskNumber Size   HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ----   ------------ ------------- ------------ ----------------- -------------------
2          252 GB Unhealthy    None          True         {20, 120}         2
3          252 GB Healthy      None          True         {1020, 1120}      0

Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

SerialNumber               HealthStatus OperationalStatus  OperationalDetails
------------               ------------ ------------------ ------------------
802c-01-1602-117cb5fc      Healthy      OK
802c-01-1602-117cb64f      Warning      Predictive Failure {Threshold Exceeded,NVDIMM_N Error}

Merece la pena tener en cuenta que puede obtener la misma información mediante el cmdlet Get-PhysicalDisk y especificando BusType como SCM:

Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

Nota:

Para buscar la ubicación física de un dispositivo de memoria persistente especificado en un evento, en la pestaña Detalles del evento del Visor de eventos, vaya a EventData>Ubicación. Tenga en cuenta que en Windows Server 2016 se muestra una ubicación incorrecta de los dispositivos de memoria persistente, pero esto se ha corregido en Windows Server, versión 1709.

HealthStatus muestra si el disco de memoria persistente es correcto.

El valor UnsafeshutdownCount realiza un seguimiento del número de apagados que pueden provocar la pérdida de datos en este disco lógico. Es la suma de los recuentos de apagados no seguros de todos los dispositivos de memoria persistente subyacentes de este disco. Para obtener más información sobre el estado de mantenimiento, use el cmdlet Get-PmemPhysicalDevice para buscar información como OperationalStatus.

Get-PmemPhysicalDevice

DeviceId DeviceType           HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ----------           ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_C1     102005310        126 GB                 0 GB
1120     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_F1     102005310        126 GB                 0 GB
120      Intel INVDIMM device Healthy      {Ok}              CPU1_DIMM_F1     102005310        126 GB                 0 GB
20       Intel INVDIMM device Unhealthy    {HardwareError}   CPU1_DIMM_C1     102005310        126 GB                 0 GB

Este cmdlet muestra qué dispositivo de memoria persistente es incorrecto. El dispositivo incorrecto (DeviceId 20) coincide con el caso del ejemplo anterior. PhysicalLocation en BIOS puede ayudar a identificar qué dispositivo de memoria persistente está en estado defectuoso.

Para obtener ayuda sobre las distintas condiciones de estado, vea las secciones siguientes.

Estado de mantenimiento de advertencia

Esta condición está presente cuando comprueba el mantenimiento de un dispositivo de memoria persistente y ve que su estado de mantenimiento aparece como Advertencia, tal como se muestra en esta salida de ejemplo:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy Aceptar
802c-01-1602-117cb64f Advertencia Error predictivo {Umbral superado, error NVDIMM_N}

En la tabla siguiente se muestra información sobre esta condición.

Dirección Descripción
Condición probable Infracción del umbral de advertencia
Causa principal Los dispositivos de memoria persistente supervisan varios umbrales, como la temperatura, la duración de NVM o la duración de la fuente de energía. Cuando se supera uno de estos umbrales, se envía una notificación al sistema operativo.
Comportamiento general El dispositivo sigue siendo totalmente operativo. Se trata de una advertencia, no de un error.
Comportamiento de Espacios de almacenamiento El dispositivo sigue siendo totalmente operativo. Se trata de una advertencia, no de un error.
Más información Campo OperationalStatus del objeto PhysicalDisk. Registro de eventos: Microsoft-Windows-ScmDisk0101/Operational
Qué hacer En función del umbral de advertencia que se haya infringido, puede ser prudente reemplazar el dispositivo de memoria persistente.

Error en las escrituras en un dispositivo de memoria persistente

Esta condición está presente cuando comprueba el mantenimiento de un dispositivo de memoria persistente y ve que su estado de mantenimiento aparece como Incorrecto y el estado operativo menciona un Error de E/S, tal como se muestra en esta salida de ejemplo:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy Aceptar
802c-01-1602-117cb64f Unhealthy (Incorrecto) {Metadatos obsoletas, Error de E/S, Error transitorio} {Pérdida de persistencia de datos, Pérdida de datos, NV...}

En la tabla siguiente se muestra información sobre esta condición.

Dirección Descripción
Condición probable Pérdida de persistencia/alimentación de reserva
Causa principal Los dispositivos de memoria persistente dependen de una fuente de alimentación de reserva para su persistencia (generalmente una batería o un supercondensador). Si esta fuente de alimentación de copia de seguridad no está disponible o el dispositivo no puede realizar una copia de seguridad por algún motivo (error de controlador/flash), los datos están en peligro y Windows impedirá escrituras adicionales en los dispositivos afectados. Las lecturas siguen siendo posibles para evacuar datos.
Comportamiento general El volumen NTFS se desmontará.
En el campo de estado de mantenimiento PhysicalDisk se mostrará "Incorrecto" para todos los dispositivos NVDIMM-N afectados.
Comportamiento de Espacios de almacenamiento El espacio de almacenamiento seguirá funcionando si solo hay un módulo de memoria persistente afectado. Si se ven afectados varios dispositivos, se producirá un error de escritura en el Espacio de almacenamiento.
En el campo de estado de mantenimiento PhysicalDisk se mostrará "Incorrecto" para todos los dispositivos de memoria persistente afectados.
Más información Campo OperationalStatus del objeto PhysicalDisk.
Registro de eventos: Microsoft-Windows-ScmDisk0101/Operational
Qué hacer Se recomienda realizar copias de seguridad de los datos afectados de PMem. Para obtener acceso de lectura, puede conectar manualmente el disco (aparecerá como un volumen NTFS de solo lectura).

Para borrar completamente esta condición, se debe resolver la causa principal (es decir, inspeccionar la fuente de alimentación o sustituir el módulo de memoria persistente, según el problema) y el volumen del módulo se debe desconectar y conectar de nuevo, o se debe reiniciar el sistema.

Para permitir el uso del módulo de memoria persistente en Espacios de almacenamiento de nuevo, use el cmdlet Reset-PhysicalDisk, que vuelve a integrar el dispositivo e inicia el proceso de reparación.

El dispositivo aparece con una capacidad de "0" bytes o como "Disco físico genérico".

Esta condición está presente cuando se muestra un dispositivo de memoria persistente con una capacidad de 0 bytes y no se puede inicializar, o se expone como un objeto "Disco físico genérico" sin número de serie que muestra el estado operativo Comunicación perdida, como se muestra en esta salida de ejemplo:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy Aceptar
Advertencia Pérdida de comunicación

En la tabla siguiente se muestra información sobre esta condición.

Dirección Descripción
Condición probable BIOS no expone el módulo de memoria persistente al sistema operativo
Causa principal Los dispositivos de memoria persistentes se basan en DRAM. Cuando se hace referencia a una dirección DRAM dañada, la mayoría de CPU se iniciarán en una comprobación de la máquina y reiniciarán el servidor. Algunas plataformas de servidor desasignan el módulo de memoria persistente, evitando que el sistema operativo tenga acceso a él y que pueda causar otra comprobación de máquina. Esto también puede ocurrir si el BIOS detecta que el módulo de memoria persistente ha dado error y debe reemplazarse.
Comportamiento general El módulo de memoria persistente se muestra como no inicializado, con una capacidad de 0 bytes y no se puede leer o escribir.
Comportamiento de Espacios de almacenamiento El espacio de almacenamiento permanece operativo (siempre que solo se vea afectado un módulo de memoria persistente).
El objeto PMem PhysicalDisk se muestra con un estado de mantenimiento de advertencia y como un "disco físico general".
Más información Campo OperationalStatus del objeto PhysicalDisk.
Registro de eventos: Microsoft-Windows-ScmDisk0101/Operational
Qué hacer El dispositivo de memoria persistente debe reemplazarse o sanearse, de forma que la plataforma de servidor lo exponga de nuevo al sistema operativo del host. Se recomienda la sustitución del dispositivo, ya que pueden producirse más errores que no se puedan corregir. La adición de un dispositivo de reemplazo a una configuración de espacios de almacenamiento se puede lograr con el cmdlet Add-PhysicalDisk.

El dispositivo aparece como un disco RAW o vacío tras un reinicio

Esta condición está presente al comprobar el mantenimiento de un dispositivo de memoria persistente y ve que el estado de mantenimiento aparece como Incorrecto, y el estado operativo es de tipo Metadatos no reconocidos, como se muestra en esta salida de ejemplo:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy Aceptar {Desconocido}
802c-01-1602-117cb64f Unhealthy (Incorrecto) {Metadatos no reconocidos, metadatos obsoletos} {Desconocido}

En la tabla siguiente se muestra información sobre esta condición.

Dirección Descripción
Condición probable Error de copia de seguridad y restauración
Causa principal Un error en el procedimiento de copia de seguridad o de restauración probablemente hará que se pierdan todos los datos del módulo de memoria persistente. Cuando se carga el sistema operativo, aparecerá como un nuevo dispositivo de memoria persistente sin una partición o un sistema de archivos y aparecerá como RAW, lo que significa que no tiene un sistema de archivos.
Comportamiento general La memoria persistente estará en modo de solo lectura. Se requiere una acción explícita del usuario para empezar a utilizarlo de nuevo.
Comportamiento de Espacios de almacenamiento La característica Espacios de almacenamiento permanece operativa si solo se ve afectado un módulo de memoria persistente.
El objeto de disco físico PMem se mostrará con el estado de mantenimiento "Incorrecto" y Espacios de almacenamiento no lo usará.
Más información Campo OperationalStatus del objeto PhysicalDisk.
Registro de eventos: Microsoft-Windows-ScmDisk0101/Operational
Qué hacer Si el usuario no quiere reemplazar el dispositivo afectado, puede usar el cmdlet Reset-PhysicalDisk para borrar la condición de solo lectura en el módulo de memoria persistente afectado. En entornos de Espacios de almacenamiento, también intentará volver a integrar el módulo de memoria persistente en Espacios de almacenamiento e iniciar el proceso de reparación.

Pasos siguientes

Para obtener información relacionada, consulte: