Gestione persistente dell'integrità della memoria

Si applica a: Azure Stack HCI, versioni 22H2 e 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016, Windows 10

Questo articolo fornisce informazioni sulla gestione degli errori e sulla gestione dell'integrità specifici dei dispositivi PMem (Persistent Memory), spesso denominati memoria di classe di archiviazione (SCM), che è un tipo di supporto non volatile che può essere usato come archiviazione di livello superiore.

Questi brevi video offrono una panoramica del supporto di Windows per la memoria persistente:

Vedere Anche Informazioni e distribuzione della memoria persistente.

I dispositivi di memoria persistente sono supportati con i driver nativi a partire da Windows Server 2016 e Windows 10 (versione 1607). Sebbene i dispositivi di memoria persistente si comportano in modo simile ad altri dischi (HDD e SSD), esistono alcune differenze.

Un caso d'uso comune è dove due moduli di memoria persistente vengono usati come cache di scrittura con mirroring in uno spazio di archiviazione. Per impostare questa configurazione, vedere Configurazione di Spazi di archiviazione con una cache write-back NVDIMM-N.

In Windows Server 2016, la GUI di Spazi di archiviazione mostra il tipo di bus NVDIMM-N come UNKNOWN. Non ha alcuna perdita di funzionalità o incapacità nella creazione di pool, VD di archiviazione. È possibile verificare il tipo di bus eseguendo il cmdlet seguente:

Get-PhysicalDisk | fl

Il parametro BusType nell'output visualizzerà correttamente il tipo di bus come SCM.

Visualizzare lo stato di integrità della memoria persistente

Questa sezione descrive come visualizzare lo stato di integrità dei moduli di memoria persistente. Quando si usa memoria persistente, esistono alcune differenze nell'esperienza di monitoraggio:

  • La memoria persistente non crea contatori delle prestazioni del disco fisico, quindi non verrà visualizzata nei grafici in Windows Admin Center.
  • La memoria persistente non crea dati Storport 505, quindi non si otterrà il rilevamento proattivo del outlier.

In caso contrario, l'esperienza di monitoraggio è uguale a per qualsiasi altro disco fisico.

È possibile eseguire query sull'integrità di un disco di memoria persistente eseguendo i cmdlet seguenti:

Get-PmemDisk

DiskNumber Size   HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ----   ------------ ------------- ------------ ----------------- -------------------
2          252 GB Unhealthy    None          True         {20, 120}         2
3          252 GB Healthy      None          True         {1020, 1120}      0

Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

SerialNumber               HealthStatus OperationalStatus  OperationalDetails
------------               ------------ ------------------ ------------------
802c-01-1602-117cb5fc      Healthy      OK
802c-01-1602-117cb64f      Warning      Predictive Failure {Threshold Exceeded,NVDIMM_N Error}

Vale la pena notare che è possibile ottenere le stesse informazioni usando il cmdlet e specificando busType Get-PhysicalDisk come SCM:

Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

Nota

Per trovare la posizione fisica di un dispositivo di memoria persistente specificato in un evento, nella scheda Dettagli dell'evento in Visualizzatore eventi passare a Location EventData>. Si noti che Windows Server 2016 elenca la posizione errata dei dispositivi di memoria persistente, ma questo è risolto in Windows Server versione 1709.

HealthStatus mostra se il disco di memoria persistente è integro.

Il valore UnsafeshutdownCount tiene traccia del numero di arresti che potrebbero causare la perdita di dati su questo disco logico. È la somma dei conteggi di arresto non sicuri di tutti i dispositivi di memoria persistente sottostanti di questo disco. Per altre informazioni sullo stato di integrità, usare il Get-PmemPhysicalDevice cmdlet per trovare informazioni come OperationalStatus.

Get-PmemPhysicalDevice

DeviceId DeviceType           HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ----------           ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_C1     102005310        126 GB                 0 GB
1120     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_F1     102005310        126 GB                 0 GB
120      Intel INVDIMM device Healthy      {Ok}              CPU1_DIMM_F1     102005310        126 GB                 0 GB
20       Intel INVDIMM device Unhealthy    {HardwareError}   CPU1_DIMM_C1     102005310        126 GB                 0 GB

Questo cmdlet mostra quale dispositivo di memoria persistente non è integro. Il dispositivo non integro (DeviceId 20) corrisponde al caso nell'esempio precedente. PhysicalLocation in BIOS può aiutare a identificare quale dispositivo di memoria persistente è in stato di errore.

Per comprendere le diverse condizioni di integrità, vedere le sezioni seguenti.

Stato di integrità avviso

Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e si noterà che lo stato di integrità è elencato come Avviso, come illustrato nell'output di esempio:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Avviso Errore prevedibile {Soglia superata,NVDIMM_N errore}

Nella tabella seguente sono elencate alcune informazioni su questa condizione.

Prua Descrizione
Condizione probabile Soglia di avviso violata
Causa radice I dispositivi di memoria persistente tengono traccia di varie soglie, ad esempio temperatura, durata NVM e/o durata della fonte energetica. Quando uno di questi valori soglia viene superato, il sistema operativo viene notificato.
Comportamento generale Il dispositivo rimane completamente operativo. Si tratta di un avviso, non di un errore.
Comportamento di Spazi di archiviazione Il dispositivo rimane completamente operativo. Si tratta di un avviso, non di un errore.
Altre informazioni Campo OperationalStatus dell'oggetto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational
Operazioni da eseguire A seconda della soglia di avviso superata, può essere prudente sostituire il dispositivo di memoria persistente.

Scrive in un dispositivo di memoria persistente non riuscita

Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e viene visualizzato lo stato di integrità elencato come Non integro e lo stato operativo indica un errore I/O, come illustrato nell'output di esempio:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Unhealthy {Metadati obsoleti, errore I/O, errore temporaneo} {Perdita della persistenza dei dati, perdita di dati, NV...}

Nella tabella seguente sono elencate alcune informazioni su questa condizione.

Prua Descrizione
Condizione probabile Perdita di persistenza/alimentazione di backup
Causa radice I dispositivi di memoria persistente si basano su una fonte di alimentazione di backup per la loro persistenza, in genere una batteria o un super-cap. Se questa fonte di alimentazione di backup non è disponibile o il dispositivo non può eseguire un backup per qualsiasi motivo (errore controller/flash), i dati sono a rischio e Windows impedisce ulteriori scritture sui dispositivi interessati. Le operazioni di lettura sono comunque possibile per spostare i dati.
Comportamento generale Verrà smontato il volume NTFS.
Il campo Stato integrità del disco fisico mostrerà "Non integro" per tutti i dispositivi NVDIMM-N interessati.
Comportamento di Spazi di archiviazione Lo spazio di archiviazione rimarrà operativo fino a quando viene interessato solo un modulo di memoria persistente. Se sono interessati più dispositivi, le scritture sullo spazio di archiviazione avranno esito negativo.
Il campo Stato integrità del disco fisico mostrerà "Non integro" per tutti i dispositivi di memoria persistenti interessati.
Altre informazioni Campo OperationalStatus dell'oggetto PhysicalDisk.
EventLog – Microsoft-Windows-ScmDisk0101/Operational
Operazioni da eseguire È consigliabile eseguire il backup dei dati PMem interessati. Per ottenere l'accesso in lettura, è possibile portare online il disco manualmente (verrà visualizzato come un volume NTFS in sola lettura).

Per cancellare completamente questa condizione, è necessario risolvere la causa radice, ovvero l'alimentatore del servizio o sostituire il modulo di memoria persistente, a seconda del problema, e il volume nel modulo deve essere portato offline e portato di nuovo online oppure il sistema deve essere riavviato.

Per rendere nuovamente utilizzabile il modulo di memoria persistente in Spazi di archiviazione, usare il Reset-PhysicalDisk cmdlet , che reintegra il dispositivo e avvia il processo di ripristino.

Il dispositivo viene visualizzato con una capacità di '0' byte o come "Disco fisico generico"

Questa condizione è presente quando un dispositivo di memoria persistente viene visualizzato con una capacità di 0 byte e non può essere inizializzato oppure viene esposto come oggetto "Disco fisico generico" senza numero di serie che visualizza uno stato operativo di Comunicazione persa, come illustrato in questo output di esempio:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
Avviso Comunicazione perduta

Nella tabella seguente sono elencate alcune informazioni su questa condizione.

Prua Descrizione
Condizione probabile IL BIOS non ha esposto il modulo di memoria persistente al sistema operativo
Causa radice I dispositivi di memoria persistente sono basati su DRAM. Quando viene fatto riferimento a un indirizzo DRAM danneggiato, la maggior parte delle CPU avvia un controllo del computer e riavvia il server. Alcune piattaforme server annullano quindi il mapping del modulo di memoria persistente, impedendo al sistema operativo di accedervi e causando potenzialmente un altro controllo del computer. Ciò può verificarsi anche se il BIOS rileva che il modulo di memoria persistente non è riuscito e deve essere sostituito.
Comportamento generale Il modulo di memoria persistente viene visualizzato come non inizializzato, con una capacità di 0 byte e non può essere letto o scritto.
Comportamento di Spazi di archiviazione Lo spazio di archiviazione rimane operativo (purché sia interessato un solo modulo di memoria persistente).
L'oggetto PMem PhysicalDisk viene visualizzato con stato di integrità avviso e come "Disco fisico generale"
Altre informazioni Campo OperationalStatus dell'oggetto PhysicalDisk.
EventLog – Microsoft-Windows-ScmDisk0101/Operational
Operazioni da eseguire Il dispositivo di memoria persistente deve essere sostituito o sanificato, in modo che la piattaforma server lo esponga nuovamente al sistema operativo host. È consigliabile sostituire il dispositivo, perché potrebbero verificarsi errori più non correggibili. L'aggiunta di un dispositivo sostitutivo a una configurazione degli spazi di archiviazione può essere ottenuta con il Add-PhysicalDisk cmdlet .

Il dispositivo viene visualizzato come disco RAW o vuoto dopo un riavvio

Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e viene visualizzato lo stato di integrità non integro e lo stato operativo dei metadati non riconosciuti, come illustrato in questo output di esempio:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK {Sconosciuto}
802c-01-1602-117cb64f Unhealthy {Metadati non riconosciuti, metadati obsoleti} {Sconosciuto}

Nella tabella seguente sono elencate alcune informazioni su questa condizione.

Prua Descrizione
Condizione probabile Errore di backup/ripristino
Causa radice Un errore nella procedura di backup o ripristino comporterà probabilmente la perdita di tutti i dati nel modulo di memoria persistente. Quando il sistema operativo viene caricato, viene visualizzato come un nuovo dispositivo di memoria persistente senza una partizione o un file system e una superficie come RAW, ovvero non ha un file system.
Comportamento generale La memoria persistente sarà in modalità di sola lettura. Sarà necessaria un'azione esplicita dell'utente per iniziare a usarlo nuovamente.
Comportamento di Spazi di archiviazione Spazi di archiviazione rimane operativo se è interessato un solo modulo di memoria persistente).
L'oggetto disco fisico PMem verrà visualizzato con lo stato di integrità "Non integro" e non viene usato da Spazi di archiviazione.
Altre informazioni Campo OperationalStatus dell'oggetto PhysicalDisk.
EventLog – Microsoft-Windows-ScmDisk0101/Operational
Operazioni da eseguire Se l'utente non vuole sostituire il dispositivo interessato, può usare il Reset-PhysicalDisk cmdlet per cancellare la condizione di sola lettura nel modulo di memoria persistente interessato. Negli ambienti Spazi di archiviazione, questo tenterà anche di reintegrare il modulo di memoria persistente in Spazi di archiviazione e avviare il processo di ripristino.

Passaggi successivi

Per informazioni correlate, vedere anche: