Gestione persistente dell'integrità della memoria
Si applica a: Azure Stack HCI, versioni 22H2 e 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016, Windows 10
Questo articolo fornisce informazioni sulla gestione degli errori e sulla gestione dell'integrità specifici dei dispositivi PMem (Persistent Memory), spesso denominati memoria di classe di archiviazione (SCM), che è un tipo di supporto non volatile che può essere usato come archiviazione di livello superiore.
Questi brevi video offrono una panoramica del supporto di Windows per la memoria persistente:
- Uso di memoria non volatile (NVDIMM-N) come archiviazione in blocchi in Windows Server 2016
- Uso di memoria non volatile (NVDIMM-N) come archiviazione Byte-Addressable in Windows Server 2016
Vedere Anche Informazioni e distribuzione della memoria persistente.
I dispositivi di memoria persistente sono supportati con i driver nativi a partire da Windows Server 2016 e Windows 10 (versione 1607). Sebbene i dispositivi di memoria persistente si comportano in modo simile ad altri dischi (HDD e SSD), esistono alcune differenze.
Un caso d'uso comune è dove due moduli di memoria persistente vengono usati come cache di scrittura con mirroring in uno spazio di archiviazione. Per impostare questa configurazione, vedere Configurazione di Spazi di archiviazione con una cache write-back NVDIMM-N.
In Windows Server 2016, la GUI di Spazi di archiviazione mostra il tipo di bus NVDIMM-N come UNKNOWN. Non ha alcuna perdita di funzionalità o incapacità nella creazione di pool, VD di archiviazione. È possibile verificare il tipo di bus eseguendo il cmdlet seguente:
Get-PhysicalDisk | fl
Il parametro BusType nell'output visualizzerà correttamente il tipo di bus come SCM.
Visualizzare lo stato di integrità della memoria persistente
Questa sezione descrive come visualizzare lo stato di integrità dei moduli di memoria persistente. Quando si usa memoria persistente, esistono alcune differenze nell'esperienza di monitoraggio:
- La memoria persistente non crea contatori delle prestazioni del disco fisico, quindi non verrà visualizzata nei grafici in Windows Admin Center.
- La memoria persistente non crea dati Storport 505, quindi non si otterrà il rilevamento proattivo del outlier.
In caso contrario, l'esperienza di monitoraggio è uguale a per qualsiasi altro disco fisico.
È possibile eseguire query sull'integrità di un disco di memoria persistente eseguendo i cmdlet seguenti:
Get-PmemDisk
DiskNumber Size HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ---- ------------ ------------- ------------ ----------------- -------------------
2 252 GB Unhealthy None True {20, 120} 2
3 252 GB Healthy None True {1020, 1120} 0
Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails
SerialNumber HealthStatus OperationalStatus OperationalDetails
------------ ------------ ------------------ ------------------
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Warning Predictive Failure {Threshold Exceeded,NVDIMM_N Error}
Vale la pena notare che è possibile ottenere le stesse informazioni usando il cmdlet e specificando busType Get-PhysicalDisk
come SCM:
Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails
Nota
Per trovare la posizione fisica di un dispositivo di memoria persistente specificato in un evento, nella scheda Dettagli dell'evento in Visualizzatore eventi passare a Location EventData>. Si noti che Windows Server 2016 elenca la posizione errata dei dispositivi di memoria persistente, ma questo è risolto in Windows Server versione 1709.
HealthStatus mostra se il disco di memoria persistente è integro.
Il valore UnsafeshutdownCount tiene traccia del numero di arresti che potrebbero causare la perdita di dati su questo disco logico. È la somma dei conteggi di arresto non sicuri di tutti i dispositivi di memoria persistente sottostanti di questo disco. Per altre informazioni sullo stato di integrità, usare il Get-PmemPhysicalDevice
cmdlet per trovare informazioni come OperationalStatus.
Get-PmemPhysicalDevice
DeviceId DeviceType HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ---------- ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020 Intel INVDIMM device Healthy {Ok} CPU2_DIMM_C1 102005310 126 GB 0 GB
1120 Intel INVDIMM device Healthy {Ok} CPU2_DIMM_F1 102005310 126 GB 0 GB
120 Intel INVDIMM device Healthy {Ok} CPU1_DIMM_F1 102005310 126 GB 0 GB
20 Intel INVDIMM device Unhealthy {HardwareError} CPU1_DIMM_C1 102005310 126 GB 0 GB
Questo cmdlet mostra quale dispositivo di memoria persistente non è integro. Il dispositivo non integro (DeviceId 20) corrisponde al caso nell'esempio precedente. PhysicalLocation in BIOS può aiutare a identificare quale dispositivo di memoria persistente è in stato di errore.
Per comprendere le diverse condizioni di integrità, vedere le sezioni seguenti.
Stato di integrità avviso
Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e si noterà che lo stato di integrità è elencato come Avviso, come illustrato nell'output di esempio:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | OK | |
802c-01-1602-117cb64f | Avviso | Errore prevedibile | {Soglia superata,NVDIMM_N errore} |
Nella tabella seguente sono elencate alcune informazioni su questa condizione.
Prua | Descrizione |
---|---|
Condizione probabile | Soglia di avviso violata |
Causa radice | I dispositivi di memoria persistente tengono traccia di varie soglie, ad esempio temperatura, durata NVM e/o durata della fonte energetica. Quando uno di questi valori soglia viene superato, il sistema operativo viene notificato. |
Comportamento generale | Il dispositivo rimane completamente operativo. Si tratta di un avviso, non di un errore. |
Comportamento di Spazi di archiviazione | Il dispositivo rimane completamente operativo. Si tratta di un avviso, non di un errore. |
Altre informazioni | Campo OperationalStatus dell'oggetto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Operazioni da eseguire | A seconda della soglia di avviso superata, può essere prudente sostituire il dispositivo di memoria persistente. |
Scrive in un dispositivo di memoria persistente non riuscita
Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e viene visualizzato lo stato di integrità elencato come Non integro e lo stato operativo indica un errore I/O, come illustrato nell'output di esempio:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | OK | |
802c-01-1602-117cb64f | Unhealthy | {Metadati obsoleti, errore I/O, errore temporaneo} | {Perdita della persistenza dei dati, perdita di dati, NV...} |
Nella tabella seguente sono elencate alcune informazioni su questa condizione.
Prua | Descrizione |
---|---|
Condizione probabile | Perdita di persistenza/alimentazione di backup |
Causa radice | I dispositivi di memoria persistente si basano su una fonte di alimentazione di backup per la loro persistenza, in genere una batteria o un super-cap. Se questa fonte di alimentazione di backup non è disponibile o il dispositivo non può eseguire un backup per qualsiasi motivo (errore controller/flash), i dati sono a rischio e Windows impedisce ulteriori scritture sui dispositivi interessati. Le operazioni di lettura sono comunque possibile per spostare i dati. |
Comportamento generale | Verrà smontato il volume NTFS. Il campo Stato integrità del disco fisico mostrerà "Non integro" per tutti i dispositivi NVDIMM-N interessati. |
Comportamento di Spazi di archiviazione | Lo spazio di archiviazione rimarrà operativo fino a quando viene interessato solo un modulo di memoria persistente. Se sono interessati più dispositivi, le scritture sullo spazio di archiviazione avranno esito negativo. Il campo Stato integrità del disco fisico mostrerà "Non integro" per tutti i dispositivi di memoria persistenti interessati. |
Altre informazioni | Campo OperationalStatus dell'oggetto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Operazioni da eseguire | È consigliabile eseguire il backup dei dati PMem interessati. Per ottenere l'accesso in lettura, è possibile portare online il disco manualmente (verrà visualizzato come un volume NTFS in sola lettura). Per cancellare completamente questa condizione, è necessario risolvere la causa radice, ovvero l'alimentatore del servizio o sostituire il modulo di memoria persistente, a seconda del problema, e il volume nel modulo deve essere portato offline e portato di nuovo online oppure il sistema deve essere riavviato. Per rendere nuovamente utilizzabile il modulo di memoria persistente in Spazi di archiviazione, usare il Reset-PhysicalDisk cmdlet , che reintegra il dispositivo e avvia il processo di ripristino. |
Il dispositivo viene visualizzato con una capacità di '0' byte o come "Disco fisico generico"
Questa condizione è presente quando un dispositivo di memoria persistente viene visualizzato con una capacità di 0 byte e non può essere inizializzato oppure viene esposto come oggetto "Disco fisico generico" senza numero di serie che visualizza uno stato operativo di Comunicazione persa, come illustrato in questo output di esempio:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | OK | |
Avviso | Comunicazione perduta |
Nella tabella seguente sono elencate alcune informazioni su questa condizione.
Prua | Descrizione |
---|---|
Condizione probabile | IL BIOS non ha esposto il modulo di memoria persistente al sistema operativo |
Causa radice | I dispositivi di memoria persistente sono basati su DRAM. Quando viene fatto riferimento a un indirizzo DRAM danneggiato, la maggior parte delle CPU avvia un controllo del computer e riavvia il server. Alcune piattaforme server annullano quindi il mapping del modulo di memoria persistente, impedendo al sistema operativo di accedervi e causando potenzialmente un altro controllo del computer. Ciò può verificarsi anche se il BIOS rileva che il modulo di memoria persistente non è riuscito e deve essere sostituito. |
Comportamento generale | Il modulo di memoria persistente viene visualizzato come non inizializzato, con una capacità di 0 byte e non può essere letto o scritto. |
Comportamento di Spazi di archiviazione | Lo spazio di archiviazione rimane operativo (purché sia interessato un solo modulo di memoria persistente). L'oggetto PMem PhysicalDisk viene visualizzato con stato di integrità avviso e come "Disco fisico generale" |
Altre informazioni | Campo OperationalStatus dell'oggetto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Operazioni da eseguire | Il dispositivo di memoria persistente deve essere sostituito o sanificato, in modo che la piattaforma server lo esponga nuovamente al sistema operativo host. È consigliabile sostituire il dispositivo, perché potrebbero verificarsi errori più non correggibili. L'aggiunta di un dispositivo sostitutivo a una configurazione degli spazi di archiviazione può essere ottenuta con il Add-PhysicalDisk cmdlet . |
Il dispositivo viene visualizzato come disco RAW o vuoto dopo un riavvio
Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e viene visualizzato lo stato di integrità non integro e lo stato operativo dei metadati non riconosciuti, come illustrato in questo output di esempio:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | OK | {Sconosciuto} |
802c-01-1602-117cb64f | Unhealthy | {Metadati non riconosciuti, metadati obsoleti} | {Sconosciuto} |
Nella tabella seguente sono elencate alcune informazioni su questa condizione.
Prua | Descrizione |
---|---|
Condizione probabile | Errore di backup/ripristino |
Causa radice | Un errore nella procedura di backup o ripristino comporterà probabilmente la perdita di tutti i dati nel modulo di memoria persistente. Quando il sistema operativo viene caricato, viene visualizzato come un nuovo dispositivo di memoria persistente senza una partizione o un file system e una superficie come RAW, ovvero non ha un file system. |
Comportamento generale | La memoria persistente sarà in modalità di sola lettura. Sarà necessaria un'azione esplicita dell'utente per iniziare a usarlo nuovamente. |
Comportamento di Spazi di archiviazione | Spazi di archiviazione rimane operativo se è interessato un solo modulo di memoria persistente). L'oggetto disco fisico PMem verrà visualizzato con lo stato di integrità "Non integro" e non viene usato da Spazi di archiviazione. |
Altre informazioni | Campo OperationalStatus dell'oggetto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Operazioni da eseguire | Se l'utente non vuole sostituire il dispositivo interessato, può usare il Reset-PhysicalDisk cmdlet per cancellare la condizione di sola lettura nel modulo di memoria persistente interessato. Negli ambienti Spazi di archiviazione, questo tenterà anche di reintegrare il modulo di memoria persistente in Spazi di archiviazione e avviare il processo di ripristino. |
Passaggi successivi
Per informazioni correlate, vedere anche: