Eventi
Ottieni gratuitamente la certificazione in Microsoft Fabric.
19 nov, 23 - 10 dic, 23
Per un periodo di tempo limitato, il team della community di Microsoft Fabric offre buoni per esami DP-600 gratuiti.
Prepara oraQuesto browser non è più supportato.
Esegui l'aggiornamento a Microsoft Edge per sfruttare i vantaggi di funzionalità più recenti, aggiornamenti della sicurezza e supporto tecnico.
SI APPLICA A: NoSQL
Azure Cosmos DB distribuisce i dati tra partizioni logiche e fisiche in base alle chiavi di partizioni per abilitare il ridimensionamento orizzontale. Usando le chiavi di partizioni gerarchiche (denominate anche sottopartizioni), è possibile configurare una gerarchia con tre livelli per le chiavi di partizioni per ottimizzare ulteriormente la distribuzione dei dati e per un livello superiore di ridimensionamento.
Se attualmente si usano chiavi sintetiche, si hanno scenari in cui le chiavi di partizioni possono superare 20 GB di dati o si desidera garantire che il documento di ogni tenant sia mappato alla propria partizione logica, le sottopartizioni possono essere utili. Se si usa questa funzionalità, i prefissi della chiave di partizione logica possono superare 20 GB e 10.000 unità di richieste al secondo (UR/s). Le query in base al prefisso vengono instradate in modo efficiente al subset di partizioni che contengono i dati.
Se esistono applicazioni multi-tenant e attualmente si isolano i tenant in base alla chiave di partizione, le partizioni gerarchiche possono essere utili. Le partizioni gerarchiche consentono il ridimensionamento oltre il limite di chiavi di partizioni logiche di 20 GB e rappresentano una soluzione efficace se si desidera garantire che ogni documento dei tenant possa essere ridimensionato all'infinito. Se la chiave di partizione corrente o se una singola chiave di partizione raggiunge spesso 20 GB, le partizioni gerarchiche rappresentano una scelta ottimale per il carico di lavoro.
Tuttavia, a seconda della natura del carico di lavoro e della cardinalità della chiave di primo livello, possono esistere alcuni compromessi che verranno illustrati in dettaglio nella pagina degli scenari di partizioni gerarchiche.
Quando si sceglie ogni livello della chiave di partizione gerarchica, è importante tenere presenti i concetti generali di partizionamento seguenti e comprendere in che modo ognuno può influire sul carico di lavoro:
Per tutti i contenitori, ogni livello del percorso completo (a partire dal primo livello) della chiave di partizione gerarchica deve:
Avere una cardinalità elevata. La prima, la seconda e la terza chiave (se applicabile) della partizione gerarchica devono avere tutte un'ampia gamma di valori possibili.
TenantId
e abbia solo 5 tenant univoci. Ognuna di queste operazioni dei tenant sarà limitata a una sola partizione fisica, limitando l'uso della velocità effettiva solo a ciò che si trova in tale partizione fisica. Ciò è dovuto al fatto che le partizioni gerarchiche si ottimizzano per tutti i documenti con la stessa chiave di primo livello da inserire nella stessa partizione fisica per evitare query full fan-out.Distribuire l'uso delle unità di richiesta (UR) e l'archiviazione dei dati in maniera omogenea in tutte le partizioni logiche. Questa ripartizione garantisce anche la distribuzione uniforme dell'utilizzo di UR e dello spazio di archiviazione tra le partizioni fisiche.
UserId
, ma in pratica il carico di lavoro esegue operazioni su un solo UserId
specifico, è probabile che si verifichi una partizione ad accesso frequente perché tutte le operazioni saranno nell'ambito di una o poche partizioni fisiche.Carichi di lavoro con intensa attività di lettura: è consigliabile scegliere chiavi di partizioni gerarchiche che appaiono frequentemente nelle query.
TenantId
, UserId
e SessionId
, in tale ordine. Affinché le query vengano instradate in modo efficiente solo alle partizioni fisiche pertinenti, includere la chiave di partizione nel predicato del filtro. Per altre informazioni sulla scelta delle chiavi di partizioni per carichi di lavoro con intensa attività di lettura, vedere la panoramica sul partizionamento.Carichi di lavoro con intensa attività di scrittura: è consigliabile usare un valore cardinale elevato per il primo livello della chiave di partizione gerarchica. La cardinalità elevata implica che la chiave di primo livello (e i livelli successivi) ha almeno migliaia di valori univoci e valori più univoci rispetto al numero di partizioni fisiche.
Si supponga, ad esempio, di avere un carico di lavoro che isola i tenant in base alla chiave di partizione e che abbia alcuni tenant di grandi dimensioni con attività di scrittura più intensa rispetto ad altri. Attualmente, Azure Cosmos DB interromperà l'inserimento di dati su un valore della chiave di partizione se supera i 20 GB di dati. In questo carico di lavoro, Microsoft e Contoso sono tenant di grandi dimensioni e si prevede che la crescita sia molto più veloce rispetto ad altri tenant di Microsoft. Per evitare il rischio di non poter inserire dati per questi tenant, le chiavi di partizioni gerarchiche consentono di ridimensionare questi tenant oltre il limite di 20 GB. È possibile aggiungere altri livelli, ad esempio UserId e SessionId, per garantire una maggiore scalabilità tra i tenant.
Per assicurarsi che il carico di lavoro possa supportare le scritture per tutti i documenti con la stessa chiave di primo livello, è consigliabile usare l'ID elemento come chiave di secondo o terzo livello.
Se attualmente la cardinalità del primo livello non è elevata e si raggiunge il limite di 20 GB di partizioni logiche nella chiave di partizione, è consigliabile usare una chiave di partizione sintetica anziché una chiave di partizione gerarchica.
Si supponga di avere uno scenario multi-tenant in cui archiviare le informazioni sugli eventi per gli utenti in ogni tenant. Le informazioni sugli eventi potrebbero avere occorrenze di eventi tra cui, ad esempio, accesso, clickstream o eventi di pagamento.
In uno scenario reale, alcuni tenant possono crescere enormemente, con migliaia di utenti, mentre molti altri tenant sono più piccoli e hanno pochi utenti. Il partizionamento per /TenantId
potrebbe causare il superamento del limite di archiviazione di 20 GB di Azure Cosmos DB su una singola partizione logica. Il partizionamento per /UserId
esegue tutte le query tra partizioni dei tenant. Entrambi gli approcci presentano svantaggi significativi.
L'uso di una chiave di partizione sintetica che combina TenantId
e UserId
aggiunge complessità all'applicazione. Inoltre, le query delle chiavi di partizioni sintetiche per un tenant sono ancora tra partizioni, a meno che tutti gli utenti non siano noti e specificati in anticipo.
Se il carico di lavoro include tenant con modelli di carico di lavoro approssimativamente identici, la chiave di partizione gerarchica può essere utile. Con le chiavi di partizioni gerarchiche è possibile eseguire prima la partizione in TenantId
e quindi in UserId
. Se si prevede che la combinazione di TenantId
e UserId
produca partizioni che superano 20 GB, è anche possibile partizionare ulteriormente fino a un altro livello, ad esempio in SessionId
. La profondità complessiva non può superare tre livelli. Quando una partizione fisica supera 50 GB di spazio di archiviazione, Azure Cosmos DB divide automaticamente la partizione fisica in modo che circa la metà dei dati si trovi in una partizione fisica e l'altra metà si trovi nell'altra partizione. In effetti, la sottopartizione implica che un singolo valore TenantId
può superare 20 GB di dati ed è possibile per TenantId
che dati siano ripartiti in più partizioni fisiche.
Le query che specificano TenantId
o sia TenantId
che UserId
vengono instradate in modo efficiente solo al subset di partizioni fisiche che contengono i dati pertinenti. Se si specifica il percorso della chiave di partizione con sottopartizioni completo o con prefisso, è possibile evitare in modo efficace una query full fan-out. Ad esempio, se il contenitore avesse 1.000 partizioni fisiche, ma un valore TenantId
specifico solo su 5 partizioni fisiche, la query verrebbe instradata al numero inferiore di partizioni fisiche pertinenti.
Se il contenitore ha una proprietà con una vasta gamma di valori possibili, è probabile che la proprietà sia una scelta ottimale per la chiave di partizione per l'ultimo livello della gerarchia. Un esempio possibile di questo tipo di proprietà è l'ID elemento. L'ID elemento di una proprietà di sistema è presente in ogni elemento di un contenitore. Aggiungendo l'ID elemento come altro livello, si garantisce la possibilità di un ridimensionamento oltre il limite di 20 GB delle chiavi di partizioni logiche. È possibile il ridimensionamento oltre questo limite per il primo livello o per i primi e i secondi livelli di chiavi.
Ad esempio, potrebbe essere disponibile un contenitore per un carico di lavoro multi-tenant partizionato da TenantId
e UserId
. Se è possibile che una singola combinazione di TenantId
e UserId
superi 20 GB, è consigliabile partizionare usando tre livelli di chiavi, con la chiave di terzo livello con elevata cardinalità. Un esempio di questo scenario è il caso in cui la chiave di terzo livello sia un GUID con cardinalità naturalmente elevata. È improbabile che la combinazione di TenantId
, UserId
e un GUID superi 20 GB, quindi la combinazione di TenantId
e UserId
può essere ridimensionata in modo efficace oltre 20 GB.
Per altre informazioni sull'uso dell'ID elemento come chiave di partizione, vedere la panoramica sul partizionamento.
Importante
L'uso di contenitori che usano chiavi di partizioni gerarchiche è supportato solo nelle versioni dell'SDK seguenti. È necessario usare un SDK supportato per creare nuovi contenitori con chiavi di partizioni gerarchiche e per eseguire operazioni di creazione, lettura, aggiornamento ed eliminazione (CRUD) o di query sui dati. Se si desidera usare un SDK o un connettore attualmente non supportato, inviare una richiesta nel forum della community Microsoft.
Trovare la versione di anteprima più recente dell'SDK supportato:
SDK | Versioni supportate | Collegamento di Gestione pacchetti |
---|---|---|
.NET SDK v3 | > = 3.33.0 | https://www.nuget.org/packages/Microsoft.Azure.Cosmos/3.33.0/ |
Java SDK v4 | > = 4.42.0 | https://github.com/Azure/azure-sdk-for-java/blob/main/sdk/cosmos/azure-cosmos/CHANGELOG.md#4420-2023-03-17/ |
JavaScript SDK v4 | 4.0.0 | https://www.npmjs.com/package/@azure/cosmos/ |
Python SDK | > = 4.6.0 | https://pypi.org/project/azure-cosmos/4.6.0/ |
Per iniziare, creare un nuovo contenitore usando un elenco predefinito di percorsi chiave di sottopartizionamento fino a tre livelli di profondità.
È possibile creare un nuovo contenitore usando una di queste opzioni:
Il modo più semplice per creare un contenitore e specificare chiavi di partizioni gerarchiche consiste nell'uso del portale di Azure.
Accedere al portale di Azure.
Passare alla pagina dell'account Azure Cosmos DB for NoSQL esistente.
Nel menu a sinistra, selezionare Esplora dati.
In Esplora dati, selezionare l'opzione Nuovo contenitore.
In Nuovo contenitore, per Chiave di partizione immettere /TenantId
. Per i campi rimanenti, immettere qualsiasi valore corrispondente allo scenario.
Nota
Qui viene usato /TenantId
come esempio. È possibile specificare qualsiasi chiave per il primo livello quando si implementano chiavi di partizioni gerarchiche nei propri contenitori.
Selezionare Aggiungi chiave di partizione gerarchica due volte.
Per i secondi e i terzi livelli di sottopartizione, immettere rispettivamente /UserId
e /SessionId
.
Seleziona OK per creare il contenitore.
Quando si crea un nuovo contenitore usando l'SDK, definire un elenco di percorsi chiave di sottopartizionamento fino a tre livelli di profondità. Usare l'elenco di chiavi di sottopartizioni quando si configurano le proprietà del nuovo contenitore.
// List of partition keys, in hierarchical order. You can have up to three levels of keys.
List<string> subpartitionKeyPaths = new List<string> {
"/TenantId",
"/UserId",
"/SessionId"
};
// Create a container properties object
ContainerProperties containerProperties = new ContainerProperties(
id: "<container-name>",
partitionKeyPaths: subpartitionKeyPaths
);
// Create a container that's subpartitioned by TenantId > UserId > SessionId
Container container = await database.CreateContainerIfNotExistsAsync(containerProperties, throughput: 400);
Il modello di Azure Resource Manager per un contenitore sottopartizionato è quasi identico a un contenitore standard. L'unica differenza chiave è il valore del percorso properties/partitionKey
. Per altre informazioni sulla creazione di un modello di Azure Resource Manager per una risorsa di Azure Cosmos DB, vedere Informazioni di riferimento sul modello di Azure Resource Manager per Azure Cosmos DB.
Configurare l'oggetto partitionKey
usando i valori nella tabella seguente per creare un contenitore sottopartizionato:
Percorso | Valore |
---|---|
paths |
Elenco di chiavi di partizioni gerarchiche (max tre livelli di profondità) |
kind |
MultiHash |
version |
2 |
Si supponga, ad esempio, di avere una chiave di partizione gerarchica composta da TenantId
>UserId
>SessionId
. L'oggetto partitionKey
verrà configurato per includere tutti e tre i valori nella proprietà paths
, un valore kind
di MultiHash
e un valore version
di 2
.
partitionKey: {
paths: [
'/TenantId'
'/UserId'
'/SessionId'
]
kind: 'MultiHash'
version: 2
}
Per altre informazioni sull'oggetto partitionKey
, vedere la specifica ContainerPartitionKey.
È possibile testare la funzionalità di sottopartizionamento usando l'ultima versione dell'emulatore locale per Azure Cosmos DB. Per abilitare la il sottopartizionamento nell'emulatore, avviare l'emulatore dalla directory di installazione con il flag /EnablePreview
:
.\CosmosDB.Emulator.exe /EnablePreview
Avviso
L'emulatore attualmente non supporta tutte le funzionalità delle chiavi di partizioni gerarchiche come il portale. L'emulatore attualmente non supporta:
Per altre informazioni, vedere Emulatore di Azure Cosmos DB.
Quando esiste un contenitore con chiavi di partizioni gerarchiche, usare le versioni specificate precedentemente degli SDK .NET o Java per eseguire operazioni ed eseguire query su tale contenitore.
Esistono due opzioni per aggiungere un nuovo elemento a un contenitore con chiavi di partizioni gerarchiche abilitate:
Se si passa un oggetto con il valore della chiave di partizione impostato, l'SDK può estrarre automaticamente il percorso completo della chiave di partizione.
// Create a new item
UserSession item = new UserSession()
{
id = "f7da01b0-090b-41d2-8416-dacae09fbb4a",
TenantId = "Microsoft",
UserId = "00aa00aa-bb11-cc22-dd33-44ee44ee44ee",
SessionId = "0000-11-0000-1111"
};
// Pass in the object, and the SDK automatically extracts the full partition key path
ItemResponse<UserSession> createResponse = await container.CreateItemAsync(item);
La classe PartitionKeyBuilder
nell'SDK può costruire un valore per un percorso della chiave di partizione gerarchica definito in precedenza. Usare questa classe quando si aggiunge un nuovo elemento a un contenitore in cui è abilitato il sottopartizionamento.
Suggerimento
Su larga scala, le prestazioni potrebbero essere migliorate se si specifica il percorso completo della chiave di partizione, anche se l'SDK può estrarre il percorso dall'oggetto.
// Create a new item object
PaymentEvent item = new PaymentEvent()
{
id = Guid.NewGuid().ToString(),
TenantId = "Microsoft",
UserId = "00aa00aa-bb11-cc22-dd33-44ee44ee44ee",
SessionId = "0000-11-0000-1111"
};
// Specify the full partition key path when creating the item
PartitionKey partitionKey = new PartitionKeyBuilder()
.Add(item.TenantId)
.Add(item.UserId)
.Add(item.SessionId)
.Build();
// Create the item in the container
ItemResponse<PaymentEvent> createResponse = await container.CreateItemAsync(item, partitionKey);
Le ricerche chiave/valore (letture di punti) vengono eseguite in modo simile a un contenitore non sottopartizionato. Si supponga, ad esempio, di avere una chiave di partizione gerarchica composta da TenantId
>UserId
>SessionId
. L'identificatore univoco per l'elemento è un GUID. È rappresentato come stringa che funge da identificatore univoco della transazione del documento. Per eseguire una lettura di punti su un singolo elemento, passare la proprietà id
dell'elemento e il valore completo per la chiave di partizione, inclusi tutti e tre i componenti del percorso.
// Store the unique identifier
string id = "f7da01b0-090b-41d2-8416-dacae09fbb4a";
// Build the full partition key path
PartitionKey partitionKey = new PartitionKeyBuilder()
.Add("Microsoft") //TenantId
.Add("00aa00aa-bb11-cc22-dd33-44ee44ee44ee") //UserId
.Add("0000-11-0000-1111") //SessionId
.Build();
// Perform a point read
ItemResponse<UserSession> readResponse = await container.ReadItemAsync<UserSession>(
id,
partitionKey
);
Il codice SDK usato per eseguire una query in un contenitore sottopartizionato è identico all'esecuzione di una query in un contenitore non sottopartizionato.
Quando la query specifica tutti i valori delle chiavi di partizioni nel filtro WHERE
o in un prefisso della gerarchia di chiavi, l'SDK instrada automaticamente la query alle partizioni fisiche corrispondenti. Le query che forniscono solo il "centro" della gerarchia sono query tra partizioni.
Si supponga, ad esempio, di avere una chiave di partizione gerarchica composta da TenantId
>UserId
>SessionId
. I componenti del filtro della query determinano se la query è una query a singola partizione, una query tra partizioni mirata o una query fan-out.
Query | Definizione dei percorsi di trasferimento |
---|---|
SELECT * FROM c WHERE c.TenantId = 'Microsoft' AND c.UserId = '00aa00aa-bb11-cc22-dd33-44ee44ee44ee' AND c.SessionId = '0000-11-0000-1111' |
Instradato alla singola partizione logica e fisica che contiene i dati per i valori specificati di TenantId , UserId e SessionId . |
SELECT * FROM c WHERE c.TenantId = 'Microsoft' AND c.UserId = '00aa00aa-bb11-cc22-dd33-44ee44ee44ee' |
Instradato solo al sottoinsieme mirato di partizioni logiche e fisiche che contengono dati per i valori specificati di TenantId e UserId . Questa query è una query tra partizioni mirata che restituisce dati per un utente specifico nel tenant. |
SELECT * FROM c WHERE c.TenantId = 'Microsoft' |
Instradato solo al sottoinsieme mirato di partizioni logiche e fisiche che contengono dati per il valore specificato di TenantId . Questa query è una query tra partizioni mirata che restituisce dati per tutti gli utenti in un tenant. |
SELECT * FROM c WHERE c.UserId = '00aa00aa-bb11-cc22-dd33-44ee44ee44ee' |
Instradato a tutte le partizioni fisiche, generando una query tra partizioni fan-out. |
SELECT * FROM c WHERE c.SessionId = '0000-11-0000-1111' |
Instradato a tutte le partizioni fisiche, generando una query tra partizioni fan-out. |
Di seguito è riportato un esempio di esecuzione di una query che include tutti i livelli di sottopartizionamento, rendendo effettivamente la query una query a partizione singola.
// Define a single-partition query that specifies the full partition key path
QueryDefinition query = new QueryDefinition(
"SELECT * FROM c WHERE c.TenantId = @tenant-id AND c.UserId = @user-id AND c.SessionId = @session-id")
.WithParameter("@tenant-id", "Microsoft")
.WithParameter("@user-id", "00aa00aa-bb11-cc22-dd33-44ee44ee44ee")
.WithParameter("@session-id", "0000-11-0000-1111");
// Retrieve an iterator for the result set
using FeedIterator<PaymentEvent> results = container.GetItemQueryIterator<PaymentEvent>(query);
while (results.HasMoreResults)
{
FeedResponse<UserSession> resultsPage = await resultSet.ReadNextAsync();
foreach(UserSession result in resultsPage)
{
// Process result
}
}
Di seguito è riportato un esempio di query che include un sottoinsieme dei livelli di sottopartizionamento, rendendo effettivamente la query una query tra partizioni multiple mirata.
// Define a targeted cross-partition query specifying prefix path[s]
QueryDefinition query = new QueryDefinition(
"SELECT * FROM c WHERE c.TenantId = @tenant-id")
.WithParameter("@tenant-id", "Microsoft")
// Retrieve an iterator for the result set
using FeedIterator<PaymentEvent> results = container.GetItemQueryIterator<PaymentEvent>(query);
while (results.HasMoreResults)
{
FeedResponse<UserSession> resultsPage = await resultSet.ReadNextAsync();
foreach(UserSession result in resultsPage)
{
// Process result
}
}
TenantId
- >UserId
, non è possibile assegnare un'autorizzazione per un valore specifico di TenantId
. Tuttavia, è possibile assegnare un'autorizzazione per una chiave di partizione se si specifica sia il valore per TenantId
che ''UserId''.Eventi
Ottieni gratuitamente la certificazione in Microsoft Fabric.
19 nov, 23 - 10 dic, 23
Per un periodo di tempo limitato, il team della community di Microsoft Fabric offre buoni per esami DP-600 gratuiti.
Prepara ora