Recolha de estatísticas e relatórios na Deteção de Dados Eletrónicos do Microsoft Purview (Premium)

Dica

A Deteção de Dados Eletrónicos (pré-visualização) está agora disponível no novo portal do Microsoft Purview. Para saber mais sobre como utilizar a nova experiência de Deteção de Dados Eletrónicos, veja Saiba mais sobre a Deteção de Dados Eletrónicos (pré-visualização).

Depois de criar uma estimativa de coleção, pode ver estatísticas sobre os itens obtidos, como as localizações de conteúdo que contêm mais itens que correspondem aos critérios de pesquisa e o número de itens devolvidos pela consulta de pesquisa. Também pode pré-visualizar um subconjunto dos resultados.

Depois de identificar o conjunto de documentos que pretende examinar mais detalhadamente, pode adicionar os resultados da pesquisa a um conjunto de revisões para recolher e processar.

Dica

Se você não é um cliente E5, use a avaliação das soluções do Microsoft Purview de 90 dias para explorar como os recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de testes do portal de conformidade do Microsoft Purview. Saiba mais detalhes sobre os termos de inscrição e avaliação.

Estatísticas de pesquisa para estimativas de coleção

Esta secção descreve as estatísticas disponíveis para estimativas de coleção. Estas estatísticas estão disponíveis no separador Estatísticas de pesquisa na página de lista de opções de uma estimativa de coleção.

Estimativas da coleção

Esta secção apresenta um resumo gráfico dos itens estimados devolvidos pela coleção. Isto indica o número de itens que correspondem aos critérios de pesquisa da coleção. Estas informações dão-lhe uma ideia do número estimado de itens devolvidos pela coleção.

  • Itens estimados por localizações: o número total de itens estimados devolvidos pela coleção. O número específico de itens localizados em caixas de correio e localizados em sites também é exibido.
  • Localizações estimadas com resultados: o número total de localizações de conteúdo que contêm itens devolvidos pela coleção. O número específico de caixas de correio e locais de site também é exibido.
  • Volume de dados por localização (em MB): o tamanho total de todos os itens estimados devolvidos pela coleção. O tamanho específico dos itens de caixa de correio e itens de site também é exibido.

Secção de estimativas de coleção para uma estimativa de coleção.

Relatório de condição

Esta secção apresenta estatísticas sobre a consulta de pesquisa de coleções e o número de itens estimados que correspondem a diferentes partes da consulta de pesquisa. Pode utilizar estas estatísticas para analisar o número de itens que correspondem a cada componente da consulta de pesquisa. Isto pode ajudá-lo a refinar os critérios de pesquisa para a coleção e, se necessário, restringir o âmbito da coleção.

  • Tipo de localização: o tipo de localização de conteúdo a que as estatísticas de consulta são aplicáveis. O valor do Exchange indica uma localização de caixa de correio; um valor do SharePoint indica uma localização do site.
  • Parte: a parte da consulta de pesquisa a que as estatísticas são aplicáveis. Primário indica toda a consulta de pesquisa. Palavra-chave indica que as estatísticas na linha são para uma palavra-chave específica. Se utilizar uma lista de palavras-chave quando for a consulta de pesquisa na coleção, as estatísticas de cada componente da consulta são incluídas nesta tabela.
  • Condição: o componente real (palavra-chave ou condição) da consulta de pesquisa que foi executada para a estimativa da coleção que devolveu as estatísticas apresentadas na linha correspondente.
  • Localizações com acessos: o número de localizações de conteúdo (especificadas pela coluna Tipo de localização ) que contêm itens que correspondem à consulta primária ou de palavra-chave listada na coluna Condição .
  • Itens: o número de itens (da localização de conteúdo especificada) que correspondem à consulta listada na coluna Condição . Conforme explicado anteriormente, se um item contiver várias instâncias de uma palavra-chave que está a ser pesquisada, só é contado uma vez nesta coluna.
  • Tamanho (MB): o tamanho total de todos os itens que foram encontrados (na localização de conteúdo especificada) que correspondem à consulta de pesquisa na coluna Condição .

Secção Relatório de condição para uma estimativa de coleção.

Locais principais

Esta secção apresenta estatísticas sobre as localizações de conteúdo específicas com a maioria dos itens devolvidos pela coleção.

  • Localização: o nome da localização (o endereço de e-mail das caixas de correio e o URL dos sites).
  • Tipo de localização: uma caixa de correio terá um tipo de Exchange e os sites do SharePoint terão um tipo de SharePoint.
  • Itens: número estimado de itens na localização de conteúdo devolvida pela coleção.
  • Tamanho: o tamanho total dos itens estimados em cada localização de conteúdo.

Secção principais localizações para uma estimativa de coleção.

Estatísticas e relatórios para coleções consolidadas

Esta secção descreve as estatísticas que estão disponíveis depois de consolidar uma coleção num conjunto de revisão, incluindo o número real de itens adicionados ao conjunto de revisão. Estas estatísticas (além das informações do conjunto de carga) fornecem informações históricas sobre o conteúdo adicionado a um caso.

Depois de consolidar uma coleção num conjunto de revisão, os seguintes separadores são apresentados na página de lista de opções da ligação consolidada. Cada um destes separadores contém diferentes tipos de informações sobre a coleção.

Separadores na página de lista de opções da coleção consolidada.

Separador Resumo para coleções

O separador Resumo para coleções consolidadas contém várias secções que fornecem informações sobre os itens de coleção, estimativas de itens e localizações, indexação, tipos de ficheiro e muito mais.

Descrição geral da coleção (pré-visualização)

A secção Descrição geral da coleção no separador Resumo de um conjunto de revisão consolidada contém informações sobre como os itens foram encontrados, obtidos e processados como parte da coleção. As informações nesta secção são um resumo das informações recolhidas e apresentadas durante a estimativa inicial da coleção e incluem informações recolhidas e processadas durante a consolidação da coleção para o conjunto de revisão. Pode utilizar as informações nesta secção para ajudar a melhorar a compreensão de como os dados de recolha final evoluem a partir dos dados estimados durante a consolidação e o processamento da recolha.

Estas informações são segmentadas e apresentadas nas seguintes sub-secções:

  • Localizações com resultados: esta secção resume o número de localizações pesquisadas e o número de localizações com acessos com base nas condições definidas na estimativa da coleção. Também apresenta o número e o tipo de localizações pesquisadas.

    Localizações com acessos.

  • Estimativas de pré-coleção: esta secção resume o número de itens e o tamanho do total de itens calculados para a estimativa da coleção (antes de a coleção ser consolidada). Também é apresentada uma contagem de itens que foram parcialmente indexados .

    Estimativas de pré-recolha.

  • Itens de coleção: esta secção apresenta o tipo, a contagem e uma descrição de todos os itens obtidos a partir de localizações com resultados durante a consolidação da coleção para o conjunto de revisão. Durante este processo, pode haver alguma adição e consolidação de itens durante o processamento. As adições e consolidações podem incluir tipos incluídos na tabela seguinte:

    Tipo de item Descrição do tipo de item
    Itens com acessos Número estimado de itens encontrados pela pesquisa.
    Rever duplicados do conjunto Os itens que já se encontram no mesmo conjunto de revisão não são recolhidos.
    Procurar duplicados As instâncias duplicadas dos mesmos itens não são recolhidas.
    Todas as versões Todas as versões dos itens no SharePoint são recolhidas.
    Versões históricas As versões históricas mantidas pelo SharePoint são recolhidas.
    Anexos na nuvem Os anexos na nuvem são identificados e recolhidos a partir de ligações do SharePoint.
    Versão como partilhada As versões partilhadas dos itens são recolhidas para além das versões mais recentes.
    Conversações contextuais do Teams São recolhidas mensagens de chat adicionais que possam ser relevantes.
    Transcrições de chat consolidadas As mensagens de chat recolhidas são consolidadas em menos transcrições HTML.
    Exceções de obtenção Tempos limite de acesso, ficheiros vazios e outras exceções.
    Total de itens recolhidos Número total de itens recolhidos de várias localizações.
  • Processamento para rever o conjunto: esta secção apresenta o tipo, a contagem e a descrição dos itens que foram adicionados ao conjunto de revisão a partir da estimativa da coleção. Os itens são descomprimidos, analisados para texto, reindexados e processados em preparação para a revisão.

    A processar para rever o conjunto.

Conteúdo da coleção

A secção Conteúdos da coleção no separador Resumo de um conjunto de revisão consolidada contém estatísticas e outras informações sobre os itens que foram recolhidos das origens de dados na coleção e adicionados ao conjunto de revisão.

  • Total de itens extraídos. O número total de itens adicionados ao conjunto de revisão. Este número indica a soma dos itens principais e dos itens subordinados adicionados ao conjunto de revisão.

    Dica

    Paire o cursor sobre as barras de item principal ou subordinado para apresentar o número total de itens principais ou subordinados.

  • Itens principais. O número de itens devolvidos pela coleção que foi utilizada para recolher os itens que foram adicionados ao conjunto de revisão. Este número corresponde (e é igual a) ao número estimado de itens que é apresentado na secção Parâmetros da coleção . O número de itens principais que recolhe informações que foram utilizadas para recolher os itens que foram adicionados ao conjunto de revisão.

    Um item principal pode conter vários itens subordinados. Por exemplo, uma mensagem de e-mail é um item principal se contiver um ficheiro anexado ou tiver um anexo na nuvem. Neste caso, o ficheiro anexado ou o ficheiro de destino do anexo na nuvem é considerado um item subordinado. Quando consolida uma coleção, os itens principais e quaisquer itens subordinados correspondentes (como ficheiros anexados e anexos na nuvem) são adicionados ao conjunto de revisão como itens ou ficheiros individuais.

  • Itens subordinados. O número de itens subordinados adicionados ao conjunto de revisão. Apenas os itens subordinados que são anexos de ficheiros e anexos na nuvem são adicionados ao conjunto de revisão como ficheiros individuais. Outros tipos de itens subordinados, como assinaturas de e-mail e imagens, são extraídos de um item principal e processados pelo Reconhecimento Ótico de Carateres (OCR) para extrair texto do item subordinado. O texto extraído destes tipos de itens subordinados é adicionado ao item principal para que possa vê-lo no conjunto de revisões. Ao não adicionar itens subordinados ao conjunto de revisão como um ficheiro separado, a Deteção de Dados Eletrónicos (Premium) ajuda a simplificar o processo de revisão ao limitar o número de itens potencialmente imateriais no conjunto de revisão.

  • Itens exclusivos. O número de itens exclusivos adicionados ao conjunto de revisão. Os itens exclusivos são exclusivos do conjunto de revisão. Todos os itens são exclusivos quando a primeira coleção é adicionada a um novo conjunto de revisões porque não havia itens anteriores no conjunto de revisão.

  • Itens duplicados identificados. O número de itens da coleção que não foram adicionados ao conjunto de revisões porque o mesmo item já existe no conjunto de revisão. As estatísticas sobre itens duplicados podem ajudar a explicar as diferenças entre o número de itens estimados de uma estimativa de coleção e o número real de itens adicionados ao conjunto de revisão.

Indexação

A secção Indexação no separadorResumo de um conjunto de revisão consolidada contém informações de indexação sobre os itens adicionados ao conjunto de revisão.

  • Novos itens indexados. O número de itens que foram indexados recentemente antes de serem adicionados ao conjunto de revisão. Exemplos de um item recentemente indexado são itens subordinados extraídos de um item principal e, em seguida, indexados antes de serem adicionados ao conjunto de revisão. Além disso, os itens que não estão localizados em origens de dados de custódia e localizações de conteúdo não depositário listados no separador Origens de dados no caso são indexados antes de serem adicionados à revisão. Por exemplo, os itens indexados recentemente incluem itens recolhidos de localizações adicionais.

  • Itens indexados atualizados. O número de itens parcialmente indexados que foram indexados com êxito e adicionados ao conjunto de revisão. Esta estatística indica os itens parcialmente indexados do separador Origens de dados que foram indexados com êxito quando a coleção foi consolidada no conjunto de revisão.

  • Erros de indexação. O número de itens parcialmente indexados que não puderam ser indexados antes de serem adicionados ao conjunto de revisão. Estes itens podem necessitar de remediação de erros.

Tipos de ficheiro de coleção

A secção Tipos de ficheiro de coleção no separador Resumo de um conjunto de revisão consolidada apresenta a contagem de itens para cada tipo de ficheiro incluído na coleção. Os tipos de ficheiro incluem e-mail, imagem, documento, áudio, tipos de ficheiro de vídeo e muito mais. Para obter uma lista completa dos tipos de ficheiro suportados, veja Tipos de ficheiro suportados na Deteção de Dados Eletrónicos (Premium).

Erros

A secção Erros no separador Resumo de um conjunto de revisão consolidada apresenta o tipo e o número de erros encontrados durante a consolidação da coleção. Os erros podem incluir ficheiros com um tamanho zero, ficheiros protegidos, ficheiros mal formados, erros internos e muito mais. Um relatório de erros no formato .csv pode ser transferido ao selecionar Transferir o relatório de erros nesta secção.

Parâmetros de coleção

A secção Parâmetros da coleção no separador Resumo de um conjunto de revisão consolidada apresenta as informações de recolha que foram utilizadas para recolher os itens que foram adicionados ao conjunto de revisão. Este separador apresenta informações semelhantes às informações no separador Estatísticas de pesquisa. Esta secção fornece uma captura rápida da consulta de pesquisa utilizada pela coleção, as localizações de conteúdo que foram pesquisadas e os resultados estimados da coleção. Conforme explicado anteriormente, o número de itens estimados nesta secção seria igual ao número de itens principais apresentados na secção Conteúdos da coleção .

Separador Origens de dados para coleções

O separador Origens de dados contém informações sobre origens de dados de custódia e não de custódia. A secção Origens de dados de custódia apresenta todas as origens de dados de custódia para cada depositário incluído na coleção. A secção Origens de dados não custodiais apresenta todas as origens de dados não guardadas da coleção. As informações da origem de dados apresentadas também estão disponíveis no separador Origens de dados principal para cada caso.

Separador Estatísticas de pesquisa para coleções

As estatísticas apresentadas no separador Estatísticas de pesquisa são as mesmas estatísticas da última vez que foi executada uma estimativa de coleção. Isto inclui estimativas de coleção, relatório de condição e localizações principais. Estas informações são preservadas da estimativa de coleção para referência histórica e podem ser comparadas com a coleção real consolidada com o conjunto de revisão.

Diferenças entre as estimativas da coleção e a coleção consolidada real

Quando executa uma estimativa de coleção, é apresentada uma estimativa do número de itens (e o respetivo tamanho total) que correspondem aos critérios da coleção no separador Resumo e na secção Estimativas da coleção do separador Estatísticas de pesquisa. Depois de consolidar uma estimativa de coleção para um conjunto de revisão, o número real de itens (e o respetivo tamanho total) adicionados ao conjunto de revisão é muitas vezes diferente das estimativas. Na maioria dos casos, são adicionados mais itens ao conjunto de revisão do que os estimados na estimativa da coleção. A lista seguinte descreve as razões mais comuns para estas diferenças e sugestões para as identificar:

  • Itens subordinados. Itens subordinados (como anexos de ficheiros e anexos na nuvem) que são extraídos dos respetivos itens principais e adicionados como ficheiros individuais. O número de itens subordinados pode aumentar o número de itens adicionados ao conjunto de revisão. Em geral, o número de itens principais identificados na secção Conteúdos da coleção no separador Resumo de uma coleção consolidada deve ser igual ao número de itens estimados da estimativa da coleção.

  • Duplicar itens. Os itens da estimativa de coleção que já tenham sido adicionados ao conjunto de revisões numa coleção anterior não serão adicionados. Conforme explicado anteriormente, o número de itens duplicados na coleção é apresentado na secção Conteúdos da coleção no separador Resumo .

  • Opções de configuração da coleção. Quando consolida uma estimativa de coleção num conjunto de revisões, tem de optar por incluir threads de conversação, anexos na nuvem e versões de documentos. Qualquer um destes itens adicionados ao conjunto de revisão não está incluído nas estimativas da estimativa da coleção. São identificados e recolhidos apenas quando consolida a coleção. A seleção destas opções irá, muito provavelmente, aumentar o número de itens adicionados ao conjunto de revisões.

    Por exemplo, várias versões de documentos do SharePoint não estão incluídas na estimativa da estimativa da coleção. No entanto, se selecionar a opção para incluir todas as versões do documento quando consolidar uma estimativa de coleção, o número real (e o tamanho total) dos itens adicionados ao conjunto de revisões aumentará.

    Para obter mais informações sobre estas opções, veja Consolidar uma estimativa de coleção num conjunto de revisões.

Eis outras razões pelas quais os resultados estimados de uma estimativa de coleção podem ser diferentes dos resultados consolidados reais.

  • A forma como os resultados são estimados para as estimativas da coleção. Uma estimativa dos resultados da pesquisa devolvidos por uma estimativa de coleção é apenas isso, uma estimativa (e não uma contagem real) dos itens que cumprem os critérios de consulta da coleção. Para compilar a estimativa dos itens de e-mail, é pedida uma lista dos IDs de mensagens que cumprem os critérios de pesquisa na base de dados do Exchange. No entanto, quando consolida a coleção num conjunto de revisões, a coleção é novamente executada e as mensagens reais são obtidas a partir da base de dados do Exchange. Assim, as diferenças podem resultar devido à forma como o número estimado de itens e o número real de itens são determinados.

  • Alterações que ocorrem entre o momento em que estima e consolida estimativas de coleções. Quando consolida uma estimativa de coleção num conjunto de revisões, a pesquisa é novamente executada para recolher os itens mais recentes no índice de pesquisa que cumprem os critérios de pesquisa. É possível que tenham sido criados, enviados ou eliminados itens adicionais que correspondam aos critérios de pesquisa no momento em que a estimativa da coleção foi executada pela última vez e quando a estimativa da coleção é consolidada num conjunto de revisão. Também é possível que os itens que estavam no índice de pesquisa quando os resultados da estimativa da coleção foram estimados já não estejam lá porque foram removidos de uma origem de dados antes de consolidarem a coleção. Uma forma de mitigar este problema é especificar um intervalo de datas para uma coleção. Outra forma é colocar uma suspensão nas localizações de conteúdo para que os itens sejam preservados e não possam ser removidos.

  • Itens não identificados. Se a estimativa da coleção incluir a pesquisa em todas as caixas de correio do Exchange ou em todos os sites do SharePoint, apenas serão adicionados itens não filtrados de localizações de conteúdo que contenham itens que correspondam aos critérios da coleção ao conjunto de revisão. Por outras palavras, se não forem encontrados resultados numa caixa de correio ou site, os itens não identificados nessa caixa de correio ou site não serão adicionados ao conjunto de revisões. No entanto, os itens não filtrados de todas as localizações de conteúdo (mesmo aqueles que não contêm itens que correspondem à consulta da coleção) serão incluídos nos resultados estimados da coleção.

  • Itens parcialmente indexados: a seleção desta opção adiciona itens parcialmente indexados de origens de dados adicionais ao conjunto de revisão. Se a coleção tiver procurado origens de dados adicionais (conforme especificado na página Localizações adicionais no assistente de coleções), poderão existir itens parcialmente indexados a partir destas localizações que pretende adicionar ao conjunto de revisão. Normalmente, as origens de dados de custódia e não de custódia não têm itens parcialmente indexados. Isto deve-se ao facto de o processo de indexação Avançado reindexar os itens quando as origens de dados de custódia e não de custódia são adicionadas a um caso. Além disso, adicionar itens parcialmente indexados irá aumentar o número de itens adicionados ao conjunto de revisão.

    Depois de os itens parcialmente indexados serem adicionados ao conjunto de revisão, pode aplicar um filtro para ver especificamente estes itens. Para obter mais informações, veja Exemplo de cenário: Filtrar itens parcialmente indexados

    Em alternativa, se a estimativa da coleção incluir localizações de conteúdo específicas (o que significa que caixas de correio ou sites específicos, quando especificados na página Localizações adicionais no assistente de estimativa da coleção), os itens nãondexados (que não são excluídos pelos critérios de recolha) das localizações de conteúdo especificadas na pesquisa serão exportados. Neste caso, o número estimado de itens nãondexados e o número de itens não identificados que são adicionados ao conjunto de revisão devem ser os mesmos.