Índice semântico para Copilot

O índice semântico é gerado a partir de conteúdos no Microsoft Graph. É utilizado para ajudar na produção de respostas contextualmente relevantes às consultas dos utilizadores. Além disso, permite que as organizações pesquisem em bilhões de vetores (representações matemáticas de recursos ou atributos) e retornem os resultados relacionados. Combinado com melhorias no Microsoft Graph, o índice semântico liga-o a informações relevantes na sua organização. Baseia-se na abordagem abrangente da Microsoft em matéria de segurança, conformidade, privacidade e respeita todos os limites organizacionais no seu inquilino.

O que é um índice?

O conceito de indexação de dados está bem estabelecido no Microsoft 365. A indexação é uma das formas importantes de os serviços do Microsoft 365 acederem à enorme quantidade de dados no Microsoft Graph, onde reside o seu inquilino do Microsoft 365. Com a indexação, os utilizadores veem os resultados da pesquisa do Microsoft Graph, incluindo conteúdos e sinais da maioria das aplicações do Microsoft 365 no seu inquilino. Isto garante que os resultados da pesquisa são personalizados e elevados com base nas suas ligações entre conteúdo e pessoas na sua rede.

As interações com dados no Microsoft Graph baseiam-se em palavra-chave correspondência, personalização e correspondência social. A pesquisa de palavras-chave consulta um índice no Microsoft Graph, que mapeia para locais em documentos ou em um conjunto de documentos. O Microsoft 365 usa o Microsoft Graph para classificar o conteúdo mais relevante com base no respectivo conhecimento de sinais adicionais para os usuários e sua rede mais próxima. Isso é conhecido como personalização e equiparação social no Microsoft 365, o que impulsiona a relevância das consultas com relação ao conteúdo na sua organização. O acesso aos dados do locatário no Microsoft Graph é limitado pelo controle de acesso baseado em função. As organizações estão sempre no controle dos recursos da Pesquisa da Microsoft, por meio do portal de Pesquisa e Inteligência no centro de administração do Microsoft 365.

Como o índice semântico ajuda a gerenciar seus dados

O índice semântico melhora as funcionalidades do Microsoft 365 que lhe permitem encontrar conteúdos relevantes com base em palavras-chave, preferências pessoais e ligações sociais. Fá-lo através da criação de índices vetorizados. Um vetor é uma representação numérica de uma palavra, pixel de imagem ou outros pontos de dados. O vetor é organizado ou mapeado com números próximos, colocados próximos uns dos outros para representar a similaridade. Os vetores são armazenados em espaços multidimensionais onde pontos de dados semanticamente semelhantes estão agrupados no espaço de vetor, permitindo ao Microsoft 365 processar um conjunto mais amplo de consultas de pesquisa para além da "correspondência exata".

Em termos práticos, isto significa que os serviços do Microsoft 365, como Microsoft 365 Copilot podem:

  • Compreender as relações entre diferentes formas de palavras (por exemplo, tecnologia, tecnologia, tecnologias; EUA, E.U.A., Estados Unidos, Estados Unidos da América; cão, gato, animal de estimação).
  • Capture sinónimos para expandir a quantidade de informações pesquisáveis, incluindo a intenção de frases, fragmentos, documentos e reuniões.
  • Identifique recursos relacionados com a consulta ou o conteúdo de exemplo.

O gráfico a seguir usa texto (em vez dos números usados por índices de vetores) para mostrar um exemplo de similaridade entre pontos de dados:

Gráfico mostrando um exemplo de como os pontos de dados para um Índice Semântico são clusterizados juntos.

O índice semântico fornece uma pesquisa e obtenção rápida e precisa de dados com base na respetiva distância ou semelhança de vetor. Isto significa que, além de utilizar métodos lexical tradicionais para consulta com base em correspondências exatas ou critérios predefinidos, o índice semântico pode encontrar os dados mais semelhantes ou relevantes com base no significado semântico ou contextual.

Recursos

As seguintes funcionalidades de índice semântico fazem mais do que melhorar os resultados da pesquisa; Trabalham em conjunto para o ajudar a compreender os seus dados, encontrar informações mais rapidamente e melhorar a sua produtividade. Os utilizadores podem interagir com o índice semântico inicialmente através Microsoft 365 Copilot integração. Geramos um índice semântico para utilizadores com uma licença de Microsoft 365 Copilot paga. Eis os detalhes de como cada funcionalidade funciona.

Microsoft Copilot com chat baseado no Graph

O índice semântico ajuda a apresentar resultados no Microsoft Copilot com o chat com base no Graph ao compreender a intenção da consulta e ao acrescentar informações adicionais ao pedido de Microsoft Copilot. As informações relevantes são obtidas no Microsoft Graph e no índice semântico para fornecer ao modelo de linguagem grande (LLM) mais informações sobre as quais deve ser fundamentado. Por exemplo, suponha que você queira que o Microsoft Copilot localize um email em que um colega elogia o trabalho de design de um fornecedor. O índice semântico inclui palavras próximas (por exemplo, eufórico, empolgado, impressionado) na pesquisa para ampliar a área de pesquisa e fornecer o melhor resultado. Todo este trabalho ocorre nos bastidores para adicionar relevância aos resultados que procura com Microsoft Copilot, sem adicionar complexidade.

Como funciona o índice semântico

O índice semântico melhora Microsoft Copilot e resultados de pesquisa na aplicação Microsoft 365, no SharePoint Online e no Microsoft Teams. Suporta uma experiência de pesquisa melhorada e uma compreensão conceptual dos seus dados online que são ativados automaticamente pela Microsoft.

Atualmente, o índice semântico é criado ao nível do inquilino. É um índice de toda a organização gerado a partir de ficheiros do SharePoint Online baseados em texto que são acessíveis por duas ou mais pessoas através da herança de sites. No entanto, só exporá os resultados para um usuário se o usuário já tiver acesso ao conteúdo controlado pelo controle de acesso baseado em função. Além disso, o site do SharePoint Online precisa permanecer pesquisável. Com o tempo, também iremos gerar conteúdo de índice ao nível do utilizador. Esta ação adiciona um índice personalizado de um conjunto de dados de trabalho acessível para os utilizadores que realizam tarefas diárias. Isso inclui qualquer conteúdo baseado em texto que você criar ou com o qual interagir, como emails e documentos que mencionam você ou que você comenta ou compartilha.

A secção seguinte explica como ativar cada índice, como o fluxo de dados no Microsoft 365 Copilot utiliza o índice semântico, que tipos de ficheiro cada índice pode processar e como cada índice lida com as atualizações.

Habilitação

Cada Microsoft 365 Copilot cliente tem agora um índice semântico ao nível do inquilino. O processo de indexação não requer qualquer envolvimento administrativo.

Fluxos de dados

O índice semântico interage com o Microsoft Graph para fornecer aos utilizadores acesso às informações no índice. O diagrama seguinte mostra como o fluxo de dados funciona para um pedido com Microsoft 365 Copilot.

Captura de ecrã a mostrar a relação entre Microsoft 365 Copilot, Microsoft 365 Apps, Microsoft Graph e Modelo de Linguagem Grande.

Os prompts de usuários dos aplicativos do Microsoft 365 são enviados para o Copilot (1) e o Copilot acessa o Microsoft Graph e o índice semântico para o processamento (2). O Copilot envia o prompt modificado para o Modelo de Linguagem Grande (3), recebe a resposta do LLM (4) e, em seguida, acessa o Microsoft Graph e o índice semântico para o pós-processamento (5). Em seguida, o Copilot envia a resposta e o comando do aplicativo de volta para os aplicativos do Microsoft 365. Todas as solicitações são criptografadas por HTTPS e os dados do cliente permanecem criptografados quando inativos.

Tipos de conteúdo com suporte

O índice semântico dá suporte à indexação da caixa de correio de usuários e tipos de arquivos listados na tabela a seguir, sendo que o número de tipos de arquivo com suporte aumenta ao longo do tempo. Uma lista dos tipos de arquivo compatíveis com o índice no nível do usuário e o índice no nível do locatário está incluída na tabela.

Tipo de arquivo/conteúdo Nível do usuário Nível do locatário
Caixa de Correio do Usuário Com suporte Não aplicável
Caixa de Correio Delegada Sem suporte Não aplicável
Caixa de Correio Compartilhada Sem suporte Não aplicável
Dados de Caixa de Correio Arquivados Sem suporte Não aplicável
Dados do SharePoint Arquivados Sem suporte Sem suporte
Documentos do Word (doc/docx) Com suporte Com suporte
PowerPoint (pptx) Com suporte Com suporte
Arquivos PDF Com suporte Com suporte
Páginas da web (aspx) Com suporte Com suporte
Arquivos do OneNote (one) Com suporte Com suporte
Dados do Conector do Graph Não aplicável Com suporte

Atualizações do índice

Quando o índice Semântico conclui a indexação de um cliente pela primeira vez, os documentos criados pelos utilizadores são indexados quase em tempo real na caixa de correio do utilizador. Os documentos novos que são adicionados aos sites do SharePoint Online e podem ser acessados por dois ou mais usuários por meio da herança de site são indexados diariamente. Quando um documento indexado no nível de usuário e do locatário é atualizado, as alterações são indexadas imediatamente.

Administração

Fornecemos aos administradores atividades opcionais para preparar e gerenciar o índice semântico por meio do centro de administração do Microsoft 365. Nenhum envolvimento administrativo é necessário para habilitar o índice semântico, já que o serviço é habilitado automaticamente pela Microsoft. O índice semântico é uma melhoria da Pesquisa do Microsoft 365 e não pode ser desativado.

Os administradores podem optar por preparar e gerir o índice semântico ao rever as considerações para planear e implementar uma colaboração de ficheiros no SharePoint e partilhar permissões na experiência moderna do SharePoint. Os administradores podem optar por excluir arquivos do índice semântico revisando as considerações para excluir os dados com a Prevenção contra Perda de Dados (DLP) do Microsoft Purview. Se uma solução DLP não estiver presente, os administradores podem excluir sites do SharePoint Online do índice ao nível do inquilino.

Como excluir sites do SharePoint Online

Por vezes, as organizações sem Prevenção Contra Perda de Dados do Microsoft Purview podem querer excluir um site do SharePoint Online de ter os seus dados indexados pelo Microsoft Search. Essas medidas só devem ser levadas em conta para dados confidenciais como folha de pagamento, RH ou informações financeiras. Para excluir um site do SharePoint Online, siga as etapas abaixo:

  1. Navegue até o site com as permissões de administrador apropriadas.
  2. Selecione Configurações e, em seguida, Informações do site no menu suspenso.
  3. Selecione Ver todas as configurações do site para exibir a página de Configurações do Site.
  4. Selecione Pesquisa e disponibilidade offline na categoria Pesquisa e selecione Não para a opção Permitir que esse site apareça nos resultados da pesquisa e excluí-lo tanto da Pesquisa da Microsoft quanto da pesquisa de índice semântico. Isso também pode ser feito com o PowerShell para vários sites.

Captura de tela mostrando as configurações para excluir sites do SharePoint Online.

A Pesquisa da Microsoft e o índice semântico dão suporte à exclusão do conteúdo do SharePoint Online apenas a partir do índice no nível do locatário. Não existe nenhuma opção para excluir os resultados somente da Pesquisa da Microsoft ou somente do índice semântico; as ações se aplicam aos dois recursos ao mesmo tempo.

Configurar informações de itens

Na página de Pesquisa e Inteligência do centro de administração do Microsoft 365, os insights de Itens são habilitados por padrão. Desativar informações de pessoas ou itens reduz a experiência da Pesquisa da Microsoft e do índice semântico porque os resultados não incluirão pessoas relevantes que seriam derivadas de grupos de distribuição ou do organograma da organização.

  • Os insights de pessoas fornecem uma lista de pessoas relevantes para um usuário com base em seu trabalho colaborativo público no Microsoft 365. A colaboração pública inclui membros de um grupo de distribuição público e pessoas conectadas no organograma da organização.

  • Os insights de Item permitem recomendações para as pessoas na sua organização com base no trabalho colaborativo no Microsoft 365. Essas recomendações podem incluir, mas não se limitam a documentos ou outros tipos de conteúdo e aparecem nos cartões pessoais (contatos), no Delve, nos aplicativos do Microsoft 365, nos resultados do Microsoft Copilot e em outros locais.

Nem os insights de Item nem os insights de Pessoas abrangem recursos de personalização baseados nos dados do próprio usuário.

Como incorporar informações de terceiros

Com os Conectores Copilot, as organizações podem trazer dados organizacionais ou conteúdos de origens externas para o Microsoft Graph, onde são depois colocados no índice semântico. A Microsoft indexa todos os seus dados de conectores do Graph e, ao mesmo tempo, mantém os controles de acesso para o conteúdo. Isso expande os tipos de fontes de conteúdo que são pesquisáveis nos aplicativos de produtividade do seu Microsoft 365 e no ecossistema mais amplo da Microsoft e funciona melhor sempre que o conteúdo do conector for rico em textos. Os dados de terceiros podem ser hospedados localmente ou em nuvens públicas ou privadas, e essas informações são consumidas pelo Microsoft Graph, que pode ser ingerido no índice semântico para ajudar a fornecer à sua organização todo o contexto do Microsoft 365 e o conteúdo de terceiros da sua organização. Saiba mais sobre os requisitos de licenciamento do conector de grafos para Microsoft 365 Enterprise e Microsoft 365 Copilot em Requisitos de licença e preços.

Privacidade, conformidade e segurança

O modelo de permissões dentro do locatário do Microsoft 365 pode ajudar a garantir que os dados não vazem involuntariamente entre usuários, grupos e locatários. O índice semântico apresenta apenas dados aos quais cada pessoa pode aceder através dos mesmos controlos subjacentes ao acesso a dados utilizados noutros serviços do Microsoft 365. O índice semântico respeita os limites de acesso baseado na identidade do usuário de forma que o processo de fundamentação acesse somente o conteúdo que o usuário atual está autorizado a acessar. Para obter mais informações, confira a Política de privacidade e a documentação do serviço da Microsoft.

O Microsoft 365 Copilot está em conformidade com nossos compromissos de privacidade, segurança e conformidade existentes com clientes comerciais do Microsoft 365, incluindo a Regulamentação Geral de Proteção de Dados (GDPR) e o Limite de Dados da União Europeia (UE). Solicitações, respostas e dados acedidos através do índice semântico não são utilizados para preparar LLMs de base, incluindo os utilizados pelo Microsoft 365 Copilot. Para obter mais informações, consulte Dados, Privacidade e Segurança para Microsoft 365 Copilot.

Armazenamento e processamento

Os dados gerados pelo índice semântico permanecem no locatário da empresa e estão em conformidade com suas políticas e processos de segurança, conformidade, identidade e privacidade. O índice semântico funciona somente com o conteúdo para o qual os usuários já têm permissão e não afeta as cotas de armazenamento.

As informações do índice ao nível do utilizador são armazenadas onde se encontra a caixa de correio do utilizador. Por outro lado, as informações do índice ao nível do inquilino são armazenadas num contentor de inquilino isolado e protegido do cliente. Este contentor está localizado na região onde se encontra o site do SharePoint, que pode ser a região Base ou outra região especificada pelo administrador do inquilino. Para os clientes dentro do Limite de Dados da União Europeia (EUDB), o índice é armazenado num datacenter baseado na UE/EFTA. O processamento de outros clientes pode ocorrer na região de um locatário ou nos Estados Unidos. Para as organizações com estabelecimentos em diferentes regiões geográficas, todos os limites geográficos são respeitados. Os dados localizados em uma região são armazenados e processados na respectiva região.

Suporte à Chave do Cliente (BYOK) no Microsoft Purview

O índice semântico fornece suporte BYOK (Bring Your Own Key) para empresas que tenham ativado o BYOK no respetivo ambiente. A Microsoft habilita automaticamente o índice semântico para os clientes com o BYOK habilitado sem qualquer envolvimento administrativo.

Proteção de informações

No contexto da pesquisa, não existem outras maneiras de excluir dados do índice semântico usando recursos de proteção de informações. O índice semântico herda as definições de segurança e privacidade do Microsoft Search e os dados trazidos de conectores de terceiros são fornecidos com o mesmo armazenamento e proteções que outros dados do Microsoft 365. Para organizações que estão a investigar opções adicionais de proteção de informações, o Microsoft 365 fornece capacidades incorporadas nas aplicações do Microsoft 365. Os produtos de suplemento também estão disponíveis para ajudar os Administradores a proteger os dados organizacionais através da minimização de dados e da redução da partilha excessiva. As seções a seguir descrevem as opções disponíveis para as organizações apenas para fins de referência.

Minimização de dados

A minimização de dados reduz a quantidade de dados disponíveis a que a sua organização pode aceder. A retenção e a exclusão de conteúdo geralmente são necessárias para fins de conformidade e requisitos regulatórios, mas excluir um conteúdo que não tem mais valor comercial também ajuda a gerenciar os riscos e a responsabilidade civil. O Gerenciamento do Ciclo de Vida de Dados do Microsoft Purview, que é licenciado separadamente, pode ser usado para excluir um conteúdo que não seja mais necessário, com políticas de retenção para o gerenciamento em larga escala e rótulos de retenção para as exceções e um controle granular.

Redução do compartilhamento excessivo

Faz tempo que as organizações são capazes de adotar medidas para reduzir o compartilhamento excessivo no Microsoft 365 usando controles existentes no centro de administração do Microsoft 365 e no SharePoint Online. É importante observar que o índice semântico não altera as permissões de acesso ao conteúdo e não altera os princípios de como os usuários devem compartilhar informações com seus colegas. Por exemplo, o índice semântico não faz com que o conteúdo compartilhado com um link que funciona para todas as pessoas na minha organização se torne parte do índice no nível do locatário. Somente os usuários que selecionarem um link ao qual têm acesso terão as informações adicionadas ao respectivo índice de usuário. Ao explorar as opções de proteção de informações, é recomendável que as organizações levem em conta o seguinte:

  • Planejar a colaboração segura de arquivos: leia Planejar e implantar uma colaboração de arquivos para entender melhor as boas práticas para operar um ambiente de colaboração de arquivos seguro e produtivo para seus usuários.

  • Dimensionar corretamente o acesso dos utilizadores aos dados para reduzir a lista – reduza a partilha excessiva ao herdar listas de exclusão para sites do SharePoint Online e efetuar verificações de controlo de acesso em tempo real. As organizações podem pensar em usar o Complemento de Gerenciamento Avançado do SharePoint no Syntex para gerenciar e controlar essas permissões.

  • Utilizar etiquetas de confidencialidade – outra forma de reduzir a partilha de conteúdos é utilizar Proteção de Informações do Microsoft Purview para aplicar etiquetas de confidencialidade, que lhe permitem classificar dados com base na sua confidencialidade e aplicar proteções como encriptação e marketing de conteúdos. As etiquetas de confidencialidade também estão incluídas na limitação da pesquisa (ou seja, suportadas para filtragem e regras do lado da aplicação utilizadas para marcação visual e restrições de acesso).

  • Limite de acesso: a Prevenção contra Perda de Dados do Microsoft Purview está disponível no Microsoft 365 E5 e pode ser usada para limitar retroativa e temporariamente o acesso a documentos que foram reportados como apresentando compartilhamento em excesso. As organizações que não tem Microsoft 365 E5 licenças podem utilizar a versão de avaliação de soluções do Microsoft Purview de 90 dias para explorar como as capacidades adicionais do Purview podem ajudar a gerir as suas necessidades de conformidade e segurança de dados.

Os clientes interessados em explorar como implantar soluções avançadas de proteção de informações, devem ler o artigo a seguir, que explica como implantar uma solução de proteção de informações com o Microsoft Purview. Para obter mais informações sobre como o Microsoft Purview pode ajudá-lo a reforçar os seus requisitos de segurança e conformidade de dados para Microsoft 365 Copilot, consulte Proteger e gerir interações Microsoft 365 Copilot com o Microsoft Purview.

Recursos adicionais

O Microsoft 365, o Microsoft Graph e o índice semântico permitem uma expressividade sem precedentes para pesquisa, chat e copilots que tiram partido dos dados do Microsoft 365. Esta expressividade ajuda a apresentar os dados de base adequados para tirar o máximo partido dos dados organizacionais com o Microsoft 365 e Microsoft 365 Copilot.

Para saber mais sobre Microsoft 365 Copilot, marcar estes recursos: