Desativações e desativações do modelo do Serviço OpenAI do Azure

Descrição geral

Os modelos do Serviço OpenAI do Azure são continuamente atualizados com modelos mais recentes e mais capazes. Como parte desse processo, depreciamos e aposentamos modelos mais antigos. Este documento fornece informações sobre os modelos atualmente disponíveis, preteridos e desativados.

Terminologia

  • Aposentadoria
    • Quando um modelo é aposentado, ele não está mais disponível para uso. As implantações do Serviço OpenAI do Azure de um modelo aposentado sempre retornam respostas de erro.
  • Preterição
    • Quando um modelo é preterido, ele não está mais disponível para novos clientes. Ele continua disponível para uso por clientes com implantações existentes até que o modelo seja desativado.

Notificações

O Azure OpenAI notifica os clientes sobre implantações ativas do Serviço OpenAI do Azure para modelos com desativações futuras. Notificamos os clientes sobre as próximas aposentadorias da seguinte forma para cada implantação:

  1. No lançamento do modelo, designamos programaticamente uma data de aposentadoria "não antes de" (normalmente um ano depois).
  2. Pelo menos 60 dias antes da aposentadoria do modelo para modelos geralmente disponíveis (GA).
  3. Pelo menos 30 dias de antecedência antes das atualizações da versão do modelo de visualização.

As aposentadorias são feitas de forma contínua, região por região.

Disponibilidade do modelo

  1. Pelo menos um ano de disponibilidade do modelo para modelos GA após a data de lançamento de um modelo em pelo menos uma região do mundo
  2. Para implantações globais, todas as versões futuras do modelo começando com gpt-4o e gpt-4 0409 estarão disponíveis com seu (N) próximo modelo subsequente (N+1) para comparação em conjunto.
  3. Os clientes têm 60 dias para experimentar um novo modelo de GA em pelo menos uma região global ou padrão, antes que qualquer atualização aconteça para um modelo de GA mais recente.

Considerações para a nuvem pública do Azure

Tenha em atenção o seguinte:

  1. Nem todas as combinações de versões de modelos estarão disponíveis em todas as regiões.
  2. Versão N do modelo e N+1 pode nem sempre estar disponível na mesma região.
  3. A versão N do modelo GA pode ser atualizada para uma versão N+X futura do modelo em algumas regiões com base em limitações de capacidade e sem que a nova versão N+X do modelo esteja disponível separadamente para teste na mesma região. A nova versão do modelo estará disponível para teste em outras regiões antes de qualquer atualização ser agendada.
  4. As versões de modelo de visualização e as versões GA do mesmo modelo nem sempre estarão disponíveis para teste juntas na mesma região. Haverá versões de pré-visualização e GA disponíveis para teste em diferentes regiões.
  5. Reservamo-nos o direito de limitar futuros clientes que utilizem uma determinada região para equilibrar a qualidade do serviço para os clientes existentes.
  6. Como sempre na Microsoft, a segurança é de extrema importância. Se um modelo ou versão do modelo tiver problemas de conformidade ou segurança, reservamo-nos o direito de invocar a necessidade de fazer aposentadorias emergenciais. Consulte os termos de serviço para obter mais informações.

Considerações especiais para nuvens do Azure Government

  1. As implantações padrão globais não estarão disponíveis em nuvens governamentais.
  2. Nem todos os modelos ou versões de modelos disponíveis em nuvem comercial/pública estarão disponíveis em nuvens governamentais.
  3. Nas nuvens do Azure Government, pretendemos oferecer suporte a apenas uma versão de um determinado modelo de cada vez.
    1. Por exemplo, apenas uma versão de gpt-35-turbo 0125 e gpt-4o (2024-05-13).
  4. Haverá, no entanto, uma sobreposição de 30 dias entre as novas versões do modelo, onde mais de duas estarão disponíveis.
    1. Por exemplo, se gpt-35-turbo 0125 ou gpt-4o (2024-05-13) for atualizado para uma versão futura, ou
    2. para alterações da família de modelos além das atualizações de versão, como ao mudar de gpt-4 1106-preview para gpt-4o (2024-05-13).

Quem é notificado das próximas aposentadorias

O Azure OpenAI notifica aqueles que são membros das seguintes funções para cada assinatura com uma implantação de um modelo com uma próxima desativação.

  • Proprietário
  • Contribuinte
  • Leitor
  • Contribuidor de monitorização
  • Leitor de monitorização

Como se preparar para desativações de modelos e atualizações de versão

Para se preparar para desativações de modelos e atualizações de versão, recomendamos que os clientes testem seus aplicativos com os novos modelos e versões e avaliem seu comportamento. Também recomendamos que os clientes atualizem seus aplicativos para usar os novos modelos e versões antes da data de aposentadoria.

Para obter mais informações sobre o processo de avaliação do modelo, consulte o Guia de introdução à avaliação do modelo.

Para obter informações sobre o processo de atualização do modelo, consulte Como atualizar para um novo modelo ou versão.

Modelos atuais

Nota

Nem todos os modelos passam por um período de preterição antes da aposentadoria. Alguns modelos/versões têm apenas uma data de reforma.

Os modelos ajustados estão sujeitos à mesma descontinuação e desativação que o modelo base equivalente.

Esses modelos estão atualmente disponíveis para uso no Serviço OpenAI do Azure.

Modelo Versão Data da reforma Sugestões de substituição
babbage-002 1 Data de descontinuação: 15 de novembro de 2024
Data de Aposentadoria: 27 de janeiro de 2025
davinci-002 1 Data de descontinuação: 15 de novembro de 2024
Data de Aposentadoria: 27 de janeiro de 2025
dall-e-2 2 Janeiro 27, 2025 dalle-3
dall-e-3 3 Não antes de 30 de abril de 2025
gpt-35-turbo 0301 Janeiro 27, 2025

As implantações definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 0125, a partir de 13 de novembro de 2024.
gpt-35-turbo (0125)

gpt-4o-mini
gpt-35-turbo
gpt-35-turbo-16k
0613 Janeiro 27, 2025

As implantações definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 0125, a partir de 13 de novembro de 2024.
gpt-35-turbo (0125)

gpt-4o-mini
gpt-35-turbo 1106 Não antes de 27 de janeiro de 2025

As implantações definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 0125, a partir de 13 de novembro de 2024.
gpt-35-turbo (0125)

gpt-4o-mini
gpt-35-turbo 0125 Não antes de 22 de fevereiro de 2025 gpt-4o-mini
gpt-4
gpt-4-32k
0314 6 de junho de 2025 gpt-4o
gpt-4
gpt-4-32k
0613 6 de junho de 2025 gpt-4o
gpt-4 1106-Pré-visualização A ser atualizado para a gpt-4 versão: turbo-2024-04-09, a partir de 27 de janeiro de 2025 1 gpt-4o
gpt-4 0125-Pré-visualização A ser atualizado para a gpt-4 versão: turbo-2024-04-09, a partir de 27 de janeiro de 2025 1 gpt-4o
gpt-4 visão-pré-visualização A ser atualizado para a gpt-4 versão: turbo-2024-04-09, a partir de 27 de janeiro de 2025 1 gpt-4o
gpt-4o 2024-05-13 Não antes de 20 de maio de 2025

As implantações definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 2024-08-06, a partir de 5 de dezembro de 2024.
gpt-4o-mini 2024-07-18 Não antes de 18 de julho de 2025
gpt-3.5-turbo-instruct 0914 Não antes de 14 de setembro de 2025
text-embedding-ada-002 2 Não antes de 3 de abril de 2025 text-embedding-3-small ou text-embedding-3-large
text-embedding-ada-002 1 Não antes de 3 de abril de 2025 text-embedding-3-small ou text-embedding-3-large
text-embedding-3-small Não antes de 2 de fevereiro de 2025
text-embedding-3-large Não antes de 2 de fevereiro de 2025

1 Notificaremos todos os clientes com essas implantações de visualização pelo menos 30 dias antes do início das atualizações. Publicaremos um cronograma de atualização detalhando a ordem das regiões e versões do modelo que seguiremos durante as atualizações, e vincularemos a esse cronograma a partir daqui.

Importante

Os recursos de visualização de aprimoramentos de visão, incluindo Reconhecimento Ótico de Caracteres (OCR), aterramento de objetos, prompts de vídeo serão desativados e não estarão mais disponíveis quando gpt-4 Version: vision-preview for atualizado para turbo-2024-04-09. Se você estiver confiando em qualquer um desses recursos de visualização, essa atualização automática do modelo será uma grande mudança.

Versões de modelo padrão

Modelo Versão padrão atual Nova versão padrão Data de atualização padrão
gpt-35-turbo 0301 0125 As implantações de versões 0301, 0613e 1106 definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 0125, a partir de 13 de novembro de 2024.
gpt-4o 2024-05-13 2024-08-06 As implantações definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 2024-08-06, a partir de 5 de dezembro de 2024.

Modelos preteridos

Estes modelos foram preteridos em 6 de julho de 2023 e foram aposentados em 14 de junho de 2024. Esses modelos não estão mais disponíveis para novas implantações. As implantações criadas antes de 6 de julho de 2023 permanecem disponíveis para os clientes até 14 de junho de 2024. Recomendamos que os clientes migrem seus aplicativos para implantações de modelos de substituição antes da desativação de 14 de junho de 2024.

Se você já é um cliente que procura informações sobre esses modelos, consulte Modelos legados.

Modelo Data de preterição Data da reforma Substituição sugerida
Ada 6 de julho de 2023 14 de junho de 2024 Babbage-002
Babbage 6 de julho de 2023 14 de junho de 2024 Babbage-002
Curie 6 de julho de 2023 14 de junho de 2024 Davinci-002
Davinci 6 de julho de 2023 14 de junho de 2024 Davinci-002
texto-ada-001 6 de julho de 2023 14 de junho de 2024 GPT-35-Turbo-Instruir
texto-babbage-001 6 de julho de 2023 14 de junho de 2024 GPT-35-Turbo-Instruir
texto-curie-001 6 de julho de 2023 14 de junho de 2024 GPT-35-Turbo-Instruir
texto-davinci-002 6 de julho de 2023 14 de junho de 2024 GPT-35-Turbo-Instruir
texto-davinci-003 6 de julho de 2023 14 de junho de 2024 GPT-35-Turbo-Instruir
Código-Cushman-001 6 de julho de 2023 14 de junho de 2024 GPT-35-Turbo-Instruir
Código-Davinci-002 6 de julho de 2023 14 de junho de 2024 GPT-35-Turbo-Instruir
texto-similaridade-ada-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
texto-similaridade-babbage-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
texto-semelhança-curie-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
text-similarity-davinci-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
pesquisa de texto-ada-doc-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
pesquisa de texto-ada-query-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
pesquisa de texto-babbage-doc-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
texto-pesquisa-babbage-query-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
pesquisa de texto-curie-doc-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
pesquisa de texto-curie-query-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
pesquisa de texto-davinci-doc-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
pesquisa de texto-davinci-query-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
código-pesquisa-ada-código-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
código-pesquisa-ada-text-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
código-pesquisa-babbage-código-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno
código-search-babbage-text-001 6 de julho de 2023 14 de junho de 2024 incorporação de texto-3-pequeno

Histórico de aposentadoria e depreciação

25 de outubro de 2024

  • babbage-002 Data davinci-002 de preterição: 15 de novembro de 2024 e data de aposentadoria: 27 de janeiro de 2025.

12 de setembro de 2024

  • gpt-35-turbo (0301), (0613), (1106) e gpt-35-turbo-16k (0613) atualização automática para a data de atualização padrão atualizada para 13 de novembro de 2024.

9 de setembro de 2024

  • gpt-35-turbo (0301) e (0613) aposentadoria alterada para 27 de janeiro de 2025.
  • gpt-4 A data de atualização do modelo de visualização foi alterada para começar não antes de 27 de janeiro de 2025.

3 de setembro de 2024

  • Tabelas atualizadas para incluir informações sobre atualizações de gpt-35-turbo versão padrão. As implantações de versões 0301, 0613e 1106 definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 0125, a partir de 15 de novembro de 2024.|

22 de agosto de 2024

  • Data de aposentadoria atualizada gpt-35-turbo (0301) para não antes de 1º de novembro de 2024.
  • Atualizado gpt4 e gpt-4-32k (0314 e 0613) data de substituição para 1º de novembro de 2024.

8 de agosto de 2024

  • Data de aposentadoria do modelo ( gpt-35-turbo-16k 0613) atualizada gpt-35-turbo para 1º de novembro de 2024.

30 de julho de 2024

  • Data de atualização do modelo de pré-visualização atualizada gpt-4 para 15 de novembro de 2024 ou posterior para as seguintes versões:
    • 1106-Pré-visualização
    • 0125-Pré-visualização
    • vision-preview (O recurso de aprimoramentos de visão não será mais suportado quando este modelo for desativado/atualizado.)

Julho 18, 2024

  • Atualizada gpt-4 a data de descontinuação 0613 para 1º de outubro de 2024 e a data de aposentadoria para 6 de junho de 2025.

19 de junho de 2024

  • Data de aposentadoria 0301 atualizada gpt-35-turbo para não antes de 1º de outubro de 2024.
  • Data de aposentadoria atualizada gpt-35-turbo de 0613 gpt-35-turbo-16kpara 1º de outubro de 2024.
  • Data gpt-4 de substituição atualizada para gpt-4-32k 1º de outubro de 2024 e data de aposentadoria para 6 de junho de 2025.

4 de junho de 2024

Data de aposentadoria para modelos legados atualizada em um mês.

24 de abril de 2024

A data da reforma antecipada para gpt-35-turbo 0301 e 0613 foi atualizada para 1 de agosto de 2024.

13 de Março de 2024

Publicamos este documento para fornecer informações sobre os modelos atuais, modelos preteridos e próximas aposentadorias.

23 de fevereiro de 2024

Anunciamos a próxima atualização in-loco da versão 1106-preview para 0125-preview começar não antes de 8 de março de gpt-4 2024.

30 de novembro de 2023

A versão padrão do gpt-4 e gpt-3-32k foi atualizada a 0613 partir de 30 de novembro de 0314 2023. A atualização das 0314 implantações definidas para atualização automática foi 0613 concluída em 3 de dezembro de 2023.

6 de julho de 2023

Anunciamos a descontinuação de modelos com aposentadoria iminente em 5 de julho de 2024.