Desativações e desativações do modelo do Serviço OpenAI do Azure
Descrição geral
Os modelos do Serviço OpenAI do Azure são continuamente atualizados com modelos mais recentes e mais capazes. Como parte desse processo, depreciamos e aposentamos modelos mais antigos. Este documento fornece informações sobre os modelos atualmente disponíveis, preteridos e desativados.
Terminologia
- Aposentadoria
- Quando um modelo é aposentado, ele não está mais disponível para uso. As implantações do Serviço OpenAI do Azure de um modelo aposentado sempre retornam respostas de erro.
- Preterição
- Quando um modelo é preterido, ele não está mais disponível para novos clientes. Ele continua disponível para uso por clientes com implantações existentes até que o modelo seja desativado.
Notificações
O Azure OpenAI notifica os clientes sobre implantações ativas do Serviço OpenAI do Azure para modelos com desativações futuras. Notificamos os clientes sobre as próximas aposentadorias da seguinte forma para cada implantação:
- No lançamento do modelo, designamos programaticamente uma data de aposentadoria "não antes de" (normalmente um ano depois).
- Pelo menos 60 dias antes da aposentadoria do modelo para modelos geralmente disponíveis (GA).
- Pelo menos 30 dias de antecedência antes das atualizações da versão do modelo de visualização.
As aposentadorias são feitas de forma contínua, região por região.
Disponibilidade do modelo
- Pelo menos um ano de disponibilidade do modelo para modelos GA após a data de lançamento de um modelo em pelo menos uma região do mundo
- Para implantações globais, todas as versões futuras do modelo começando com
gpt-4o
egpt-4 0409
estarão disponíveis com seu (N
) próximo modelo subsequente (N+1
) para comparação em conjunto. - Os clientes têm 60 dias para experimentar um novo modelo de GA em pelo menos uma região global ou padrão, antes que qualquer atualização aconteça para um modelo de GA mais recente.
Considerações para a nuvem pública do Azure
Tenha em atenção o seguinte:
- Nem todas as combinações de versões de modelos estarão disponíveis em todas as regiões.
- Versão
N
do modelo eN+1
pode nem sempre estar disponível na mesma região. - A versão
N
do modelo GA pode ser atualizada para uma versãoN+X
futura do modelo em algumas regiões com base em limitações de capacidade e sem que a nova versãoN+X
do modelo esteja disponível separadamente para teste na mesma região. A nova versão do modelo estará disponível para teste em outras regiões antes de qualquer atualização ser agendada. - As versões de modelo de visualização e as versões GA do mesmo modelo nem sempre estarão disponíveis para teste juntas na mesma região. Haverá versões de pré-visualização e GA disponíveis para teste em diferentes regiões.
- Reservamo-nos o direito de limitar futuros clientes que utilizem uma determinada região para equilibrar a qualidade do serviço para os clientes existentes.
- Como sempre na Microsoft, a segurança é de extrema importância. Se um modelo ou versão do modelo tiver problemas de conformidade ou segurança, reservamo-nos o direito de invocar a necessidade de fazer aposentadorias emergenciais. Consulte os termos de serviço para obter mais informações.
Considerações especiais para nuvens do Azure Government
- As implantações padrão globais não estarão disponíveis em nuvens governamentais.
- Nem todos os modelos ou versões de modelos disponíveis em nuvem comercial/pública estarão disponíveis em nuvens governamentais.
- Nas nuvens do Azure Government, pretendemos oferecer suporte a apenas uma versão de um determinado modelo de cada vez.
- Por exemplo, apenas uma versão de
gpt-35-turbo 0125
egpt-4o (2024-05-13)
.
- Por exemplo, apenas uma versão de
- Haverá, no entanto, uma sobreposição de 30 dias entre as novas versões do modelo, onde mais de duas estarão disponíveis.
- Por exemplo, se
gpt-35-turbo 0125
ougpt-4o (2024-05-13)
for atualizado para uma versão futura, ou - para alterações da família de modelos além das atualizações de versão, como ao mudar de
gpt-4 1106-preview
paragpt-4o (2024-05-13)
.
- Por exemplo, se
Quem é notificado das próximas aposentadorias
O Azure OpenAI notifica aqueles que são membros das seguintes funções para cada assinatura com uma implantação de um modelo com uma próxima desativação.
- Proprietário
- Contribuinte
- Leitor
- Contribuidor de monitorização
- Leitor de monitorização
Como se preparar para desativações de modelos e atualizações de versão
Para se preparar para desativações de modelos e atualizações de versão, recomendamos que os clientes testem seus aplicativos com os novos modelos e versões e avaliem seu comportamento. Também recomendamos que os clientes atualizem seus aplicativos para usar os novos modelos e versões antes da data de aposentadoria.
Para obter mais informações sobre o processo de avaliação do modelo, consulte o Guia de introdução à avaliação do modelo.
Para obter informações sobre o processo de atualização do modelo, consulte Como atualizar para um novo modelo ou versão.
Modelos atuais
Nota
Nem todos os modelos passam por um período de preterição antes da aposentadoria. Alguns modelos/versões têm apenas uma data de reforma.
Os modelos ajustados estão sujeitos à mesma descontinuação e desativação que o modelo base equivalente.
Esses modelos estão atualmente disponíveis para uso no Serviço OpenAI do Azure.
Modelo | Versão | Data da reforma | Sugestões de substituição |
---|---|---|---|
babbage-002 |
1 | Data de descontinuação: 15 de novembro de 2024 Data de Aposentadoria: 27 de janeiro de 2025 |
|
davinci-002 |
1 | Data de descontinuação: 15 de novembro de 2024 Data de Aposentadoria: 27 de janeiro de 2025 |
|
dall-e-2 |
2 | Janeiro 27, 2025 | dalle-3 |
dall-e-3 |
3 | Não antes de 30 de abril de 2025 | |
gpt-35-turbo |
0301 | Janeiro 27, 2025 As implantações definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 0125 , a partir de 13 de novembro de 2024. |
gpt-35-turbo (0125) gpt-4o-mini |
gpt-35-turbo gpt-35-turbo-16k |
0613 | Janeiro 27, 2025 As implantações definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 0125 , a partir de 13 de novembro de 2024. |
gpt-35-turbo (0125) gpt-4o-mini |
gpt-35-turbo |
1106 | Não antes de 27 de janeiro de 2025 As implantações definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 0125 , a partir de 13 de novembro de 2024. |
gpt-35-turbo (0125) gpt-4o-mini |
gpt-35-turbo |
0125 | Não antes de 22 de fevereiro de 2025 | gpt-4o-mini |
gpt-4 gpt-4-32k |
0314 | 6 de junho de 2025 | gpt-4o |
gpt-4 gpt-4-32k |
0613 | 6 de junho de 2025 | gpt-4o |
gpt-4 |
1106-Pré-visualização | A ser atualizado para a gpt-4 versão: turbo-2024-04-09 , a partir de 27 de janeiro de 2025 1 |
gpt-4o |
gpt-4 |
0125-Pré-visualização | A ser atualizado para a gpt-4 versão: turbo-2024-04-09 , a partir de 27 de janeiro de 2025 1 |
gpt-4o |
gpt-4 |
visão-pré-visualização | A ser atualizado para a gpt-4 versão: turbo-2024-04-09 , a partir de 27 de janeiro de 2025 1 |
gpt-4o |
gpt-4o |
2024-05-13 | Não antes de 20 de maio de 2025 As implantações definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 2024-08-06 , a partir de 5 de dezembro de 2024. |
|
gpt-4o-mini |
2024-07-18 | Não antes de 18 de julho de 2025 | |
gpt-3.5-turbo-instruct |
0914 | Não antes de 14 de setembro de 2025 | |
text-embedding-ada-002 |
2 | Não antes de 3 de abril de 2025 | text-embedding-3-small ou text-embedding-3-large |
text-embedding-ada-002 |
1 | Não antes de 3 de abril de 2025 | text-embedding-3-small ou text-embedding-3-large |
text-embedding-3-small |
Não antes de 2 de fevereiro de 2025 | ||
text-embedding-3-large |
Não antes de 2 de fevereiro de 2025 |
1 Notificaremos todos os clientes com essas implantações de visualização pelo menos 30 dias antes do início das atualizações. Publicaremos um cronograma de atualização detalhando a ordem das regiões e versões do modelo que seguiremos durante as atualizações, e vincularemos a esse cronograma a partir daqui.
Importante
Os recursos de visualização de aprimoramentos de visão, incluindo Reconhecimento Ótico de Caracteres (OCR), aterramento de objetos, prompts de vídeo serão desativados e não estarão mais disponíveis quando gpt-4
Version: vision-preview
for atualizado para turbo-2024-04-09
. Se você estiver confiando em qualquer um desses recursos de visualização, essa atualização automática do modelo será uma grande mudança.
Versões de modelo padrão
Modelo | Versão padrão atual | Nova versão padrão | Data de atualização padrão |
---|---|---|---|
gpt-35-turbo |
0301 | 0125 | As implantações de versões 0301 , 0613 e 1106 definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 0125 , a partir de 13 de novembro de 2024. |
gpt-4o |
2024-05-13 | 2024-08-06 | As implantações definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão: 2024-08-06 , a partir de 5 de dezembro de 2024. |
Modelos preteridos
Estes modelos foram preteridos em 6 de julho de 2023 e foram aposentados em 14 de junho de 2024. Esses modelos não estão mais disponíveis para novas implantações. As implantações criadas antes de 6 de julho de 2023 permanecem disponíveis para os clientes até 14 de junho de 2024. Recomendamos que os clientes migrem seus aplicativos para implantações de modelos de substituição antes da desativação de 14 de junho de 2024.
Se você já é um cliente que procura informações sobre esses modelos, consulte Modelos legados.
Modelo | Data de preterição | Data da reforma | Substituição sugerida |
---|---|---|---|
Ada | 6 de julho de 2023 | 14 de junho de 2024 | Babbage-002 |
Babbage | 6 de julho de 2023 | 14 de junho de 2024 | Babbage-002 |
Curie | 6 de julho de 2023 | 14 de junho de 2024 | Davinci-002 |
Davinci | 6 de julho de 2023 | 14 de junho de 2024 | Davinci-002 |
texto-ada-001 | 6 de julho de 2023 | 14 de junho de 2024 | GPT-35-Turbo-Instruir |
texto-babbage-001 | 6 de julho de 2023 | 14 de junho de 2024 | GPT-35-Turbo-Instruir |
texto-curie-001 | 6 de julho de 2023 | 14 de junho de 2024 | GPT-35-Turbo-Instruir |
texto-davinci-002 | 6 de julho de 2023 | 14 de junho de 2024 | GPT-35-Turbo-Instruir |
texto-davinci-003 | 6 de julho de 2023 | 14 de junho de 2024 | GPT-35-Turbo-Instruir |
Código-Cushman-001 | 6 de julho de 2023 | 14 de junho de 2024 | GPT-35-Turbo-Instruir |
Código-Davinci-002 | 6 de julho de 2023 | 14 de junho de 2024 | GPT-35-Turbo-Instruir |
texto-similaridade-ada-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
texto-similaridade-babbage-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
texto-semelhança-curie-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
text-similarity-davinci-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
pesquisa de texto-ada-doc-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
pesquisa de texto-ada-query-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
pesquisa de texto-babbage-doc-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
texto-pesquisa-babbage-query-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
pesquisa de texto-curie-doc-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
pesquisa de texto-curie-query-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
pesquisa de texto-davinci-doc-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
pesquisa de texto-davinci-query-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
código-pesquisa-ada-código-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
código-pesquisa-ada-text-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
código-pesquisa-babbage-código-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
código-search-babbage-text-001 | 6 de julho de 2023 | 14 de junho de 2024 | incorporação de texto-3-pequeno |
Histórico de aposentadoria e depreciação
25 de outubro de 2024
babbage-002
Datadavinci-002
de preterição: 15 de novembro de 2024 e data de aposentadoria: 27 de janeiro de 2025.
12 de setembro de 2024
gpt-35-turbo
(0301), (0613), (1106) egpt-35-turbo-16k
(0613) atualização automática para a data de atualização padrão atualizada para 13 de novembro de 2024.
9 de setembro de 2024
gpt-35-turbo
(0301) e (0613) aposentadoria alterada para 27 de janeiro de 2025.gpt-4
A data de atualização do modelo de visualização foi alterada para começar não antes de 27 de janeiro de 2025.
3 de setembro de 2024
- Tabelas atualizadas para incluir informações sobre atualizações de
gpt-35-turbo
versão padrão. As implantações de versões0301
,0613
e1106
definidas como Atualização automática como padrão serão atualizadas automaticamente para a versão:0125
, a partir de 15 de novembro de 2024.|
22 de agosto de 2024
- Data de aposentadoria atualizada
gpt-35-turbo
(0301) para não antes de 1º de novembro de 2024. - Atualizado
gpt4
egpt-4-32k
(0314 e 0613) data de substituição para 1º de novembro de 2024.
8 de agosto de 2024
- Data de aposentadoria do modelo (
gpt-35-turbo-16k
0613) atualizadagpt-35-turbo
para 1º de novembro de 2024.
30 de julho de 2024
- Data de atualização do modelo de pré-visualização atualizada
gpt-4
para 15 de novembro de 2024 ou posterior para as seguintes versões:- 1106-Pré-visualização
- 0125-Pré-visualização
- vision-preview (O recurso de aprimoramentos de visão não será mais suportado quando este modelo for desativado/atualizado.)
Julho 18, 2024
- Atualizada
gpt-4
a data de descontinuação 0613 para 1º de outubro de 2024 e a data de aposentadoria para 6 de junho de 2025.
19 de junho de 2024
- Data de aposentadoria 0301 atualizada
gpt-35-turbo
para não antes de 1º de outubro de 2024. - Data de aposentadoria atualizada
gpt-35-turbo
de 0613gpt-35-turbo-16k
para 1º de outubro de 2024. - Data
gpt-4
de substituição atualizada paragpt-4-32k
1º de outubro de 2024 e data de aposentadoria para 6 de junho de 2025.
4 de junho de 2024
Data de aposentadoria para modelos legados atualizada em um mês.
24 de abril de 2024
A data da reforma antecipada para gpt-35-turbo
0301 e 0613 foi atualizada para 1 de agosto de 2024.
13 de Março de 2024
Publicamos este documento para fornecer informações sobre os modelos atuais, modelos preteridos e próximas aposentadorias.
23 de fevereiro de 2024
Anunciamos a próxima atualização in-loco da versão 1106-preview
para 0125-preview
começar não antes de 8 de março de gpt-4
2024.
30 de novembro de 2023
A versão padrão do gpt-4
e gpt-3-32k
foi atualizada a 0613
partir de 30 de novembro de 0314
2023. A atualização das 0314
implantações definidas para atualização automática foi 0613
concluída em 3 de dezembro de 2023.
6 de julho de 2023
Anunciamos a descontinuação de modelos com aposentadoria iminente em 5 de julho de 2024.