Modelos do Serviço OpenAI do Azure

Artigo
10/25/2024

O Serviço OpenAI do Azure é alimentado por um conjunto diversificado de modelos com diferentes funcionalidades e pontos de preço. A disponibilidade do modelo varia de acordo com a região e a nuvem. Para obter a disponibilidade do modelo do Azure Governamental, confira o Serviço OpenAI do Azure Governamental.

Modelos	Descrição
o1-preview e o1-mini	Os modelos de acesso limitado foram especificamente desenvolvidos para lidar com tarefas de raciocínio e resolução de problemas com foco e capacidade aumentados.
GPT-4o e GPT-4o mini e GPT-4 Turbo	Os modelos mais recentes do OpenAI do Azure com versões multimodal que podem aceitar texto e imagens como entrada.
Áudio GPT-4o	Um modelo GPT-4o que dá suporte a interações conversacionais de baixa latência, "fala dentro, fala fora".
GPT-4	Um conjunto de modelos que aprimoram o GPT-3.5 e podem entender e gerar código e linguagem natural.
GPT-3.5	Um conjunto de modelos que aprimoram o GPT-3 e podem entender e gerar código e linguagem natural.
Incorporações	Um conjunto de modelos que podem converter texto em um formulário de vetor numérico para facilitar a similaridade de texto.
DALL-E	Uma série de modelos que podem gerar imagens originais a partir de linguagem natural.
Whisper	Uma série de modelos em versão prévia que podem transcrever e traduzir uma fala em texto.
Conversão de texto em fala (versão prévia)	Uma série de modelos em versão prévia que podem sintetizar a conversão de texto em fala.

acesso limitado aos modelos o1-preview e o1-mini

Os modelos o1-preview e o1-mini do OpenAI do Azure foram especificamente desenvolvidos para lidar com tarefas de raciocínio e resolução de problemas com foco e capacidade aumentados. Esses modelos gastam mais tempo processando e entendendo a solicitação do usuário, o que os torna excepcionalmente competentes em áreas como ciência, programação e matemática, em comparação com as iterações anteriores.

ID do Modelo	Descrição	Máx. de solicitações (tokens)	Dados de treinamento (até)
`o1-preview` (2024-09-12)	O modelo mais capaz na série o1, oferecendo habilidades de raciocínio aprimoradas.	Input: 128,000 Saída: 32.768	Outubro de 2023
`o1-mini` (2024-09-12)	Uma opção mais rápida e econômica na série o1, ideal para codificar tarefas que exigem velocidade e menor consumo de recursos.	Input: 128,000 Saída: 65.536	Outubro de 2023

Disponibilidade

Os modelos o1-preview e o1-mini agora estão disponíveis para acesso à API e implantação de modelos. O registro é obrigatório e o acesso será concedido com base nos critérios de elegibilidade da Microsoft.

Solicitar acesso: aplicativo de modelo de acesso limitado

Depois que o acesso for concedido, você precisará criar uma implantação para cada modelo.

Suporte a API

Suporte para os modelos da série o1 foi adicionado na versão da API 2024-09-01-preview.

O parâmetro max_tokens foi descontinuado e substituído pelo novo parâmetro max_completion_tokens. Os modelos da série o1 só funcionarão com o parâmetro max_completion_tokens.

Uso

Atualmente, esses modelos não oferecem suporte ao mesmo conjunto de parâmetros que outros modelos que usam a API de conclusões de chat. Atualmente, apenas um subconjunto muito limitado é suportado, portanto parâmetros comuns como temperature, top_p, não estão disponíveis e incluí-los fará com que sua solicitação falhe. o1-preview e o1-mini os modelos também não aceitarão a função de mensagem do sistema como parte da matriz de mensagens.

Talvez seja necessário atualizar sua versão da biblioteca OpenAI Python para aproveitar o novo parâmetro max_completion_tokens.

pip install openai --upgrade

Se você é novo no uso do Microsoft Entra ID para autenticação, veja Como configurar o Serviço OpenAI do Azure com autenticação do Microsoft Entra ID.

from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

Talvez seja necessário atualizar sua versão da biblioteca OpenAI Python para aproveitar o novo parâmetro max_completion_tokens.

pip install openai --upgrade


from openai import AzureOpenAI

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

{
  "id": "chatcmpl-AEj7pKFoiTqDPHuxOcirA9KIvf3yz",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null,
      "message": {
        "content": "Writing your first Python API is an exciting step in developing software that can communicate with other applications. An API (Application Programming Interface) allows different software systems to interact with each other, enabling data exchange and functionality sharing. Here are the steps you should consider when creating your first Python API:\n\n1. **Define the Purpose and Requirements**\n\n   - **Identify the Functionality**: Clearly outline what your API is supposed to do. What data or services will it provide to the users?\n   - **Determine the Endpoints**: Plan the different URLs (endpoints) through which users can access the API functionalities.\n   - **Specify Request and Response Formats**: Decide on the data formats (usually JSON) for incoming requests and outgoing responses.\n\n2. **Choose the Right Framework**\n\n   Python offers several frameworks for building APIs. Two of the most popular are:\n\n   - **Flask**: A lightweight and flexible web framework, great for small to medium-sized APIs.\n   - **FastAPI**: A modern, high-performance framework for building APIs with Python 3.6+ types, offering automatic interactive documentation.\n\n   **Example**:\n   ```bash\n   pip install flask\n   ```\n   or\n   ```bash\n   pip install fastapi uvicorn\n   ```\n\n3. **Set Up the Development Environment**\n\n   - **Create a Virtual Environment**: Isolate your project dependencies using `venv` or `conda`.\n   - **Install Required Packages**: Ensure all necessary libraries and packages are installed.\n\n   **Example**:\n   ```bash\n   python -m venv env\n   source env/bin/activate  # On Windows use `env\\Scripts\\activate`\n   ```\n\n4. **Implement the API Endpoints**\n\n   - **Write the Code for Each Endpoint**: Implement the logic that handles requests and returns responses.\n   - **Use Decorators to Define Routes**: In frameworks like Flask, you use decorators to specify the URL endpoints.\n\n   **Example with Flask**:\n   ```python\n   from flask import Flask, request, jsonify\n\n   app = Flask(__name__)\n\n   @app.route('/hello', methods=['GET'])\n   def hello_world():\n       return jsonify({'message': 'Hello, World!'})\n\n   if __name__ == '__main__':\n       app.run(debug=True)\n   ```\n\n5. **Handle Data Serialization and Deserialization**\n\n   - **Parsing Incoming Data**: Use libraries to parse JSON or other data formats from requests.\n   - **Formatting Output Data**: Ensure that responses are properly formatted in JSON or XML.\n\n6. **Implement Error Handling**\n\n   - **Handle Exceptions Gracefully**: Provide meaningful error messages and HTTP status codes.\n   - **Validate Input Data**: Check for required fields and appropriate data types to prevent errors.\n\n   **Example**:\n   ```python\n   @app.errorhandler(404)\n   def resource_not_found(e):\n       return jsonify(error=str(e)), 404\n   ```\n\n7. **Add Authentication and Authorization (If Necessary)**\n\n   - **Secure Endpoints**: If your API requires, implement security measures such as API keys, tokens (JWT), or OAuth.\n   - **Manage User Sessions**: Handle user login states and permissions appropriately.\n\n8. **Document Your API**\n\n   - **Use Tools Like Swagger/OpenAPI**: Automatically generate interactive API documentation.\n   - **Provide Usage Examples**: Help users understand how to interact with your API.\n\n   **Example with FastAPI**:\n   FastAPI automatically generates docs at `/docs` using Swagger UI.\n\n9. **Test Your API**\n\n   - **Write Unit and Integration Tests**: Ensure each endpoint works as expected.\n   - **Use Testing Tools**: Utilize tools like `unittest`, `pytest`, or API testing platforms like Postman.\n\n   **Example**:\n   ```python\n   import unittest\n   class TestAPI(unittest.TestCase):\n       def test_hello_world(self):\n           response = app.test_client().get('/hello')\n           self.assertEqual(response.status_code, 200)\n   ```\n\n10. **Optimize Performance**\n\n    - **Improve Response Times**: Optimize your code and consider using asynchronous programming if necessary.\n    - **Manage Resource Utilization**: Ensure your API can handle the expected load.\n\n11. **Deploy Your API**\n\n    - **Choose a Hosting Platform**: Options include AWS, Heroku, DigitalOcean, etc.\n    - **Configure the Server**: Set up the environment to run your API in a production setting.\n    - **Use a Production Server**: Instead of the development server, use WSGI servers like Gunicorn or Uvicorn.\n\n    **Example**:\n    ```bash\n    uvicorn main:app --host 0.0.0.0 --port 80\n    ```\n\n12. **Monitor and Maintain**\n\n    - **Logging**: Implement logging to track events and errors.\n    - **Monitoring**: Use monitoring tools to track performance and uptime.\n    - **Update and Patch**: Keep dependencies up to date and patch any security vulnerabilities.\n\n13. **Consider Versioning**\n\n    - **Plan for Updates**: Use versioning in your API endpoints to manage changes without breaking existing clients.\n    - **Example**:\n      ```python\n      @app.route('/v1/hello', methods=['GET'])\n      ```\n\n14. **Gather Feedback and Iterate**\n\n    - **User Feedback**: Encourage users to provide feedback on your API.\n    - **Continuous Improvement**: Use the feedback to make improvements and add features.\n\n**Additional Tips**:\n\n- **Keep It Simple**: Start with a minimal viable API and expand functionality over time.\n- **Follow RESTful Principles**: Design your API according to REST standards to make it intuitive and standard-compliant.\n- **Security Best Practices**: Always sanitize inputs and protect against common vulnerabilities like SQL injection and cross-site scripting (XSS).\nBy following these steps, you'll be well on your way to creating a functional and robust Python API. Good luck with your development!",
        "refusal": null,
        "role": "assistant",
        "function_call": null,
        "tool_calls": null
      },
      "content_filter_results": {
        "hate": {
          "filtered": false,
          "severity": "safe"
        },
        "protected_material_code": {
          "filtered": false,
          "detected": false
        },
        "protected_material_text": {
          "filtered": false,
          "detected": false
        },
        "self_harm": {
          "filtered": false,
          "severity": "safe"
        },
        "sexual": {
          "filtered": false,
          "severity": "safe"
        },
        "violence": {
          "filtered": false,
          "severity": "safe"
        }
      }
    }
  ],
  "created": 1728073417,
  "model": "o1-preview-2024-09-12",
  "object": "chat.completion",
  "service_tier": null,
  "system_fingerprint": "fp_503a95a7d8",
  "usage": {
    "completion_tokens": 1843,
    "prompt_tokens": 20,
    "total_tokens": 1863,
    "completion_tokens_details": {
      "audio_tokens": null,
      "reasoning_tokens": 448
    },
    "prompt_tokens_details": {
      "audio_tokens": null,
      "cached_tokens": 0
    }
  },
  "prompt_filter_results": [
    {
      "prompt_index": 0,
      "content_filter_results": {
        "custom_blocklists": {
          "filtered": false
        },
        "hate": {
          "filtered": false,
          "severity": "safe"
        },
        "jailbreak": {
          "filtered": false,
          "detected": false
        },
        "self_harm": {
          "filtered": false,
          "severity": "safe"
        },
        "sexual": {
          "filtered": false,
          "severity": "safe"
        },
        "violence": {
          "filtered": false,
          "severity": "safe"
        }
      }
    }
  ]
}

Disponibilidade de região

Disponível para implantação padrão e padrão global no Leste dos EUA, Leste dos EUA2, Centro-Norte dos EUA, Centro-Sul dos EUA, Suécia Central, Oeste dos EUA e Oeste dos EUA3 para clientes aprovados.

Áudio GPT-4o

O modelo gpt-4o-realtime-preview faz parte da família de modelos GPT-4o e dá suporte a interações conversacionais de baixa latência, "fala dentro, fala fora". O áudio GPT-4o foi projetado para lidar com interações de conversa em tempo real e de baixa latência, tornando-o um ótimo ajuste para agentes de suporte, assistentes, tradutores e outros casos de uso que precisam de idas e vindas altamente responsivas com um usuário.

O áudio GPT-4o está disponível nas regiões Leste dos EUA 2 (eastus2) e Central da Suécia (swedencentral). Para usar o áudio GPT-4o, você precisa criar ou usar um recurso existente em uma das regiões com suporte.

Quando o recurso é criado, você pode implantar o modelo de áudio GPT-4o. Se você estiver executando uma implantação programática, o nome do modelo será gpt-4o-realtime-preview. Para obter mais informações sobre como usar o áudio GPT-4o, consulte a documentação de áudio GPT-4o.

Detalhes sobre o máximo de tokens de solicitação e dados de treinamento estão disponíveis na tabela a seguir.

ID do Modelo	Descrição	Máx. de solicitações (tokens)	Dados de treinamento (até)
`gpt-4o-realtime-preview` (2024-10-01-preview) Áudio GPT-4o	Modelo de áudio para processamento de áudio em tempo real	Input: 128,000 Output: 4,096	Outubro de 2023

GPT-4o e GPT-4 Turbo

O GPT-4o integra texto e imagens em um único modelo, permitindo que ele manipule vários tipos de dados simultaneamente. Essa abordagem multimodal melhora a precisão e a capacidade de resposta nas interações entre humanos e computadores. O GPT-4o tem as mesmas tarefas de codificação e texto em inglês que o GPT-4 Turbo, enquanto oferece um desempenho superior em idiomas além do inglês e em tarefas de visão, definindo novos parâmetros de comparação para os recursos de IA.

Como fazer para acessar os modelos do GPT-4o e GPT-4o mini?

O GPT-4o e GPT-4o mini estão disponíveis para implantação de modelo padrão e padrão global.

Você deve criar ou usar um recurso já existente em uma região que seja padrão com suporte ou padrão global, onde o modelo está disponível.

Após a criação do recurso, será possível implantar os modelos do GPT-4o. Se você estiver executando uma implantação programática, os nomes dos modelos serão:

gpt-4o Versão 2024-08-06
gpt-4o, Versão 2024-05-13
gpt-4o-mini Versão 2024-07-18

GPT-4 Turbo

O GPT-4 Turbo é um modelo multimodal grande (aceitando entradas de texto ou imagem e gerando texto) que pode resolver problemas difíceis com maior precisão do que qualquer um dos modelos anteriores do OpenAI. Assim como o GPT-3.5 Turbo e os modelos GPT-4 Turbo mais antigos, o GPT-4 Turbo é otimizado para chat e funciona bem para tarefas de conclusão tradicionais.

A última versão GA do GPT-4 Turbo é:

gpt-4 Versão: turbo-2024-04-09

Essa é a substituição dos seguintes modelos de versão prévia:

gpt-4 Versão: 1106-Preview
gpt-4 Versão: 0125-Preview
gpt-4 Versão: vision-preview

Diferenças entre os modelos OpenAI e Azure OpenAI GPT-4 Turbo GA

A versão mais recente do modelo turbo 0409 do OpenAI suporta o modo JSON e chamadas de função para todas as solicitações de inferência.
A versão do OpenAI do Azure do turbo-2024-04-09 mais recente no momento não dá suporte ao uso do modo JSON e chamadas de função ao fazer solicitações de inferência com entrada de imagem (visão). As solicitações de entrada baseadas em texto (solicitações sem image_url e imagens embutidas) dão suporte ao modo JSON e à chamada de função.

Diferenças do gpt-4 vision-preview

A integração de aprimoramentos específicos do IA do Azure Vision com GPT-4 Turbo com Vision não é suportada para gpt-4 Versão: turbo-2024-04-09. Isso inclui Reconhecimento Óptico de Caracteres (OCR), ancoragem de objetos, solicitações de vídeo e melhor manuseio dos seus dados com imagens.

Disponibilidade gerenciada provisionada do GPT-4 Turbo

gpt-4 Versão: turbo-2024-04-09 está disponível para implantações padrão e provisionadas. Atualmente, a versão provisionada deste modelo não dá suporte a solicitações de inferência de imagem/visão. As implantações provisionadas deste modelo aceitam apenas a entrada de texto. As implantações de modelo Standard aceitam solicitações de inferência de texto e imagem/visão.

Implantar o GPT-4 Turbo com Visão GA

Para implantar o modelo GA na interface do usuário do Estúdio, selecione GPT-4 e escolha a versão turbo-2024-04-09 no menu suspenso. A cota padrão para o modelo gpt-4-turbo-2024-04-09 será a mesma da cota atual para o GPT-4-Turbo. Consulte os limites de cota regional.

GPT-4

O GPT-4 é o antecessor do GPT-4 Turbo. Tanto os modelos GPT-4 quanto os modelos GPT-4 Turbo têm um nome de modelo base de gpt-4. Você pode distinguir entre os modelos GPT-4 e Turbo examinando a versão do modelo.

gpt-4 Versão 0314
gpt-4 Versão 0613
gpt-4-32k Versão 0613

Você pode ver o comprimento do contexto do token compatível com cada modelo na tabela de resumo do modelo.

Modelos de GPT-4 e GPT-4 Turbo

Esses modelos só podem ser usados com a API de Conclusão de Chat.

Consulte as versões de modelo para saber mais sobre como o Serviço OpenAI do Azure lida com atualizações de versão de modelo e trabalhando com modelos, para saber como exibir e definir as configurações de versão do modelo de suas implantações GPT-4.

ID do Modelo	Descrição	Máx. de solicitações (tokens)	Dados de treinamento (até)
`gpt-4o` (2024-08-06) GPT-4o (Omni)	Modelo em GA maior mais recente – Saídas estruturadas - Processamento de imagem, texto – Modo JSON – chamada de função paralela - Precisão e capacidade de resposta aprimoradas - Paridade com o texto em inglês e tarefas de codificação em comparação ao GPT-4 Turbo com o Visão - Desempenho superior em idiomas além do inglês e em tarefas de visão	Input: 128,000 Saída: 16.384	Outubro de 2023
`gpt-4o-mini` (18/07/2024) GPT-4o mini	Modelo em GA menor mais recente - Modelo rápido, barato e capaz, ideal para substituir modelos da série GPT-3.5 Turbo. - Processamento de imagem, texto – Modo JSON – chamada de função paralela	Input: 128,000 Saída: 16.384	Outubro de 2023
`gpt-4o` (2024-05-13) GPT-4o (Omni)	– Processamento de imagem, texto – Modo JSON – chamada de função paralela - Precisão e capacidade de resposta aprimoradas - Paridade com o texto em inglês e tarefas de codificação em comparação ao GPT-4 Turbo com o Visão - Desempenho superior em idiomas além do inglês e em tarefas de visão	Input: 128,000 Output: 4,096	Outubro de 2023
`gpt-4` (turbo-2024-04-09) GPT-4 Turbo com Visão	Novo modelo em disponibilidade geral - Substituição de todos os modelos de versão prévia do GPT-4 anteriores (`vision-preview`, `1106-Preview`, ). `0125-Preview` Atualmente, a - disponibilidade do recurso é diferente dependendo do método de entrada e do tipo de implantação.	Input: 128,000 Output: 4,096	dez. de 2023
`gpt-4` (0125-Preview)* Versão prévia do GPT-4 Turbo	Modelo de versão prévia – Substitui 1106-Preview – Melhor desempenho de geração de código – Reduz casos em que o modelo não conclui uma tarefa – Modo JSON – chamada de função paralela – saída reproduzível (versão prévia)	Input: 128,000 Output: 4,096	dez. de 2023
`gpt-4` (vision-preview) Versão prévia do GPT-4 Turbo com Visão	Modelo de versão prévia – Aceita entrada de texto e imagem. – Dá suporte a aprimoramentos – Modo JSON – chamada de função paralela – saída reproduzível (versão prévia)	Input: 128,000 Output: 4,096	Abril de 2023
`gpt-4` (1106-preview) Versão prévia do GPT-4 Turbo	Modelo de versão prévia – Modo JSON – chamada de função paralela – saída reproduzível (versão prévia)	Input: 128,000 Output: 4,096	Abril de 2023
`gpt-4-32k` (0613)	Modelo de GA mais antigo – Chamada de função básica com ferramentas	32.768	Setembro de 2021
`gpt-4` (0613)	Modelo de GA mais antigo – Chamada de função básica com ferramentas	8\.192	Setembro de 2021
`gpt-4-32k`(0314)	Modelo de GA mais antigo - Informações sobre desativação	32.768	Setembro de 2021
`gpt-4` (0314)	Modelo de GA mais antigo - Informações sobre desativação	8\.192	Setembro de 2021

Cuidado

Não recomendamos o uso desses modelos de versão prévia em produção. Atualizaremos todas as implantações de modelos de versão prévia para versões prévias futuras ou para a versão GA mais recente. Os modelos de visualização designados não seguem o ciclo de vida padrão do modelo do Azure OpenAI.

GPT-4 versão 0125-preview é uma versão atualizada da versão prévia do GPT-4 Turbo lançada anteriormente como versão 1106-preview.
O GPT-4 versão 0125-preview conclui tarefas como a geração de código mais completamente em comparação com o gpt-4-1106-preview. Por isso, dependendo da tarefa, os clientes podem descobrir que o GPT-4-0125-preview gera mais saída em comparação com o gpt-4-1106-preview. Recomendamos que os clientes comparem as saídas do novo modelo. O GPT-4-0125-preview também aborda bugs no gpt-4-1106-preview com manipulação UTF-8 para idiomas diferentes do inglês.
A versão GPT-4 turbo-2024-04-09 é a versão GA mais recente e substitui 0125-Preview, 1106-preview e vision-preview.

Importante

As versões GPT-4 (gpt-4) 1106-Preview, 0125-Previewe vision-preview serão atualizadas com uma versão estável de gpt-4 no futuro.

As implantações de gpt-4 versões 1106-Preview, 0125-Previewe vision-preview definidas como "Atualização automática para padrão" e "Atualização quando expirada" começarão a ser atualizadas após o lançamento da versão estável. Para cada implantação, ocorre uma atualização da versão do modelo sem interrupção do serviço para chamadas de API. As atualizações são realizadas por região e espera-se que o processo completo de atualização leve 2 semanas.
As implantações de gpt-4 versões 1106-Preview, 0125-Previewe vision-preview definidas como "Sem autoupgrade" não serão atualizadas e interromperão a operação quando a versão prévia for atualizada na região. Confira Desativações e preterições do modelo do OpenAI do Azure para obter mais informações sobre o cronograma da atualização.

GPT-3.5

Os modelos GPT-3.5 conseguem entender e gerar linguagem natural ou código. O modelo mais capaz e mais econômico da família GPT-3.5 é o GPT-3.5 Turbo, que foi otimizado para chat e também funciona bem para tarefas de preenchimento tradicionais. O GPT-3.5 Turbo está disponível para uso com a API de Conclusão de Chat. O GPT-3.5 Turbo Instruct tem recursos semelhantes ao text-davinci-003 usando a API de Conclusão em vez da API de Conclusão de Chat. Recomendamos o uso do GPT-3.5 Turbo e do GPT-3.5 Turbo Instruct em vez dos modelos herdados GPT-3.5 e GPT-3.

ID do Modelo	Descrição	Máx. de solicitações (tokens)	Dados de treinamento (até)
`gpt-35-turbo` (0125) NOVO	Modelo GA mais recente – Modo JSON – chamada de função paralela – saída reproduzível (versão prévia) – Maior precisão na resposta nos formatos solicitados. – Correção de um bug que causou um problema de codificação de texto em chamadas de função em idiomas que não o inglês.	Input: 16,385 Output: 4,096	Setembro de 2021
`gpt-35-turbo` (1106)	Modelo de GA mais antigo – Modo JSON – chamada de função paralela – saída reproduzível (versão prévia)	Input: 16,385 Output: 4,096	Setembro de 2021
`gpt-35-turbo-instruct` (0914)	Somente ponto de extremidade de conclusão — Substituição de modelos de preenchimento herdados	4,097	Setembro de 2021
`gpt-35-turbo-16k` (0613)	Modelo de GA mais antigo – Chamada de função básica com ferramentas	16.384	Setembro de 2021
`gpt-35-turbo` (0613)	Modelo de GA mais antigo – Chamada de função básica com ferramentas	4\.096	Setembro de 2021
`gpt-35-turbo`¹ (0301)	Modelo de GA mais antigo - Informações sobre desativação	4\.096	Setembro de 2021

Para saber mais sobre como interagir com o GPT-3.5 Turbo e a API de Preenchimentos de Chat, confira nossas instruções passo a passo aprofundadas.

¹ Esse modelo aceitará solicitações > 4.096 tokens. Não é recomendável exceder o limite de 4.096 tokens de entrada, pois a versão mais recente do modelo é limitada a 4.096 tokens. Se você encontrar problemas ao exceder 4.096 tokens de entrada com esse modelo, essa configuração não terá suporte oficial.

Incorporações

text-embedding-3-large é o modelo de inserção mais recente e mais capaz. A atualização entre modelos de inserções não é possível. Para passar do uso de text-embedding-ada-002 para text-embedding-3-large, você precisaria gerar novas inserções.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

Em testes, o OpenAI relata que os modelos de inserções de terceira geração grandes e pequenos oferecem melhor desempenho médio de recuperação de vários idiomas com o parâmetro de comparação MIRACL, mantendo ainda o desempenho para tarefas em inglês com o parâmetro de comparação MTEB.

Benchmark de avaliação	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
Média MIRACL	31,4	44,0	54.9
Média MTEB	61,0	62,3	64,6

Os modelos de inserções de terceira geração dão suporte à redução do tamanho da inserção por meio de um novo parâmetro dimensions. Normalmente, inserções maiores são mais caras de uma perspectiva de computação, memória e armazenamento. Ser capaz de ajustar o número de dimensões permite mais controle sobre o custo e o desempenho gerais. Não há suporte para o parâmetro dimensions em todas as versões da biblioteca OpenAI 1.x Python. Para aproveitar esse parâmetro, recomendamos atualizar para a versão mais recente: pip install openai --upgrade.

O teste de parâmetro de comparação MTEB da OpenAI constatou que, mesmo quando as dimensões do modelo de terceira geração são reduzidas para menos de 1.536 dimensões de text-embeddings-ada-002, o desempenho permanece ligeiramente melhor.

DALL-E

Os modelos DALL-E geram imagens a partir de prompts de texto fornecidos pelo usuário. DALL-E 3 está geralmente disponível para uso com APIs REST. DALL-E 2 e DALL-E 3 com SDKs de cliente estão em versão prévia.

Whisper

Os modelos do Whisper podem ser usados para conversão de fala em texto.

Use também o modelo Whisper por meio da API de transcrição em lote da Fala de IA do Azure. ConsulteO que é o modelo Whisper? para saber mais sobre quando usar a Fala de IA do Azure versus o Serviço OpenAI do Azure.

Conversão de texto em fala (versão prévia)

Os modelos de conversão de texto em fala do OpenAI, atualmente em versão prévia, podem ser usado para sintetizar a conversão de texto em fala.

Você também pode usar as vozes da conversão de texto em fala do OpenAI por meio da Fala de IA do Azure. Para saber mais, consulte o guia Vozes da conversão de texto em fala do OpenAI por meio do Serviço OpenAI do Azure ou Fala de IA do Azure.

Tabela de resumo de modelos e disponibilidade por região

Modelos por tipo de implantação

O OpenAI do Azure fornece aos clientes opções sobre a estrutura de hospedagem que se ajusta aos seus padrões de negócios e de uso. O serviço oferece dois tipos principais de implantação:

O tipo Standard é oferecido com uma opção de implantação global, roteando o tráfego globalmente para fornecer uma taxa de transferência mais alta.
O tipo Provisionado também é oferecido com uma opção de implantação global, permitindo que os clientes comprem e implantem unidades de produtividade provisionadas em toda a infraestrutura global do Azure.

Todas as implantações podem executar exatamente as mesmas operações de inferência; no entanto, a cobrança, a escala e o desempenho são substancialmente diferentes. Para saber mais sobre os tipos de implantação do OpenAI do Azure, confira nosso guia de tipos de implantação.

Disponibilidade de modelo padrão global

Região	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4o-realtime-preview, 2024-10-01	gpt-4, turbo-2024-04-09
australiaeast	-	-	✅	-	✅	-	✅
brazilsouth	-	-	✅	-	✅	-	✅
canadaeast	-	-	✅	-	✅	-	✅
eastus	✅	✅	✅	✅	✅	-	✅
eastus2	✅	✅	✅	✅	✅	✅	✅
francecentral	-	-	✅	-	✅	-	✅
germanywestcentral	-	-	✅	-	✅	-	✅
japaneast	-	-	✅	-	✅	-	✅
koreacentral	-	-	✅	-	✅	-	✅
northcentralus	✅	✅	✅	✅	✅	-	✅
norwayeast	-	-	✅	-	✅	-	✅
polandcentral	-	-	✅	-	✅	-	✅
southafricanorth	-	-	✅	-	✅	-	✅
southcentralus	✅	✅	✅	✅	✅	-	✅
southindia	-	-	✅	-	✅	-	✅
spaincentral	-	-	✅	✅	✅	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	-	✅	-	✅	-	✅
uksouth	-	-	✅	-	✅	-	✅
westeurope	-	-	✅	-	✅	-	✅
westus	✅	✅	✅	✅	✅	-	✅
westus3	✅	✅	✅	✅	✅	-	✅

Disponibilidade global do modelo gerenciado provisionado

Região	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18
australiaeast	✅	✅
brazilsouth	✅	✅
canadacentral	✅	✅
canadaeast	✅	✅
eastus	✅	✅
eastus2	✅	✅
francecentral	✅	✅
germanywestcentral	✅	✅
japaneast	✅	✅
koreacentral	✅	✅
northcentralus	✅	✅
norwayeast	✅	✅
polandcentral	✅	✅
southafricanorth	✅	✅
southcentralus	✅	✅
southindia	✅	✅
spaincentral	✅	✅
swedencentral	✅	✅
switzerlandnorth	✅	✅
switzerlandwest	✅	✅
uksouth	✅	✅
westeurope	✅	✅
westus	✅	✅
westus3	✅	✅

Disponibilidade do modelo de lote global

Região	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, turbo-2024-04-09	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125
eastus	✅	✅	✅	✅	✅	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅

Disponibilidade do modelo de implantação padrão

Região	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613	gpt-35-turbo-instruct, 0914	text-embedding-3-small, 1	text-embedding-3-large, 1	text-embedding-ada-002, 1	text-embedding-ada-002, 2	dall-e-2, 2.0	dall-e-3, 3.0	babbage-002, 1	davinci-002, 1	tts, 001	tts-hd, 001	whisper, 001
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	-	✅	-	-	-	-	✅	-	✅	-	-	-	-	-
brazilsouth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	-
eastus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-
eastus2	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅	-	-	✅	-	✅	-	-	-	-	-	-	-
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	-
northcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	✅	-	✅	✅	-	-	-	-	✅	-	-	✅	✅	✅	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-	-	-	✅	-	✅	-	-	-	-	-	-	✅
southafricanorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-
southcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-	-	-	-	✅	✅	-	-	-	-	-	-	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-	-	-	✅	-	✅	-	-	-	-	-	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	✅	-	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	-	✅	-	-	-	-	✅	-	-	-	-	-	-	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	-	-	-	-	-
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-	-	-	-	-	✅	-	-	-	-	-	-	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-	-	-	✅	-	✅	-	-	-	-	-	-	-

Disponibilidade do modelo de implantação provisionada

Região	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
brazilsouth	✅	-	✅	✅	✅	✅	-	✅	✅	-
canadacentral	-	-	-	✅	-	-	-	✅	-	✅
canadaeast	✅	-	✅	✅	✅	-	✅	-	✅	-
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	-	✅	✅	✅	✅	-	✅	-	✅
germanywestcentral	✅	-	-	✅	✅	✅	✅	✅	✅	-
japaneast	✅	-	✅	-	✅	✅	✅	-	-	✅
koreacentral	✅	-	✅	✅	-	-	✅	✅	✅	-
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	-	✅	✅	-	✅	-	✅	-	-
polandcentral	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	-	-	✅	✅	-	✅	✅	✅	-
southcentralus	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southindia	✅	-	✅	✅	✅	✅	-	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandwest	-	-	-	-	-	-	-	-	-	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	-	✅	✅	✅	✅	✅	✅	✅

Observação

A versão provisionada da gpt-4 Versão: turbo-2024-04-09 atualmente está limitada apenas a texto.

Para obter mais informações sobre implantações provisionadas, consulte nossa Orientação provisionada.

Essa tabela não inclui informações de ajuste fino de disponibilidade regional. Consulte a seção de ajuste fino para obter essas informações.

Disponibilidade padrão do modelo de zona de dados

Selecione o acesso do cliente

Além das regiões acima que estão disponíveis para todos os clientes do Azure OpenAI, alguns clientes pré-existentes selecionados receberam acesso a versões do GPT-4 in regiões adicionais:

Modelar	Região da zona de dados de dólar americano	Região da zona de dados de euro
`gpt-4o`(06/08/2024) `gpt-4o`(13/05/2024)	Leste dos EUA 2 Oeste dos EUA 3	Espanha Central Europa Ocidental
`gpt-4o-mini` (18/07/2024)	Leste dos EUA 2 Oeste dos EUA 3	Espanha Central Europa Ocidental

Modelos Standard por ponto de extremidade

Preenchimentos de chat

Região	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	-	✅
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	✅	-	✅	✅
eastus2	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	✅	-	✅	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅
northcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	✅	-	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-
southcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	-	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-

Disponibilidade do modelo GPT-4 e GPT-4 Turbo

Selecione o acesso do cliente

Além das regiões acima que estão disponíveis para todos os clientes do Azure OpenAI, alguns clientes pré-existentes selecionados receberam acesso a versões do GPT-4 in regiões adicionais:

Modelar	Region
`gpt-4` (0314) `gpt-4-32k` (0314)	Leste dos EUA França Central Centro-Sul dos Estados Unidos Sul do Reino Unido
`gpt-4` (0613) `gpt-4-32k` (0613)	Leste dos EUA Leste dos EUA 2 Leste do Japão Sul do Reino Unido

Modelos GPT-3.5

Consulte versões de modelo para saber mais sobre como o Serviço OpenAI do Azure lida com atualizações de versão de modelo e trabalhando com modelos, para saber como exibir e definir as configurações de versão do modelo de suas implantações do GPT-3.5 Turbo.

Modelos de inserções

Região	text-embedding-3-small, 1	text-embedding-3-large, 1	text-embedding-ada-002, 1	text-embedding-ada-002, 2
australiaeast	-	-	-	✅
brazilsouth	-	-	-	✅
canadaeast	✅	✅	-	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	-	✅
francecentral	-	✅	-	✅
japaneast	✅	✅	-	✅
northcentralus	-	-	-	✅
norwayeast	-	✅	-	✅
southafricanorth	-	-	-	✅
southcentralus	-	-	✅	✅
southindia	-	✅	-	✅
swedencentral	-	✅	-	✅
switzerlandnorth	-	-	-	✅
uksouth	-	✅	-	✅
westeurope	-	-	-	✅
westus	-	-	-	✅
westus3	-	✅	-	✅

Esses modelos só podem ser usados com solicitações da API de Inserção.

Observação

ID do Modelo	Máx. de solicitações (tokens)	Dimensões de saída	Dados de treinamento (até)
`text-embedding-ada-002` (versão 2)	8\.192	1.536	Setembro de 2021
`text-embedding-ada-002` (versão 1)	2,046	1.536	Setembro de 2021
`text-embedding-3-large`	8\.192	3.072	Setembro de 2021
`text-embedding-3-small`	8\.192	1.536	Setembro de 2021

Observação

Ao enviar uma matriz de entradas para inserção, o número máximo de itens de entrada na matriz por chamada para o ponto de extremidade de inserção é 2048.

Modelos de geração de imagem

Região	dall-e-2, 2.0	dall-e-3, 3.0
australiaeast	-	✅
eastus	✅	✅
swedencentral	-	✅

Modelos do DALL-E

ID do Modelo	Solicitação máxima (caracteres)
dalle2 (versão prévia)	1.000
dall-e-3	4.000

Modelos de áudio

Região	tts, 001	tts-hd, 001	whisper, 001
eastus2	-	-	✅
northcentralus	✅	✅	✅
norwayeast	-	-	✅
southindia	-	-	✅
swedencentral	✅	✅	✅
switzerlandnorth	-	-	✅
westeurope	-	-	✅

Modelos de sussurro

ID do Modelo	Solicitação máxima (tamanho do arquivo de áudio)
`whisper`	25 MB

Modelos de conversão de texto em fala (versão prévia)

ID do Modelo	Descrição
`tts`	O modelo mais recente de conversão de texto em fala do OpenAI do Azure, otimizado para velocidade.
`tts-hd`	O modelo mais recente de conversão de texto em fala do OpenAI do Azure, otimizado para qualidade.

Modelos de preenchimento

babbage-002 e davinci-002 não são treinados para seguir as instruções. Consultar esses modelos base só deve ser feito como um ponto de referência para uma versão ajustada para avaliar o progresso do treinamento.

Região	gpt-35-turbo-instruct, 0914	babbage-002, 1	davinci-002, 1
eastus	✅	-	-
northcentralus	-	✅	✅
swedencentral	✅	✅	✅

Modelos de ajuste fino

Observação

gpt-35-turbo: o ajuste fino desse modelo é limitado a um subconjunto de regiões e não está disponível em todas as regiões em que o modelo base está.

As regiões compatíveis para o ajuste fino podem variar ao usar modelos do OpenAI do Azure em um projeto do AI Studio ou fora dele.

ID do Modelo	Regiões com ajuste fino	Máx. de solicitações (tokens)	Dados de treinamento (até)
`babbage-002`	Centro-Norte dos EUA Suécia Central Oeste da Suíça	16.384	Setembro de 2021
`davinci-002`	Centro-Norte dos EUA Suécia Central Oeste da Suíça	16.384	Setembro de 2021
`gpt-35-turbo` (0613)	Leste dos EUA 2 Centro-Norte dos EUA Suécia Central Oeste da Suíça	4\.096	Setembro de 2021
`gpt-35-turbo` (1106)	Leste dos EUA 2 Centro-Norte dos EUA Suécia Central Oeste da Suíça	Input: 16,385 Output: 4,096	Setembro de 2021
`gpt-35-turbo` (0125)	Leste dos EUA 2 Centro-Norte dos EUA Suécia Central Oeste da Suíça	16.385	Setembro de 2021
`gpt-4` (0613) ¹	Centro-Norte dos EUA Suécia Central	8192	Setembro de 2021
`gpt-4o-mini` ¹ (2024-07-18)	Centro-Norte dos EUA Suécia Central	Input: 128,000 Saída: 16.384 Comprimento do contexto do exemplo de treinamento: 64.536	Outubro de 2023
`gpt-4o` ¹ (2024-08-06)	Leste dos EUA 2 Centro-Norte dos EUA Suécia Central	Input: 128,000 Saída: 16.384 Comprimento do contexto do exemplo de treinamento: 64.536	Outubro de 2023

No momento, ¹ GPT-4 está em visualização pública.

Assistentes (versão prévia)

Para Assistentes, você precisa de uma combinação de um modelo com suporte e uma região com suporte. Determinadas ferramentas e funcionalidades exigem os modelos mais recentes. Os modelos a seguir estão disponíveis na API dos Assistentes, no SDK e no Estúdio de IA do Azure. A tabela a seguir é para pagamento conforme o uso. Para obter informações sobre a disponibilidade da unidade de produtividade provisionado (PTU), veja rendimento provisionado. Os modelos e regiões listados podem ser usados com os Assistentes v1 e v2. Você pode usar modelos padrão globais se eles forem compatíveis com as regiões listadas abaixo.

Region	`gpt-35-turbo (0613)`	`gpt-35-turbo (1106)`	`fine tuned gpt-3.5-turbo-0125`	`gpt-4 (0613)`	`gpt-4 (1106)`	`gpt-4 (0125)`	`gpt-4o (2024-05-13)`	`gpt-4o-mini (2024-07-18)`
Leste da Austrália	✅	✅		✅	✅
Leste dos EUA	✅					✅	✅	✅
Leste dos EUA 2	✅		✅	✅	✅		✅
França Central	✅	✅		✅	✅
Leste do Japão	✅
Leste da Noruega					✅
Suécia Central	✅	✅	✅	✅	✅		✅
Sul do Reino Unido	✅	✅			✅	✅
Oeste dos EUA		✅			✅		✅
Oeste dos EUA 3					✅		✅

Aposentadoria do modelo

Para obter as informações mais recentes sobre descontinuações modelo, consulte o guia de descontinuação modelo.

Compartilhar via

Modelos do Serviço OpenAI do Azure

acesso limitado aos modelos o1-preview e o1-mini

Disponibilidade

Suporte a API

Uso

Disponibilidade de região

Áudio GPT-4o

GPT-4o e GPT-4 Turbo

Como fazer para acessar os modelos do GPT-4o e GPT-4o mini?

GPT-4 Turbo

Diferenças entre os modelos OpenAI e Azure OpenAI GPT-4 Turbo GA

Diferenças do gpt-4 vision-preview

Disponibilidade gerenciada provisionada do GPT-4 Turbo

Implantar o GPT-4 Turbo com Visão GA

GPT-4

Modelos de GPT-4 e GPT-4 Turbo

GPT-3.5

Incorporações

DALL-E

Whisper

Conversão de texto em fala (versão prévia)

Tabela de resumo de modelos e disponibilidade por região

Modelos por tipo de implantação

Disponibilidade de modelo padrão global

Disponibilidade padrão do modelo de zona de dados

Selecione o acesso do cliente

Modelos Standard por ponto de extremidade

Preenchimentos de chat

Disponibilidade do modelo GPT-4 e GPT-4 Turbo

Selecione o acesso do cliente

Modelos GPT-3.5

Modelos de ajuste fino

Assistentes (versão prévia)

Aposentadoria do modelo

Próximas etapas

Comentários

Recursos adicionais