Referenční informace: Dokončení | Azure AI Studio

Důležité

Položky označené (Preview) v tomto článku jsou aktuálně ve verzi Public Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučujeme ji pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

Vytvoří dokončení pro zadaný příkazový řádek a parametry.

POST /completions?api-version=2024-04-01-preview
Název V Požaduje se Type Popis
verze-api query True string Verze rozhraní API ve formátu "RRRR-MM-DD" nebo "RRRR-MM-DD-preview".

Hlavička požadavku

Název Požadováno Type Popis
parametry navíc string Chování rozhraní API v případech, kdy jsou v datové části uvedeny další parametry. Díky použití pass-through rozhraní API předáte parametr podkladovému modelu. Tuto hodnotu použijte, pokud chcete předat parametry, které znáte, že základní model může podporovat. Pomocí ignore rozhraní API zahodíte nepodporovaný parametr. Tuto hodnotu použijte, pokud potřebujete použít stejnou datovou část v různých modelech, ale jeden z dalších parametrů může model v případě, že není podporován, chybovat. Použití error rozhraní API zamítá všechny další parametry v datové části. Dají se určit pouze parametry zadané v tomto rozhraní API nebo se vrátí chyba 400.
azureml-model-deployment string Název nasazení, na které chcete požadavek směrovat. Podporováno pro koncové body, které podporují více nasazení.

Text požadavku

Název Požadováno Type Popis
pobídnout True Zobrazí se výzva k vygenerování dokončení pro, zakódované jako řetězec, pole řetězců, pole tokenů nebo pole polí tokenů. Všimněte si, že je to oddělovač dokumentů, <\|endoftext\|> který model vidí během trénování, takže pokud není zadána výzva, model se vygeneruje, jako by byl od začátku nového dokumentu.
frequency_penalty Číslo Kladné hodnoty sankují nové tokeny na základě jejich stávající frekvence v textu, což snižuje pravděpodobnost opakování stejného doslovného znění řádku modelu.
max_tokens integer Maximální počet tokenů, které lze vygenerovat v dokončení. Počet tokenů výzvy plus max_tokens nesmí překročit délku kontextu modelu.
presence_penalty Číslo Kladné hodnoty sankují nové tokeny na základě toho, jestli se zatím zobrazují v textu, což zvyšuje pravděpodobnost, že model mluví o nových tématech.
semeno integer Pokud je zadáno, model se snaží vzorkovat deterministicky, aby opakované požadavky se stejnými seed parametry měly vrátit stejný výsledek.

Determinismus není zaručený a měli byste odkazovat na system_fingerprint parametr odpovědi pro monitorování změn v back-endu.
Zastavit Sekvence, ve kterých rozhraní API přestane generovat další tokeny Vrácený text nebude obsahovat sekvenci zastavení.
datový proud boolean Zda se má streamovat zpět částečný průběh. Pokud jsou nastavené, tokeny se posílají jako události odesílané jen pro data, jakmile budou k dispozici, a datový proud je ukončen zprávoudata: [DONE].
Teplota Číslo Jakou teplotu vzorkování použít, mezi 0 a 2. Vyšší hodnoty jako 0,8 způsobí, že výstup bude náhodnější, zatímco nižší hodnoty, jako je 0,2, zajistí větší zaměření a deterministiku.

Obecně doporučujeme měnit temperature , ale top_p ne obojí.
top_p Číslo Alternativou k odběru vzorků s teplotou, označovanou jako vzorkování jádra, kde model bere v úvahu výsledky tokenů s top_p hmotností pravděpodobnosti. Hodnota 0,1 tedy znamená, že se považují pouze tokeny, které tvoří 10% hmotnost pravděpodobnosti.

Obecně doporučujeme měnit top_p , ale temperature ne obojí.

Odpovědi

Name Typ Popis
200 OK CreateCompletionResponse OK
401 – Neautorizováno Neautorizovaná chyba Přístupový token chybí nebo je neplatný.

Hlavičky

x-ms-error-code: string
404 – Nenalezeno NotFoundError Způsob, který model nepodporuje. V dokumentaci k modelu zjistíte, které trasy jsou k dispozici.

Hlavičky

x-ms-error-code: string
422 Nezpracovaná entita UnprocessableContentError Požadavek obsahuje nezpracovaný obsah.

Hlavičky

x-ms-error-code: string
429 – Příliš mnoho požadavků TooManyRequestsError Dosáhli jste svého přiřazeného limitu rychlosti a vaše žádost se musí postupovat podle tempa.

Hlavičky

x-ms-error-code: string
Další stavové kódy ContentFilterError Chybný požadavek

Hlavičky

x-ms-error-code: string

Zabezpečení

Autorizace

Token s předponou Bearer: , např. Bearer abcde12345

Typ: apiKey
V: hlavička

AADToken

Ověřování Azure Active Directory OAuth2

Typ: oauth2
Flow: aplikace
Adresa URL tokenu: https://login.microsoftonline.com/common/oauth2/v2.0/token

Příklady

Vytvoří dokončení pro zadané výzvy a parametry.

Ukázkový požadavek

POST /completions?api-version=2024-04-01-preview

{
  "prompt": "This is a very good text",
  "frequency_penalty": 0,
  "presence_penalty": 0,
  "max_tokens": 256,
  "seed": 42,
  "stop": "<|endoftext|>",
  "stream": false,
  "temperature": 0,
  "top_p": 1
}

Ukázková odezva

Stavový kód: 200

{
  "id": "1234567890",
  "model": "llama2-7b",
  "choices": [
    {
      "index": 0,
      "finish_reason": "stop",
      "text": ", indeed it is a good one."
    }
  ],
  "created": 1234567890,
  "object": "text_completion",
  "usage": {
    "prompt_tokens": 15,
    "completion_tokens": 8,
    "total_tokens": 23
  }
}

Definice

Název Popis
Choices Seznam možností dokončení chatu
CompletionFinishReason Důvod, proč model přestal generovat tokeny To je stop v případě, že model dosáhne přirozeného bodu zastavení nebo zadané sekvence zastavení, length pokud byl dosažen maximální počet tokenů zadaných v požadavku, content_filter pokud byl obsah vynechán kvůli příznaku z našich filtrů obsahu.
Dokončení Statistiky využití žádosti o dokončení
ContentFilterError Volání rozhraní API selže, když výzva aktivuje filtr obsahu podle konfigurace. Upravte výzvu a zkuste to znovu.
CreateCompletionRequest
CreateCompletionResponse Představuje odpověď na dokončení z rozhraní API.
Podrobnosti
TextCompletionObject Typ objektu, který je vždy "text_completion"
UnprocessableContentError

Volby

Seznam možností dokončení chatu

Name Typ Popis
finish_reason CompletionFinishReason Důvod, proč model přestal generovat tokeny To je stop v případě, že model dosáhl přirozeného bodu zastavení nebo zadané sekvence zastavení, length pokud byl dosažen maximální počet tokenů zadaných v požadavku, content_filter pokud byl obsah vynechán kvůli příznaku z našich filtrů obsahu, tool_calls pokud model volal nástroj.
index integer Index výběru v seznamu voleb.
text string Vygenerovaný text.

CompletionFinishReason

Důvod, proč model přestal generovat tokeny To je stop v případě, že model dosáhne přirozeného bodu zastavení nebo zadané sekvence zastavení, length pokud byl dosažen maximální počet tokenů zadaných v požadavku, content_filter pokud byl obsah vynechán kvůli příznaku z našich filtrů obsahu.

Name Typ Popis
content_filter string
length string
Zastavit string

Dokončení

Statistiky využití žádosti o dokončení

Name Typ Popis
completion_tokens integer Počet tokenů ve vygenerovaném dokončení
prompt_tokens integer Počet tokenů v příkazovém řádku
total_tokens integer Celkový počettokench

ContentFilterError

Volání rozhraní API selže, když výzva aktivuje filtr obsahu podle konfigurace. Upravte výzvu a zkuste to znovu.

Name Typ Popis
code string Kód chyby.
chyba string Popis chyby.
zpráva string Chybová zpráva
Param string Parametr, který aktivoval filtr obsahu.
stav integer Stavový kód HTTP

CreateCompletionRequest

Name Type Výchozí hodnota Popis
frequency_penalty Číslo 0 Kladné hodnoty sankují nové tokeny na základě jejich stávající frekvence v textu, což snižuje pravděpodobnost opakování stejného doslovného znění řádku modelu.
max_tokens integer 256 Maximální počet tokenů, které lze vygenerovat v dokončení. Počet tokenů výzvy plus max_tokens nesmí překročit délku kontextu modelu.
presence_penalty Číslo 0 Kladné hodnoty sankují nové tokeny na základě toho, jestli se zatím zobrazují v textu, což zvyšuje pravděpodobnost, že model mluví o nových tématech.
pobídnout <\|endoftext\|> Zobrazí se výzva k vygenerování dokončení pro, zakódované jako řetězec, pole řetězců, pole tokenů nebo pole polí tokenů. Všimněte si, že je to oddělovač dokumentů, <\|endoftext\|> který model vidí během trénování, takže pokud není zadána výzva, model se vygeneruje, jako by byl od začátku nového dokumentu.
semeno integer Pokud je zadáno, náš systém se bude snažit vzorkovat deterministicky, aby opakované požadavky se stejnými seed parametry měly vrátit stejný výsledek.

Determinismus není zaručený a měli byste odkazovat na system_fingerprint parametr odpovědi pro monitorování změn v back-endu.
Zastavit Sekvence, ve kterých rozhraní API přestane generovat další tokeny Vrácený text nebude obsahovat sekvenci zastavení.
datový proud boolean False Zda se má streamovat zpět částečný průběh. Pokud jsou nastavené, tokeny se posílají jako události odesílané jen pro data, jakmile budou k dispozici, a datový proud je ukončen zprávoudata: [DONE].
Teplota Číslo 0 Jakou teplotu vzorkování použít, mezi 0 a 2. Vyšší hodnoty jako 0,8 způsobí, že výstup bude náhodnější, zatímco nižší hodnoty, jako je 0,2, zajistí větší zaměření a deterministiku.

Obecně doporučujeme tuto změnu změnit, top_p ale ne obojí.
top_p Číslo 0 Alternativou k odběru vzorků s teplotou, označovanou jako vzorkování jádra, kde model bere v úvahu výsledky tokenů s top_p hmotností pravděpodobnosti. Hodnota 0,1 tedy znamená, že se považují pouze tokeny, které tvoří 10% hmotnost pravděpodobnosti.

Obecně doporučujeme tuto změnu změnit, temperature ale ne obojí.

CreateCompletionResponse

Představuje odpověď na dokončení z rozhraní API. Poznámka: Streamované i nestreamované objekty odpovědi sdílejí stejný obrazec (na rozdíl od koncového bodu chatu).

Name Typ Popis
volby Volby[] Seznam voleb dokončení, které model vygeneroval pro vstupní výzvu.
vytvořené integer Časové razítko unixu (v sekundách) doby vytvoření dokončení.
ID řetězec Jedinečný identifikátor dokončení.
model string Model použitý k dokončení.
objekt TextCompletionObject Typ objektu, který je vždy "text_completion"
system_fingerprint string Tento otisk prstu představuje konfiguraci back-endu, se kterou model běží.

Lze použít s parametrem seed požadavku, abyste pochopili, kdy byly provedeny změny back-endu, které můžou mít vliv na determinismus.
využití Dokončení Statistiky využití žádosti o dokončení

Podrobnosti

Name Typ Popis
Loc string[] Parametr způsobující problém
hodnota string Hodnota předaná parametru způsobuje problémy.

TextCompletionObject

Typ objektu, který je vždy "text_completion"

Name Typ Popis
text_completion string

ListObject

Typ objektu, který je vždy "list".

Name Typ Description
list string

NotFoundError

Name Typ Popis
chyba string Popis chyby.
zpráva string Chybová zpráva
stav integer Stavový kód HTTP

TooManyRequestsError

Name Typ Popis
chyba string Popis chyby.
zpráva string Chybová zpráva
stav integer Stavový kód HTTP

Neautorizovaná chyba

Name Typ Popis
chyba string Popis chyby.
zpráva string Chybová zpráva
stav integer Stavový kód HTTP

UnprocessableContentError

Name Typ Popis
code string Kód chyby.
detail Podrobnosti
chyba string Popis chyby.
zpráva string Chybová zpráva
stav integer Stavový kód HTTP