Dávkové odvozování pomocí rozhraní API základního modelu zřízené propustnosti
Tento článek obsahuje ukázkový poznámkový blok, který provádí dávkové odvozování na zřízeném koncovém bodu propustnosti pomocí rozhraní API modelu Foundation a ai_query.
Požadavky
- Pracovní prostor v podporované oblasti rozhraní API základního modelu
- Jedna z následujících možností:
- Výpočetní prostředky pro všechny účely s velikostí
i3.2xlarge
výpočetních prostředků nebo většími spuštěnými modulem Databricks Runtime 15.4 ML LTS nebo vyšší s alespoň 2 pracovními procesy. - SQL Warehouse – střední a větší.
- Výpočetní prostředky pro všechny účely s velikostí
Spuštění dávkového odvození
Obecně platí, že nastavení dávkového odvozování zahrnuje 2 kroky:
- Vytvoření koncového bodu, který se má použít pro dávkové odvozování
- Vytvoření dávkových požadavků a odeslání těchto požadavků do koncového bodu dávkového odvozování pomocí
ai_query
.
Ukázkový poznámkový blok popisuje tyto kroky a ukazuje dávkové odvozování pomocí modelu Meta Llama 3.1 70B.