Principy vkládání
Vkládání je typ reprezentace dat, který používají modely strojového učení. Vkládání představuje sémantický význam části textu. Vložení můžete vizualizovat jako matici čísel a číselná vzdálenost mezi dvěma vkládáními představuje jejich sémantickou podobnost. Pokud jsou například dva texty podobné, měly by být jejich reprezentace také podobné.
Vkládání modelů
Jak efektivní budou výsledky hledání, je přímé korelace na efektivitu vloženého modelu.
Existují modely speciálně vytvořené pro provedení konkrétní úlohy. Pomocí vkládání hledání podobnosti můžete zachytit sémantickou podobnost mezi částmi textu. Vkládání textu může zjistit význam dlouhého dokumentu na krátký dotaz. Pomocí vkládání kódu a dotazů pro vyhledávání v přirozeném jazyce můžete použít vkládání fragmentů kódu a dotazů pro vyhledávání v přirozeném jazyce.
Uživatelé zadají vstup do dotazu pro model vložení, který se převede z textu na vektor, například pomocí modelu vkládání textu ada-002 k vygenerování vkládání textu.
Výsledkem budou všechny dokumenty odpovídající dotazu obsaženému v indexu vyhledávání. Dokumenty se vkládáním obsahujícími vektorová pole musí existovat v indexu vyhledávání a stejný model se musí použít pro indexování a dotaz.
Vkládání místa
Vkládejte prostor je jádrem vektorových dotazů obsahujících všechna vektorová pole ze stejného modelu vkládání. Skládá se ze všech vektorových polí naplněných stejným modelem.
V tomto prostoru pro vložení jsou podobné položky umístěny blízko sebe a odlišné položky jsou umístěny dále od sebe.
Například dokumenty, které hovoří o hotelech s vodním parkem, by byly blízko ve vloženého prostoru, zatímco hotely bez tohoto zařízení by byly daleko, zatímco stále jsou v okolí hotelů. Odlišné koncepty, jako jsou restaurace, by byly dál daleko. V praxi jsou vložené prostory abstraktní a nemají dobře definované významy srozumitelné lidem, ale základní myšlenka zůstává stejná.