Vytvoření sdíleného fondu virtuálních počítačů Datová Věda
V tomto článku se dozvíte, jak vytvořit sdílený fond virtuálních počítačů Datová Věda Virtual Machines (DSVM) pro tým. Použití sdíleného fondu nabízí důležité výhody:
- Lepší využití zdrojů
- Snadnější sdílení a spolupráce
- Efektivnější správa prostředků DSVM
K vytvoření fondu dsVM můžete použít mnoho metod a technologií. Tento článek se zaměřuje na fondy pro interaktivní virtuální počítače. Alternativní spravovaná výpočetní infrastruktura zahrnuje službu Azure Machine Learning Compute. Další informace najdete v tématu Vytvoření výpočetního clusteru.
Interaktivní fond virtuálních počítačů
Fond interaktivních virtuálních počítačů sdílený celým týmem umělé inteligence a datových věd nabízí uživatelům způsob, jak se přihlásit k dostupné instanci DSVM, a nemusí mít vyhrazenou instanci pro každou sadu uživatelů. Tento přístup poskytuje lepší dostupnost a efektivnější využití prostředků.
K vytvoření interaktivního fondu virtuálních počítačů použijte technologii škálovacích sad virtuálních počítačů Azure. Pomocí škálovacích sad můžete vytvořit a spravovat skupinu identických virtuálních počítačů s vyrovnáváním zatížení a automatickým škálováním.
Uživatel se přihlásí k IP adrese nebo ADRESE DNS hlavního fondu. Škálovací sada automaticky směruje relaci do dostupného DSVM ve škálovací sadě. Vzhledem k tomu, že uživatelé chtějí konzistentní a známé prostředí, bez ohledu na virtuální počítač, ke kterým se přihlašují, připojí všechny instance virtuálního počítače ve škálovací sadě sdílenou síťovou jednotku. Podobá se sdílené složce Azure Files nebo sdílené složce systému souborů NFS (Network File System). Sdílený pracovní prostor uživatele se obvykle uchovává v úložišti sdílených souborů připojených ke každé instanci.
Na GitHubu najdete ukázkovou šablonu Azure Resource Manageru, která vytvoří škálovací sadu s instancemi DSVM s Ubuntu. Stejné umístění hostuje ukázku souboru parametrů pro šablonu Azure Resource Manageru.
Zadejte hodnoty pro soubor parametrů v Azure CLI a vytvořte škálovací sadu ze šablony Azure Resource Manageru:
az group create --name [[NAME OF RESOURCE GROUP]] --location [[ Data center. For eg: "West US 2"]
az deployment group create --resource-group [[NAME OF RESOURCE GROUP ABOVE]] --template-uri https://raw.githubusercontent.com/Azure/DataScienceVM/master/Scripts/CreateDSVM/Ubuntu/dsvm-vmss-cluster.json --parameters @[[PARAMETER JSON FILE]]
Tyto příkazy předpokládají, že máte:
- Kopie souboru parametrů s hodnotami zadanými pro vaši instanci škálovací sady
- Počet instancí virtuálních počítačů
- Ukazatele na sdílenou složku Azure Files
- Přihlašovací údaje pro účet úložiště, který se připojí k jednotlivým virtuálním počítačům
Příkazy místně odkazují na soubor parametrů. Můžete také předat vložené parametry nebo je zobrazit ve skriptu.
Předchozí šablona umožňuje SSH a port JupyterHubu ze škálovací sady front-endu do back-endového fondu virtuálních počítačů s Ubuntu DSVM. Jako uživatel byste se přihlásili k virtuálnímu počítači v Secure Shellu (SSH) nebo v JupyterHubu běžným způsobem. Vzhledem k tomu, že instance virtuálních počítačů je možné dynamicky vertikálně navýšit nebo snížit, musí být jakýkoli stav uložen v připojené sdílené složce Azure Files. Stejný přístup můžete použít k vytvoření fondu virtuálních počítačů dsVM s Windows.
Skript , který připojí sdílenou složku Azure Files, je také k dispozici v úložišti Azure Data ScienceVM na GitHubu. Skript připojí sdílenou složku Azure Files k zadanému přípojovému bodu v souboru parametrů. Skript také vytvoří obnovitelné odkazy na připojenou jednotku v počátečním domovském adresáři uživatele. Adresář poznámkového bloku specifický pro uživatele ve sdílené složce Azure Files je s adresářem propojený $HOME/notebooks/remote
, aby uživatelé měli přístup k poznámkovým blokům Jupyter, mohli je spouštět a ukládat. Stejnou konvenci můžete použít při vytváření více uživatelů na virtuálním počítači, abyste mohli odkazovat pracovní prostor Jupyter každého uživatele na sdílenou složku Azure Files.
Škálovací sady virtuálních počítačů podporují automatické škálování. Můžete nastavit pravidla o tom, kdy vytvořit další instance a kdy vertikálně snížit kapacitu instancí. Můžete například vertikálně snížit kapacitu na nula instancí, abyste ušetřili náklady na využití cloudového hardwaru, když se virtuální počítače vůbec nepoužívají. Stránky dokumentace ke škálovacím sadám virtuálních počítačů obsahují podrobné kroky pro automatické škálování.