Integrera OneLake med Azure HDInsight

Artikel
11/24/2024

Azure HDInsight är en hanterad molnbaserad tjänst för stordataanalys som hjälper organisationer att bearbeta stora mängder data. Den här självstudien visar hur du ansluter till OneLake med en Jupyter-anteckningsbok från ett Azure HDInsight-kluster.

Använda Azure HDInsight

Så här ansluter du till OneLake med en Jupyter Notebook från ett HDInsight-kluster:

Skapa ett HDInsight-kluster (HDI) Apache Spark. Följ dessa instruktioner: Konfigurera kluster i HDInsight.
1. När du tillhandahåller klusterinformation bör du komma ihåg användarnamnet och lösenordet för klusterinloggningen, eftersom du behöver dem för att komma åt klustret senare.
2. Skapa en användartilldelad hanterad identitet (UAMI): Skapa för Azure HDInsight – UAMI och välj den som identitet på lagringsskärmen .
Ge UAMI åtkomst till arbetsytan Infrastruktur som innehåller dina objekt. Hjälp med att bestämma vilken roll som är bäst finns i Arbetsyteroller.
Gå till ditt sjöhus och leta reda på namnet på din arbetsyta och lakehouse. Du hittar dem i URL:en för ditt lakehouse eller fönstret Egenskaper för en fil.
Leta efter klustret i Azure Portal och välj anteckningsboken.
Ange den information om autentiseringsuppgifter som du angav när du skapade klustret.
Skapa en ny Apache Spark-notebook-fil.

Kopiera arbetsytan och lakehouse-namnen till anteckningsboken och skapa OneLake-URL:en för ditt lakehouse. Nu kan du läsa valfri fil från den här filsökvägen.

fp = 'abfss://' + 'Workspace Name' + '@onelake.dfs.fabric.microsoft.com/' + 'Lakehouse Name' + '/Files/' 
df = spark.read.format("csv").option("header", "true").load(fp + "test1.csv") 
df.show()

Prova att skriva lite data till lakehouse.

writecsvdf = df.write.format("csv").save(fp + "out.csv")

Testa att dina data har skrivits genom att kontrollera lakehouse eller genom att läsa den nyligen inlästa filen.

Nu kan du läsa och skriva data i OneLake med hjälp av din Jupyter Notebook i ett HDI Spark-kluster.

OneLake-säkerhet

Dela via

Integrera OneLake med Azure HDInsight

Använda Azure HDInsight

Feedback

Ytterligare resurser

Dela via

Integrera OneLake med Azure HDInsight

Använda Azure HDInsight

Relaterat innehåll

Feedback

Ytterligare resurser