在 HDInsight Hadoop 叢集上安裝和使用 Hue

瞭解如何在 HDInsight 叢集上安裝 Hue,並使用通道將要求路由傳送至 Hue。

注意

HDInsight 4.0 和更新版本中不支援 Hue。

何謂 Hue?

Hue 是一組用來與 Apache Hadoop 叢集互動的 Web 應用程式。 您可以使用 Hue 來流覽與 Hadoop 叢集相關聯的記憶體(在 HDInsight 叢集的情況下為 WASB)、執行 Hive 作業和 Pig 腳本等等。 HDInsight Hadoop 叢集上的 Hue 安裝提供下列元件。

  • Beeswax Hive 編輯器
  • Apache Pig
  • 中繼存放區管理員
  • Apache Oozie
  • FileBrowser (與 WASB 預設容器交談)
  • 作業瀏覽器

警告

完全支援 HDInsight 叢集提供的元件,Microsoft 支援服務 有助於隔離和解決與這些元件相關的問題。

自定義元件會收到商業上合理的支援,以協助您進一步針對問題進行疑難解答。 這可能會導致解決問題,或要求您參與 開放原始碼 技術可用的頻道,其中找到這項技術的深度專業知識。 例如,有許多社群網站可以使用,例如:HDInsight 的 Microsoft Q&A 問題頁面。 https://stackoverflow.com 此外,Apache 專案在 上 https://apache.org也有項目網站,例如: Hadoop

使用腳本動作安裝 Hue

針對您的文稿動作,請使用下表中的資訊。 如需使用腳本動作的特定指示,請參閱 使用腳本動作 自定義 HDInsight 叢集。

注意

若要在 HDInsight 叢集上安裝 Hue,建議的前端節點大小至少為 A4(8 核心,14 GB 記憶體)。

屬性
指令碼類型: -自 定義
名稱 安裝 Hue
Bash 指令碼 URI https://hdiconfigactions.blob.core.windows.net/linuxhueconfigactionv02/install-hue-uber-v02.sh
節點類型: Head

執行 HIVE 查詢

  1. 從 Hue 入口網站中,選取 [查詢編輯器],然後選取 [Hive] 以開啟 Hive 編輯器。

    HDInsight hue portal use hive editor.

  2. 在 [輔助] 索引標籤的 [資料庫] 底下,您應該會看到 hivesampletable 這是隨附於 HDInsight 上所有 Hadoop 叢集的範例數據表。 在右窗格中輸入範例查詢,並在下方窗格中的 [結果] 索引標籤上查看輸出,如螢幕快照所示。

    HDInsight hue portal hive query.

    您也可以使用 [ 圖表] 索引標籤來查看結果的視覺表示法。

瀏覽叢集記憶體

  1. 從 Hue 入口網站中,選取 功能表列右上角的 [檔案瀏覽器 ]。

  2. 根據預設,檔案瀏覽器會在 /user/myuser 目錄中開啟。 選取路徑中使用者目錄前的正斜線,以移至與叢集相關聯的 Azure 記憶體容器根目錄。

    HDInsight hue portal file browser.

  3. 以滑鼠右鍵按下檔案或資料夾,以查看可用的作業。 使用右上角的 [ 上傳] 按鈕,將檔案上傳至目前目錄。 使用 [ 新增] 按鈕來建立新的檔案或目錄。

注意

Hue 檔案瀏覽器只能顯示與 HDInsight 叢集相關聯的預設容器內容。 您無法使用檔案瀏覽器存取您可能與叢集相關聯的任何其他記憶體帳戶/容器。 不過,Hive 作業一律可以存取與叢集相關聯的其他容器。 例如,如果您在Hive編輯器中輸入 命令 dfs -ls wasbs://newcontainer@mystore.blob.core.windows.net ,您也可以看到其他容器的內容。 在此命令中, newcontainer 不是與叢集相關聯的預設容器。

重要考量

  1. 用來安裝 Hue 的腳本只會將它安裝在叢集的主要前端節點上。

  2. 在安裝期間,會重新啟動多個 Hadoop 服務(HDFS、YARN、MR2、Oozie),以更新設定。 腳本完成安裝 Hue 之後,可能需要一些時間才能啟動其他 Hadoop 服務。 這可能會影響 Hue 一開始的效能。 一旦所有服務啟動時,Hue 就會完全正常運作。

  3. Hue 不瞭解 Apache Tez 作業,這是 Hive 目前的預設值。 如果您想要使用 MapReduce 作為 Hive 執行引擎,請更新腳本以在腳本中使用下列命令:

    set hive.execution.engine=mr;

  4. 使用 Linux 叢集時,您可以有一個案例,其中您的服務是在主要前端節點上執行,而 Resource Manager 可以在次要節點上執行。 使用 Hue 來檢視叢集上 RUNNING 作業的詳細數據時,這類案例可能會導致錯誤(如下所示)。 不過,您可以在作業完成時檢視作業詳細數據。

    Hue portal error sample message.

    這是因為已知問題。 因應措施是修改 Ambari,讓使用中的 Resource Manager 也會在主要前端節點上執行。

  5. Hue 瞭解 WebHDFS,而 HDInsight 叢集則使用 Azure 儲存體 使用 wasbs://。 因此,與腳本動作搭配使用的自定義腳本會安裝 WebWasb,這是與 WASB 通訊的 WebHDFS 相容服務。 因此,即使 Hue 入口網站在位置上說 HDFS (例如當您將滑鼠移至檔案瀏覽器時),它應該解譯為 WASB。

下一步

使用腳本動作自定義 HDInsight 叢集