Porty používané službami Apache Hadoop ve službě HDInsight
Tento dokument obsahuje seznam portů používaných službami Apache Hadoop spuštěnými v clusterech HDInsight. Poskytuje také informace o portech používaných pro připojení ke clusteru pomocí SSH.
Veřejné porty vs. neveřejné porty
Clustery HDInsight se systémem Linux zveřejňují na internetu pouze tři porty: 22, 23 a 443. Tyto porty zabezpečují přístup ke clusteru pomocí SSH a služeb vystavených přes zabezpečený protokol HTTPS.
HDInsight implementuje několik Virtual Machines Azure (uzlů clusteru) běžících na Virtual Network Azure. Z virtuální sítě můžete přistupovat k portům, které nejsou zpřístupněny přes internet. Pokud se k hlavnímu uzlu připojíte přes SSH, budete mít přímý přístup ke službám spuštěným na uzlech clusteru.
Důležité
Pokud jako možnost konfigurace pro HDInsight nezadáte azure Virtual Network, vytvoří se automaticky. K této virtuální síti ale nemůžete připojit další počítače (například jiné Virtual Machines Azure nebo počítač pro vývoj klientů).
Pokud chcete k virtuální síti připojit další počítače, musíte nejprve vytvořit virtuální síť a pak ji zadat při vytváření clusteru HDInsight. Další informace najdete v tématu Plánování virtuální sítě pro HDInsight.
Veřejné porty
Všechny uzly v clusteru HDInsight se nacházejí v azure Virtual Network. K uzlům není možné přistupovat přímo z internetu. Veřejná brána poskytuje přístup k internetu k následujícím portům, které jsou společné pro všechny typy clusterů HDInsight.
Služba | Port | Protokol | Description |
---|---|---|---|
Sshd | 22 | SSH | Připojí klienty k sshd na primárním hlavním uzlu. Další informace najdete v tématu Použití SSH se službou HDInsight. |
Sshd | 22 | SSH | Připojí klienty k sshd na hraničním uzlu. Další informace najdete v tématu Použití SSH se službou HDInsight. |
Sshd | 23 | SSH | Připojí klienty k sshd na sekundárním hlavním uzlu. Další informace najdete v tématu Použití SSH se službou HDInsight. |
Ambari | 443 | HTTPS | Webové uživatelské rozhraní Ambari. Viz Správa SLUŽBY HDInsight pomocí webového uživatelského rozhraní Apache Ambari. |
Ambari | 443 | HTTPS | Ambari REST API. Viz Správa SLUŽBY HDInsight pomocí rozhraní Apache Ambari REST API. |
WebHCat | 443 | HTTPS |
HCatalog REST API. Viz Použití MapReduce s Curl. |
HiveServer2 | 443 | ODBC | Připojuje se k Hivu pomocí rozhraní ODBC. Viz Připojení Excelu ke službě HDInsight pomocí ovladače Microsoft ODBC. |
HiveServer2 | 443 | JDBC | Připojí se k ApacheHive pomocí JDBC. Viz Připojení k Apache Hivu ve službě HDInsight pomocí ovladače Hive JDBC. |
Pro konkrétní typy clusterů jsou k dispozici následující:
Služba | Port | Protokol | Typ clusteru | Description |
---|---|---|---|---|
Stargate |
443 | HTTPS | HBase | HBase REST API. Viz Začínáme s používáním Apache HBase. |
Livy | 443 | HTTPS | Spark | Spark REST API. Viz Vzdálené odesílání úloh Apache Sparku pomocí Apache Livy. |
Server Spark Thrift | 443 | HTTPS | Spark | Server Spark Thrift používaný k odesílání dotazů Hive. Viz Použití Beeline s Apache Hivem ve službě HDInsight. |
Proxy REST Kafka | 443 | HTTPS | Kafka | Kafka REST API. Viz Interakce s clustery Apache Kafka ve službě Azure HDInsight pomocí proxy serveru REST. |
Authentication
Všechny služby veřejně zveřejněné na internetu musí být ověřeny:
Port | Přihlašovací údaje |
---|---|
22 nebo 23 | Přihlašovací údaje uživatele SSH zadané při vytváření clusteru |
443 | Přihlašovací jméno (výchozí: admin) a heslo nastavené při vytváření clusteru |
Neveřejné porty
Poznámka
Některé služby jsou dostupné jenom u konkrétních typů clusterů. Například HBase je k dispozici pouze u typů clusterů HBase.
Důležité
Některé služby běží současně pouze na jednom hlavním uzlu. Pokud se pokusíte připojit ke službě na primárním hlavním uzlu a dojde k chybě, zkuste to znovu pomocí sekundárního hlavního uzlu.
Ambari
Služba | Uzly | Port | Cesta URL | Protokol |
---|---|---|---|---|
Webové uživatelské rozhraní Ambari | Hlavní uzly | 8080 | / | HTTP |
Ambari REST API | Hlavní uzly | 8080 | /api/v1 | HTTP |
Příklady:
- Ambari REST API:
curl -u admin "http://10.0.0.11:8080/api/v1/clusters"
Porty HDFS
Služba | Uzly | Port | Protokol | Description |
---|---|---|---|---|
Webové uživatelské rozhraní NameNode | Hlavní uzly | 30070 | HTTPS | Webové uživatelské rozhraní pro zobrazení stavu |
Služba metadat NameNode | hlavní uzly | 8020 | IPC | Metadata systému souborů |
Datový uzel | Všechny pracovní uzly | 30075 | HTTPS | Webové uživatelské rozhraní pro zobrazení stavu, protokolů atd. |
Datový uzel | Všechny pracovní uzly | 30010 | Přenos dat | |
Datový uzel | Všechny pracovní uzly | 30020 | IPC | Operace s metadaty |
Sekundární uzel NameNode | Hlavní uzly | 50090 | HTTP | Kontrolní bod pro metadata uzlu NameNode |
Porty YARN
Služba | Uzly | Port | Protokol | Description |
---|---|---|---|---|
Resource Manager webové uživatelské rozhraní | Hlavní uzly | 8088 | HTTP | Webové uživatelské rozhraní pro Resource Manager |
Resource Manager webové uživatelské rozhraní | Hlavní uzly | 8090 | HTTPS | Webové uživatelské rozhraní pro Resource Manager |
rozhraní pro správu Resource Manager | hlavní uzly | 8141 | IPC | Pro odesílání aplikací (Hive, server Hive, Pig atd.) |
plánovač Resource Manager | hlavní uzly | 8030 | HTTP | Rozhraní pro správu |
Resource Manager aplikační rozhraní | hlavní uzly | 8050 | HTTP | Adresa rozhraní správce aplikací |
NodeManager | Všechny pracovní uzly | 30050 | Adresa správce kontejnerů | |
Webové uživatelské rozhraní služby NodeManager | Všechny pracovní uzly | 30060 | HTTP | Resource Manager rozhraní |
Adresa časové osy | Hlavní uzly | 10200 | RPC | Služba RPC služby Časová osa. |
Webové uživatelské rozhraní časové osy | Hlavní uzly | 8188 | HTTP | Webové uživatelské rozhraní služby Časové osy |
Porty Hivu
Služba | Uzly | Port | Protokol | Description |
---|---|---|---|---|
HiveServer2 | Hlavní uzly | 10001 | Thrift | Služba pro připojení k Hivu (Thrift/JDBC) |
Metastore Hive | Hlavní uzly | 9083 | Thrift | Služba pro připojení k metadatům Hivu (Thrift/JDBC) |
Porty WebHCat
Služba | Uzly | Port | Protokol | Description |
---|---|---|---|---|
Server WebHCat | Hlavní uzly | 30111 | HTTP | Webové rozhraní API a HCatalog další služby Hadoop |
Porty MapReduce
Služba | Uzly | Port | Protokol | Description |
---|---|---|---|---|
JobHistory | Hlavní uzly | 19888 | HTTP | Webové uživatelské rozhraní JobHistory MapReduce |
JobHistory | Hlavní uzly | 10020 | MapReduce JobHistory Server | |
Obslužná rutina shuffleHandler | 13562 | Přenáší zprostředkující výstupy mapování do žádajících reduktorů. |
Oozie
Služba | Uzly | Port | Protokol | Description |
---|---|---|---|---|
Server Oozie | Hlavní uzly | 11000 | HTTP | Adresa URL pro službu Oozie |
Server Oozie | Hlavní uzly | 11001 | HTTP | Port pro správce Oozie |
Metriky Ambari
Služba | Uzly | Port | Protokol | Description |
---|---|---|---|---|
TimeLine (historie aplikace) | Hlavní uzly | 6188 | HTTP | Webové uživatelské rozhraní služby TimeLine |
TimeLine (historie aplikace) | Hlavní uzly | 30200 | RPC | Webové uživatelské rozhraní služby TimeLine |
Porty HBase
Služba | Uzly | Port | Protokol | Description |
---|---|---|---|---|
HMaster | Hlavní uzly | 16000 | ||
Webové uživatelské rozhraní HMaster info | Hlavní uzly | 16010 | HTTP | Port pro hlavní webové uživatelské rozhraní HBase |
Oblastní server | Všechny pracovní uzly | 16020 | ||
Webové uživatelské rozhraní informací o regionovém serveru | Všechny pracovní uzly | 16030 | HTTP | Port webového uživatelského rozhraní serveru oblasti HBase |
2181 | Port, který klienti používají pro připojení k ZooKeeperu |
Porty Kafka
Služba | Uzly | Port | Protokol | Description |
---|---|---|---|---|
Zprostředkovatel | Pracovní uzly | 9092 | Protokol kafka wire | Používá se ke komunikaci s klientem. |
Uzly Zookeeper | 2181 | Port, který klienti používají pro připojení k Zookeeperu | ||
Proxy server REST | Uzly pro správu Kafka | 9400 | HTTPS | Specifikace Rest Kafka |
Porty Sparku
Služba | Uzly | Port | Protokol | Cesta URL | Description |
---|---|---|---|---|---|
Servery Spark Thrift | Hlavní uzly | 10002 | Thrift | Služba pro připojení k Spark SQL (Thrift/JDBC) | |
Server Livy | Hlavní uzly | 8998 | HTTP | Služba pro spouštění příkazů, úloh a aplikací | |
Jupyter Notebooks | Hlavní uzly | 8001 | HTTP | Jupyter Notebook web |
Příklady:
- Livy:
curl -u admin -G "http://10.0.0.11:8998/"
. V tomto příkladu10.0.0.11
je IP adresa hlavního uzlu, který je hostitelem služby Livy.