빠른 시작: Azure HDInsight에서 HBase Shell을 사용하여 Apache HBase 쿼리

이 빠른 시작에서는 Apache HBase 셸을 사용하여 HBase 테이블을 만들고 데이터를 삽입한 다음, 테이블을 쿼리하는 방법을 알아봅니다.

Azure 구독이 아직 없는 경우 시작하기 전에 체험 계정을 만듭니다.

필수 조건

테이블을 만든 후 데이터 조작

대부분의 사람들의 경우, 데이터는 테이블 형식으로 나타납니다.

HDInsight Apache HBase tabular data.

Cloud BigTable의 구현인 HBase에서는 동일한 데이터가 다음과 같이 표시됩니다.

HDInsight Apache HBase BigTable data.

SSH를 사용하여 HBase 클러스터를 연결한 다음, Apache HBase 셸을 사용하여 HBase 테이블을 만들고 데이터를 삽입하고 데이터를 쿼리할 수 있습니다.

  1. ssh 명령을 사용하여 HBase 클러스터에 연결합니다. CLUSTERNAME을 클러스터의 이름으로 대체하여 아래 명령을 편집한 다음, 다음 명령을 입력합니다.

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. hbase shell 명령을 사용하여 HBase 대화형 셸을 시작합니다. SSH 연결에서 다음 명령을 입력합니다.

    hbase shell
    
  3. create 명령을 사용하여 두 열 패밀리가 있는 HBase 테이블을 만듭니다. 다음 명령을 입력합니다.

    create 'Contacts', 'Personal', 'Office'
    
  4. list 명령을 사용하여 HBase에 모든 테이블을 나열합니다. 다음 명령을 입력합니다.

    list
    
  5. put 명령을 사용하여 특정 테이블의 지정된 행에서 지정된 열에 값을 삽입합니다. 다음 명령을 입력합니다.

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. scan 명령을 사용하여 Contacts 테이블 데이터를 검사하고 반환합니다. 다음 명령을 입력합니다.

    scan 'Contacts'
    
  7. get 명령을 사용하여 행의 콘텐츠를 페치합니다. 다음 명령을 입력합니다.

    get 'Contacts', '1000'
    

    행이 하나만 있기 때문에 scan 명령을 사용하면 동일한 결과가 표시됩니다.

  8. delete 명령을 사용하여 테이블에서 셀 값을 삭제합니다. 다음 명령을 입력합니다.

    delete 'Contacts', '1000', 'Office:Address'
    
  9. disable 명령을 사용하여 테이블을 사용하지 않도록 설정합니다. 다음 명령을 입력합니다.

    disable 'Contacts'
    
  10. drop 명령을 사용하여 HBase에서 테이블을 삭제합니다. 다음 명령을 입력합니다.

    drop 'Contacts'
    
  11. exit 명령을 사용하여 HBase 대화형 셸을 중지합니다. 다음 명령을 입력합니다.

    exit
    

HBase 테이블 스키마에 대한 자세한 내용은 Apache HBase 스키마 디자인 소개를 참조하세요. HBase 명령에 대한 자세한 내용은 Apache HBase 참조 가이드를 참조하세요.

리소스 정리

빠른 시작을 완료한 후 클러스터를 삭제하는 것이 좋습니다. HDInsight를 사용하면 데이터가 Azure Storage에 저장되기 때문에 클러스터를 사용하지 않을 때 안전하게 삭제할 수 있습니다. HDInsight 클러스터를 사용하지 않는 기간에도 요금이 청구됩니다. 클러스터에 대한 요금이 스토리지에 대한 요금보다 몇 배 더 많기 때문에, 클러스터를 사용하지 않을 때는 삭제하는 것이 경제적인 면에서 더 합리적입니다.

클러스터를 삭제하려면 브라우저, PowerShell 또는 Azure CLI를 사용하여 HDInsight 클러스터 삭제를 참조하세요.

다음 단계

이 빠른 시작에서는 Apache HBase 셸을 사용하여 HBase 테이블을 만들고 데이터를 삽입한 다음, 테이블을 쿼리하는 방법을 알아봅니다. HBase에 저장된 데이터에 대해 자세히 알아보려면 다음 문서에 Apache Spark를 사용하여 쿼리를 실행하는 방법이 나와 있습니다.