Trino란? (미리 보기)

참고 항목

2025년 1월 31일에 Azure HDInsight on AKS가 사용 중지됩니다. 2025년 1월 31일 이전에 워크로드가 갑자기 종료되지 않도록 워크로드를 Microsoft Fabric 또는 동등한 Azure 제품으로 마이그레이션해야 합니다. 구독의 나머지 클러스터는 호스트에서 중지되고 제거됩니다.

Important

이 기능은 현지 미리 보기로 제공됩니다. Microsoft Azure 미리 보기에 대한 보충 사용 약관에는 베타 또는 미리 보기로 제공되거나 아직 일반 공급으로 릴리스되지 않은 Azure 기능에 적용되는 더 많은 약관이 포함되어 있습니다. 이 특정 미리 보기에 대한 자세한 내용은 Azure HDInsight on AKS 미리 보기 정보를 참조하세요. 질문이나 기능 제안이 있는 경우 AskHDInsight에서 세부 정보와 함께 요청을 제출하고 Azure HDInsight 커뮤니티에서 더 많은 업데이트를 확인하세요.

Trino(이전의 PrestoSQL)는 다른 유형의 데이터 원본에 대한 페더레이션 및 대화형 분석을 위한 오픈 소스 분산 SQL 쿼리 엔진입니다. 여러 원본에서 대규모(기가바이트에서 페타바이트)로 데이터를 쿼리하여 엔터프라이즈 차원의 분석을 가능하게 할 수 있습니다.

Trino는 광범위한 분석 사용 사례에 사용되며 대화형 및 임시 쿼리에 적합합니다.

Trino에서 제공하는 주요 기능 중 일부는 다음과 같습니다.

  • 수백 개의 메모리, I/O 및 CPU 집약적 쿼리를 동시에 실행하고 클러스터 리소스를 효율적으로 활용하면서 수천 개의 작업자 노드로 확장할 수 있는 적응형 다중 테넌트 시스템.
  • 여러 시스템 통합의 복잡성을 줄이는 확장 가능하고 페더레이션된 디자인.
  • 몇 가지 주요 관련 기능 및 최적화가 포함된 고성능.
  • Hadoop 에코시스템과의 완벽한 호환성.

Trino 서버에는 코디네이터와 작업자라는 두 가지 유형이 있습니다.

코디네이터

Trino 코디네이터는 문 구문 분석, 쿼리 계획 및 Trino 작업자 노드 관리를 담당하는 서버입니다. Trino 설치의 "뇌"이며 클라이언트가 실행을 위해 문을 제출하기 위해 연결하는 노드이기도 합니다. 코디네이터는 각 작업자의 활동을 추적하고 쿼리 실행을 조정합니다. 코디네이터는 일련의 단계를 포함하는 쿼리의 논리적 모델을 만듭니다. 이 모델은 Trino 작업자 클러스터에서 실행되는 일련의 연결된 작업으로 변환됩니다.

작업자

Trino 작업자는 작업 실행 및 데이터 처리를 담당하는 Trino 설치의 서버입니다. 작업자 노드는 커넥터에서 데이터를 가져오고 중간 데이터를 서로와 교환합니다. 코디네이터는 작업자의 결과를 가져오고 최종 결과를 클라이언트에 반환할 책임이 있습니다.

Trino 아키텍처를 보여 주는 다이어그램.