Apache Kafka 워크로드를 Azure HDInsight 4.0으로 마이그레이션

Azure HDInsight 4.0는 성능, 연결 및 보안이 크게 향상된 최신 오픈 소스 구성 요소를 제공합니다. 이 문서에서는 HDInsight 3.6의 Apache Kafka 워크로드를 HDInsight 4.0으로 마이그레이션하는 방법에 대해 설명합니다. 워크로드를 HDInsight 4.0으로 마이그레이션한 후에는 HDInsight 3.6에서 사용할 수 없는 여러 가지 새로운 기능을 사용할 수 있습니다.

HDInsight 3.6 Kafka 마이그레이션 경로

HDInsight 3.6은 두 가지 버전의 Kafka: 1.0.0 및 1.1.0을 지원합니다. HDInsight 4.0은 1.1.0 및 2.1.0 버전을 지원합니다. 어떤 버전의 Kafka 및 실행하려는 HDInsight 버전에 따라 지원되는 마이그레이션 경로가 여러 개 있습니다. 이러한 경로는 아래에 설명되어 있으며 아래 다이어그램에 나와 있습니다.

  • 최신 버전에서 Kafka 및 HDInsight 모두 실행(권장): Kafka 2.1.0(아래 경로 D 및 E)을 사용하여 HDInsight 3.6 및 Kafka 1.0.0 또는 1.1.0 애플리케이션을 HDInsight 4.0으로 마이그레이션합니다.
  • 최신 버전에서 HDInsight를 실행하지만 더 최신 버전에서는 Kafka만 실행: HDInsight 3.6 및 Kafka 1.0.0 애플리케이션을 Kafka 1.1.0(아래 경로 B)을 사용하여 HDInsight 4.0으로 마이그레이션합니다.
  • 최신 버전에서 HDInsight를 실행하지만 Kafka 버전 보존: HDInsight 3.6 및 Kafka 1.1.0 애플리케이션을 Kafka 1.1.0(아래 경로 C)을 사용하여 HDInsight 4.0으로 마이그레이션합니다.
  • 더 최신 버전에서 Kafka를 실행하고 HDInsight 버전 보존: Kafka 1.0.0 애플리케이션을 1.1.0로 마이그레이션하고 HDInsight 3.6(아래 경로 A)에서 유지합니다. 이 옵션은 여전히 새 클러스터를 배포해야 합니다. 기존 클러스터에서 Kafka 버전 업그레이드는 지원되지 않습니다. 원하는 버전으로 클러스터를 만든 후 새 클러스터를 사용하도록 Kafka 클라이언트를 마이그레이션합니다.

Upgrade paths for Apache Kafka on 3.6.

Apache Kafka 버전

Kafka 1.1.0

Kafka 1.0.0에서 1.1.0로 마이그레이션하는 경우 다음과 같은 새로운 기능을 활용할 수 있습니다.

  • Kafka 컨트롤러에 대한 향상된 기능을 통해 제어되는 종료 시간이 단축되므로 broker를 다시 시작하여 문제를 더 빠르게 복구할 수 있습니다.
  • 클러스터에 더 많은 파티션(따라서 더 많은 항목)을 포함할 수 있는 FetchRequests 논리가 개선되었습니다.
  • Kafka Connect는 토픽에 대한 레코드 헤더정규식을 지원합니다.

업데이트의 전체 목록은 Apache Kafka 1.1 릴리스 정보를 참조하세요.

Apache Kafka 2.1.0

Kafka 2.1로 마이그레이션하면 다음과 같은 기능을 활용할 수 있습니다.

  • 향상된 복제 프로토콜 때문에 broker 복원력이 향상되었습니다.
  • KafkaAdminClient API의 새로운 기능
  • 구성 가능한 할당량 관리
  • Zstandard 압축 지원

업데이트의 전체 목록은 Apache Kafka 2.0 릴리스 정보Apache Kafka 2.1 릴리스 정보를 참조하세요.

Kafka 클라이언트 호환성

새 Kafka broker는 이전 클라이언트를 지원합니다. KIP-35 - 프로토콜 버전 검색은 Kafka broker의 기능을 동적으로 결정하기 위한 메커니즘을 도입하며 KIP-97: 향상된 Kafka Client RPC 호환성 정책은 새 호환성 정책과 Java 클라이언트용 보장을 도입합니다. 이전에는 Kafka 클라이언트는 동일한 버전이나 최신 버전의 broker와 상호 작용해야 했습니다. 이제 최신 버전의 Java 클라이언트 및 librdkafka와 같은 KIP-35을 지원하는 다른 클라이언트가 이전 요청 형식으로 대체되거나 기능을 사용할 수 없는 경우 적절한 오류를 throw할 수 있습니다.

Upgrade Kafka client compatibility.

이것은 클라이언트에서 이전 broker를 지원한다는 것을 의미하지 않습니다. 자세한 내용은 호환성 매트릭스를 참조하세요.

일반 마이그레이션 프로세스

다음 마이그레이션 지침은 단일 가상 네트워크에서 HDInsight 3.6에 Apache Kafka 1.0.0 또는 1.1.0 클러스터를 배포했다고 가정합니다. 기존 broker에는 몇 가지 토픽이 있으며 생산자와 소비자가 적극적으로 사용하고 있습니다.

Current Kafka presumed environment.

마이그레이션을 완료하려면 다음 단계를 수행합니다.

  1. 테스트를 위해 새 HDInsight 4.0 클러스터 및 클라이언트를 배포합니다. 새 HDInsight 4.0 Kafka 클러스터를 배포합니다. 여러 Kafka 클러스터 버전을 선택할 수 있는 경우 최신 버전을 선택하는 것이 좋습니다. 배포 후 필요에 따라 몇 가지 매개 변수를 설정하고 기존 환경과 동일한 이름으로 토픽을 만듭니다. 또한 TLS를 설정하고 필요에 따라 BYOK(bring-your-own-key) 암호화를 수행합니다. 그런 다음, 새 클러스터에서 올바르게 작동하는지 확인합니다.

    Deploy new HDInsight 4.0 clusters.

  2. 생산자 애플리케이션의 클러스터를 전환하고 모든 큐 데이터를 현재 소비자가 사용할 때까지 기다립니다. 새 HDInsight 4.0 Kafka 클러스터가 준비되면 기존 생산자 대상을 새 클러스터로 전환합니다. 기존 소비자 앱이 기존 클러스터의 모든 데이터를 사용하기 전까지는 그대로 둡니다.

    Switch cluster for producer app.

  3. 소비자 애플리케이션에서 클러스터를 전환합니다. 기존 소비자 애플리케이션에서 기존 클러스터의 모든 데이터 사용을 완료했는지 확인한 후 새 클러스터로 연결을 전환합니다.

    Switch cluster on consumer app.

  4. 이전 클러스터를 제거하고 필요에 따라 애플리케이션을 테스트합니다. 스위치가 완료되고 제대로 작동하면 이전 HDInsight 3.6 Kafka 클러스터와 테스트에 사용된 생산자와 소비자를 필요에 따라 제거합니다.

다음 단계