Databricks Git 폴더에 대한 Git 통합

Databricks Git 폴더는 Azure Databricks의 시각적 Git 클라이언트 및 API입니다. Databricks Repos는 리포지토리 복제, 커밋 및 푸시, 끌어오기, 분기 관리, 커밋할 때 차이점의 시각적 비교와 같은 일반적인 Git 작업을 지원합니다.

Git 폴더 내에서 Notebook 또는 다른 파일로 코드를 개발하고 버전 제어, 협업 및 CI/CD에 Git을 사용하여 데이터 과학 및 엔지니어링 코드 개발 모범 사례를 따를 수 있습니다.

참고 항목

Git 폴더(Repos)는 주로 작성 및 협업 워크플로를 위해 디자인되었습니다.

Databricks Git 폴더로 무엇을 할 수 있나요?

Databricks Git 폴더는 Git 공급자와 통합하여 데이터 및 AI 프로젝트에 대한 소스 제어를 제공합니다.

Databricks Git 폴더에서 Git 기능을 사용하여 다음을 수행할 수 있습니다.

  • 원격 Git 리포지토리를 복제하고, 원격 Git 리포지토리로 푸시하고, 원격 Git 리포지토리에서 끌어옵니다.
  • 병합, 다시 지정 및 충돌 해결을 포함하여 개발 작업을 위한 분기를 만들고 관리합니다.
  • IPYNB Notebook을 포함하여 Notebook을 만들고 해당 Notebook 및 기타 파일을 편집합니다.
  • 커밋 시 차이점을 시각적으로 비교하고 병합 충돌을 해결합니다.

단계별 지침은 Databricks Git 폴더(Repos)에서 Git 작업 실행을 참조하세요.

참고 항목

Databricks Git 폴더에는 CI/CD 파이프라인과 통합할 수 있는 API도 있습니다. 예를 들어 Databricks 리포지토리를 프로그래밍 방식으로 업데이트하여 항상 최신 코드 버전을 사용하도록 할 수 있습니다. Databricks Git 폴더를 사용한 코드 개발 모범 사례에 대한 자세한 내용은 Git 및 Databricks Git 폴더(Repos)를 사용하는 CI/CD 기술을 참조하세요.

Azure Databricks에서 지원되는 Notebook의 종류에 대한 자세한 내용은 Databricks Notebook 내보내기 및 가져오기를 참조하세요.

지원되는 Git 공급자

Databricks Git 폴더는 통합 Git 리포지토리에서 지원됩니다. 리포지토리는 다음 섹션에 나열된 클라우드 및 엔터프라이즈 Git 공급자에서 호스트할 수 있습니다.

참고 항목

"Git 공급자"란?

"Git 공급자"는 Git을 기반으로 소스 제어 모델을 호스트하는 특정(명명된) 서비스입니다. Git 기반 소스 제어 플랫폼은 개발 회사가 호스트하는 클라우드 서비스 또는 자체 하드웨어에서 자체 회사가 설치 및 관리하는 온-프레미스 서비스와 같은 두 가지 방법으로 호스트됩니다. GitHub, Microsoft, GitLab 및 Atlassian과 같은 많은 Git 공급자는 클라우드 기반 SaaS와 온-프레미스("자체 관리"라고도 함) Git 서비스를 모두 제공합니다.

구성 중에 Git 공급자를 선택할 때는 클라우드(SaaS)와 온-프레미스 Git 공급자 간의 차이점을 알고 있어야 합니다. 온-프레미스 솔루션은 일반적으로 회사 VPN 뒤에서 호스트되며 인터넷에서 액세스할 수 없습니다. 일반적으로 온-프레미스 Git 공급자의 이름은 "서버" 또는 "자체 관리"로 끝나지만 확실하지 않은 경우 회사 관리자에게 문의하거나 Git 공급자의 설명서를 검토하세요.

Git 공급자가 클라우드 기반이고 지원되는 공급자로 나열되지 않은 경우 공급자로 "GitHub"를 선택하면 작동할 수 있지만 보장되지는 않습니다.

참고 항목

"GitHub"를 공급자로 사용하고 있으며 클라우드 또는 온-프레미스 버전 중 무엇을 사용하는지 여전히 확실하지 않은 경우 GitHub 문서의 About GitHub Enterprise Server를 참조하세요.

Databricks에서 지원하는 클라우드 Git 공급자

  • GitHub, GitHub AE 및 GitHub Enterprise Cloud
  • Atlassian BitBucket Cloud
  • GitLab 및 GitLab EE
  • Microsoft Azure DevOps(Azure Repos)

Databricks에서 지원하는 온-프레미스 Git 공급자

  • GitHub Enterprise Server
  • Atlassian BitBucket 서버 및 데이터 센터
  • GitLab 자체 관리형
  • Microsoft Azure DevOps Server: 작업 영역 관리자는 URL이 dev.azure.com/* 또는 visualstudio.com/*과 일치하지 않는 경우 Microsoft Azure DevOps Server에 대한 URL 도메인 접두사를 명시적으로 허용 목록에 추가해야 합니다. 자세한 내용은 허용 목록의 URL로 사용 제한을 참조하세요.

인터넷에서 액세스할 수 없는 온-프레미스 Git 리포지토리를 통합하는 경우 Git 인증 요청에 대한 프록시도 회사의 VPN 내에 설치해야 합니다. 자세한 내용은 Azure Databricks Git 폴더(Repos)에 대한 프라이빗 Git 연결 설정을 참조하세요.

Git 공급자와 함께 액세스 토큰을 사용하는 방법을 알아보려면 Git 자격 증명 구성 및 Azure Databricks에 원격 리포지토리 연결을 참조하세요.

Git 통합을 위한 리소스

Azure Databricks와 Git 통합을 위해 Databricks CLI 2.0 사용:

다음 참조 문서를 읽습니다.

다음 단계