DataGrip 与 Azure Databricks 的集成
注意
本文介绍了 Databricks 既不提供也不支持的 DataGrip。 若要联系提供商,请参阅 DataGrip 支持。
DataGrip 是一个适用于数据库开发人员的集成开发环境 (IDE),它提供查询控制台、架构导航、解释计划、智能代码完成、实时分析和快速修复、重构、版本控制集成以及其他功能。
本文介绍了如何使用本地开发计算机来安装、配置和使用 DataGrip,以使用 Azure DataRicks 中的数据库。
注意
本文已使用 macOS、Databricks JDBC 驱动程序版本 2.6.36 和 DataGrip 版本 2023.3.1 进行了测试。
要求
安装 DataGrip 之前,本地开发计算机必须满足以下要求:
- Linux、macOS 或 Windows 操作系统。
- 将 Databricks JDBC 驱动程序下载到本地开发计算机上,从下载的
DatabricksJDBC42-<version>.zip
文件中提取DatabricksJDBC42.jar
文件。 - 要与 DataGrip 连接的 Azure Databricks 群集或 SQL 仓库。
步骤 1:安装 DataGrip
下载并安装 DataGrip。
- Linux:下载
.zip
文件,提取其内容,然后按照Install-Linux-tar.txt
文件中的说明进行操作。 - macOS:下载并运行
.dmg
文件。 - Windows:下载并运行
.exe
文件。
有关详细信息,请参阅 DataGrip 网站上的安装 DataGrip。
步骤 2:配置用于 DataGrip 的 Databricks JDBC 驱动程序
使用前面下载的 Databricks JDBC 驱动程序的相关信息设置 DataGrip。
- 启动 DataGrip。
- 单击“文件”>“数据源”。
- 在“数据源和驱动程序”对话框中,单击“驱动程序”选项卡。
- 单击“ (驱动程序)”按钮来添加驱动程序+。
- 对于“名称”,请输入
Databricks
。 - 在“常规”选项卡上的“驱动程序文件”列表中,单击“ (添加)”按钮+。
- 单击“自定义 JAR”。
- 通过浏览找到并选择你之前提取的
DatabricksJDBC42.jar
文件,然后单击“打开”。 - 对于“类”,请选择
com.databricks.client.jdbc.Driver
。 - 单击“确定”。
步骤 3:将 DataGrip 连接到你的 Azure Databricks 数据库
在 DataGrip 中,单击“文件”>“数据源”。
在“数据源”选项卡上,单击“ (添加)”按钮+。
选择在上一步添加的 Databricks 驱动程序。
在“常规”选项卡上,对于“URL”,请输入你的 Azure Databricks 资源的“JDBC URL”字段的值。 有关 JDBC URL 字段语法,请参阅 Databricks JDBC 驱动程序的身份验证设置。
单击 “测试连接”。
提示
在测试连接之前,你应当启动你的资源。 否则,测试会在资源启动的同时进行,可能需要几分钟才能完成。
如果连接成功,请在“架构”选项卡上选中你希望能够访问的架构对应的复选框,例如“所有架构”。
单击“确定”。
针对需要 DataGrip 访问的每个资源,按此步骤中的说明重复操作。
步骤4:使用 DataGrip 来浏览表
使用 DataGrip 访问你的 Azure Databricks 工作区中的表。
- 在 DataGrip 的“数据库”窗口中,依次展开你的资源节点、要浏览的架构、“tables”。
- 双击某个表。 此时会显示该表中的第一组行。
按此步骤中的说明重复操作,以访问其他表。
若要访问其他架构中的表,请在“数据库”窗口的工具栏中,单击“数据源属性”图标。 在“数据源和驱动程序”对话框中的“架构”选项卡上,选中你要访问的每个其他架构对应的复选框,然后单击“确定”。
步骤 5:使用 DataGrip 运行 SQL 语句
使用 DataGrip 从 samples
目录的 nyctaxi
架构中加载示例 trips
表。
在 DataGrip 中,单击“文件”>“新建”>“SQL 文件”。
为文件输入一个名称,例如
select_trips
。在
select_trips.sql
文件选项卡中,输入以下 SQL 语句:SELECT * FROM samples.nyctaxi.trips;
选择
SELECT
语句。在文件选项卡的工具栏上,单击“执行”图标。
后续步骤
- 详细了解 DataGrip 中的查询控制台。
- 了解 DataGrip 中的数据编辑器。
- 详细了解 DataGrip 中的各种工具窗口。
- 了解如何在 DataGrip 中进行搜索。
- 了解如何在 DataGrip 中导出数据。
- 了解如何在 DataGrip 中使用正则表达式查找和替换文本。