你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

教程：使用 Synapse 工作区通过 IntelliJ 创建 Apache Spark 应用程序

本教程演示如何使用 Azure Toolkit for IntelliJ 插件开发以 Scala 编写的 Apache Spark 应用程序，并将其直接从 IntelliJ 集成开发环境 (IDE) 提交到无服务器 Apache Spark 池。可按多种方式使用该插件：

在本教程中，你将了解如何执行以下操作：

先决条件

IntelliJ IDEA 社区版。
Azure 工具包插件 3.27.0-2019.2 – 从 IntelliJ 插件存储库安装
JDK（版本 1.8）。
Scala 插件 – 从 IntelliJ 插件存储库安装。
以下先决条件仅适用于 Windows 用户：

在 Windows 计算机上运行本地 Spark Scala 应用程序时，可能会发生 SPARK-2356 中所述的异常。发生此异常的原因是 Windows 中缺少 WinUtils.exe。若要解决此错误，请将 WinUtils 可执行文件下载到某个位置（例如 C:\WinUtils\bin）。然后，必须添加环境变量 HADOOP_HOME，并将其值设置为 C:\WinUtils。

启动 IntelliJ IDEA，选择“创建新项目”打开“新建项目”窗口。
从左侧窗格中选择“Apache Spark/HDInsight”。
在主窗口中选择“Spark 项目和示例(Scala)”。
在“生成工具”下拉列表中选择以下类型之一：
- Maven：支持 Scala 项目创建向导。
- SBT：用于管理依赖项和生成 Scala 项目。
选择“下一步”。

在“新建项目”窗口中提供以下信息：

属性	说明
项目名称	输入名称。本教程使用 `myApp`。
项目位置	输入所需的项目保存位置。
项目 SDK	首次使用 IDEA 时，此字段可能是空白的。选择“新建...”并导航到 JDK。
Spark 版本	创建向导集成了适当版本的 Spark SDK 和 Scala SDK。可以在此处选择所需的 Spark 版本。

选择 Apache Spark SDK

选择“完成”。可能需要在几分钟后才会显示该项目。
Spark 项目自动为你创建项目。若要查看项目，请执行以下操作：

a. 在菜单栏中，导航到“文件”>“项目结构...”。

b. 在“项目结构”窗口中选择“项目”。

c. 查看项目后选择“取消”。
通过“myApp”>“src”>“main”>“scala”>“sample”>“LogQuery”找到“LogQuery”。本教程使用 LogQuery 来运行。

登录到 Azure 订阅以连接到 Spark 池。

创建 Scala 应用程序后，可以远程运行该应用程序。

在“运行/调试配置”窗口中提供以下值，然后选择“确定”：

properties	值
Spark 池	选择要在其上运行应用程序的 Spark 池。
选择要提交的项目	保留默认设置。
主类名	默认值是所选文件中的主类。可以通过选择省略号图标 (...) 并选择另一个类来更改类。
作业配置	可以更改默认的键和值。有关详细信息，请参阅 Apache Livy REST API。
命令行参数	如果需要，可为 main 类输入参数并以空格分隔。
引用的 Jar 和引用的文件	可以输入引用的 Jar 和引用的文件的路径（如果有）。还可以在 Azure 虚拟文件系统中浏览文件，但目前仅支持 ADLS 第 2 代群集。更多相关信息：Apache Spark 配置和如何将资源上传到群集。
作业上传存储	展开以显示其他选项。
存储类型	从下拉列表中选择“使用 Azure Blob 上传”或“使用群集默认存储帐户上传” 。
存储帐户	输入存储帐户。
存储密钥	输入存储密钥。
存储容器	输入“存储帐户”和“存储密钥”后，从下拉列表中选择你的存储容器。

“Spark 提交”对话框 1

选择“SparkJobRun”图标将项目提交到选定的 Spark 池。底部的“群集中的远程 Spark 任务”选项卡显示作业执行进度。可以选择红色按钮来停止应用程序。

可以按照以下说明为 Apache Spark 作业设置本地运行和本地调试。

打开“运行/调试配置”对话框，选择加号图标 (+)。然后选择“Synapse 上的 Apache Spark”选项。输入“名称”、“Main 类名”的信息以保存。
- 环境变量和 WinUtils.exe 位置仅适用于 Windows 用户。
- 环境变量：如果以前已设置系统环境变量，系统可以自动检测到该变量，无需手动添加。
- WinUtils.exe 位置：可以通过选择右侧的文件夹图标来指定 WinUtils 位置。
然后选择本地播放按钮。
本地运行完成后，如果脚本包含输出，则可在“data”>“default”中检查输出文件。