你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

如何创建使用 Azure Cosmos DB for NoSQL 和更改源处理器的 Java 应用

适用范围: NoSQL

Azure Cosmos DB 是 Microsoft 提供的一项完全托管的 NoSQL 数据库服务。 通过它,可轻松构建全球分布且高度可缩放的应用程序。 本操作指南将指导你完成创建 Java 应用程序的过程,该应用程序使用 Azure Cosmos DB for NoSQL 数据库,并实现用于实时数据处理的更改源处理器。 此 Java 应用使用 Azure Cosmos DB Java SDK v4 与 Azure Cosmos DB for NoSQL 通信。

重要

本教程仅适用于 Azure Cosmos DB Java SDK v4。 有关详细信息,请查看 Azure Cosmos DB Java SDK v4 发行说明Maven 存储库Azure Cosmos DB 中的更改源处理器和 Azure Cosmos DB Java SDK v4 故障排除指南。 如果你当前使用的是早于 v4 的版本,请参阅迁移到 Azure Cosmos DB Java SDK v4 指南,获取升级到 v4 的相关帮助。

先决条件

背景

Azure Cosmos DB 更改源提供了事件驱动的接口,用于触发操作来响应具有多种用途的文档插入。

管理更改源事件的工作主要由 SDK 中内置的更改源处理器库来完成。 此库足够强大,可以根据需要在多个工作线程之间分配更改源事件。 你所要做的就是为更改源库提供回调。

这个简单的 Java 应用程序示例演示了使用 Azure Cosmos DB 和更改源处理器进行实时数据处理的情况。 该应用程序将示例文档插入“源容器”来模拟数据流。 绑定到源容器的更改源处理器处理传入的更改并记录文档内容。 该处理器会自动管理并行处理的租约。

源代码

可克隆 SDK 示例存储库,并在 SampleChangeFeedProcessor.java 中找到此示例:

git clone https://github.com/Azure-Samples/azure-cosmos-java-sql-api-samples.git
cd azure-cosmos-java-sql-api-sample/src/main/java/com/azure/cosmos/examples/changefeed/

演练

  1. 使用 Azure Cosmos DB 和 Azure Cosmos DB Java SDK V4 在 Java 应用程序中配置 ChangeFeedProcessorOptionsChangeFeedProcessorOptions 提供在数据处理期间控制更改源处理器行为的基本设置。

    options = new ChangeFeedProcessorOptions();
    options.setStartFromBeginning(false);
    options.setLeasePrefix("myChangeFeedDeploymentUnit");
    options.setFeedPollDelay(Duration.ofSeconds(5));
    options.setFeedPollThroughputControlConfig(throughputControlGroupConfig);
    
  2. 使用相关配置来初始化 ChangeFeedProcessor,包括主机名、源容器、租用容器和数据处理逻辑。 start() 方法会启动数据处理,从而对来自源容器的传入数据更改进行并发和实时处理。

    logger.info("Start Change Feed Processor on worker (handles changes asynchronously)");
    ChangeFeedProcessor changeFeedProcessorInstance = new ChangeFeedProcessorBuilder()
        .hostName("SampleHost_1")
        .feedContainer(feedContainer)
        .leaseContainer(leaseContainer)
        .handleChanges(handleChanges())
        .options(options)
        .buildChangeFeedProcessor();
    changeFeedProcessorInstance.start()
                               .subscribeOn(Schedulers.boundedElastic())
                               .subscribe();
    
  3. 指定委托使用 handleChanges() 方法来处理传入的数据更改。 该方法会处理从更改源接收的 JsonNode 文档。 作为开发人员,你有两种方法来处理更改源提供给你的 JsonNode 文档。 一种方法是以 JsonNode 的形式操作文档。 这非常有用,尤其是当你没有一个适合所有文档的统一数据模型时。 第二种方法是将 JsonNode 转换为与 JsonNode 具有相同结构的 POJO。 然后,你可以在 POJO 上操作。

    private static Consumer<List<JsonNode>> handleChanges() {
        return (List<JsonNode> docs) -> {
            logger.info("Start handleChanges()");
    
            for (JsonNode document : docs) {
                try {
                    //Change Feed hands the document to you in the form of a JsonNode
                    //As a developer you have two options for handling the JsonNode document provided to you by Change Feed
                    //One option is to operate on the document in the form of a JsonNode, as shown below. This is great
                    //especially if you do not have a single uniform data model for all documents.
                    logger.info("Document received: " + OBJECT_MAPPER.writerWithDefaultPrettyPrinter()
                            .writeValueAsString(document));
    
                    //You can also transform the JsonNode to a POJO having the same structure as the JsonNode,
                    //as shown below. Then you can operate on the POJO.
                    CustomPOJO2 pojo_doc = OBJECT_MAPPER.treeToValue(document, CustomPOJO2.class);
                    logger.info("id: " + pojo_doc.getId());
    
                } catch (JsonProcessingException e) {
                    e.printStackTrace();
                }
            }
            isWorkCompleted = true;
            logger.info("End handleChanges()");
    
        };
    }
    
  4. 生成和运行 Java 应用程序。 该应用程序会启动更改源处理器,将示例文档插入源容器,并处理传入的更改。

结束语

在本指南中,你了解了如何使用 Azure Cosmos DB Java SDK V4 创建 Java 应用程序,该应用程序使用 Azure Cosmos DB for NoSQL 数据库,并使用更改源处理器来实时处理数据。 可以扩展此应用程序来处理更复杂的用例,并使用 Azure Cosmos DB 构建可靠、可缩放的全球分布式应用程序。

其他资源

后续步骤

现在,可通过以下文章继续详细了解更改源估算器: