Usar a API de Leitura

3 minutos

Para usar o recurso OCR de Leitura, chame a função ImageAnalysis (API REST ou método de SDK equivalente), passando a URL da imagem ou os dados binários e, opcionalmente, especificando uma legenda com neutralidade de gênero ou o idioma em que o texto está escrito (com um valor padrão de en para inglês).

Para fazer uma solicitação de OCR para ImageAnalysis, especifique o recurso visual como READ.

ImageAnalysisResult result = client.Analyze(
    <image-to-analyze>,
    VisualFeatures.Read);

Python

result = client.analyze(
    image_url=<image_to_analyze>,
    visual_features=[VisualFeatures.READ]
)

Se estiver usando a API REST, especifique o recurso como read.

https://<endpoint>/computervision/imageanalysis:analyze?features=read&...

Os resultados da função OCR de Leitura são retornados de forma síncrona, como JSON ou o objeto específico da linguagem de uma estrutura semelhante. Esses resultados são divididos em blocos (com o serviço atual usando apenas um bloco), linhas e palavras. Além disso, os valores de texto são incluídos nos níveis de linha e de palavra, facilitando a leitura de linhas inteiras de texto caso você não precise extrair texto no nível da palavra individual.

{
    "metadata":
    {
        "width": 500,
        "height": 430
    },
    "readResult":
    {
        "blocks":
        [
            {
                "lines":
                [
                    {
                        "text": "Hello World!",
                        "boundingPolygon":
                        [
                            {"x":251,"y":265},
                            {"x":673,"y":260},
                            {"x":674,"y":308},
                            {"x":252,"y":318}
                        ],
                        "words":
                        [
                            {
                                "text":"Hello",
                                "boundingPolygon":
                                [
                                    {"x":252,"y":267},
                                    {"x":307,"y":265},
                                    {"x":307,"y":318},
                                    {"x":253,"y":318}
                                ],
                            "confidence":0.996
                            },
                            {
                                "text":"World!",
                                "boundingPolygon":
                                [
                                    {"x":318,"y":264},
                                    {"x":386,"y":263},
                                    {"x":387,"y":316},
                                    {"x":319,"y":318}
                                ],
                                "confidence":0.99
                            }
                        ]
                    },
                ]
            }
        ]
    }
}

Usar a API de Leitura

Comentários