OCR 작업

Power Automate를 사용하면 OCR(광학 인식)을 통해 파일 내의 데이터를 읽고 추출하고 관리할 수 있습니다.

OCR 엔진을 만들고 이미지 및 문서에서 텍스트를 추출하려면 OCR로 텍스트 추출 작업을 사용합니다. 다음 예제에서는 지정된 전체 이미지에서 텍스트를 추출합니다.

OCR 작업으로 텍스트 추출 스크린샷.

모든 OCR 작업은 새 OCR 엔진 변수를 생성하거나 기존 변수를 사용할 수 있습니다. OCR 기능을 제공하는 모든 작업에서 기존 OCR 엔진 변수를 사용할 수 있습니다.

Power Automate는 Windows OCR과 Tesseract 엔진을 지원합니다. 선택한 OCR 엔진을 구성하려면 해당 작업의 OCR 엔진 설정으로 이동합니다. 사용 가능한 옵션에는 언어, 이미지 너비 및 높이 승수가 포함됩니다.

노트

  • 사용 가능한 모든 OCR 엔진은 Power Automate에 사전 설치되어 있으며 클라우드에 연결하지 않고도 로컬에서 작동합니다. 그러나 특정 언어로 된 텍스트를 추출하려면 언어 팩이나 데이터 파일을 다운로드해야 할 수도 있습니다.
  • 이미지 승수는 이미지 크기를 늘려 검색 및 텍스트 추출을 보다 효과적으로 만듭니다. 3보다 큰 값을 설정하면 잘못된 결과가 발생할 수 있습니다.

Windows OCR 엔진 사용

Power Automate의 기본 OCR 엔진은 Windows OCR 엔진입니다. Windows OCR 엔진을 사용하여 텍스트를 추출하려면 추출하려는 언어에 적절한 언어 팩을 설치해야 합니다.

적절한 언어 팩이 설치되어 있지 않으면 Power Automate에서 설치하라는 오류 메시지가 표시됩니다. 언어 팩 다운로드 및 설치에 대한 자세한 내용을 보려면 Windows용 언어 팩으로 이동하세요.

적절한 언어 팩을 설치한 후 OCR 작업의 OCR 엔진 설정을 확장하고 원하는 언어를 선택하세요. Windows OCR 엔진은 중국어(간체 및 번체), 체코어, 덴마크어, 네덜란드어, 영어, 핀란드어, 프랑스어, 독일어, 그리스어, 헝가리어, 이탈리아어, 일본어, 한국어, 노르웨이어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 세르비아어(키릴 자모 및 라틴어), 슬로바키아어, 스페인어, 스웨덴어 및 터키어를 포함한 25개 언어를 지원합니다..

Tesseract OCR 엔진 사용

노트

Tesseract OCR 엔진을 사용하려면 머신의 CPU가 AVX2 명령어 세트를 지원하는지 확인하세요.

Windows OCR 엔진 외에도 Power Automate는 Tesseract 엔진을 지원합니다. 이 엔진은 추가 구성 없이 영어, 독일어, 스페인어, 프랑스어 및 이탈리아어의 5개 언어로 텍스트를 추출할 수 있습니다.

언급된 목록 이외의 언어로 텍스트를 추출하려면 OCR 작업의 OCR 엔진 설정에서 다른 언어 사용 옵션을 사용합니다. 이 옵션을 사용하면 작업에 언어 약어언어 데이터 경로라는 두 가지 매개 변수가 추가로 표시됩니다.

언어 약어 필드는 OCR 중에 찾을 언어를 엔진에 나타냅니다. 언어 데이터 경로 필드에는 OCR 엔진 학습에 사용되는 언어 데이터 파일(.traineddata)이 포함됩니다. 이 GitHub 저장소에서 사용 가능한 모든 언어에 대한 언어 데이터 파일을 찾을 수 있습니다.

Tesseract 엔진을 사용하여 다국어 문서에서 텍스트를 추출할 수도 있습니다. 다국어 문서에서 텍스트 추출에 대한 자세한 내용은 다국어 문서에 OCR 수행에서 확인하세요.

화면의 텍스트인 경우(OCR)

주어진 텍스트가 화면에 나타나는지 여부에 따라 OCR을 사용하여 조건부 작업 블록의 시작을 표시합니다.

입력 매개 변수

인수 선택 항목 수락 기본값 Description
If text 해당 없음 있음, 없음 주어진 소스에서 분석할 텍스트가 있는지 확인 여부 지정
OCR 엔진 유형 아니요 Windows OCR 엔진, Tesseract 엔진, OCR 엔진 변수 OCR 엔진 변수 사용할 OCR 엔진 유형입니다. 미리 구성된 OCR 엔진을 선택하거나 새로 설정하세요.
OCR engine variable 아니요 OCREngineObject OCR 작업에 사용할 엔진
Text to find 아니요 텍스트 값 지정된 소스에서 검색할 텍스트
Is regular expression 해당 없음 부울 값 False 지정된 텍스트를 찾기 위해 정규 식을 사용할지 여부 지정
Search for text on 해당 없음 전체 화면, 전경 창 전체 화면 전체 보이는 화면에서 지정된 텍스트를 검색할지 아니면 전경 창에서만 검색할지 지정
Search mode 사용 불가 지정된 소스 전체, 특정 하위 영역만, 이미지에 상대적인 하위 영역 지정된 소스의 전체 전체 화면(또는 창)을 스캔할지 축소된 하위 영역을 스캔할지 지정
Image(s) 아니요 이미지목록 제공된 텍스트를 검사하기 위해 하위 지역을 지정하는 이미지(이미지의 좌측 상단 구석에 상대적)
X1 숫자 값 제공된 텍스트를 검사하기 위해 지정된 하위 지역의 시작 X 좌표
Tolerance 숫자 값 10 원래 선택한 이미지와 검색된 이미지가 얼마나 다를지 지정
Y1 숫자 값 제공된 텍스트를 검사하기 위해 지정된 하위 지역의 시작 Y 좌표
X1 숫자 값 제공된 텍스트를 검사하기 위해 지정된 이미지에 상대적인 하위 지역의 시작 X 좌표
X2 숫자 값 제공된 텍스트를 검사하기 위해 지정된 하위 지역의 끝 X 좌표
Y1 숫자 값 제공된 텍스트를 검사하기 위해 지정된 이미지에 상대적인 하위 지역의 시작 Y 좌표
Y2 숫자 값 제공된 텍스트를 검사하기 위해 지정된 하위 지역의 끝 Y 좌표
X2 숫자 값 제공된 텍스트를 검사하기 위해 지정된 이미지에 상대적인 하위 지역의 끝 X 좌표
Y2 숫자 값 제공된 텍스트를 검사하기 위해 지정된 이미지에 상대적인 하위 지역의 끝 Y 좌표
Windows OCR 언어 사용 불가 중국어(간체), 중국어(번체), 체코어, 덴마크어, 네덜란드어, 영어, 핀란드어, 프랑스어, 독일어, 그리스어, 헝가리어, 이탈리아어, 일본어, 한국어, 노르웨이어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 세르비아어(라틴어), 슬로바키아어, 스페인어, 스웨덴어 및 터키어. 영어 Windows OCR 엔진이 감지하는 텍스트의 언어입니다.
다른 언어 사용 사용 불가 부울 값 거짓 'Tesseract 언어' 필드에서 주어지지 않은 언어를 사용할지 지정
Tesseract 언어 사용 불가 영어, 독일어, 스페인어, 프랑스어, 이탈리아어 영어 Tesseract 엔진이 검사하는 텍스트의 언어
언어 약어 아니요 텍스트 값 사용할 언어의 Tesseract 약자입니다. 예를 들어 데이터가 'eng.traineddata'인 경우 이 매개 변수를 'eng'으로 설정합니다.
언어 데이터 경로 아니요 텍스트 값 지정된 언어의 Tesseract 데이터를 보유한 폴더의 경로
이미지 너비 승수 아니요 숫자 값 1 이미지의 너비 승수
이미지 높이 승수 아니요 숫자 값 1 이미지의 높이 승수
이미지 일치 알고리즘 사용 불가 기본, 고급 기본 이미지를 검색할 때 사용할 이미지 알고리즘

노트

  • Power Automate의 정규식 엔진은 .NET입니다. 정규식에 대한 자세한 내용을 보려면 정규식 언어 - 빠른 참조로 이동하세요.
  • OCR 엔진 변수 옵션은 더 이상 사용되지 않을 예정입니다.

변수 생성됨

인수 Type Description
LocationOfTextFoundX 숫자 값 화면에서 텍스트가 나타나는 지점의 X좌표입니다. 전경 창에서 검색이 수행되는 경우 반환된 좌표는 창의 왼쪽 위 모서리를 기준으로 합니다
LocationOfTextFoundY 숫자 값 화면에서 텍스트가 나타나는 지점의 X좌표입니다. 전경 창에서 검색이 수행되는 경우 반환된 좌표는 창의 왼쪽 위 모서리를 기준으로 합니다

예외

예외 Description
대화형이 아닌 모드에서 텍스트가 있는지 확인할 수 없음 대화형이 아닌 모드인 경우 화면에서 텍스트를 검사하는 것이 가능하지 않음을 나타냄
유효하지 않은 하위 지역 좌표 지정된 하위 지역 좌표가 유효하지 않음을 나타냄
OCR 텍스트를 분석하지 못함 OCR을 사용해 텍스트를 분석하는 동안 오류가 발생했음을 나타냄
OCR 엔진을 만들지 못함 OCR 엔진을 만드는 동안 오류가 발생했음을 나타냄
데이터 경로 폴더 없음 언어 데이터에 대해 지정된 폴더가 없음을 나타냄
선택한 Windows 언어 팩이 컴퓨터에 설치되어 있지 않습니다. 선택한 Windows 언어 팩이 컴퓨터에 설치되어 있지 않다는 것을 나타냅니다.
OCR 엔진 연결되지 않음 OCR 엔진이 연결되지 않음을 나타냄

화면에서 텍스트 대기(OCR)

OCR을 사용하여 특정 텍스트가 화면, 전경 창 또는 화면 또는 전경 창의 이미지에 상대적으로 나타나거나 사라질 때까지 기다립니다.

입력 매개 변수

인수 선택 항목 수락 기본값 Description
Wait for text to 해당 없음 나타남, 사라짐 나타남 제공된 텍스트가 나타나거나 사라질 때까지 대기할지 지정
OCR 엔진 유형 아니요 Windows OCR 엔진, Tesseract 엔진, OCR 엔진 변수 OCR 엔진 변수 사용할 OCR 엔진 유형입니다. 미리 구성된 OCR 엔진을 선택하거나 새로 설정하세요.
OCR engine variable 아니요 OCREngineObject OCR 작업에 사용할 엔진
Text to find 아니요 텍스트 값 지정된 소스에서 검색할 텍스트
Is regular expression 해당 없음 부울 값 False 지정된 텍스트를 찾기 위해 정규 식을 사용할지 여부 지정
Search for text on 해당 없음 전체 화면, 전경 창 전체 화면 전체 보이는 화면에서 지정된 텍스트를 검색할지 아니면 전경 창에서만 검색할지 지정
Search mode 사용 불가 지정된 소스 전체, 특정 하위 영역만, 이미지에 상대적인 하위 영역 지정된 소스의 전체 전체 화면(또는 창)을 스캔할지 축소된 하위 영역을 스캔할지 지정
Image(s) 아니요 이미지목록 제공된 텍스트를 검사하기 위해 하위 지역을 지정하는 이미지(이미지의 좌측 상단 구석에 상대적)
X1 숫자 값 제공된 텍스트를 검사하기 위해 지정된 하위 지역의 시작 X 좌표
Tolerance 숫자 값 10 원래 선택한 이미지와 검색된 이미지가 얼마나 다를지 지정
Y1 숫자 값 제공된 텍스트를 검사하기 위해 지정된 하위 지역의 시작 Y 좌표
X1 숫자 값 제공된 텍스트를 검사하기 위해 지정된 이미지에 상대적인 하위 지역의 시작 X 좌표
X2 숫자 값 제공된 텍스트를 검사하기 위해 지정된 하위 지역의 끝 X 좌표
Y1 숫자 값 제공된 텍스트를 검사하기 위해 지정된 이미지에 상대적인 하위 지역의 시작 Y 좌표
Y2 숫자 값 제공된 텍스트를 검사하기 위해 지정된 하위 지역의 끝 Y 좌표
X2 숫자 값 제공된 텍스트를 검사하기 위해 지정된 이미지에 상대적인 하위 지역의 끝 X 좌표
Y2 숫자 값 제공된 텍스트를 검사하기 위해 지정된 이미지에 상대적인 하위 지역의 끝 Y 좌표
Windows OCR 언어 사용 불가 중국어(간체), 중국어(번체), 체코어, 덴마크어, 네덜란드어, 영어, 핀란드어, 프랑스어, 독일어, 그리스어, 헝가리어, 이탈리아어, 일본어, 한국어, 노르웨이어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 세르비아어(라틴어), 슬로바키아어, 스페인어, 스웨덴어 및 터키어. 영어 Windows OCR 엔진이 감지하는 텍스트의 언어입니다.
다른 언어 사용 사용 불가 부울 값 거짓 'Tesseract 언어' 필드에서 주어지지 않은 언어를 사용할지 지정
Tesseract 언어 사용 불가 영어, 독일어, 스페인어, 프랑스어, 이탈리아어 영어 Tesseract 엔진이 검사하는 텍스트의 언어
언어 약어 아니요 텍스트 값 사용할 언어의 Tesseract 약자입니다. 예를 들어 데이터가 'eng.traineddata'인 경우 이 매개 변수를 'eng'으로 설정합니다.
언어 데이터 경로 아니요 텍스트 값 지정된 언어의 Tesseract 데이터를 보유한 폴더의 경로
이미지 너비 승수 아니요 숫자 값 1 이미지의 너비 승수
이미지 높이 승수 아니요 숫자 값 1 이미지의 높이 승수
이미지 일치 알고리즘 사용 불가 기본, 고급 기본 이미지를 검색할 때 사용할 이미지 알고리즘
시간 제한 오류로 실패 사용 불가 부울 값 False 작업이 끝까지 대기하게 할지 아니면 설정된 기간 후에 실패하게 할지를 지정합니다

노트

  • Power Automate의 정규식 엔진은 .NET입니다. 정규식에 대한 자세한 내용을 보려면 정규식 언어 - 빠른 참조로 이동하세요.
  • OCR 엔진 변수 옵션은 더 이상 사용되지 않을 예정입니다.

변수 생성됨

인수 Type Description
LocationOfTextFoundX 숫자 값 화면에서 텍스트가 나타나는 지점의 X좌표입니다. 전경 창에서 검색이 수행되는 경우 반환된 좌표는 창의 왼쪽 위 모서리를 기준으로 합니다
LocationOfTextFoundY 숫자 값 화면에서 텍스트가 나타나는 지점의 X좌표입니다. 전경 창에서 검색이 수행되는 경우 반환된 좌표는 창의 왼쪽 위 모서리를 기준으로 합니다

예외

예외 Description
대화형이 아닌 모드에서 텍스트가 있는지 확인할 수 없음 대화형이 아닌 모드인 경우 화면에서 텍스트를 검사하는 것이 가능하지 않음을 나타냄
유효하지 않은 하위 지역 좌표 지정된 하위 지역 좌표가 유효하지 않음을 나타냄
OCR 텍스트를 분석하지 못함 OCR을 사용해 텍스트를 분석하는 동안 오류가 발생했음을 나타냄
OCR 엔진을 만들지 못함 OCR 엔진을 만드는 동안 오류가 발생했음을 나타냄
데이터 경로 폴더 없음 언어 데이터에 대해 지정된 폴더가 없음을 나타냄
선택한 Windows 언어 팩이 컴퓨터에 설치되어 있지 않습니다. 선택한 Windows 언어 팩이 컴퓨터에 설치되어 있지 않다는 것을 나타냅니다.
OCR 엔진 연결되지 않음 OCR 엔진이 연결되지 않음을 나타냄
시간 제한 오류 설정된 시간 후에 작업이 실패했음을 나타냅니다.

OCR을 포함한 텍스트 추출

주어진 OCR 엔진을 사용하여 주어진 소스에서 텍스트를 추출합니다.

입력 매개 변수

인수 선택 항목 수락 기본값 Description
OCR 엔진 아니요 Windows OCR 엔진, Tesseract 엔진, OCR 엔진 변수 OCR 엔진 변수 사용할 OCR 엔진 유형입니다. 미리 구성된 OCR 엔진을 선택하거나 새로 설정하세요
OCR 엔진 변수 아니요 OCREngineObject OCR 작업에 사용할 엔진
OCR source 해당 없음 화면, 전경 창, 디스크의 이미지 화면 OCR 작업을 수행할 이미지의 소스
Image file path 아니요 파일 OCR 작업을 수행할 이미지의 경로
Search mode 해당 없음 지정된 소스 전체, 특정 하위 영역만, 이미지에 상대적인 하위 영역 지정된 소스의 전체 OCR 작업에 대해 선택된 모드
Image 아니요 이미지목록 제공된 이미지에 상대적인 하위 지역까지 검사 범위를 좁히는 데 사용할 이미지
Tolerance 숫자 값 10 원래 선택한 이미지와 이미지가 얼마나 다를지 지정
X1 숫자 값 검사를 좁히기 위한 하위 지역의 시작 X 좌표
X2 숫자 값 검사를 좁히기 위한 하위 지역의 끝 X 좌표
Y1 숫자 값 검사를 좁히기 위한 하위 지역의 시작 Y 좌표
Y2 숫자 값 검사를 좁히기 위한 하위 지역의 끝 Y 좌표
Windows OCR 언어 사용 불가 중국어(간체), 중국어(번체), 체코어, 덴마크어, 네덜란드어, 영어, 핀란드어, 프랑스어, 독일어, 그리스어, 헝가리어, 이탈리아어, 일본어, 한국어, 노르웨이어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 세르비아어(라틴어), 슬로바키아어, 스페인어, 스웨덴어 및 터키어. 영어 Windows OCR 엔진이 감지하는 텍스트의 언어입니다.
다른 언어 사용 사용 불가 부울 값 거짓 'Tesseract 언어' 필드에서 주어지지 않은 언어를 사용할지 지정
Tesseract 언어 사용 불가 영어, 독일어, 스페인어, 프랑스어, 이탈리아어 영어 Tesseract 엔진이 검사하는 텍스트의 언어
언어 약어 아니요 텍스트 값 사용할 언어의 Tesseract 약자입니다. 예를 들어 데이터가 'eng.traineddata'인 경우 이 매개 변수를 'eng'으로 설정합니다.
언어 데이터 경로 아니요 텍스트 값 지정된 언어의 Tesseract 데이터를 보유한 폴더의 경로
이미지 너비 승수 아니요 숫자 값 1 이미지의 너비 승수
이미지 높이 승수 아니요 숫자 값 1 이미지의 높이 승수
이미지가 나타나기까지 대기 사용 불가 부울 값 True 화면 또는 전경 창에서 이미지가 나타날 때까지 대기할지 여부 지정
시간 제한 아니요 숫자 값 5 실패하기 전 작업이 완료될 때까지 대기할 시간 지정
이미지 일치 알고리즘 사용 불가 기본, 고급 기본 이미지를 검색할 때 사용할 이미지 알고리즘

노트

OCR 엔진 변수 옵션은 더 이상 사용되지 않을 예정입니다.

변수 생성됨

인수 Type Description
OcrText 텍스트 값 텍스트 추출 후 결과

예외

예외 설명
OCR 텍스트를 추출하지 못함 주어진 소스에서 OCR 텍스트를 추출하는 동안 오류가 발생했음을 나타냄
이미지 파일 찾을 수 없음 주어진 경로에서 파일이 없음을 나타냄
랜드마크 이미지 찾을 수 없음 랜드마크 이미지가 없음을 나타냄
대화형이 아닌 모드에서 화면에서 텍스트 가져올 수 없음 대화형이 아닌 모드인 경우 화면에서 텍스트를 가져오는 것이 가능하지 않음을 나타냄
OCR 엔진을 만들지 못함 OCR 엔진을 만드는 동안 오류가 발생했음을 나타냄
데이터 경로 폴더 없음 언어 데이터에 대해 지정된 폴더가 없음을 나타냄
선택한 Windows 언어 팩이 컴퓨터에 설치되어 있지 않습니다. 선택한 Windows 언어 팩이 컴퓨터에 설치되어 있지 않다는 것을 나타냅니다.
OCR 엔진 연결되지 않음 OCR 엔진이 연결되지 않음을 나타냄