Oracle CDC 데이터베이스
Important
Change Data Capture for Oracle by Attunity는 이제 더 이상 사용되지 않습니다. 자세한 내용은 공지를 참조하세요.
Oracle CDC 인스턴스는 대상 SQL Server 인스턴스에서 동일한 이름으로 SQL Server 데이터베이스와 연결됩니다. 이 데이터베이스를 Oracle CDC 데이터베이스(또는 CDC 데이터베이스)라고 합니다.
CDC 데이터베이스는 Oracle CDC Designer 콘솔을 사용하여 만들어지고 구성되며, 포함되는 요소는 다음과 같습니다.
데이터베이스를 SQL Server CDC에 사용하도록 설정하여 만든
cdc
스키마Oracle CDC 인스턴스에서 사용하는 cdc.xdbcdc_xxxx 테이블 세트
tuphe 원본 Oracle 데이터베이스에서 캡처된 테이블의 정의가 포함된 빈 미러 테이블 세트
SQL Server CDC 메커니즘에 생성되고 Oracle이 아닌 일반 SQL Server CDC에서 사용되는 것과 동일한 변경 테이블 및 변경 액세스 함수 세트
cdc
스키마는 처음에 dbowner 고정 데이터베이스 역할의 멤버만 액세스할 수 있습니다. 변경 테이블 및 변경 기능에 대한 액세스는 SQL Server CDC와 동일한 보안 모델에 의해 결정됩니다. 보안 모델에 대한 자세한 내용은 보안 모델을 참조하세요.
CDC 데이터베이스 만들기
대부분의 경우 CDC 데이터베이스는 CDC Designer 콘솔을 사용하여 만들지만, CDC Designer 콘솔을 통해 생성된 CDC 배포 스크립트를 사용하여 만들 수도 있습니다. SQL Server 시스템 관리자는 필요한 경우 스토리지, 보안 또는 가용성과 같은 항목에 대한 데이터베이스 설정을 변경할 수 있습니다.
CDC Designer 콘솔을 사용하여 데이터베이스 테이블 및 필요한 스크립트를 만드는 방법에 대한 자세한 내용은 새 인스턴스 마법사 사용을 참조하세요.
CDC 데이터베이스 사용자 역할
CDC 데이터베이스를 만들고 CDC에 사용하도록 설정하면 cdc_service라는 데이터베이스 사용자가 CDC 데이터베이스에 만들어지고 Oracle CDC Service가 구성된 SQL Server 로그인과 연결됩니다. 이 사용자는 db_datareader, db_datawriter 및 db_ddladmin 데이터베이스 역할의 멤버가 됩니다. SQL Server 로그인이 dbo
사용자와도 연결되는 경우 cdc_service 만들어지지 않습니다.
이 역할 할당을 사용하면 Oracle CDC Service에서 캡처된 데이터와 제어 정보를 사용하여 cdc
스키마 아래의 테이블을 업데이트할 수 있습니다.
CDC 데이터베이스가 만들어지고 CDC 원본 Oracle 테이블이 설정된 경우 CDC 데이터베이스 소유자는 미러 테이블의 SELECT 권한을 부여하고 SQL Server CDC 제어 역할을 정의하여 변경 데이터에 액세스하는 사용자를 제어할 수 있습니다.
미러 테이블
Oracle 원본 데이터베이스의 각 캡처된 테이블(<schema-name>.<table-name>)에 대해 동일한 스키마와 테이블 이름을 가진 유사한 빈 테이블이 CDC 데이터베이스에 만들어집니다. SQL Server의 cdc
스키마가 SQL Server CDC용으로 예약되어 있으므로 스키마 이름이 cdc
(대/소문자 구분 안 함)인 Oracle 원본 테이블을 캡처할 수 없습니다.
미러 테이블은 비어 있으며 여기에는 데이터가 저장되지 않습니다. 미러 테이블은 Oracle CDC 인스턴스에 사용되는 표준 SQL Server CDC 인프라를 사용하도록 설정하는 데 사용됩니다. 데이터가 미러 테이블에 삽입되거나 업데이트되지 않도록 하려면 PUBLIC에 대한 모든 UPDATE, DELETE 및 INSERT 작업이 거부됩니다. 이렇게 하면 수정할 수 없습니다.
변경 데이터에 대한 액세스
캡처 인스턴스와 연결된 변경 데이터에 대한 액세스 권한을 얻는 데 사용되는 SQL Server 보안 모델로 인해 사용자에게 연결된 미러 테이블의 캡처된 모든 열에 대한 select
액세스 권한이 부여해야 합니다(원래 Oracle 테이블에 대한 액세스 권한은 SQL Server의 변경 테이블에 대한 액세스를 제공하지 않음). SQL Server 보안 모델에 대한 자세한 내용은 보안 모델을 참조하세요.
또한 캡처 인스턴스를 만들 때 게이팅 역할을 지정하는 경우 호출자도 지정된 게이팅 역할의 멤버여야 합니다. 메타데이터에 액세스하는 다른 일반적인 변경 데이터 캡처 함수에 모든 데이터베이스 사용자가 public 역할을 통해 액세스할 수 있습니다. 물론 반환된 메타데이터에 대한 액세스는 기본 원본 테이블에 대한 select 액세스 권한을 사용하거나 정의된 제어 역할에서의 멤버 자격을 통해 일반적으로 제어됩니다.
캡처 인스턴스를 만들 때 SQL Server CDC 구성 요소에 의해 생성된 특수 테이블 기반 함수를 호출하여 변경 데이터를 읽을 수 있습니다. 이 함수에 대한 자세한 내용은 변경 데이터 캡처 함수(Transact-SQL)를 참조하세요.
Integration Services CDC 원본 구성 요소를 통해 CDC 데이터에 액세스하는 경우에 동일한 규칙이 적용됩니다.
CDC 데이터베이스 테이블
이 섹션에서는 CDC 데이터베이스의 다음 테이블에 대해 설명합니다.
변경 테이블(_CT)
변경 테이블은 미러 테이블에서 만들어집니다. 여기에는 Oracle 데이터베이스에서 캡처된 변경 데이터가 포함됩니다. 테이블은 다음 규칙에 따라 이름이 지정됩니다.
[cdc].[<capture-instance>_CT]
<schema-name>.<table-name>
테이블에 캡처를 처음 사용하는 경우 기본 캡처 인스턴스 이름은 <schema-name>_<table-name>
입니다. 예를 들어 Oracle HR.EMPLOYEES 테이블에 대한 기본 캡처 인스턴스 이름은 HR_EMPLOYEES이고, 연결된 변경 테이블은 [cdc].[HR_EMPLOYEES_CT]입니다.
캡처 테이블은 Oracle CDC 인스턴스에서 작성됩니다. 캡처 인스턴스를 만들 때 SQL Server에서 생성된 특수 테이블 반환 함수를 사용하여 읽습니다. 예들 들어 fn_cdc_get_all_changes_HR_EMPLOYEES
입니다. 이러한 CDC 함수에 대한 자세한 내용은 변경 데이터 캡처 함수(Transact-SQL)를 참조하세요.
cdc.lsn_time_mapping
[cdc].[lsn_time_mapping] 테이블은 SQL Server CDC 구성 요소에서 생성됩니다. Oracle CDC의 경우에는 일반적인 용도와 다르게 사용됩니다.
Oracle CDC의 경우 이 테이블에 저장된 LSN 값은 변경 내용과 연결된 SCN(Oracle 시스템 변경 번호) 값을 기반으로 합니다. LSN 값의 처음 6바이트는 원래 Oracle SCN 번호입니다.
또한 Oracle CDC를 사용하는 경우 time 열(tran_begin_time
및 tran_end_time
)은 일반 SQL Server CDC에와 마찬가지로 현지 시간이 아닌 변경의 UTC 시간을 저장합니다. 이렇게 하면 일광 절약 시간 변경이 lsn_time_mapping 저장된 데이터에 영향을 주지 않습니다.
cdc.xdbcdc_config
이 테이블에는 Oracle CDC 인스턴스에 대한 구성 데이터가 포함되어 있습니다. CDC Designer 콘솔을 사용하여 업데이트됩니다. 이 테이블에는 하나의 행만 있습니다.
다음 표에서는 cdc.xdbcdc_config 테이블 열을 설명합니다.
항목 | 설명 |
---|---|
version | CDC 인스턴스 구성의 버전을 추적합니다. 테이블이 업데이트될 때마다, 그리고 새 캡처 인스턴스가 추가되거나 기존 캡처 인스턴스가 제거될 때마다 업데이트됩니다. |
connect_string | Oracle 연결 문자열입니다. 기본 예제는 다음과 같습니다.<server>:<port>/<instance> (예: erp.contoso.com:1521/orcl )연결 문자열에서 Oracle Net 연결 설명자를 지정할 수도 있습니다(예: (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp) (HOST=erp.contoso.com) (PORT=1521)) (CONNECT_DATA=(SERVICE_NAME=orcl))) )디렉터리 서버 또는 tnsnames를 사용하는 경우 연결 문자열이 연결의 이름일 수 있습니다. Oracle 연결 문자열 대한 자세한 내용은 https://go.microsoft.com/fwlink/?LinkId=231153을 참조하세요. 여기서는 Oracle CDC Service에서 사용하는 Oracle 인스턴트 클라이언트의 Oracle 데이터베이스 연결 문자열에 대해 자세히 설명합니다. |
use_windows_authentication | 다음과 같은 부울 값입니다. 0: 인증을 위해 Oracle 사용자 이름 및 암호가 제공됩니다(기본값). 1: Oracle 데이터베이스에 연결하는 데 Windows 인증이 사용됩니다. Oracle 데이터베이스가 Windows 인증에서 작동하도록 구성된 경우에만 이 옵션을 사용할 수 있습니다. |
사용자 이름 | 로그 마이닝 Oracle 데이터베이스 사용자의 이름입니다. use_windows_authentication = 0인 경우에만 필수입니다. |
password | 로그 마이닝 Oracle 데이터베이스 사용자의 암호입니다. use_windows_authentication = 0인 경우에만 필수입니다. |
transaction_staging_timeout | 커밋되지 않은 Oracle 트랜잭션이 cdc.xdbcdc_staged_transactions 테이블에 기록되기 전에 메모리에 유지되는 시간(초)입니다. 기본값은 120초입니다. |
memory_limit | 데이터를 메모리에 캐시하는 데 사용할 수 있는 메모리 양(Mb)에 대한 제한입니다. 설정이 낮을수록 더 많은 트랜잭션이 cdc.xdbcdc_staged_transactions 테이블에 기록됩니다. 기본값은 50Mb입니다. |
options | 이름[=값][; ] 형태의 옵션 목록이며 보조 옵션(예: 추적, 튜닝)을 지정하는 데 사용됩니다. 사용 가능한 옵션에 대한 설명은 아래 표를 참조하세요. |
다음 표에서는 사용 가능한 옵션에 대해 설명합니다.
속성 | 기본값 | Min | Max | 정적 | 설명 |
---|---|---|---|---|---|
trace | False | - | - | False | 사용 가능한 값은 참 False On off |
cdc_update_state_interval | 10 | 1 | 120 | False | 트랜잭션에 할당된 메모리 청크의 크기(KB)입니다(트랜잭션은 둘 이상의 청크를 할당할 수 있음). cdc.xdbcdc_config 테이블의 memory_limit 열을 참조하세요. |
target_max_batched_transactions | 100 | 1 | 1000 | 참 | SQL Server CT 테이블 업데이트에서 하나의 트랜잭션으로 처리될 수 있는 Oracle 트랜잭션의 최대 수입니다. |
target_idle_lsn_update_interval | 10 | 0 | 1 | False | 캡처된 테이블에 대한 작업이 없을 때 lsn_time_mapping테이블을 업데이트하는 간격(초)입니다. |
trace_retention_period | 24 | 1 | 24*31 | False | 시간(메시지를 추적 테이블에 보관하는 시간)입니다. |
sql_reconnect_interval | 2 | 2 | 3600 | False | SQL Server에 연결하기 전에 대기하는 시간(초)입니다. 이 간격은 SQL Server 클라이언트의 연결 시간 제한과 함께 사용됩니다. |
sql_reconnect_limit | -1 | -1 | -1 | False | SQL Server 다시 연결의 최대 횟수입니다. -1(기본값)은 프로세스가 중지될 때까지 다시 연결을 시도한다는 것을 의미합니다. |
cdc_restart_limit | 6 | -1 | 3600 | False | 대부분의 경우 CDC Service는 비정상적으로 종료된 CDC 인스턴스를 자동으로 다시 시작합니다. 이 속성은 인스턴스를 다시 시작하기 위해 서비스가 중지되는 오류가 발생하는 시간당 횟수를 정의합니다. -1 값은 인스턴스를 항상 다시 시작해야 한다는 것을 의미합니다. 구성 테이블이 업데이트되면 인스턴스를 다시 시작하기 서비스가 반환됩니다. |
cdc_memory_report | 0 | 0 | 1000 | False | 매개 변수 값이 변경된 경우 CDC 인스턴스에서 해당 메모리 보고서를 추적 테이블에 출력합니다. |
target_command_timeout | 600 | 1 | 3600 | False | SQL Server에서 작동하는 명령 시간 제한입니다. |
source_character_set | - | - | - | 참 | Oracle 데이터베이스 코드 페이지 대신 특정 Oracle 인코딩을 사용하도록 설정할 수 있습니다. 이는 문자 데이터에서 사용하는 실제 인코딩이 Oracle 데이터베이스 코드 페이지에서 표현한 것과 다를 때 사용할 수 있습니다. |
source_error_retry_interval | 30 | 1 | 3600 | False | 연결 오류 또는 시스템 테이블 간의 일시적인 동기화 부족과 같은 여러 오류에 대해 다시 시도하기 전에 사용됩니다. |
source_prefetch_size | 100 | 1 | 10000 | 참 | 프리페치 일괄 처리의 크기입니다. |
source_max_tables_in_query | 100 | 1 | 10000 | 참 | 테이블을 필터링하지 않고 Oracle 로그 읽기로 전환하기 전에 WHERE 절에 허용되는 최대 테이블 수입니다. |
source_read_retry_interval | 2 | 1 | 3600 | False | EOF에서 Oracle 트랜잭션 로그 읽기를 다시 시도하기 전에 원본에서 대기하는 시간입니다. |
source_reconnect_interval | 30 | 1 | 3600 | False | 원본 데이터베이스에 다시 연결을 시도하기 전에 대기하는 시간(초)입니다. |
source_reconnect_limit | -1 | -1 | False | 원본 데이터베이스를 다시 연결하는 최대 횟수입니다. -1(기본값)은 프로세스가 중지될 때까지 다시 연결을 시도한다는 것을 의미합니다. | |
source_command_timeout | 30 | 1 | 3600 | False | Oracle에서 작동하는 연결 시간 제한입니다. |
source_connection_timeout | 30 | 1 | 3600 | False | SQL Server에서 작동하는 연결 시간 제한입니다. |
trace_data_errors | 참 | - | - | False | 부울입니다. 참은 데이터 변환 및 잘림 오류를 기록한다는 것을 나타냅니다. |
CDC_stop_on_breaking_schema_changes | False | - | - | False | 부울입니다. True 이면 주요 스키마 변경이 감지되는 경우에 중지합니다. False 이면 미러 테이블과 캡처 인스턴스를 삭제합니다. |
source_oracle_home | - | - | False | CDC 인스턴스가 Oracle에 연결하는 데 사용할 특정 Oracle 홈 경로 또는 Oracle 홈 이름으로 설정할 수 있습니다. |
cdc.xdbcdc_state
이 테이블에는 Oracle CDC 인스턴스의 지속형 상태에 대한 정보가 포함됩니다. 캡처 상태는 복구 및 장애 조치(failover) 시나리오와 상태 모니터링에 사용됩니다.
다음 표에서는 cdc.xdbcdc_state 테이블 열을 설명합니다.
항목 | 설명 |
---|---|
status | 현재 Oracle CDC 인스턴스에 대한 현재 상태 코드입니다. 상태는 CDC의 현재 상태를 설명합니다. |
sub_status | 현재 상태 대한 추가 정보를 제공하는 두 번째 수준 상태입니다. |
활성 | 다음과 같은 부울 값입니다. 0: Oracle CDC 인스턴스 프로세스가 활성 상태가 아닙니다. 1: Oracle CDC 인스턴스 프로세스가 활성 상태입니다. |
error | 다음과 같은 부울 값입니다. 0: Oracle CDC 인스턴스가 오류 상태가 아닙니다. 1: Oracle CDC 인스턴스가 오류 상태입니다. |
status_message | 오류 또는 상태에 대한 설명을 제공하는 문자열입니다. |
timestamp | 캡처 상태를 마지막으로 업데이트한 시간(UTC)이 포함된 타임스탬프입니다. |
active_capture_node | Oracle 트랜잭션 로그를 처리 중인 Oracle CDC Service 및 Oracle CDC 인스턴스를 현재 실행 중인 호스트의 이름입니다. 호스트는 클러스터 내의 노드일 수 있습니다. |
last_transaction_timestamp | 마지막 트랜잭션이 변경 테이블에 기록된 시간(UTC)이 포함된 타임스탬프입니다. |
last_change_timestamp | 원본 Oracle 트랜잭션 로그에서 가장 최근의 변경 레코드를 읽은 시간(UTC)이 포함된 타임스탬프입니다. 이 타임스탬프를 통해 CDC 프로세스의 현재 대기 시간을 식별할 수 있습니다. |
transaction_log_head_cn | Oracle 트랜잭션 로그에서 읽은 가장 최근의 CN(변경 번호)입니다. |
transaction_log_tail_cn | 다시 시작하거나 복구하는 경우 Oracle CDC 인스턴스에서 위치가 변경되는 Oracle 트랜잭션 로그의 CN(변경 번호)입니다. |
current_cn | 원본 데이터베이스에 있는 것으로 알려진 가장 최근의 CN(변경 번호)입니다. |
software_version | Oracle CDC Service의 내부 버전입니다. |
completed_transactions | CDC가 마지막으로 다시 설정된 이후 처리된 트랜잭션 수입니다. |
written_changes | SQL Server 변경 테이블에 기록된 변경 레코드 수입니다. |
read_changes | 원본 Oracle 트랜잭션 로그에서 읽은 변경 레코드 수입니다. |
staged_transactions | cdc.xdbcdc_staged_transactions 테이블에서 준비된 현재 활성 트랜잭션 수입니다. |
cdc.xdbcdc_trace
이 테이블에는 CDC 인스턴스의 작업에 대한 정보가 포함됩니다. 이 테이블에 저장되는 정보에는 오류 레코드, 주목할 만한 상태 변경 및 추적 레코드가 포함됩니다. cdc.xcbcdc_trace 테이블을 사용할 수 없는 경우에도 정보를 사용할 수 있도록 오류 정보는 Windows 이벤트 로그에도 기록됩니다.
다음 표에서는 cdc.xdbcdc_trace 테이블 열을 설명합니다.
항목 | 설명 |
---|---|
timestamp | 추적 레코드가 기록된 정확한 UTC 타임스탬프입니다. |
type | 다음 값 중 하나를 포함합니다. 오류 INFO TRACE |
node | 레코드가 기록된 노드의 이름입니다. |
status | 상태 테이블에서 사용되는 상태 코드입니다. |
sub_status | 상태 테이블에서 사용되는 하위 상태 코드입니다. |
status_message | 상태 테이블에서 사용되는 상태 메시지입니다. |
데이터 | 오류 또는 추적 레코드에 페이로드가 포함되는 사례에 대한 추가 데이터입니다(예: 손상된 로그 레코드). |
cdc.xdbcdc_staged_transactions
이 테이블에는 트랜잭션 커밋 또는 롤백 이벤트가 캡처될 때까지 대규모 또는 장기 실행 트랜잭션에 대한 변경 레코드가 저장됩니다. Oracle CDC 서비스에서 캡처된 로그 레코드를 트랜잭션 커밋 시간별로 정렬한 다음, 각 트랜잭션에 대한 시간순으로 정렬합니다. 동일한 트랜잭션에 대한 로그 레코드는 트랜잭션이 종료될 때까지 메모리에 저장되었다가 대상 변경 테이블에 기록되거나 삭제(롤백의 경우)됩니다. 사용 가능한 메모리 양이 제한되어 있으므로 트랜잭션이 완료될 때까지 대규모 트랜잭션이 cdc.xdbcdc_staged_transactions 테이블에 기록됩니다. 트랜잭션은 오랜 시간 동안 실행되면 준비 테이블에도 기록됩니다. 따라서 Oracle CDC 인스턴스가 다시 시작되면 Oracle 트랜잭션 로그에서 이전 변경 내용을 다시 읽을 필요가 없습니다.
다음 표에서는 cdc.xdbcdc_staged_transactions 테이블 열에 대해 설명합니다.
항목 | 설명 |
---|---|
transaction_id | 준비 중인 트랜잭션의 고유 트랜잭션 식별자입니다. |
seq_num | 현재 트랜잭션의 xcbcdc_staged_transactions 행 수입니다(0부터 시작). |
data_start_cn | 이 행에 있는 데이터의 첫 번째 변경 내용에 대한 CN(변경 번호)입니다. |
data_end_cn | 이 행에 있는 데이터의 마지막 변경 내용에 대한 CN(변경 번호)입니다. |
데이터 | BLOB 형식의 트랜잭션에 대한 스테이징된 변경 내용입니다. |