在oracle中,數據源是一種數據連接的抽象,包含了數據庫位置和數據庫類型等信息;數據源提供了讀取和寫入oracle雙向通道的功能,方便可以通過向導模式和腳本模式配置數據同步任務。
本教程操作環境:windows10系統、Oracle 11g版、Dell G3電腦。
oracle的數據源是什么
數據源。數據源包含了數據庫位置和數據庫類型等信息,實際上是一種數據連接的抽象。
Oracle數據源為您提供讀取和寫入Oracle雙向通道的功能,方便您后續可以通過向導模式和腳本模式配置數據同步任務。本文為您介紹,配置數據源之前需要準備的網絡環境及賬號權限,以及在DataWorks中如何新增Oracle數據源。
前提條件
配置數據源之前,請確保已完成以下規劃與準備工作。
-
準備數據源:已購買來源數據源Oracle。
-
資源規劃與準備:已購買獨享數據集成資源組,并完成資源配置。詳情可參見資源規劃與配置。
-
網絡環境評估與規劃:新增數據源之前,您需根據業務情況,打通數據源、獨享數據集成資源組之間的網絡,并進行交換機、白名單等網絡環境下的訪問配置。
如果數據源和獨享數據集成資源組均處于同地域的同一VPC網絡中,數據源與資源組間的網絡天然聯通。
如果數據源和獨享數據集成資源組均處于不同的網絡環境中,您需要通過VPN網關等方式,將數據源與資源組間的網絡打通。
-
準備賬號并授權:
您需要規劃一個可訪問數據源的賬號,用于后續數據集成過程中訪問數據源并進行數據提取、寫入的同步操作。
-
開啟補充日志:
來源數據源為Oracle時,您需要開啟數據庫級別的歸檔日志、Redo日志及補充日志。
歸檔日志:Oracle通過歸檔日志保存所有的重做歷史記錄,用于在數據庫出現故障時完全恢復數據庫。
Redo日志:Oracle通過Redo日志來保證數據庫的事務可以被重新執行,從而使得在故障(例如斷電)之后,數據可以被恢復,因此您需要為數據庫開啟并切換Redo日志。
補充日志:補充日志是對Redo日志中信息的補充。在Oracle中,Redo日志用于記錄被修改的字段的值,而補充日志是對Redo日志中變更記錄的補充信息,可以確保Oracle的Redo日志包含描述所有數據更改的完整信息,以便在進行數據恢復、數據同步等操作時,可以追溯到完整的語句及相關變更。Oracle數據庫的某些功能要求啟用補充日志才能正常或更好的工作,因此您需要為數據庫開啟補充日志。
例如,如果未啟用補充日志,執行UPDATE命令后,Redo日志中只會記錄通過UPDATE命令更改后的字段值,啟用補充日志后,則Redo日志中會記錄被修改字段,修改前的值、修改后的值以及修改目標字段的條件值。當數據庫發生故障(例如斷電)時,您可以基于此修改信息恢復數據。
使用數據集成時推薦開啟主鍵列或唯一索引列補充日志。
開啟主鍵列的補充日志后,如果數據庫有任何更新,則組成主鍵的所有列都會被記錄在日志中。
開啟唯一索引列的補充日志后,如果組成唯一鍵或位圖索引的任何列被修改,則組成該唯一鍵或位圖索引的列都會被記錄在日志中。
Oracle僅支持在主庫中為主庫或備庫開啟補充日志。
-
檢查數據庫的字符編碼格式:
您需要確保Oracle中不能包含數據集成不支持的字符編碼格式,防止同步數據失敗。當前數據集成同步數據時,僅支持UTF8、AL32UTF8、AL16UTF16及ZHS16GBK編碼格式。
-
檢查數據庫表的數據類型:
您需要確保Oracle中不能包含數據集成不支持的數據類型,防止同步數據失敗。當前數據集成進行實時同步時,不支持LONG、BFILE、LONG RAW及NCLOB數據類型 。
推薦教程:《Oracle視頻教程》