專題演講 日期:2006年5月29日

演講題目: Global View as Constrained Union of Local Views in Heterogeneous Database Environment

演講者: Gongzhu HuDepartment of Computer Science Central Michigan University, USA

內容:

   

網際網路以驚人的速度擴充,且電腦系統與網路環境快速的發展,銀行、電信、圖書等服務業,勢必會漸漸朝向彼此整合的型態來發展,才能提高其服務品質。由於各個獨立組織的內部資料庫的運作條件、型態各不相同,因此要能整合這些異質性的資料,以進行資料的查詢、分析成為一個很重要的議題。

然而,何謂資料整合(Data Integration)?胡教授分別以UniformAccess toMultipleAutonomousHeterogeneousStructuredData Sources加以定義。不同的平台、系統,使得蒐集的資料產生版本、存取機制、語意的不一致,都說明了資料整合的重要性。整合是一個抽象的概念,在資料整合過程中,需要排除異質性。一個抽象的資料模型必須考慮下列幾點:Data definition as each levelMapping from one level to anotherBottom-up or top-down。對於這些欲整合的資料,若了解的越深入,運用資料時會更有彈性;若抽象的層級越高,則資料的操作將會更容易。接著,胡教授以numberlanguagedata typeobject-orientationdatabases…等,分別說明每一種型態的各個不同層級所代表的意函。

我們如何去定義資料的模型?我們要怎麼開始呢?是由上而下建立,還是由下而上?我們要怎麼定義不同層級的關係?每個層級如何對應到另一個層級?胡教授分別以Federated databasesData warehousesData conversion/migrationSchema integration幾個案例,舉出特別的解決方法來說明資料庫的整合過程。

最後,胡教授做了以下結語:

1.      資料整合是藉由建立一個較高級的資料抽象模型來表達不同的資料來源的資料。

2.      這個抽象的概念是在schema層級。

3.      Global view 是由多個不同的語意的local schema產生。

4.      可藉由schema transformation 來建立global viewlocal view之間的關係。

5.      global view上的查詢處理,就是利用這些關係的資訊來做為準則。

 

撰文:簡嬿羚