2012年10月4日 星期四

From relational databases to distributed/parallel databases to cloud databases


課程 : 論文研討()

日期 : 2012/09/28

時間 : 13:50 ~ 15:30

地點 : S104

作者 : 資工研一 李依蓉

講者 : 國立政治大學 陳良弼教授

主題:From Relational Databases to Distributed/Parallel Databases to Cloud Databases

現在,我們正處於海量數據與即時決策的時代;在這樣的時代中,如何在最短的時間內高效處理大量的數據,便成為人們在商業等領域的制勝法寶。舉例說來,eBay作為一個超大型的線上交易網站,其系統每天的資料成長量是50TB;一年下來,所累積的資料量就有17.8PB。而這還僅僅是資料的單純累計。實際上,爲了滿足顧客即時的查詢、以及爲瞭解市場成長而進行的5000多項分析,eBay每日的數據處理量已經達到了PB等級。

不僅僅是eBay,在大陸的淘寶網、以及台灣的中華電信等其他公司也面著同樣的問題:如何快速處理海量數據。

如果我們仍舊使用以往的關係式數據庫、使用以往的操作平臺,則將由於財務及時間上的巨大成本而無法應對這樣的挑戰。

因此,我們引入了NoSQL這個非關係型的資料結構,在雲端平臺上處理雲端數據庫結構。NoSQL的全稱是Not only SQL,而非完全的拋棄SQL;也即運用各種數據庫處理技術來服務于目前的需求,而不僅僅採用SQL數據庫的意思。這樣,一方面有助於處理關係型數據庫所遇到的一些結構瓶頸,另一方面也能幫助還不成熟的非關係型數據庫儘快能運用到實務當中。關係型數據庫的表所存儲的都是格式化的數據結構,在同一個欄位下不會存在層次結構;這種結構便於表與表之間的鏈接等操作,但是不夠靈活,而且在處理用戶的即時查詢時要耗費較多的時間。但是非關係型數據庫與之相反,它通常是弱一致性的,採用一個大表格去儲存具備層次結構的資料。由此可見,關係型的數據庫只要可以用在執行規模小而讀寫頻繁的數據,而非關係型數據庫則可以用於經常需要查詢的情形。

雖然非關係型數據庫有諸多好處,但是它畢竟是新型的一種概念,所以仍有很多地方需要改進;同時,對於銀行等對數據的穩定性非常在意的企業,如何能平穩的把關係型數據庫轉化為非關係型數據庫也是一個很大的挑戰。

但是,我們應該看到,非關係型的數據庫更適合于未來的發展。目前,已經有多家企業採用該模式,如阿里云,新浪APE等。

 
     這期企業相當於在實戰中為我們的學術研究提供支援。相信在他們的幫助下,雲端數據庫將會以很快的速度發展成熟。

沒有留言:

張貼留言