2012年10月4日 星期四

From relational databases to distributed/parallel databases to cloud databases


課程:論文研討()
主題:From Relational Databases to Distributed/Parallel Databases to Cloud Databases
日期101928
時間:14:00~15:30
地點:S104
講者:陳良弼教授
作者:資工碩一  張哲源

    本週請到了國立政治大學陳良弼教授擔任演講者,陳教授在資料探勘有著非常豐碩的成就,因此在講解這方面最適合不過了。開頭則是先講Relational Databases,隨著資料量越來越龐大,處理的方式也有所不同,Distributed/Parallel Databases 及 Cloud Databases也因此而誕生了,現在最熱門的話題則是Cloud Databases,也就是所謂的雲端資料庫。

    什麼是Relational Databases(關聯式資料庫), 他是一種建立在關連模組上的資料庫,借助集合代數等數學概念和方法來處理資料庫中的資料,也就是透過某些關連性來做連結,如下圖(一)所示,還記得在大學時曾經修過SQL的課程,上課時也是先建表,然後再依照他的關聯性去做連結,藉由SQL所下達的指令能夠找出我們需要的資料,但是前提是資料庫的關聯性要先建立好,否則會找不到東西。

圖(一)
    什麼是Distributed/Parallel Databases(分散/平型式資料庫),分散式資料庫是利用網路將多個分散的資料庫作連結,進而組成一個邏輯統一的資料庫,每個被連線的資料庫稱為網站或節點。平型式資料庫是由二台主機同時操控同一個資料庫,借此提升資料庫整體效能,增加使用者資料的傳輸及運作,避免資料庫壅塞的問題發生,同時可避免主機損壞而使資料庫無法使用的困境,因此當其中一台主機損毀時資料庫仍然可正常的運作, 如下圖(二)所示。
圖(二)

    再來則是現今最熱門的Cloud Databases,我們最常用的Google提供了許多雲端資料庫的服務,讓我們可以把資料上傳上去,只需要登入就可以隨時下載,在大學專研時有使用過Map/Reduce這個方法做過雲端運算,雖然那時候只有做出單節點運算,不過對於雲端運算方面也算是有了更進一步的了解。在演講後面提到了NoSQL這個詞,主要是因為網路越來越發達,要處理的資料量過於龐大,必須透過NoSQL的方式處理,什麼是NoSQL呢? 不同於傳統的資料庫,NoSQL的數據儲存可以是非固定的表格模式,也經常會避免使用SQL的JOIN操作,有水平可擴展性的特徵,下圖(三)為NoSQL四大類資料庫。
圖(三)
    往後雲端資料庫以及雲端運算都會是未來的趨勢,聽完這場講座後讓我更加熟悉各種資料庫以及未來的發展方向,相信在未來這兩樣東西都會成長得非常迅速,對我們的生活帶來更多的便利性。

圖片來源: 圖(一)
               圖(二)
               圖(三)



沒有留言:

張貼留言