課程:論文研討(一)
日期:101.9.28
時間:14:00PM~15:30PM
地點:S104
主題:From Relational Databases to Distributed/Parallel Databases to Cloud Databases
日期:101.9.28
時間:14:00PM~15:30PM
地點:S104
主題:From Relational Databases to Distributed/Parallel Databases to Cloud Databases
講師:陳良弼教授
作者:資工產碩一 王雨喬
感覺這次講座主任請到了大人物,因為第一次看到這麼多系上的老師來聽演講…,不但如此演講結束後老師還提出有關cloud databases的問題跟演講教授討論,提出的問題有cloud databases是屬於平行處理還是分散處理?cloud databases是甚麼?聽完老師們的討論,我的問號更多了…,後來有跟劉老師討論到這問題,於是我聽從劉老師的建議,把所有相關名詞定義好好搞清楚,不然都模模糊糊的,
講者有提到關聯式、正規化、分散式、平行資料,以下是我查到相關名詞定義:
雲端運算的定義:
雲端運算由5個基本特徵、3種服務模式及4種佈署模式組成。
5個基礎特徵分別是:
1. 自助式隨需服務(On-demand self-service):客戶可以依其需求索取計算資源(例如伺服器或儲存空間),且整個過程是單方面自動化的,無須與資源提供者互動。
2. 廣泛網路接取(Broad network access):服務是經由網路提供,且有標準機制能讓不同的客戶端平台(如智慧型手機及筆電等)都可以使用。
3. 共享資源池(Resource pooling):服務者所提供的計算資源,例如儲存空間、網路頻寬、計算能力、虛擬機器數量等,可類比為一個大水池,能隨時依需要(重新)分配給不同平台的多個使用者。使用者不需了解資源的實體位置,只要有抽象概念即可(如資源是在哪個國家或哪個資料中心)
4. 快速的彈性(Rapid elasticity):計算資源不僅可以快速且有彈性地被提供或釋放,且對客戶而言,資源是取之不盡且可以恣意購買的。
5. 可量測的服務(Measured service):計算資源可依其所提供的服務特性被自動控管及最佳化。提供者與使用者雙方都可透明地監控資源使用情形。
3種服務模式指的是SaaS、PaaS及IaaS,例子:
· SaaS:Gmail、Saleforce CRM
· PaaS:Google App Engine、MS Azure
· IaaS:Amazon EC2
4種佈署模式則是指私有雲、社群雲(community cloud,數個組織因共同利益考量所建構者)、公有雲及混合雲
關聯式資料庫的定義:
是利用一些被定義的資料集合,以表格的形式組成各種關聯,然後將這些關聯組合起來,利用資料庫表格當中某些欄位的關聯性,建立整個資料庫的大架構,便構成一個關聯式資料庫。
關聯式資料庫的定義資料來源
正規化的定義:
所謂正規劃是指將資料表依據一定的程序,分割成利於關聯式資料庫搜尋、比對、儲存的方法。
正規化的定義資料來源
分散式處理/分散式運算的定義:
所處的網路環境與分散式系統類似,但著重於充分利用電腦資源,儘量避免處理器閒置。處理工作偏重於需要大量運算的問題。
分散式處理/分散式運算的定義資料來源
平行處理的定義:
指在多處理器的單一主機上,將執行的工作分成小單位,在各處理器上同時執行,以縮短執行時間
平行處理的定義資料來源
雖然以上名詞老師演講時很多都有解釋,但聽完還是沒有很清楚,查完就比較了解了,再來說說這次的主題─cloud databases,cloud databases老師列出以下四種特性:
Ø Scalability
Ø Efficiency
Ø Fault tolerance
Ø Ability to interface with existing database management systems
圖(一)
老師還有介紹NoSQL databases和SQL database及比較兩者差異,NoSQL databases比較容易scale,反之SQL database比較難scale,雖然如此,但現在大多的應用都建立在SQL database模組上,還有提到SQLMR(A Scalable Database Management
System for Cloud Computing),講解SQLMR的系統架構如圖(一)↑,解釋SQLMR以下四種特性:
Ø SQL compliant
Ø Scalable
Ø Fault tolerant
Ø High performance
沒有留言:
張貼留言