顯示具有 00366511吳家隆 標籤的文章。 顯示所有文章
顯示具有 00366511吳家隆 標籤的文章。 顯示所有文章

2011年12月23日 星期五

Open Your Driving Vision

課程 : 專題講座
日期 : 2011.12.23
時間 : 14:00 ~ 15:30
地點 : S516
作者 : 資工產碩() — 00366511吳家隆
講者 : 國立中央大學資訊工程所 吳曉光 教授


  車用行動通訊網路 Vehicular Ad-Hoc Network (VANET)是藉由無線通訊與資料傳遞技術,串聯交通工具以及路邊交通設施,所形成的特殊網路。其主要功能在於讓所有的用路人可以即時取得與傳遞與交通相關的資訊,以便提高行車效率,增進用路安全與舒適性。

1986 年,第一套行動通訊系統在美國芝加哥誕生,1G 是採用類比訊號傳輸,主要系統為 AMPS,另外還有 NMT TACS

台灣的中華電信在 3 年後,也就是 1989 年的 7 1 日推出國內第一支行動電話,也就是我們熟知的黑金剛大哥大。

最早應用在手機上網的規格是 WAP (Wireless Application Protocol:無線應用協定) ,不過最初 GSM 的數據傳輸速度不快,所以 WAP 的應用最終宣告失敗,也因此有了更新一代的無線通訊技術:GPRS (General Packet Radio Service:通用封包無線服務)

3G 最吸引人的地方在於每秒可達 384 Kbit 的高速傳輸速度,因此 3G 被視為是開啟行動通訊新紀元的重要關鍵。


       隨著無線通訊網路技術的進步與普及,行車安全問題也越來越受到重視,IEEE針對VANET定義了約四十種的相關應用,除了學界的前瞻技術探討外,目前美國、歐洲的業界也在發展各類型的應用,顯示出國際上對VANET的相關應用與研究發展之高度重視,目前VANET已成為通訊界與汽車產業所關注的新興技術。

強化人車安全 DSRC演進踩油門

       美國材料試驗協會(ASTM)為了發展專用短距通訊(DSRC)技術,因而針對北美地區不同廠商的電子收費系統(ETC)技術進行評估。電子收費系統特色在於採用915MHz頻段、利用分時多工存取(TDMA),以及配備主動式車載單元(OBU)作為通訊方式。如圖1所示,由於915MHz僅能支援0.5Mbit/s傳輸速率,且傳輸距離僅有30公尺;因此美國聯邦通訊委員會(FCC)決定將5.9GHz這個頻段資源應用在汽車通訊上,使DSRC規範可支援6M25Mbit/s傳輸速率,傳輸距離更提升為數百公尺。
<>                                        車用無線網路頻帶使用示意圖<>
            ASTM確定DSRC規範E2213-02時,便將5.9GHz採納為規格制定頻段,並決定採用IEEE 802.11a作為傳輸技術。而ASTME2213-03標準移往IEEE,也促成IEEE 802.11p的誕生。

     IEEE 802.11p又稱為車用環境無線存取(WAVE)技術,目前規格制定進度為6.0版草案。在5.9GHz頻段上使用,此頻帶上有75MHz的頻寬,以10MHz為單位切割,將有七個頻道可供操作。其中一個頻道為控制頻道,其他則為服務頻道。

利用IEEE 802.11a規格作為實體層(Physical Layer)通訊技術,IEEE 802.11p相關應用以DSRC原先所規畫的方向為主,並加強車用安全,包括碰撞警示或道路危險警示等。為了在運輸方面無縫、可和諧操作的服務,WAVE網路服務提供車載裝置、管理服務以及各協定層之間的資料傳遞,其標準包括了IEEE Std 1609.1IEEE Std 1609.2IEEE Std 1609.3IEEE Std 1609.4、及IEEE Std 802.11等。



     IEEE 802.11p的發展具有兩項特性,一是相容於其他規格並與IEEE 1609系列規格相輔相成;二則是對IEEE 802.11a規格作部分的修正,讓設備可應用在高速移動上傳輸資料。



802.11p重視技術相容性

    為了避免規格不一,使得市場接受度受到影響,IEEE 802.11p除了與ASTM E2213-03相容之外,也與ISO組織下制定車用規格的TC204(ITS)WG 16建立溝通管道,TC204 WG16也決議將支援最終的IEEE 802.11p版本。TC204 WG16制定的CALM M5,主要規範車輛在快速移動時,車對車通訊、不斷線通訊與多媒體影音下載等應用。

    

    CALM M5採用5GHz頻段,因此也是利用IEEE 802.11a作為傳輸技術。當然,CALM還有其他版本,有利用2.5G3G作為通訊技術的CALM Cellular等。

由於這些車用規格在制定時講究互通性,使車載設備與道路系統在未來布建與使用上,具有較經濟的效果。若部分區域已經先布建了其他規格的道路系統設備,即便使用者採用的是IEEE 802.11p車載設備也可以利用既有的路側設備(RSU)DSRC應用。

此外,由於採用的是IEEE 802.11規格,因此也可以利用戶外的熱點(Hotspot)作為上網途徑。頻道178為控制頻道範圍,為任何車載設備皆可存取之頻帶,而其他頻道存取皆由服務提供設備來指派。IEEE 802.11p負責規範MAC/PHY標準制定,並與IEEE 1609系列規範車輛系統資訊的架構達到相輔相成。

車輛與網路連結示意

2011年12月16日 星期五

Hybrid IP Traceback Scheme with Efficient Packet Logging

課程 : 專題講座
日期 : 2011.12.16
時間 : 14:00 ~ 15:30
地點 : S516
作者 : 資工產碩() — 00366511吳家隆
講者 : 中原大學-楊明豪



分散式阻斷服務攻擊,亦稱作洪水攻擊,通常簡稱為DDoSDoS(即「Distributed Denial of Service」的縮寫)。顧名思義,即是利用網路上已被攻陷的電腦作為「喪屍」,向某一特定的目標電腦發動密集式的「拒絕服務」要求,藉以把目標電腦的網路資源及系統資源耗盡,使之無法向真正正常請求的使用者提供服務。駭客透過將一個個「喪屍」或者稱為「肉雞」組成喪屍網路(即Botnet),就可以發動大規模DDoSSYN洪水網路攻擊,或者將「喪屍」們組到一起進行帶有利益的刷網站流量、Email垃圾郵件群發,癱瘓預定標的受雇攻擊競爭對手等商業活動。

http://zh.wikipedia.org/wiki/%E5%88%86%E6%95%A3%E5%BC%8F%E9%98%BB%E6%96%B7%E6%9C%8D%E5%8B%99%E6%94%BB%E6%93%


DoS的攻擊方式是單挑,那DDoS就是聚眾圍毆了。

所謂的DDoSDoS攻擊,就是利用網路資源有限的特質(記憶空間、流量、頻寬)以及一些網路服務或通訊協定上的漏洞,將這些有限資源吃乾抹淨,讓一般的正常使用者反而無法存取該服務或網站。舉例來說,攻擊者可以瞬間發送大量的封包給被攻擊者,導致對方系統一時間無法處理,進而使得被攻擊者所提供的服務或網站因此而停擺。

DDoS
攻擊的程序

從附圖可以看出,DDoS攻擊程序包含四個階段與四種角色。

1.Client
(客戶端):攻擊者的系統。攻擊者先入侵幾個管理鬆散的網站,取得管理權限之後,便以這些被控制的主機為跳板,負責發動與監看攻擊的過程。

2.Host
(主機端):被入侵的網路主機。攻擊者可以直接控制這些主機,並利用它們去搜尋其他管理也很鬆散的主機或網站,並將惡意攻擊的網路服務程式殖入它們之內。

3.Agent
(代理程式):被殖入網路服務程式的網站或系統。雖然攻擊者無法直接控制這些電腦,但它們可以放大封包攻擊的總量,並且可以隱藏真實的攻擊來源。

4.Target
(目標):被攻擊的目標。這個毫無抵抗能力的無辜者將會受到無情的轟炸。

對付DDoS攻擊的方法

DDoS
攻擊是沒有特效藥可解的,因為攻擊者可以偽造ip位置或改變攻擊模式,令被攻擊者防不勝防。所以只有預防一途,才是最好的處理手段。首先要避免自己的電腦成為別人的跳板,不要製造管理上的漏洞(例如設定一個太簡單的管理員帳號與密碼);另外也有隨時注意資安或網路安全方面的情報,避免自己的電腦被殖入攻擊程式而不自知。




2011年12月9日 星期五

立體 3D (S3D) 數位內容製作技術

課程 : 專題講座
日期 : 2011.12.09
時間 : 14:00 ~ 15:30
地點 : S516
作者 : 資工產碩() — 00366511吳家隆
講者 : 國立中正大學 賴文能教授


 其原因在於家用3D數位內容的缺乏. 本次演講將介紹如何將一般自然界所擷取的影像(單通道或雙通道) 轉換為3D 所能播放的形式,讓硬體在內容的加持下得以促進3DTV 產業的快速發展。

立體影像原理

人們之所以能看到立體的現實生活世界,乃因為我們有左視阜與右視阜。有了這兩個視角與焦距;產生了光角。藉由視角與光角我們可以得到所見物體的大小與距離。當我們大腦接收到這兩個視覺神經所傳達的訊息,在大腦裡進行影像結合的動作,造成我們的視覺感官。所以, 人們用盡各種技術來產生左右畫面, 並結合複雜的光學來過濾掉水平光與垂直光,造成所見視差並由我們的大腦產生虛擬的影像結合並產生立體錯覺






 

生活數位化

數位科技人性化,更輕易的融入日常生活增添樂趣,讓使用者不需要被迫適應科技所帶來習慣上的改變,這是身為第四象限內容製作工程師的首要職責。

科技人性化

透過設計與美學,讓乏味無趣的邏輯系統搭上內容製作設計、精心設計的外觀,以活潑具生命力的樣貌拉近使用者與電腦數位內容之間的距離與隔閡。

虛擬實境
新體驗透過專業技術,結合光學演算法與互動應用程式,重新詮釋眼前的數位內容。讓內容使用者出乎意料且未曾有過的新體驗。不需要戴笨重的立體眼鏡和適應陰暗的燈光就能看到清晰的立體影像。

2011年11月18日 星期五

雲端應用--電子發票智慧好生活

課程 : 專題講座
日期 : 2011.11.04
時間 : 14:00 ~ 15:30
地點 : S516
作者 : 資工產碩(一) — 00366511吳家隆
講者 : 財政部財稅資料中心-高級分析師盧志山
99年12月18日,統一發票有更便利省時且環保的使用方式正式起跑
據統計,台灣目前每年統一發票印製量約115億張,交易金額達新台幣33兆元,如能省下一年80億張的紙本發票,每年即可少砍八萬棵大樹!相當於60公頃的面積,約等於2座大安森林公園。財政部長 李述德表示,基於節省人力、物力、金錢、時間等資源的考量,財政部決定全面推動發票電子化,以類似雲端運算技術進行,達到便民和節能減碳的目的。
未來民眾只要持具有內建晶片或是具備無線射頻辨識系統(RFID)的各種卡片、手錶及手機如各店家會員卡、悠遊卡、信用卡及NFC手機購物,只要結帳時刷一下,消費明細和發票號碼等資訊就會上傳至財政部財稅資料中心的資料庫。

推動統一發票電子化,預估自民國99年到102年 4年將可省下74億元的處理發票成本;若全國發票都電子化後,政府每年最高可省下1,200億元;民眾免去收集整理發票的不便,業者也省去印製及儲存發票的成本。
電子發票流程:














一、紙本電子發票熱感紙材質皆有標準規範
試辦期間有部分民眾反映紙本電子發票熱感紙之材質,存放一段時間後會有發票資訊模糊的情形,擔憂會因此而無法對領獎,本部巳於日前明確訂定營業人必需使用中高階以上之紙質,並能達到基本防水、防油、防熱與防塑等「4防」之效果,除確保依帳證規定5年以上的保存年限外,且不含有雙酚A成分。另本部要求營業人應於消費後48小時內將電子發票相關資訊上傳電子發票整合服務平台,若發生營業人開立紙本電子發票有模糊之情況,可透過營業人與該平台之協助,維護民眾相關發票權益,本部絕對會保障民眾索取與對領獎之權益。
二、電子發票資訊政府控管安全無虞
本部電子發票整合服務平台主要提供發票資訊存證之服務,係儲存載具號碼與發票資訊,並無民眾個資。民眾除可採傳統發票的對領獎方式外,對於採取會員制之試辦商,民眾亦可選擇由業者協助中獎通知。同時,對於民眾消費隱私及中獎資訊之保護,不論業者或本部電子發票整合服務平台,除依電子發票實施作業要點要求落實資訊安全保護外,更嚴守個人資料保護法之相關規範,確保民眾消費隱私安全無虞。

100年6月份對國人調查電子發票看法
贊成者為62.01%,所以要到80%待努力

LayeredTrees: Most Specific Prefix based Pipelined Design for On-Chip IP Address Lookups

課程 : 論文研討()
日期 : 2011.11.18
時間 : 14:00 ~ 15:30
地點 : S414
作者 : 資工產碩() — 00366511吳家隆
講者 : 國立成功大學資訊工程學系-

路由器(router)是一種電腦網路連線設備,按照各種網路通信協定,大多數是 TCP/IP,少數是 IPX,極少數是其它協定,依照目地端網路位置,以路由器(router)為單位,分辨介面內部流量與外部流量,轉接到恰當的路由器(router)介面去。
 
路由協定(routing protocol)從適用範圍可分為適用區域網路(local area network)與廣域網路(wide area network)路由通信協定,適合區域的變動性快,儲存空間較小,大多是直接交換。

路由器通常都會提供 snmp 網路管理方式,讀或寫路由器內部 counter,甚至更改設定,同長提供 mib1 mib2 供使用扯讀取,mib1 大致為 layer 2mib2 大致為 layer 3 4,可以透過專屬的網管系統或是共享軟體來管理路由器。

http://www.godspeed.url.tw/network_A/%E8%B7%AF%E7%94%B1%E5%99%A8(router)%E7%B0%A1%E4%BB%8B.htm

 1969年有Layered Routers封包低,速度慢

近年技術提昇封包大,速度快

查詢快分流快;網頁à影音

放在CHIP內,但無法與現實同步à硬體設備提昇à封包查詢(ON CHIP 記憶體內之作法)

Ipv4   64bit 30多萬筆  à Ipv6  128bit 7000

必須執行一個 IP報文轉發的決定(稱為轉發,路由查找,或IP地址查找,最長前綴匹配)

確認封包傳送及儲存位

5+1之方式

運用表示法來辨別及取代資料,節省空間,同時可反解還原資料
 

Multiway Most Specific Prefix 樹採用 (n + 1) 位元的 prefix 表示法和區段表 [10] 來降低記憶體使用量。其多元平衡搜尋樹為本篇論文所提出「受制的B 樹建立演算法」 (CBA) 下建造的 B 樹,此演算法不但提昇原本 B 樹節點的使用率,也保持了能有效率的更新的特性。


獨立之情形時可以用同型累計來擷取

特性如下:

高速(例如40 Gbps/40-byte= 128M數據包/秒)
小型存儲(例如緩存或片上內存)
低更新時間
處理大型路由表的能力
實施的靈活性
低預處理時間
IPv6
規格



結論
動態路由表的分層樹,晶片上存儲器,並行和流水線架構,實現120 Gbps的吞吐量

2011年11月1日 星期二

Computer vision techniques for 3DTV

課程 : 專題講座
日期 : 2011.10.28
時間 : 14:00 ~ 15:30
地點 : S516
作者 : 資工產碩(一) — 00366511吳家隆
講者 : 清華大學資訊工程系賴尚宏教授

3D電影早已不是什麽稀罕事,而且還因此衍生出了形形色色的3D產品,什麽3D電視機、3D投影儀、3D照相機、3D手機……五花八門,琳瑯滿目,的確,3D立體效果讓我們感受到了顛覆傳統、突破性的觀影體驗那種強烈的真實感,那種奇妙的興喜感,那種難以言喻的刺激感,還有那種似真似幻、既怕又愛、欲說還休的感覺,都使得我們對3D電影有著極大的興趣。

一般我們最常看到的「3D立體影像」,大多是左、右眼兩個影像,其觀賞時必須要配戴3D眼鏡才能看到3D立體效果;但是,配戴3D眼鏡是有其不方便性,尤其是在某些特殊應用(如3D廣告)需要在公共場所(Public
Area)播放、或是行動裝置(Mobile
Device)攜帶在外使用、…等,這時候我們就必須要考慮使用不需配戴3D眼鏡的「裸眼3D立體顯示」裝置來呈現。
既然是要以「裸眼3D立體」技術來呈現3D立體效果,則我們就要準備可以使用於「裸眼3D立體顯示」的多視角(Multi-View)3D立體影像,以方便多人可以在不同的觀賞位置與角度看到3D立體影像。市面上雖然也有「裸眼3D立體顯示」裝置(如任天堂3DS掌上型遊戲機),只使用左、右眼二個影像來呈現3D立體效果;但是它會有較窄的觀賞視角與較短的觀賞距離限制,較適合小尺寸顯示、個人行動裝置使用,不適合多人觀賞。
下圖是一個以光柵片來呈現3D立體影像的例子,在有效3D觀賞視角內它可以呈現9個視角的3D影像。當處於「觀賞位置1」時,可以觀賞到第1(最右)與第9(最左)的影像,此時所觀賞到的是最大視差的3D立體效果;往後的「觀賞位置2」,則觀賞到的是間隔2個視角(如第3與第6)的影像;如果在「觀賞位置3」時,則僅能觀賞到相鄰兩個視角(如第4與第5)的影像,此時所觀賞到的是最小視差的3D立體效果;如果再往後退,則兩個眼睛會看到同一個視角的影像,因此不會有3D的視覺效果。從這個例子可以解釋為何「多視角3D立體影像」可以提供多人在不同位置同時觀賞到3D立體影像;也可以知道如何觀賞「多視角3D立體影像」:當我們觀賞3D效果不舒服(或視差太大)時,只要在有效3D觀賞距離內,則我們可以往後退到感覺舒服的觀賞位置。


了解「多視角3D立體影像」的觀賞原理後,接著我們就來談談如何製作「多視角3D立體影像」。要製作「多視角3D立體影像」之前,我們必須先了解左、右眼二個視角「3D立體影像」的呈像與拍攝、製作原理,本部落格中已有不少篇相關的文章,在此就不再贅述。其實「多視角3D立體影像」的拍攝與製作,與左、右眼二個視角的拍攝與製作完全一樣;我們只要在左、右眼二個視角的攝影機中間平均插入所需要的其餘同型攝影機數目即可。另外,如果我們是以「聚焦拍攝」(Convergent Shooting),則所有攝影機的鏡頭必須要定焦在同一位置;如果我們是以「平行拍攝」(Parallel Shooting),則所有攝影機的鏡頭必須要維持平行。這是進行「多視角3D立體影像」拍攝的基本認識。



當我們要進行「多視角3D立體影像」拍攝時,必須注意以下幾點事項:
 選擇同廠牌、同型號的攝影機(或相機)來使用,其機身愈小愈好以取得較近的攝影距離。
 使用定焦鏡頭,確保所拍攝影像場景尺寸一致。
 使用手動對焦,確保每個鏡頭都已正確對焦後,才能開始拍攝。
 使用相同「白平衡」與「測光」設定,以降低發生「色偏」的問題。
 各個攝影機(或相機)鏡頭的X、Y、Z軸幾何位置校調(需搭配監看顯示器與校正圖),確保每個鏡頭平均排在同一水平線上。如果是「聚焦拍攝」,則所有鏡頭必須要定焦在同一位置上。
 「同步拍攝」以確保各個攝影機(或相機)在同一時間拍攝一致的畫面。

2011年10月17日 星期一

Image Video Segmentation and Annotation by Social Media Analysis

課程 : 專題講座
日期 : 2011.10.14
時間 : 14:00 ~ 15:30
地點 : S516
作者 : 資工產碩(一) — 00366511吳家隆
講者 : 中正大學資訊工程系 朱威達教授

圖像與影片記錄有效的管理與紀錄注釋這些數位資訊與分享

物件辨識是電腦視覺研究領域中一個很重要的研究課題。在過去二十年,有相當多的物件辨識方法被提出。

利用SIFT (Scale-Invariant Feature Transform)的特點,即使是在不同視點的物件或影像,也能夠成功找出特徵點,並建立物件影像持徵點資料庫。接著利用隨機取樣物件之影像及取出特徵點與資料庫特徵點比對,利用特徵點對應點之成功數,及設立門檻值,推斷出最接近該物件的圖樣,近而找出該物件為何種類型物件。

SIFT 的原理與理論
對於SIFT 演算法主要可分為以下步驟:
1. 尺度空間的極值偵測(Scale-space extrema detection)
2. 特徵點定位(Accurate keypoint localization)
3. 方向的分配(Orientation assignment)
4. 特徵點描述(Keypoint descriptor)

本次演講著重在如何利用多模式的內容分析,從圖片、影片、以及文字註解來解決多媒體內容的分類、摘要、註解等難題。朱教授並提出具有創見的解決方案。演講期間展現出嚴謹自信的研究態度,更與大家分享未來的研究方向

2011年10月7日 星期五

Parallel Vision with GPGPU/CUDA 以GPGPU/CUDA進行平行視覺

課程 : 專題講座日期 : 2011.10.07
時間 : 14:00 ~ 15:30
地點 : S516
作者 : 資工產碩(一) — 00366511吳家隆
講者 : 輔仁大學電機工程系-王元凱教授

圖表處理器 或 GPU (偶爾地也叫 視覺處理器 或 VPU)是回報設備的熱忱的圖表 個人計算機, 工作站或者 遊戲控制臺. 現代GPUs是非常高效率的在操作和顯示 計算機圖表和他們的高度平行的結構比通用使他們有效 CPUs 為複合體的範圍 算法. GPU可能在頂部 顯示卡或者它可以集成直接地 主板. 超過90%新的桌面和筆記本計算機集成了GPUs,比他們的擴展程序相對物通常遠較弱。

通用GPUs (GPGPU)
一個新的概念是使用的一個修改過的形式允許通用圖表處理器. 這個概念轉動巨型 浮點 一條現代圖形轉移加速電極的shader管道的計算力量到通用計算能力裡,與要做圖解操作的單一艱苦架線相對。在要求巨型的向量運算的某些應用,這比常規CPU可能產生幾個數量級更高的性能。 二位最大的分離GPU設計師, ATI 并且 NVIDIA開始追求這個新市場以應用。 ATI合作與 斯坦福大學 創造一個基於GPU的客戶為它 http://www.worldlingo.com/ma/enwiki/zh_tw/Folding@home 分配計算項目(為蛋白質摺疊的演算)那在某些情況比用於這樣應用傳統上的常規CPUs四十次快速地產生結果。

基因編程在通用GPUs (GPGPGPU)
自2005年以來 有興趣在使用GPUs提供的速度上為 演變計算 一般來說和為加速 健身 評估 基因編程 特別是。 有短的介紹在頁90-92對基因編程的一個領域指南。 多數方法編寫 線性樹節目 在主人個人計算機和轉移可執行到GPU到奔跑。 典型地速度好處通過同時運行唯一活動程序只得到在許多例子問題平行使用GPU SIMD 建築學. 結實加速可能通過不編寫節目,反而轉移他們到GPU和interpretting他們也獲得那裡. 加速可能由interpretting的多個節目或者同時跑的多個例子問題同時然後獲得。或組合在兩個。 現代GPU (即 GTX 8800)能欣然同時解釋成千上萬的非常小節目。

視覺運算的功用早已遠遠超越遊戲之外,在我們的日常生活中已隨處可見。GPU 現在能夠為3D網路瀏覽、適地性視覺化應用程式、創新的內容開發、電腦視覺、使用者介面、影像識別、HD影片處理、虛擬世界別及其他更多應用增添無比威力。 此外,GPU 已經漸漸成為許多非繪圖應用的超級平台,包括從雲端運算、金融市場分析、電磁模擬、石油與天然氣探勘、醫療偵測以及其他科學計算。觀看全球最具創新概念的新興企業,利用繪圖處理器的優異效能,在立體3D、擴增實境(Augmented Reality) 、高效能運算以及更多其它領域上的發展。

基此我們可以運用GPGPU來處理更多更快之圖形,

1. 麥克・休斯敦。GPGPU http://graphics.stanford.edu/~mhouston/ . 檢索 2007-10-04.
2. S哈丁和W Banzhaf。 快速基因編程在GPUs. 檢索 2008-05-01.


3.NVIDIA GPU 扶植創業專區http://www.nvidia.com.tw/object/gpuventures_tw.html

2011年10月6日 星期四

人類運動補捉資料之特徵描述與資料檢索

人類運動補捉資料之特徵描述與資料檢索
課程 : 專題講座
日期 : 2011.09.30
時間 : 14:00 ~ 15:30
地點 : S516
作者 : 資工產碩(一) — 00366511吳家隆
講者 : 義守大學資工系-杜維昌教授

緣起:
阿凡達介紹1995年起,2005年進行籌劃至完成,
影片採用運動補捉及多種電腦繪製方式—功能
由靜態至動態
剛性模組----

技術說明:
表演捕捉技術(Performance capture)』:
這套系統的要點是,演員穿上裝滿感應器的特製衣服做出各種動作,再傳送
到電腦倣真影像,演員頭上還裝了可監察眼、口和任何細微動作的強化攝影機。
這些強化攝影機會捕捉人臉部的表情和身體動作將資訊輸入到電腦中,而特效人
員在這些表演的基礎上製作潘多拉星球的土著納美人。《阿凡達》中有60%的鏡
頭採用了表演捕捉技術。表演捕捉與動作捕捉相似,區別在於前者能完全捕捉演
員的肢體動作甚至臉部表情,將真人演出影像與電腦動畫結合,令動畫人物的造
型與表情更接近真人。動作捕捉時,除了需要演員穿上佈滿捕捉點的緊身衣褲
外,攝影棚內還同時架有一套協同工作攝像機,通過追蹤現場打出的近紅外光譜
的反射,將數據傳到一套系統中,再與演員運動組合分析,得出整個鏡頭的立體
模型,之後這些數據被映射到後期電腦處理,令CG(就是虛擬的意思)場景呈現
出高擬真的效果。










頭上有強化攝影機可協助拍攝臉部表情

虛擬攝影機』:
透過拍攝現場的一台LCD 螢幕虛擬攝影機,導演看到了過去只停留在其想
像中的阿凡達世界,彷彿真實地置身於如夢如幻的潘朵拉星球進行拍攝,並可不
斷地指導或調整演員與虛擬環境間的互動,將真人的表演完美融合於電腦所創造
出的世界裡。柯麥隆開發了虛擬攝影機,讓攝影師像跳舞般扭來扭去,運動軌跡
能夠被系統捕捉下來,並合成到後期的畫面處理中。為了讓讀者更容易可以了解
我上述所說的,簡單的來說:這個虛擬攝影機,可同時錄製2D 和3D 影像,而
且錄的時候攝影機是看到叢林的樣子,而不是拍戲時的佈景。
4. 『3D 虛擬影像擷取攝影科技﹝Fusion 3D﹞』:
導演詹姆士柯麥隆為了呈現他心目中的3D 效果,和攝影指導一起研發了名
為『Fusion 3D』的攝影裝備。這套技術,被預測即將徹底改變電影工業歷史。這
套設備最酷的地方,不只精細地補捉虛擬角色的各種表情神韻與動作,還可以模
擬不同角度與狀態,計算出導演想要的位置,節省許多時間與人力物力成本。

動作捕捉舞台







據報導演卡麥隆舉凡各類動植物的設定都是經卡麥隆核准後執行的。也難怪特效人員會戲稱:“我們懷疑卡麥隆其實去過那個星球。”而藉由動態捕捉技術(運動捕捉)呈現如真人般地靈活肢體語言,我剛好有看到幕後花絮:所謂的虛擬攝影棚(虛擬製作工作室),臉部補捉表情攝影系統(基於圖像的面部表演捕捉系統),其實就是演員都是在棚內拍攝的,真是太佩服他們的演技啦! 竟能這樣栩栩如生!尤其是女主角的表情真是生動豐富,當她嚎啕大哭時真是令人心碎,許多觀眾都忍不住在心裡大罵:“可惡的地球人呀!!“。
http://tw.myblog.yahoo.com/wild-divine/article?mid=3478


由下列引述:
人類運動辨識及動作混合:使用支持向量機與動作捕捉資料庫--杜宗翰

1.2維平面之數據及3維運動之數據來進行人體運動姿勢辨識之研究
2. 15種動作。分別為:揮手、走路、跑步等。
3. 透過41個被動式之紅外線光標點取得
4. 不同之特徵值(光標點),利用上述之驗證資料庫,進行3摺疊之交叉驗證(3-fold cross validation)
5. 實驗的過程中發現只需要補捉約5 ~ 18個光標點就可以達到原41個光標點89.7%~ 99.7%之準確度
6. 直接以動態擷取設備之光標點數目做為聚類演算法之類別數目
7. 簡化與加快動作混合的效率
http://ndltd.ncl.edu.tw/cgi-bin/gs32/gsweb.cgi/login?o=dnclcdr&s=id=%22098LHU05428010%22.&searchmode=basic

數據代表可行性,由現行研究過程中,發現未來虛擬經科技技術取代現實越來越容易且方便;除在環境保護立場可減少更多資源浪費,同樣可將想像成為可,但如何分辨虛實是另外一個議題。

2011年9月29日 星期四

最近特徵空間轉換法之人臉辨識技術

最近特徵空間轉換法之人臉辨識技術
課程 : 專題講座
日期 : 2011.09.23
時間 : 14:00 ~ 15:30
地點 : S516
作者 : 資工產碩(一) — 00366511吳家隆
講者 : 聯合大學資工系-韓欽銓教授


緣起:
人臉辨識是目前監控系統或生物特徵認證中熱門課題,在門禁系統等商業應用上需求很
大。應用於監控系統或生物認證系統時,要求高正確率,為此目的,發展「最近特徵空間
轉換法」之人臉辨識技術。

應用:
• 門禁管理: 大樓入口處住戶識別。
• 金融業務: 提款機存戶身分識別。
• 犯罪偵察: 對犯罪嫌疑人身分識別。
• 電腦認證: 對電腦使用者身分識別。

在作人臉辨識之前,首要的步驟就是對影像做人臉的偵測,如何在複雜的背景中,粹
取出人臉影像的研究已發展多年,且已有相當多的論文發表,但一般可以分成:以特徵為
基礎(Feature-Based)和以學習為基礎(Learning-Based)這兩大類。

A .Feature-based的方法主要是依照人臉的特徵來偵測臉部,有關人臉的特徵包括,利用膚
色、邊緣偵測、人臉對稱性、人臉形狀、人臉特徵位置的分布、及人臉模板
(face template)等方法來偵測臉部。

B. Learning-Based的方法主要是利用學習的方式,例如:Rowley和Sung使用的方法是將臉
的分布,經由類神經網路學習起來。然後再用固定大小的範圍去比對整張影像,以找出人
臉的位置,此類的方法較不會因為某些特徵不明顯而導致偵測失敗。

• 人臉辨識是人類視覺之特別能力,目前已有很多不同影像處理和人臉辨識技術被提出。在以特
徵為基礎的技術中,由統計測量方法取得由臉部得到之特徵向量集合,這個集合被視為臉部形
態並且表示相關特徵和關係,這種方法被「是否能夠得到足夠資訊以估計結構」所局限。
• 另一種方法是以樣版為基礎,這種方法是以一些合適樣版來表示整個臉部,當物件結構是預先
知道的,物件大小、位置以及方向不需要固定,可變形樣版對於找出或是表示影像中目標物件
是一種有效技術。
• 人臉資料庫中包含
– 不同角度
– 不同位置
– 不同大小
– 不同光線
– 不同表情
– 不同髮型
– 有沒有戴眼鏡等變化

無法辨識影像因素
1. 光線
2. 臉部表情及髮型
3. 角度

舉例:
Delaunay分割
• 唯一性(unique)
• 區域重建 (local re-meshing)
• 不受大小、方向及位置的改變影響(arrangement invariance)
• 較能適應影像中的邊(edges).
• Delaunay三角化於臉部辨識之應用
















Delaunay應用於人臉辨識特性:
不受方向、位置、大小及雜訊影響;未來可利用三角形結構作為類神經網路之輸入
以上參考文獻:
Delaunay三角化於臉部辨識之應用
http://image.cse.nsysu.edu.tw/research/Delaunay/delaunay.htm

2011年9月19日 星期一

碎形分析與醫學影像應用(Fractal Analysis and Medical Image Applications)

課程 : 論文研討
日期 : 2011.09.16
時間 : 13:50 ~ 15:40
地點 : S516
作者 : 資工產碩(一) 00366511吳家隆
講者 : 中興大學理學院 黃博惠院長
因為光有題目,沒有參考資料對Fractal Analysis and Medical Image Applications無法立即瞭解,期初還真不清楚黃院長要說什麼;經黃院長從源由、到圖形後再至分析運用,總算知道”碎形”分析之用途。
一、碎形說明
1、 碎形—幾何形狀、不規則變化,一般平滑幾何體破裂之後所產生的形狀,
a. 席爾賓斯基墊片




















b. 擴散置限聚集的隨機碎形
















碎形──大自然的幾何學
http://163.27.3.193/Science/content/1994/00030291/0008.htm

a:席爾賓斯基墊片──分割三角形為漸次小的三角形從而產生的一個簡單碎形。
b:一種叫做擴散置限聚集的隨機碎形,產生模擬閃電和其他自然現象的樹枝樣形態


2、 康托(cantor):許多數學結構無法與歐式幾何的形式相關用來描述,取自簡單直線段上的點集;
3、 歐基里德的幾何無法用來描述雲、山、樹木或海岸線、樹木非光滑,閃電不是直線….之理論。
以上之說明碎形:具有自我相似的無窮結構;維度可代表它的特徵

接著從引用本理論及各相關如寇赫曲線、皮亞諾曲線等證明物體紋理影像判別現況,從碎形維度估算方式,表示其可行性,運用於醫療切片檢查技術上,(黃院長用榮總提供病理資料分析)所得結果---其準確度可達到92%~95%。
科技運用分析除縮短時間外,可提高準確度,而累計數據結果可長期做資料追蹤。
唯一美中不足是病理樣品數不足,提供單位因資料保密,可能是同一案例不同期資料(重複性)、人為取樣因素;但足以證明此技術其準確度及可行性。

二、實例 參考
a.乳房X光片星狀物腫瘤輪廓之偵測
http://ir.lib.nchu.edu.tw/handle/309270000/51604
乳房X光攝影(Mammography)為臨床上醫生診斷乳癌(Breast cancer)的利器,在診斷乳房攝影腫瘤的影像時,可利用輪廓特徵來決定為良性或惡性腫瘤,良性腫瘤通常都會呈現圓滑的輪廓特徵,而惡性腫瘤則呈現星狀或不規則不平滑輪廓特徵,這種星狀或不規則不平滑特徵組織,稱為星狀物腫瘤(Spiculation),指的是腫瘤周圍的乳腺組織,因星狀物往外侵犯的關係造成的變形,星狀物的存在是惡性腫瘤判斷的依據。

b.傳統暨數位乳房攝影系統之物理測試彙整建議 中華放射醫誌 Chin J Radiol 2008; 33: 153-179
可使用條狀、星狀或楔形測試(p.156)
http://www.rsroc.org.tw/db/ejournal/article/V33/N3/330306.pdf

c. 以M-頻段小波轉換為基礎的碎形特徵向量應用於超音波肝臟組織分析 李文立
以M-頻段小波轉換為基礎的碎形特徵向量來對正常肝、肝硬化、肝癌等三類的超音波肝臟影像辨識。而所提出的特徵擷取法則是架構在空間-頻率的分解及碎形幾何上。同時,我們也提出以不同的紋理量測與濾波器組為基礎的分類法則並且測試之。……………….。由於在超音波肝臟影像中,最明顯的特徵為粗糙度(roughness),其中肝癌影像較肝硬化影像來的粗糙。因此,我們提出一階層式的分類器,首先辨識正常肝臟與不正常肝臟,其辨識率為96.7%;接著辨識肝硬化與肝癌,其辨識率為93.6%。此外,我們也探討如何選取一合適的特徵向量並做一些比較性的實驗。
在碎形幾何中,碎形維度(fractal dimension)是相當重要的一個特徵。因此,在監督式的辨識實驗中,我們對碎形維度的計算,提出一更為有效和穩健的計算方法。我們所提出的計算方法是以「積木計數」為基礎並加以改良。
http://ir.lib.nthu.edu.tw/handle/987654321/34908