顯示具有 00366050 張文銓 標籤的文章。 顯示所有文章
顯示具有 00366050 張文銓 標籤的文章。 顯示所有文章

2012年1月11日 星期三

Open Your Driving Vision


學號、姓名 : 資工研一 00366050 張文銓
日期 : 2011.12.23
時間 : 14:00 ~ 15:30
演講者 : 國立中央大學資訊工程所 吳曉光 教授

車載網路Vehicular Ad-Hoc Network (VANET)為一種以移動車輛為平台,利用無線網路相連結所形成的動態連結網路。隨著無線行動網路的普及,如何運用車載網路提昇行車安全與增進乘車娛樂,已成為近年世界各國政府、產業界、學術界所共同致力研究與推廣的課題。例如美國的Vehicle Safety Consortium以及Vehicle Infrastructure Integration Program (VII),歐盟的Car-2-Car Communication Consortium,以及日本的Advanced Safety Vehicle Program;另外國際間有關車載網路相關規格的標準化也持續在進行,例如IEEE 802.11p (WAVE)等。

車載網路所使用的通訊網路,一般可以分為車內網路(Intra-vehicle Networks)、車際網路(Inter-vehicle Networks)以及寬頻網路(Broadband Networks)。車內網路的功能一般為線路取代(cable replacement)以及車內娛樂系統;車際網路的功能則為車量資訊交換以及路況資訊傳遞;寬頻網路的功能則為網際網路存取。此三類網路由於其所針對之應用服務不同,因此所搭配使用的無線網路技術在速率與傳遞距離等之需求亦各不相同。因此,如何有效結合此三類網路於車載網路系統,並能結合安全、娛樂、方便、隱私等功能,遂成為十分重要之課題。

Hybrid IP Traceback Scheme with Efficient Packet Logging


學號、姓名 : 資工研一 00366050 張文銓
日期 : 2011.12.16
時間 : 14:00 ~ 15:30
演講者 : 中原大學楊明豪

DDoS
分散式阻斷服務(DDoS)攻擊的前身是所謂的『阻斷服務(Denial of-Service,簡稱DoS)攻擊』。DoS攻擊並不以篡改或竊取主機資料為目的,而是癱瘓系統主機使之無法正常運作。換言之,由於一般網路系統的系統資源(例如記憶體、磁碟空間以及網路頻寬等)皆有限,因此駭客可以根據部分網路系統或者相關通信協定等之設計或實作上的漏洞,在一段期間內透過傳送大量且密集的封包至特定網站,使該網站無法立即處理這些封包而導致癱瘓,進而造成網路用戶無法連上該網站而被阻絕在外。
DDoS的攻擊原理大都是利用TCP/IP網路協定本身的漏洞與特性,使受攻擊之目標主機或網路因無法處理由駭客所發出或偽造的大量垃圾封包,而導致系統停滯或當機。目前電腦駭客常用的DDoS攻擊程式,大致上可以分為下列三種:
1.利用網路主機處理封包的特性進行攻擊,其做法是向受攻擊之目標主機發出超過其負荷之垃圾封包,使之因無法即時處理而導致當機;或者是改變封包的控制資料,使網路主機無法正確地處理所收到的封包。
例如:Ping of Death、TearDrop攻擊。      
2.利用icmp做洪水或倍增型攻擊。
例如:smurf、icmp攻擊。       
smurf攻擊:直接對網路進行廣播,造成網路很快地充滿垃圾封包而中斷。smurf會不斷地將小量偽造的icmp要求封包送給IP廣播位址(IP broadcast address),然後廣播位址會傳回大量的icmp回應封包給目標主機。這種smurf的攻擊方式除了攻擊特定目標主機,也能在網路上塞滿icmp的要求封包與回應封包而造成網路中斷,所以常被稱為smurf倍增型攻擊。       
icmp攻擊:將大量『偽造來源位址』的icmp要求封包送給目標主機,目標主機會回應等量的icmp回應封包而造成目標主機無法負荷而當機。      
3.利用TCP/IP通訊協定中詰問-回應模式的漏洞進行攻擊。
SYN Flood攻擊:駭客只對目標主機發送一連串的SYN封包,每個封包都要求目標主機系統回應一個SYN-ACK封包,然後目標主機系統在回應SYN-ACK封包後會等待對方送出ACK封包。由於駭客並不產生任何ACK封包給目標主機,因此目標主機的系統佇列裡面會暫存大量的SYN-ACK封包,這些封包必須等到收到對方的ACK封包或是超過逾時時間之後才會被移除。如此目標主機系統會因為充滿了SYN-ACK封包而造成無法再處理其他使用者的服務與要求。    
LAND攻擊:運用IP Spoofing技術送出一連串SYN封包給目標主機,讓目標主機系統誤以為這些封包是由自己發送的。由於目標主機在處理這些封包的時候,它自己並無法回應給自己SYN-ACK 封包,因而造成系統當機。值得注意的是LAND攻擊程式原本是設計用來造成Windows95當機,但經過實際測試結果發現,許多Unix工作站、甚至Router也受其影響。
http://www.ascc.sinica.edu.tw/nl/89/1620/02.txt 

立體 3D (S3D) 數位內容製作技術


學號、姓名 : 資工研一00366050 張文銓
日期 : 2011.12.09
時間 : 14:00 ~ 15:30
演講者 : 國立中正大學賴文能教授

3D立體技術簡介
簡單介紹一下人類如何感受立體, 空間立體感的成因主要是由於雙眼視差 (binocular parallax)與移動視差 (motion parallax) 的緣故, 雙眼視差簡單來說人類的左眼與右眼(瞳孔間距)有約6.5公分的水平方向差距, 這會使的人類在觀看物體時, 左右眼會有不同的觀看角度(觀賞距離越小, 左右眼觀賞角度差異越大), 於是左右眼所接收的影像內容就會不同, 之後大腦再將這兩幅不同的影像合成一幅立體影像. 大腦合成立體影像的過程涉及人類演化, 心理, 醫學等複雜因素, 目前各種3D立體顯示技術在開發初期會先避開這個問題, 化繁為簡的將焦點放在兩眼接受不同影像的這個概念上, 從這個簡單的想法出發我們可以將目前的3D立體顯示技術先粗分為戴眼鏡式(Stereoscopic) 以及裸眼式(Auto stereoscopic)

立體影像(Stereoscopic Images),就是真正需要由雙眼才能看得 到具有深度、層次感 (更確切地說,應是具有第三度空間)的影像。 由於"3D"這個名詞已被泛用(或濫用)在一般實際以"2D"影像加上漸層陰影、光 線追蹤 (RayTracing)、 等效果去模擬所謂的"3D" 立體影像;為了區別於此大家所耳 熟能詳的"3D"而不至於造成名詞上的混淆,乃使用"Stereoscopic Images"一詞來加以解說,亦較為貼切。Stereoscope(立體鏡),係用來觀看立體相片的一種工具。如下圖係常見的一些立體鏡,目前我們仍可以在某些玩具店或照相行裡買到 ,只是形狀、操作上或許會有些不一樣,但是功能卻是大同小異的。


LayeredTrees: Most Specific Prefix based Pipelined Design for On-Chip IP Address Lookups


學號、姓名 : 資工研一 00366050 張文銓
日期 : 2011.11.18
時間 : 14:00 ~ 15:30
演講者 : 國立成功大學資訊工程學系

路由器就是連接兩個以上網路線路的設備。 由於位於兩個或更多個網路的交匯處,從而可在它們之間傳遞分組(一種數據的組織形式)。路由器與交換機(Switch)在概念上有一定重疊但也有不同:交換機泛指工作於任何網路層次的數據中繼設備(儘管多指網橋),而路由器則更專註於網路層。
一個比較直觀的理解路由器與交換機區別的例子是這樣:交換機好比是鄰近的街道,而路由器則是街道的交匯點。一個街區的每一間房都有它自己的地址,也就是說,交換機連接的不同的設備也有它們自己的IP位址。

而教授提出的是加入On-chip的設計架構,利用FPGA(FPGA, Field Programmable Gate Array: 現場可程式邏輯閘陣列)來達到快速查詢的目的,並且使用特別的路由器lookup功能來效能更佳。

雲端應用--電子發票智慧好生活


學號、姓名 : 資工研一 00366050張文銓
日期 : 2011.11.04
時間 : 14:00 ~ 15:30
演講者 : 財政部財稅資料中心-高級分析師盧志山


簡介

電子發票制度乃是因應電子商務之發展

提供營業人利用網際網路傳輸統一發票(簡稱電子發票)給買受人之作業

透過以網際網路或其他電子方式開立、傳輸或接收之統一發票

以網路傳遞,能解決傳統紙本發票管理成本高且不易掌握時效及留存空間等問題。


節能減碳

目前每年的發票使用量平均約80餘億張,如果全面推動電子發票

一年就可以少砍80000棵樹,可節省3200噸的碳排放量

節能減碳從使用電子發票做起,一起環保愛地球。


一、發票電子化,為何還要有紙本電子發票?

電子發票推動須全盤考量,為使營業人使用電子發票初期較為便利,並考量消費索取發票習慣,一時難以改變,且兼顧隱私權與索取多元化服務,紙本電子發票為推動電子發票過程中過渡產物。依試辦實務觀察,雖然紙本電子發票與電子發票暫時並行,惟已確實達到用紙量與營業人印紙減少的效益,與無紙化政策並無違背。

二、紙本電子發票之存在是否有違背電子發票「節能省碳」之環保目標?

電子發票目標之一就是無紙化,節能減碳一直為推行以來的宗旨。此政策的推動分三階段進行,第一階段為「適應期」,針對未使用載具索取電子發票的民眾,仍會提供紙本電子發票因應。第二階段「成長期」,透過多元載具的應用,整合越來越多的載具,預劃信用卡、金融卡、甚至手機號碼等,均將成為索取電子發票的載具之一,讓民眾索取電子發票更為便利,可大量減少紙本電子發票的需求。第三階段「成熟期」,待多數民眾漸漸習慣電子發票後,導入電子發票的營業人,將不再提供紙本電子發票,並預期全年電子發票量將會占總發票量的50%,落實環保愛地球的推動目標。因此,紙本電子發票為平衡數位落差與平衡發展之必要產物。


https://www.einvoice.nat.gov.tw/wSite/ct?xItem=1354123&ctNode=1238&mp=1

Computer Vision Technique for 3DTV


學號、姓名 : 資工研一 00366050張文銓
日期 : 2011.10.28
時間 : 14:00 ~ 15:30
演講者 : 清華大學資工系副系主任 賴尚宏教授


從過去傳統電視機(CRT TV)以來就已經有「3D TV」,它是使用LCS(液晶快門)立體眼鏡來觀賞3D影片(有關LCS眼鏡的工作原理,可以參考本部落格的另一篇文章「如何觀賞3D立體影像 -- 液晶快門立體眼鏡篇」),只是它的Refresh Rate(畫面更新率)是60Hz(NTSC系統的電視),藉由其「交錯顯示」(Interlacing Display Mode)的方式,可以將左、右「交錯影像格式」(Row Interlaced Format)的影像分離出來;亦即每秒只能送給左、右眼各30個畫面(Frame),如此使用LCS眼鏡來觀賞3D影片,會有嚴重的「閃爍」(Flicker)現象,容易造成眼鏡觀賞不舒服,所以長久以來一直為人所詬病,這也是傳統3D電視機(CRT TV)無法流行起來的主因之一。
時至2007年,市場上再度看到「3D TV」的身影 -- Samsung與Mitsubishi所極力推廣的「3D Ready TV」(使用TI「DLP 3D HDTV」的技術應用於DLP的背投影系統);其工作原理是:將「棋盤式格式」(CheckerBoard Format)的左、右影像分離出來,再以120Hz的Refresh Rate將此左、右影像交換顯示(Page-Flipping或Frame Sequential Display)方式投影到螢光幕上,再透過VESA DIN-3送出「Stereo-Sync」的訊號給LCS眼鏡工作,如此就可以觀賞到3D立體影像。雖然我們左、右眼所看到的只有一半畫面的解析度,但是其3D品質已經可以被接受了。不過,這種「3D Ready TV」只有在北美地區上市,總數量約有400萬台,但是真正有進行3D應用者約僅佔1%(約4萬台)而已。其主要原因還是缺乏主流消費型的應用 – 3D立體節目與電影。




比較項目

主動式

被動式

3D顯示方式

Page-Flipping (Frame Sequence)

Micro Retarder偏光膜

3D立體眼鏡

LCS眼鏡

偏光眼鏡

3D解析度

全畫面

半畫面 (垂直畫面降一半)

3D Ready

解決方案

l 1080p/24Hz à 1080p/120Hz

l 輸出Stereo-Sync.LCS眼鏡

l Micro Retarder偏光膜

l 1080p/24Hz à Row Interlaced Image

視角

沒有任何限制

有限制

3D立體眼鏡價格



2011年10月29日 星期六

Image/Video Segmentation and Annotation by Social Media Analysis



課程 : 論文研討
日期 : 2011.10.14
時間 : 14:00~15:50
地點 : S516
作者 : 資工碩一 張文銓
講者 :
中正大學資訊工程系 朱威達教授

這次演講的主題是跟影像處理有關,利用拍攝的相片與影片或其他來源(網路或多媒體等等)的圖片與影像,進行一連串的處理,其主要目的是用來分析並解決多媒體的分類,並且可以隨意的加入摘要與註解

教授提到了SIFT的技術,不過其實我聽不太懂,所以去GOOGLE了一下,得到以下介紹。

SIFT (Scale-Invariant Feature Transform)是一種電腦視覺的演算法用來偵測與描述影像中的局部性特徵,它在空間尺度中尋找極值點,並提取出其位置、尺度、旋轉不變數。若找兩影像的關鍵點特徵來比對,可發現越相似的影像,關鍵點特徵符合數越多,藉此來判斷兩影像的相似度。

SIFT的作用在:局部影像特徵的描述與偵測可以幫助辨識物體,SIFT 特徵是基於物體上的一些局部外觀的興趣點而與影像的大小和旋轉無關。對於光線、雜訊、些微視角改變的容忍度也相當高。基於這些特性,它們是高度顯著而且相對容易擷取,在母數龐大的特徵資料庫中,很容易辨識物體而且鮮有誤認。


參考:

2011年10月11日 星期二

Parallel Vision with GPGPU/CUDA 以GPGPU/CUDA進行平行視覺


課程 : 論文研討
日期 : 2011.10.07
時間 : 13:50 ~ 15:50
地點 : S516
作者 : 資工研一 張文銓
講者 :
輔仁大學電子系 王元凱教授

根據摩爾定律,每18個月電晶體的個數會變成兩倍,而頻率也會往上升,但是產生的廢熱量也隨之往上,當頻率到達4GHz時,達到一個瓶頸。這個瓶頸不是因為做不到電晶體個數加倍,而是因為散熱的問題。當產生的廢熱量超過散熱器所能散掉的熱量時(散熱器的大小有限),就導致了開發的瓶頸,因此開發方向就往多核心開始發展。

根據研究顯示,當一顆核心分成兩顆核心時,其產生的廢熱量會僅剩下四分之一,所以單核心變成多核心的確能有效解決散熱的問題。在多核心方面,顯示卡核心很久就進入多核心的開發,因此多核心技術方面也高出很多,以現在的技術差不多幾萬元的顯示卡,其核心就多達1000顆以上,其平行處理能力也十分強勁。前幾年CPU製造商AMD併購了顯示卡製造商ATI,其目的之一也是為了顯示卡的多核心技術,期望可以用來參考在CPU上。


而其中GPGPU,根據為基百科的解釋為,通用圖形處理器General-purpose computing on graphics processing units,簡稱GPGPU或GP²U),是一種利用處理圖形任務的圖形處理器來計算原本由中央處理器處理的通用計算任務。這些通用計算常常與圖形處理沒有任何關係。由於現代圖形處理器強大的並行處理能力和可程式流水線,令流處理器可以處理非圖形數據。特別在面對單指令流多指令流(SIMD),且數據處理的運算量遠大於數據調度和傳輸的需要時,通用圖形處理器在性能上大大超越了傳統的中央處理器應用程序。

圖為240核心(現在技術已經可以到千核以上)


多核心圖片


根據王教授所做的實驗,他們原本要用3個月進行運算的資料,現在只要1到2天即可完成,也就是比原本的速度快了將近74倍左右,由此可知平行處理的確是非常方便且強力的技術。

人類運動捕捉資料之特徵描述與資料檢索


課程 : 論文研討
日期 : 2011.09.30
時間 : 14:00 ~ 15:50
地點 : S516
作者 : 資工研一 張文銓
講者 : 義守大學資工系
杜維昌教授

隨著電腦動畫產業的興起,許多動畫公司開始著重於快速的開發時程以及擬真的視覺效果,動作捕捉器也儼然成為製作動畫不可或缺的重要工具。但由於使用運動捕捉器會產生大量的運動捕捉資料,因而如何在這些龐大散亂的運動資料庫中有效且快速找尋相似的運動資料是近幾年來熱門的研究議題。演講教授的目標是透過運動資料語意的挖掘,開發快速檢索出使用者需要的運動資料,並符合人類對運動語意的認知。一般而言,運動資料是屬於高維度的資料,現有研究多數採用三維點座標、角度、節點的分佈或使用主成份分析來降低資料維度,進而達到特徵萃取的效果,但這些特徵對於姿勢的形變大多相當敏感。其中有一種方法是採用方位關連性特徵為基礎的特徵萃取方法,具有空間和時間轉換不變性,並以直方圖形式記錄每一片段可能出現姿勢的機率作為特徵,藉以加快相似度比對的計算時間。基於運動捕捉資料的紋理特性,亦開發自動化運動資料分割方法,並以此為基礎使用高維度資料結構方法建立索引,以達到快速檢索的目的。

技術之一:機械式運動捕捉

機械式運動捕捉依靠機械裝置來跟蹤和測量運動軌跡。典型的系統由多個關節和剛性連杆組成,在可轉動的關節中裝有角度感測器,可以測得關節轉動角度的變化情況。裝置運動時,根據角度感測器所測得的角度變化和連杆的長度,可以得出杆件末端點在空間中的位置和運動軌跡。實際上,裝置上任何一點的運動軌跡都可以求出,剛性連杆也可以換成長度可變的伸縮杆,用位移感測器測量其長度的變化。

早期的一種機械式運動捕捉裝置是用帶角度感測器的關節和連杆構成一個"可調姿態的數位模型",其形狀可以類比人體,也可以類比其他動物或物體。使用者可根據劇情的需要調整模型的姿態,然後鎖定。角度感測器測量並記錄關節的轉動角度,依據這些角度和模型的機械尺寸,可計算出模型的姿態,並將這些姿態數據傳給動畫軟體,使其中的角色模型也做出一樣的姿態。這是一種較早出現的運動捕捉裝置,但直到現在仍有一定的市場。國外給這種裝置起了個很形象的名字:"猴子"

這種方法的優點是成本低,精度也較高,可以做到即時測量,還可容許多個角色同時表演。但其缺點也非常明顯,主要是使用起來非常不方便,機械結構對表演者的動作阻礙和限制很大。



技術之二:聲學式運動捕捉

常用的聲學式運動捕捉裝置由發送器、接收器和處理單元組成。發送器是一個固定的超聲波發生器,接收器一般由呈三角形排列的三個超聲探頭組成。通過測量聲波從發送器到接收器的時間或者相位差,系統可以計算並確定接收器的位置和方向。

這類裝置成本較低,但對運動的捕捉有較大延遲和滯後,即時性較差,精度一般不很高,聲源和接收器間不能有大的遮擋物體,受雜訊和多次反射等干擾較大。由於空氣中聲波的速度與氣壓、濕度、溫度有關,所以還必須在演算法中做出相應的補償。

技術之三:電磁式運動捕捉

電磁式運動捕捉系統是目前比較常用的運動捕捉設備。一般由發射源、接收感測器和資料處理單元組成。發射源在空間產生按一定時空規律分佈的電磁場;接收感測器(通常有1020個)安置在表演者身體的關鍵位置,隨著表演者的動作在電磁場中運動,通過電纜或無線方式與資料處理單元相連

電磁式運動捕捉的優點首先在於它記錄的是六維資訊,即不僅能得到空間位置,還能得到方向資訊,這一點對某些特殊的應用場合很有價值。其次是速度快,即時性好,表演者表演時,動畫系統中的角色模型可以同時反應,便於排演、調整和修改。裝置的定標比較簡單,技術較成熟,魯棒性好,成本相對低廉。

它的缺點在於對環境要求嚴格,在表演場地附近不能有金屬物品,否則會造成電磁場畸變,影響精度。系統的允許表演範圍比光學式要小,特別是電纜對表演者的活動限制比較大,對於比較劇烈的運動和表演則不適用。

技術之四:光學式運動捕捉

目前常見的光學式運動捕捉大多基於電腦視覺原理。從理論上說,對於空間中的一個點,只要它能同時為兩部相機所見,則根據同一時刻兩部相機所拍攝的圖像和相機參數,可以確定這一時刻該點在空間中的位置。當相機以足夠高的速率連續拍攝時,從圖像序列中就可以得到該點的運動軌跡。

典型的光學式運動捕捉系統通常使用68個相機環繞表演場地排列,這些相機的視野重疊區域就是表演者的動作範圍。為了便於處理,通常要求表演者穿上單色的服裝,在身體的關鍵部位,如關節、髖部、肘、腕等位置貼上一些特製的標誌或發光點,稱為"Marker",視覺系統將識別和處理這些標誌

光學式運動捕捉的優點是表演者活動範圍大,無電纜、機械裝置的限制,表演者可以自由地表演,使用很方便。其採樣速率較高,可以滿足多數高速運動測量的需要。Marker的價格便宜,便於擴充。



運動捕捉技術在其他領域的應用

將運動捕捉技術用於動畫製作,可極大地提高動畫製作的水準。它極大地提高了動畫製作的效率,降低了成本,而且使動畫製作過程更為直觀,效果更為生動。隨著技術的進一步成熟,表演動畫技術將會得到越來越廣泛的應用,而運動捕捉技術作為表演動畫系統不可缺少的、最關鍵的部分,必然顯示出更加重要的地位。

提供新的人機交互手段

表情和動作是人類情緒、願望的重要表達形式,運動捕捉技術完成了將表情和動作數位化的工作,提供了新的人機交互手段,比傳統的鍵盤、滑鼠更直接方便,不僅可以實現"三維滑鼠""手勢識別",還使操作者能以自然的動作和表情直接控制電腦,並為最終實現可以理解人類表情、動作的電腦系統和機器人提供了技術基礎。

虛擬實境系統

為實現人與虛擬環境及系統的交互,必須確定參與者的頭部、手、身體等的位置與方向,準確地跟蹤測量參與者的動作,將這些動作即時檢測出來,以便將這些資料回饋給顯示和控制系統。這些工作對虛擬實境系統是必不可少的,這也正是運動捕捉技術的研究內容。

機器人遙控

機器人將危險環境的資訊傳送給控制者,控制者根據資訊做出各種動作,運動捕捉系統將動作捕捉下來,即時傳送給機器人並控制其完成同樣的動作。與傳統的遙控方式相比,這種系統可以實現更為直觀、細緻、複雜、靈活而快速的動作控制,大大提高機器人應付複雜情況的能力。在當前機器人全自主控制尚未成熟的情況下,這一技術有著特別重要的意義。

互動式遊戲

可利用運動捕捉技術捕捉遊戲者的各種動作,用以驅動遊戲環境中角色的動作,給遊戲者以一種全新的參與感受,加強遊戲的真實感和互動性。

體育訓練

運動捕捉技術可以捕捉運動員的動作,便於進行量化分析,結合人體生理學、物理學原理,研究改進的方法,使體育訓練擺脫純粹的依靠經驗的狀態,進入理論化、數位化的時代。還可以把成績差的運動員的動作捕捉下來,將其與優秀運動員的動作進行對比分析,從而幫助其訓練。


參考資料來源:

2011年9月28日 星期三

最近特徵空間轉換法之人臉辨識技術


: 論文研討
: 資工研一
: 100 9月23
演講者 : 韓欽銓教授

: 最近特徵空間轉換法之人臉辨識技術
: 張文銓
: 00366050

這次講的人臉辨識,數學式子很多,雖然韓教授已經盡量講得很生活化了,可是還是有些不太懂。只記得主要辨識技術是特徵空間計算空間中的點,然後計算距離,距離公式很簡單,就是以前就學過的,只是現在運到人臉辨識後,就會從簡單的幾何座標變成線性代數,那可是很難的東西啊!

在人臉辨識中有許多問題

1. 高維度

2. 益壽光線影響

3. 多表情

4. 多角度

5. 部分遮蔽

小樣本問題

1. 訓練樣本太小

2.影像維度太高


而人臉辨識流程主要分成三部分:

1. 特徵表示方法

2. 特徵區分能力分析

3. 分類器設計


其中韓教授所改良的方法就是在第二部分特徵區分能力分析上有所突破,而關於哪裡突破,起初聽完演講還是一頭霧水,會來聽黃世育教授解說過後,才終於懂了。

改良的地方是最近空間轉換法,也就是在比對照片時,是將照片化為0/1數據,在比較每個點的差距,例如灰階就有8bits,也就是8個數值不同點,如此就可以運用距離公式,求得與資料庫中最相近的幾張照片,從而判斷是否為某個人。此外,韓教授還有介紹一個技術,就是用點到線取代點到點。這次什麼意思呢?就是當資料庫中有數張照片,而因為要比對的人臉幾乎不可能與資料庫的照片一模一樣(光線、角度等),所以在比對時,系統會將資料庫中的照片,計算任兩張中間可能產生的變化,所以假如放6張,那資料庫可能會產生60張關聯照片,甚至可以更多,只是產生太多張付出的代價就是速度很慢。而點對點就是先比較兩張比較相似於測試者人臉的照片,再找這兩張照片的關聯照片;而點對線則是把兩張照片間所產生的關聯照片都成一條連接兩點的線,然後直接從線的正中間那張關聯照片開始比對。如此一來就可大幅縮小比對所需的時間。


人臉辨識可以運用在很多方面,以下是幾種應用:

1. 門禁管理

2. 生物特徵認證

3. 相簿管理

4. 人員計數