顯示具有 HW05 標籤的文章。 顯示所有文章
顯示具有 HW05 標籤的文章。 顯示所有文章

2011年10月7日 星期五

Parallel Vision with GPGPU/CUDA 以GPGPU/CUDA進行平行視覺

課程 : 論文研討(三)
日期 : 2011.10.07
時間 : 13:50 ~ 15:50
地點 : S516
作者 : 資工產碩(二) — 張金燦
講者 :
輔仁大學電子系王元凱教授

Parallel Vision with GPGPU/CUDA 以GPGPU/CUDA進行平行視覺


  讓PC變成超級電腦真的不是夢想了,只要使用繪圖處理器(GPU),再加上支援的PC主機板,即可讓超級電腦不再是高昂的設備,尤其將它運用在圖形的運算處理上,更能感受到他的快感,當然還有很多其他的應用的。像是前回專題演講中提到的電影阿凡達也是利用到這一個技術,讓一個電影場景的產生工作由一個星期縮短到只要一天半即可完成*;或是像比利時的安特衛普大學(University of Antwerp)有個稱為ASTRA的醫學影像掃描學術研究單位,利用PC並結合四張繪圖處理器(GPU核心)Super PC
,讓需要做3D影像處理工作由一小時縮短為30秒的例子**等,看到這個在YouTube***上的影片,想到以前請日本TOSHIBAX-Ray CT scan需要花費甚多的時間,原來後製的組合這麼耗時間。

  GPU用在非傳統的3D圖形顯示方面的應用,一般資訊界通稱為「GPGPU」(General-purpose computing on graphics processing units),有別於GPU係因為硬體廠商為了讓他發揮更大的效能,將GPU的應用模組函數開發成SDK供研究人員、學者、開發人員與程式設計師能實際的去應用她對資料的處理能力,像是今天以繪圖卡大廠NvidiaCUDA(Computing Unified Device Architecture)為例,可以讓既有的程式在經過重新編譯後,讓執行效能就有2倍的提升;王老師也提到,由台許舜欽所開發的西洋棋程式,程式碼不需做任何的變動,其運算效能在GPGPU下有大幅的提升,由其他可整合入目前被廣泛使用的程式設計語言:C/C++/Java等,看來或許哪天只要讓CPU做最簡單的I/O管理工作,其他的工作就交由GPU來完成即可了,對了中國開發的超級電腦也是應用GPU來做協同運算的。



(Bob) X-Ray CT scan image

* http://www.nvidia.com.tw/object/wetadigital_avatar_tw.html
** http://fastra.ua.ac.be/en/index.html
*** http://www.youtube.com/watch?v=GaJrgTALN-0 (
好心人已加入字幕)

當高速運算的CPU 失去他的風扇時 (跟今天演講有關哦)

2010年11月4日 星期四

2010.10.15 專題演講心得

課程 : 論文研討
日期 : 2010.10.15
時間 : 14:00 ~ 16:00
作者 : 資工產碩一 洪晟恩

        時間呼縱即逝,又到了每週五論文研討的專題演講時刻,這次請到了中央大學資管系的陳彥良教授,這次的主題是有關於資料探勘,由於碩一的課程安排裡有資料探勘的課程,所已經過幾個禮拜的薰陶,從對於何謂資料探勘一無所知,到現在多少對於資料探勘有一些些淺淺的認識。

        而這次陳彥良教授所講的主題裡有提到序列型樣,雖然這個名詞聽起來實在不知其所云,但是經由一些實例解說後便能得知其主要意義,簡單的來說已商業上為例就是記錄使用者買了某些產品後,接著又會買下什麼產品,這點讓我想到很多的線上書城常常會有推薦,例如我買了X書後會看見系統提出大部分消費者買了X書後,有多少比例的消費者會接著買Y書或Z書以供參考,而這個地方看起來似乎有些不錯的應用發展空間。

         如果說在商業價值來講,我個人認為這種記錄方式雖然不是很適合每個消費者,但依然有他可取之處與價值,比如說推出套餐組合,假如消費者通常買了X產品後有80%會再買Y產品、有70%會再買Z產品,那可以試著推出X+Y+Z的套餐然後給點小優惠,也許式有機會可以增加其週邊產品的銷售量的。

         提到記錄使用者的消費習慣,其實我覺得推出符合使用者消費習慣的個人化服務是非常好的一點,在這方面我自己與朋友和一些大學的專研生也正試著做這一類的服務應用模擬,例如我記錄某位會員很喜愛購買球鞋,那麼我就可以在有球星推出新球鞋的時候,提供新球鞋的款式以及價位、到貨時間等等資訊給這位消費者;而每個使用者都有自己的消費模式與習慣,若能掌握這一點,我覺得能有很值得去深入探討的空間。

2010年10月22日 星期五

99年10月15日專題演講心得

課程:論文研討(一)
日期:99年10月15日
時間:14:00-16:00
地點:S414
作者:資工碩一 呂誌軒
主題:Discovering RFM Sequential Patterns from Customers’s Purchasing Data



       本週書報討論系上請來了中央大學資管系的陳彥良教授為我們演講,演講內容是資料探勘的序列型樣,序列型樣(Sequential Pattern)可應用在各種地方,我們最常接觸到的,就是有會員制的大賣場,商家可以透過你先前所購買的產品資訊來印製為你量身打造的下一期商品優惠型錄,進而促進你的購買慾,也同時增加賣場的銷售量。網路上的資料量不斷的暴增,如果能從大量資料中找到有價值而且以前未知的資訊,也許能探勘到真的金礦!

       陳教授的研究是將傳統的序列型樣加入R及M這兩種條件,希望探勘出來的序列型樣不是過時的,而且是更有價值的結果。R在這裡表示Recency,而M是Monetary,至於F指的是Frequency,在原始的序列型樣就是用頻繁度(Frequency)來過濾資訊,與關聯規則(Association rule)類似,但後來發現,若只針對頻繁度來過濾,常常會找到頻繁但不重要的資訊,做了這類的改進後,就能得到我們希望的結果,而且也同時減少了演算法的執行時間。其實RFM在很早以前就已被用來對客戶進行分群,以分析客戶的貢獻度、忠誠度等資訊,陳教授能將以往已經普遍存在的東西巧妙的組合,而且得到令人滿意的結果,這種能力是我們應該學習的!

2010年10月21日 星期四

2010.10.08 書報討論演講心得

課程:論文研討(一)
日期:99年10月15日
時間:14:00-16:00
地點:S414
作者:資工碩一 許瀚中

本週書報討論的講者是中央大學資管系的陳彥良教授,而演講內容是關於資料探勘的東西。資料探勘這門學問在大學時有聽過,只是因為沒有開設相關課程所以一直沒有機會去做深入的了解。
這次關於資料探勘的主題是循序樣式探勘。何謂循序樣式探勘? 簡單的說,以大賣場為例,就是記錄下顧客在買下A產品後會順便買B或C產品,記錄下來後加以分析,然後找出其關聯性。陳教授舉了一個例子是買玩具就會買電池的例子,賣場加以記錄後,便會在玩具區的附近放一個小小的專門賣電池的區域。這樣顧客就不用大老遠再跑到電池區去購買電池。而這門課讓我覺得最神奇的是,看似簡單的找關聯,在項目十分少的時候可以很簡單的找出最佳的解答。但是如果應用在現實生活中就是一門十分大的學問,因為即便是一個大賣場而已,裡面的項目可能多達數十萬種,如此要加以分析,並且求得最佳解答,也會變成十分困難。
而陳教授也有講到GSP & RFM。RFM分別代表: Recency Freqency Monetary。在後面更專業的解析及分析其實就聽得不是很清楚。因為在大學的時候沒有學過資料探勘相關資訊,所以後面聽得十分模糊。

2010/10/15 心得

這次來報告的是中央大學資管系的陳彥良教授,而報告的題目跟 [ 關聯規則 ]跟我有相當大的關係,因為我本身也是在資料探勘的實驗室,而最近在看的論文就是 [ Apriori ] ,聽陳教授的演講好似是說他演講的東西是根[ Apriori ]有關
不過雖然我很認真聽,卻還是沒有聽得很懂。也許老師會說為什麼不發問,但當了解度不到一定程度時...說真的不知從何問起,也許是東西太深了,不過方法上倒是有懂,也算是 [ Apriori ] 的延伸,也就是加了些東西進去使它找到的關聯規則更有用意,不會找到是已經知道或是利潤不高的關聯規則。而陳教授所報告的關聯規則也可以使需要探勘的資料量變得比較小,使探勘速度變快。不過教授也說了限制也不能太高不然資料量會太少,這樣探勘速度雖快但是卻刪掉了許多有用的資訊,這樣找到的有用資訊相對也會變少,這樣資料探勘的意義就不大了。例如:10萬筆資料刪除後剩50筆探勘之後有49筆資料是有用的但10萬筆資料才找出49筆資料是有用的這樣的結論應該任誰都無法接受吧!

2010.10.15 書報討論演講心得

課程:45101 論文研討(一)
日期:99年10月15日
時間:13:50~15:40
地點:S414
作者:資工產碩一 張振欣

由於本學期有修李御璽老師的資料探勘課程,因此對於中央大學資管系的陳彥良教授本次的主題 Discovering RFM sequential patterns from customers' purchasing data 有了很深的體會與了解,也讓我深深的體會到,原來資料探勘的領域和應用,可以做到比我想像中的多更多。

從李御璽老師平常教授的內容,資料探勘在企業對商業的行銷,有非常大的利益貢獻,節省不必要的成本支出,以最小的投資而達到最大的經濟效益,李老師以銀行界導入資料探勘的效益為例,可以得知在消費者群中,從龐大的統計資料利用資料探勘的技術,進一步篩選出容易成為卡奴的人,或者容易償還的人等,有了如此的概念後,再聽過陳教授本次的授課,便有了更深一層的認識,也體驗到資料探勘在實務上有許多做法,攸關著結果的精準度。

例如依消費者購買物品的頻率而統計的資料,再依資料結果來做探勘,其結果可能有限;但若是加入購買時間的因素,其結果可能精準許多,因為在人的購買習性上,雖然可能會有重複購買相同、或者同類型的商品機會,但購買時間可能相差甚大,也許相差幾個月、這樣的消費者對商家而言的,能夠賺取的利潤恐怕不多;在另外一個角度思考,若某消費者購買頻率多,購買時間也很相近,但是購買金額卻非常少,恐怕也無法帶給商家太多利潤,也因此,若加入消費金額的因素,其資料探勘出來的結果,相信對於商家在行銷上便有相當大的幫助;因此總結:最近的消費行為(Recency),以及消費的頻率(Frequency),搭配購買的金額(Monetary),組成的資料探勘方式,也是本次的主題 RFM Sequential Patterns。

另外陳教授也補充了幾種衍伸性的資料探勘方式,例如加入了時間週期的因素,讓探勘結果可以預測在多久時間內發生的行為的Time Interval Sequential Patterns, 還有Interval Temporal Patterns、Hybrid Temporal Patterns等方式,用意在於能夠更深層面的探討資料分析的結果,經過這一小時半的課程,讓我受益良多。

99.10.15心得報告

課程:論文研討(一)
日期:99年10月15日
時間:14:00~16:00
地點:s414
作者:資工研一 游佳恩

這是中央大學陳教授,今天為我們演講有關於Sequential Pattern Mining(循序樣式探勘)的相關研究, Sequential Pattern Mining(循序樣式探勘):
1. 找到顧客購買物品之間的關係
2. 找尋這些顧客所購買的物品之間有甚麼樣的時間順序

Sequential Pattern Mining(循序樣式探勘)應用於行為消費、股市行情…等,藉由統計消費者購買A物品之後,消費者會在下一個時間點購買B物品,來推測未來消費者對於物品的購買狀況,分析關聯性,例如:80%的消費者這一次購買PC主機和螢幕,下次就會購買印表機,根據這樣的消費者的消費模式就會發現關聯性,並針對這些關聯,看要實行怎樣的方法,最能提升消費者的購買率,但光只有這樣的關聯性是不夠的,也必須在把時間和價錢加入消費者購物的分析裡,才能發揮最大的效能,獲得最大的收穫。

資料探勘是一門很大的學問,以市場的觀點來看,有效的分析,適當的方法,才能獲得最大的效益,透過今天的演講,也許不是很深刻的了解,但對資料探勘有了更進一步的認識。

2010/10/15心得報告

課程:論文研討(一)
日期:2010/10/15
時間:14:00~16:00
地點:s414
作者:資工碩一 吳安凱

這次的演講者是中央大學的資管系陳彥良教授,由李御璽老師邀請,他們有相同的研究領域背景,就是資料探勘領域。題目是Discovering RFM Sequential Patterns From Customers' Purchasing Data ,以RFM的序列模式探索客戶購買產品資料。
RFM為三個字的縮寫,Recently最近購買時間,Frequency購買頻率,Monetary Amount購買金額。RFM模型是衡量客戶價值和客戶創利能力的重要工具和手段,這個模型是透過一個客戶的近期購買行為、購買的總體頻率以及花了多少錢三項指標來描述該客戶的價值狀況。RFM是非常有用的消費行為分析工具,不但簡單明瞭且具成本效益,更能提供企業每個顧客交易資訊,RFM具備的特性是具便利性、主動性、有效更新性、能力與意願兼顧性。
另外陳教授還有提到Electronic Commerce Research and Applications,也就是電子商務研究和應用,電子商務的意義是藉由電腦網路將購買與銷售還有產品與服務等商業活動結合在一起,電子商務主要是建構在電子交易系統上,也就是將傳統的金流和物流數位化,陳教授也有談到B2B和B2C兩個名詞,就是「企業對企業的商務」和「企業對消費者的商務」兩種模式。

演講的最後有學長姐和資傳的同學發問,老師也鼓勵我們能討論和發問才能有所吸收,不是這領域的我們當然在聽演講的過程有很多的名詞等不懂,但透過他們最後的發問和互動的過程有把一些疑問簡單化,用比較白話的方式解釋給我們聽。

2010年10月20日 星期三

2010/10/15 論文研討演講 心得報告

課程:論文研討(一)
日期:991015
時間:14:0016:00
地點:S414
作者:顧家源

  本次演講題目是「Discovering RFM Sequential Pattern From Customers’ Purchasing Data」,主講人為中央大學資管系的陳彥良教授。從題目就可以很清楚知道,這次的主題是圍繞在Data Mining領域中很重要的一塊-Sequential Pattern之中,我們知道Sequential Pattern常應用在有會員制的大賣場,因為要記錄同一個顧客在不同次交易中購買了那些商品,由其中某些商品和其他商品的順序關聯性中找到規則,來猜測如果今天某位顧客買了商品A之後,改天他可能會來買商品B。與Data Mining中另一個同樣重要的Association Rule相比,關聯規則只看同一筆交易中那些商品常常一起被購買,而不去關心同一位顧客在之後又買了甚麼。

  而這次的題目算是Sequential Pattern的一個變形,傳統的Sequential Pattern只考慮某一組有順序關係的Item是不是常常出現(Frequent),而RFM Sequential Patten則多考慮了RecencyMonetary兩點,前者是檢查顧客最近的交易有沒有出現這些商品,後者則是去計算購買這些商品所花的金額;除此之外,三個參數除了下界以外還訂了上界,藉以關注在我們想找的範圍內。

  而其演算法也不會說很難懂,大抵流程跟普通的Apriori差不多,採two-step的方式進行,先找出長度為1Candidate,稱為CI1,根據RF兩個條件去篩選,得到長度為1Frequent Patten,稱為LI1,然後再藉由LI1item進行排列組合,得到CI2,依此類推,直到無法找到更長的Frequent Pattern為止;之後,再根據設定的M再進行一次篩選,即可得到想要的Pattern;且由於限制條件比較多,反過來說要處理的Searching Space就會更小,執行速度上自然也較原本的Sequential Pattern的演算法更快。

  除了RFM Sequential Pattern外,陳教授還快速的介紹了幾個同樣是解Sequential Pattern的演算法,每個都有各自不同的新條件:Time-interval SP中,除了關心每個關聯Itemset出現的序列,還要考慮兩兩之間間隔了多久時間,讓我們不只可以預測下一個是甚麼,還可以預測在多久以內會發生;Interval Temporal Patterns則是將每個Item定義成可以持續一段時間,包括其開始與結束,並找出各關聯Item間開始與結束的順序性關係;Hybrid TP則是前者的一種變體,某些Item可以是有持續時間的,也有些是瞬間的事件。

  聽了這麼多東西,除了了解演算法以外,我想這個演講更重要的目的是讓我們了解甚麼是做研究,做研究的方法與目的又是甚麼;像演講中就有提到一點,有時候有些研究在題目與條件的範圍訂定上,脫離了現實社會中可能應用的層次,這就是一種為了研究而研究,雖然也不能否定其價值,不過這個研究也未必能對社會造成重大的影響或改變。這點對在研究領域涉獵未深的我們,實在是有不小的幫助。

提問:RFM Sequential Patterns的演算法中,R的條件只考慮到一組Itemset中最近一筆出現的時間,是否會遇到Item之間間隔很久的問題?

回答:的確在此演算法中並未處理此部分,可以是個拿來考慮的問題,也可以以此方向為發展進行研究。

2010.10.15 書報討論演講心得

課程:45101論文研討(一)
日期:99年10月15日
時間:13:50~15:40
地點:S414
作者:資工碩一 李慧娟


這次受邀來演講的主講者是中央大學資管系教授陳彥良老師。
由李御璽老師邀請。演講內容也是屬於資料探勘領域。
題目是「Discovering RFM sequential patterns from customers' purchasing data」。

一開始先提到了關聯規則。
例如:牛奶和麵包會一起買。
似乎是探討,哪些Patterns會同時出現。

這個例子在之前上過的資料探勘課程裡,也曾提及。
所以聽到演講者也提到這個例子,讓我覺得真是巧合。
不過也是夠平凡的例子,才能更容易幫助理解也更印象深刻。


之後也提到了Sequential Patterns。
例如:買了印表機,之後會再來買碳粉匣。
在時間點的位置不同,但有前後關係的Patterns。


常使用例子穿插在演講中,即使只是示意概況,但是對於快速了解演講內容有很大幫助。
使用例子這點真的是報告的必須環節之一。


之後還提到了RFM分析。
RFM分別是,最近購買時間(Recency,R) 、購買次數(Frequency,F) 及購買金額(Monetary,M)。
RFM分析常常被用來作客戶價值、客戶分群。
客戶忠實度也是參考RFM。

主講者提到。
傳統的演算法是用GSP。
他們的演算法是用RFM。

但是其實我對GSP沒什麼印象,比較有印象的還是RFM。
他們的演算法在RFM上的著重比例好像不太一樣。
還有多考慮了一些情況。
但是後面一點的演講內容,聽起來就有點辛苦了。
所以還是不太瞭解。

2010.10.15 專題演講心得

課程 : 論文研討
日期 : 2010.10.15
時間 : 13:50 ~ 15:40 PM
地點 : S414
作者 : 資工產碩一 楊士緯

Sequential Patterns From Customers’ Purchasing Data

這次來演講是一位對資料探勘很有研究的老師,內容主要是講授循序化的資料探勘,這學期剛好也開始上資料探勘的課程,所以對這塊領域其實還不是非常了解,只有大略粗淺的認識。

傳統的資料探勘中,是從既有的資料找出將來可能有用的資訊,像是從銀行的信用卡帳單或是帳戶資料狀況來分析,找出哪些人是符合我某些方案的客戶,藉此來提升整體業績,而這此演講的內容則是專注在循序化的資料探勘,藉由找出資料中的順序,來推測下次會出現的情況,像是購物網站中,客戶買了一件商品之後,推測下次顧客可能會再次來購買的商品,所以常常在電子商務網站中,當我購買了某樣商品,往往網站會再出現一些購買此商品的人也同時購買了以下商品區塊,這就是sequential pattern的應用,藉由分析大量顧客的購買商品,分析出購買A商品後也同時購買B商品的結果。

資料探勘是一項非常實用的技術,可以應用在很多領域中,從既有的資料中,找出很多有用的資料,可以提升公司業績,或是應用在很多方面,在目前方向中是一塊熱門的領域,值得我們去學習。

20101015書報討論心得報告

課程:論文研討
日期:991015
時間:13:50~15:40
地點:S414
作者:資工碩一 曾詠堅

這次的演講請到了,中央大學的陳彥良教授。演講的題目是 Discovering RFM Sequential Patterns From Customers’ Purchasing Data,而這個主題主要的是在談論資料探勘領域中有關於Sequential Pattern的研究。

Sequential Patten套用在生活上,可以解讀成消費者的消費習慣。舉例這次你買了A這個物品你就有可以能順便帶一個B物品。這就是關聯性消費,但有些關聯只是單一案例。所以我們就要設定一個門檻值來挑選我們的數據、以避免讀取到一些單一案例來影響最後結果,而陳教授也認為必須將時間考慮進去。

假設它是長時間才發生一次,那他的參考價值就降低。所以要考慮到你所抓出來數據是否具有價值?否則你抓出來的數據是頻率很低,或是物品價格低廉。這樣的數據就會不準確,也可以說成不符合成本考量。

這次演講聽完,讓我對資料探勘有進一步認識,原本是對資料探勘這塊領域是模模糊糊的。但藉由這次演講機會有一點初步認識,進而發現資料探勘所應用的程面非常廣大。甚至可以用來推測市場走向,以及產品的受歡迎度。進而讓公司研究銷售策略來提高營業而。

HW05

課程:論文研討(一)
日期:2010/10/15
時間:14:00~16:00
地點:s414
作者:資工研一 田文誠
今天演講者是中央大學資管系的陳彥良教授,這次的主題主要是Discovering RFM Sequential Patter From Customer’ Purchasing Data以關聯規則的主題,當然這對一個沒接觸過Data Mining的我來說,聽起來並不輕鬆,當然在演講的過程中同學告訴我說陳教授所演講的東西很像是跟Apriori有關,不過仍然聽不懂教授是在說什麼,我印象最深刻的就是陳彥良教授從中舉了很多的例子,像是要如何做Sequential Pattern Mining,可以從很多的序列式資料做Sequential Pattern,那為什麼要做呢?做這個的義意在哪邊?從Sequential Pattern我們可以知道之前發生的事情,因此可以推出之後發生的事情,像是微軟的股市如果下跌了,那IBM的股市也會跟著下跌。
還有就是在P15頁的圖(a,1,10)意思是在時間1買了a是10元,當然後面有更難的(b,I1,e,I2,c)就是買完b間隔了I1時間後買e再間隔I2時間後買c,而陳教授報告的關聯規則也可以讓需要Mining的資料量變得比較小,使Mining的速度變快。不過教授也說了min_sup(門檻值)也不能太高不然資料量會太少,這樣速度雖快但是卻刪掉了許多有用的資訊。
在關聯分析上,我有想到個生活中已經有企業在用,那就是麥當勞,以麥當勞的套餐搭配為例,他是以客戶來點的餐點進行分析,來搭配出套餐,雖然不是所有客戶都喜歡,但是可以從客戶點的餐點,搭配出套餐,就可以增加購買率。

2010年10月19日 星期二

2010/10/15 專題研討演講 心得報告

課程:45101 論文研討(一)
日期:99年10月15日
時間:13:50~15:40
地點:S414
作者:資工產碩一 魏早達


  本週的演講請到了中央大學資管系的陳彥良教授。題目是 Discovering RFM Sequential Patterns From Customers’ Purchasing Data,這個主題主要談到的是在資料探勘領域中有關於Sequential Pattern的研究。


  在資料探勘的範疇中所謂的 Sequential Pattern,換成消費行為就是消費者這次買了什麼東西,下次可能會買什麼東西,而要成為這樣一個樣式則還需要訂定一個門檻值,也就是說要達到這個門檻值則可以說找到了 Sequential Pattern。傳統的研究認為這個門檻值就是所謂的頻率,但是陳教授認為這樣是不夠的,因為所找出來的 Pattern 是否有即時性,也就是說如果這個 Pattern在很久以前的時間點發生的,而在最近並沒有出現,就不應套用在現在的模型中,另外所找出來的 Pattern是否有價值,也是一個考慮因素,否則辛苦找出來的 Pattern,其相關商品價格相當低廉,如果拿它來作基準做促銷活動,就會有不敷成本效益的狀況。所以根據上述的考量點,就在原有只有頻率的因子的 Sequential Pattern模型中,再加入時間及價格兩個因素,這就是所謂的 R(Recency)F(Frequency)M(Monetary) Sequential Pattern。當然在設計上為了效能,這個模型在預測時僅就頻率及價格作為Pattern Match 的因子,而時間則被當成篩選的條件,這樣便可加速模型的運算速度。


  當然從這個觀點作出發,還可衍生其他相關的研究,包括探討某些 Pattern之間是否存在著Time Interval之間的關係等議題,但是經過了這兩小時的學習,陳教授給我的最大啟發是很多創意的思維,可能是一個研究的起點,但是不能失之於吹毛求疪,否則常常會淪於所謂Over Research,也可以說這樣的研究可能會有欠缺實用性的疑慮,反而會失之沒意義。

2010年10月15號專題演講心得報告

課程:45101論文研討(一)
日期:991015
時間:14:00~15:40
地點:S414
作者:資工碩一 賴相勳
Discovering RFM Sequential Patterns From Customers' Purchasing Data,這次演講的主題是著重在資料探勘。資料探勘其實在大學時候所學並不深入,所以會利用時間自我研讀。Sequential Pattern是一種資料探勘的方法,用來找尋資料庫中頻繁出現的序列/樣式/值等等,以購物為例,就是找尋相同的購買物品,分析多久買一次,一次買多少,買了哪些類別的商品等的分析。然而,這樣的分析卻只能夠得到顧客有多久才會來買東西,買東西的順序為何,卻無法得知金額,也就是消費者的貢獻度有多少。因此這次演講的主題就是這個,在傳統的Sequential Patterns方式中,加入了RFM,(RFM:RecencyFrequencyMonetaryRecency,近因,指的是最後購買到現在的期間,如果下降,有可能是客戶重複購買。Frequency就是頻率,高就是客戶常來,可視為忠誠客戶。最後的Monetary則是金額,越高,對公司來說,就是金主。透過加入了RFM的的資料探勘,可以根據金額當成購買力,劃定等級來提供不同的服務,滿足顧客的需求跟喜好,作為提昇收入的方法。有點類似重點似的分析然後提供階梯般的服務,這類加入新的條件來分析舊有資訊,並找出新的資料。既然可以運用在商業上,醫療上也可以,可以分析病人多久來拿藥,一次拿多少,然後可以推敲是否真的需要如此多的用藥量,接下來就可以制定一些相關計畫,避免醫療資源的浪費。也許可以制定一些更有效的療程方法,減少病人奔波之苦。
資料探勘涵蓋的領域跟應用的範圍非常廣泛,要怎麼樣從一大堆的資料找出有用的資訊,並且分析整理成對客戶/企業有用的資料是不斷需要新的演算方法/探勘方法來輔助。好比從一大堆資訊中找出對自己研究領域有幫助的資訊也是資料探勘的一種應用,量太大,資料太多,必須去分析是不是這些資料都對自己有用,整理成方便可用的型態。其實無時無刻都會利用資料探勘最基本的精神,再來就是效率問題,快速準確是追求的目標。對個人或企業來說都是一樣的,這次的演講題目讓我對資料探勘的應用有了更深入的瞭解,適當地加入條件可以篩選出更有價值的資料,那要怎麼樣制定條件就是問題了。這方面還是需要努力去思考專研才會有結果。

20101015書報討論心得報告

課程:45101論文研討(一)
日期:99年10月15日
時間:14:00~16:00
地點:S401
編輯:資工碩一許智凱


這次的演講者為中央大學資訊管理系的陳彥良教授,主題為「Discovering RFM Sequential Patterns from customer's purchasing data」。主要是在說明顧客的購買資料相對性來作為預測未來的作用,以及如何分析。

在一開始看到這個標題的時候,就已經有點猜到是資料庫這塊領域的演講,而後正式由陳彥良教授開始演講之後,心中則是有種感謝:"還好我讀得是銘傳大學資訊工程系",因為在大學部的時候有修過由顏秀珍老師所開的資料探勘這門課,所以在整體內容方面也已經略知一二。在Sequential Patterns這部分,一直以來都是一個很可靠的樣本資料,可以很明確的指出在顧客購買商品上的對應性,可能有買A就會買到D、買了BC就會買E,而企業可針對這套資料探勘的結果來做為他們未來要採取的行銷策略或是變動。不僅如此,Sequential Patterns也能反映出市場方面的未來走向,如股票、房產甚至於任何大大小小有對應關連性的預測都能完成。

這次聽完演講之後,再一次映證了資料探勘應用的健全,以及李御璽主任和顏秀珍老師的能力是無庸置疑的,能身為銘傳大學資訊工程系的學生,光這點就已經是先贏很多學校少說一年的能力了。

2010年10月16日 星期六

Discovering RFM Sequential Patterns From Customers' Purchasing Data

課程:45101論文研討(一)
日期:99年10月15日
時間:14:00~15:40
地點:S414
編輯:資工產碩一張金燦

演講題目:Discovering RFM Sequential Patterns From Customers' Purchasing Data
主講人: 中央大學資管系陳彥良教授

今天的演講內容主要為資料探勘上傳統的「循序樣式」(Sequential Pattern)­方法到加入金額(Monetary)要素的「RFM循序樣式」(RecencyFre quencyMonetary Sequential Patterns)方法,藉由購物行為的資料探勘說明。

由購物行為的關聯性以「循序樣式」做資料探勘之分析,如購物者去商場上購買商品後,中間間隔一段時間後再去採購某類商品或同項商品等,經由這樣的採購行為之關聯性,做客戶端的購買行為之順序分析,可以藉由其購買的時間及頻繁度來提供客戶端不同的服務價值,但卻無法了解到購物者的貢獻度,也就是金額方面,所以經由SPM(Sequential Pattern Model)技術加入金額(Monetary)形成RFM技術作為在市場上的資料探勘應用,其中:

R(Recency):指的是最後購買到現在的期間

R:R值下降,最高的可能性是客戶的重複購買 (有可能是低價性的物品...)

F(Frequency):在一定期間的購買次數

F:頻率直向上,客戶具有較高的忠誠度

M(Monetary):在一定時期所花的金額

M:M值提升,重要的客戶

企業組織應用循序樣式探勘模型研究客戶的採購行為,為了就是要主動提供給不同等級客戶不同層次的服務模式,以滿足客戶端的需求要求,以提升營運的利基,並可藉由異常的行為監督,找出他的間隔,用來作為改善的參考依據。而此類的技術應用較常應用於網站、線上交易,商店等的查詢應用,以及分群、分類等關聯規則的資料分析。

隨然說這個學期已經開始在學習資料探勘的課程了,不過今天陳教授講授的RFM循序樣式的應用還是初次聽到,但事先打了個基礎,等到課堂上老師再次講解時就可以很容易進入了!