這次來報告的是中央大學資管系的陳彥良教授,而報告的題目跟 [ 關聯規則 ]跟我有相當大的關係,因為我本身也是在資料探勘的實驗室,而最近在看的論文就是 [ Apriori ] ,聽陳教授的演講好似是說他演講的東西是根[ Apriori ]有關
不過雖然我很認真聽,卻還是沒有聽得很懂。也許老師會說為什麼不發問,但當了解度不到一定程度時...說真的不知從何問起,也許是東西太深了,不過方法上倒是有懂,也算是 [ Apriori ] 的延伸,也就是加了些東西進去使它找到的關聯規則更有用意,不會找到是已經知道或是利潤不高的關聯規則。而陳教授所報告的關聯規則也可以使需要探勘的資料量變得比較小,使探勘速度變快。不過教授也說了限制也不能太高不然資料量會太少,這樣探勘速度雖快但是卻刪掉了許多有用的資訊,這樣找到的有用資訊相對也會變少,這樣資料探勘的意義就不大了。例如:10萬筆資料刪除後剩50筆探勘之後有49筆資料是有用的但10萬筆資料才找出49筆資料是有用的這樣的結論應該任誰都無法接受吧!
 
沒有留言:
張貼留言