2007年8月14日 星期二

7月初工作日誌 (探勘工具及其API)

補上從暑假開始到目前的工作日誌

1. 研究JDM API
7月初的時候,向圖書館推薦的書到館了。花了幾天努力研究之後,對該API有概括的了解
但看到後面時才發現,原來它只是個spec標準,所以我所下載API只是個空殼,重要的演算法都沒有實作,而下載的軟體其實只有介面。唉,原本想以後用它開發程式的說。
雖然不能使用,但至少讓我見識到別人是如何開發一個標準的(preprocessing、learning、test、evaluation都規劃很好)

2. 發現另一個探勘工具 "RapidMiner"
知道JDM API不能用之後,打算以後用weka的API,後來在KDnugget網站看到票選大家最常使用的探勘工具,免費第一名是耶魯大學所開發的RapdiMiner時(weka第二),於是下載該軟體來試用看看,發現它的介面比較漂亮、演算法及功能比weka多,而且它納入weka裡的演算法。但缺點是因為它的架構較龐大,學習曲線較長。往後若有人要開發程式時或跑實驗時,這個軟體真的不錯

總而言之微軟那套工具,我覺得最有用地方在於跟微軟本身資料庫的溝通真的很方便,探勘結果可直接存入,但分析探勘結果功能不算突出。相對地,免費的則較學術,所以跑實驗功能很強,但若資料放在資料庫裡,那麼就要花點心思存取了,當然有無商業的支援還是有差。

沒有留言: