2007年2月13日 星期二

Java Data Mining (JSR-73) Overview

今天下載JDM API來看看 ,以及短短7頁的介紹文件
感覺這實在不容易上手 Orz... 看來還是得看書才會用

JDM的目的之一是要標準化各vendor開發的data mining algorithm,所以
裡面提供的演算法蠻多的 Classification、Clustering、Regression、Association都有
因為主要是商業用途,所以也提供web service


我看了一個「非常簡短」的範例 發現要使用一個分群演算法還真不容易!

它用了design pattern中的Abstract Factory來設計,所以要先會design pattern才能掌握物件的運作方式。然後也要用很多類別才能達成工作,大概算了一下有十幾個。
其產生的結果用Collection儲存,所以資料結構也要熟悉,處理起來才會得心應手

預估今年4月左右 JDM2.0會出來
新的功能包括可以mining unstructured data(text、image)、feature extraction、forecasting、model comparison、ensembles、multi-target models,並擴展web service的功能

沒有留言: