Weka è una collezione di macchine algoritmi di apprendimento per risolvere problemi di data mining nel mondo reale. Gli algoritmi possono o essere applicato direttamente ad un set di dati o chiamato dal proprio Java codice.
L'applicazione contiene gli strumenti necessari per la preelaborazione dei dati, la classificazione, la regressione, il clustering, le regole di associazione e la visualizzazione. È anche adatto per lo sviluppo di nuovi schemi di machine learning.
Le caratteristiche principali includono:
- Apprendimento della macchina.
- Data mining.
- Pre-elaborazione.
- Classificazione.
- Regressione.
- Clustering.
- Regole dell'associazione.
- Selezione degli attributi.
- Esperimenti.
- Flusso di lavoro.
- Visualizzazione.
La collezione di algoritmi di Weka va da quelli che gestiscono la preelaborazione dei dati alla modellazione. I suoi principali algoritmi di data mining includono la regressione, il clustering e la classificazione.
Sebbene Weka abbia una suite completa di algoritmi per l'analisi dei dati, è stata costruita per gestire i dati come singoli file piatti. Successivamente, non gestisce l'estrazione mineraria multi-relazionale e la modellazione delle sequenze.
Nel complesso, Weka è un buon strumento di data mining con una suite completa di algoritmi. L'interfaccia è OK, anche se con quattro da scegliere, ognuno con i propri punti di forza, può essere imbarazzante scegliere con quale lavorare, a meno che non si abbia una conoscenza approfondita dell'applicazione per iniziare.