| ITEJ「私の研究ツール」”データマイニングツールWeka”サポートページ |
|
|
|
| 作者: Hidenao Abe |
| 2011年 7月 31日(日曜日) 23:25 |
映像情報メディア学会誌 データマイニングツールWeka サポートページ1.はじめにこのページは,2011年10月号の映像情報メディア学会誌の「てれび・さろん」に掲載された解説記事「データマイニングツールWeka」のサポートページです. Wekaは,ワイカト大学(ニュージーランド)の機械学習研究グループが中心となって開発されているオープンソースのデータマイニングツールです.
OSがWindowsの場合は,Javaの実行環境(JRE)付のパッケージもありますので,JREがインストールされていなくてもWekaを利用することができます.
2.記事中の例題を用いた実行例記事中の解説で用いた例題ファイルは,UCI機械学習データセットレポジトリから取得したファイルを一部加工した(クラスに当たる項目を最後の列とした)ものです.
この入力ファイルに対して,決定木学習アルゴリズムC4.5の実装であるJ4.8をコマンドラインから適用するのが本例題の内容です.CSVファイルを入力として,数値属性と誤認された属性の修正(NumericToNominalフィルタによる),決定木学習の実行,分類予測結果(シリアライズされたモデル,予測結果付ファイル)の保存を行います.
また,以上の実行の流れをKnowledge Flowでも実行が可能です.実行画面は図1のようになります.Knowledge Flowでは,処理に対応するアイコンを上部のパネルから選択し,フローレイアウト(Flow Layout)でもう一度クリックして配置します.処理同士の接続は,各アイコンを(右)クリックして次の処理に入力する出力を→として接続していきます.連続的な画面で説明したKnowledge Flowの使い方に関しては,本サイトの解説をご覧下さい. ※Weka(ver.3.6.5)以降でメニューが日本語化されている場合,環境によって日本語フォントが表示されないこともあります.
3.Explorerでのデータ視覚化WekaのGUIであるExplorerでは,ファイルを読み込むだけでデータの内容の視覚化が可能です. 前処理(Preprocess)パネルでは,開いたファイルの情報,各属性の情報が視覚化されます.各属性の内容は,左下部のリストからそれぞれの属性を選択することにより,右下部に基本統計情報とヒストグラムが表示されます.
5.リンク集Wekaをマイニング処理機能として利用可能なツール:
データマイニングに関する情報,性能評価用の共通データセットに関するWebページ:
Wekaを映像データに適用した事例:
|
| 最終更新 2011年 9月 21日(水曜日) 13:29 |
映像情報メディア学会誌サポートページ






