Java: 形態素解析Senをインストール(Windows編)

Sponsored Link

このエントリーをはてなブックマークに追加
はてなブックマーク - Java: 形態素解析Senをインストール(Windows編)
Bookmark this on Delicious
Share on LinkedIn
Bookmark this on Livedoor Clip
Bookmark this on Yahoo Bookmark

ダウンロードするソフト

1.ActivePerl(ActivePerl, Download Perl for Windows, Mac, Linux, AIX, HP-UX & Solaris)
2.Apache Ant(Apache Ant – Binary Distributions)
3.Sen(sen: ドキュメント & ファイル: release)

ActivePerlはインストーラーに従いインストールする。
ダウンロードしたAntとSenはC:\work以下に解凍し、フォルダ名をそれぞれapache-ant、senとリネームする。

環境変数の設定

PATH(追加) C:\work\apache-ant\bin;
ANT_HOME C:\work\apache-ant
SEN_HOME C:\work\sen
JAVA_HOME C:\Sun\SDK\jdk
この後、上記の環境変数が適応されているか下記のコマンドを用いて確認する。

C:\>echo %ANT_HOME%
C:\work\apache-ant (←OK、パスが適応されている)

適応されていなければ再起動する。

辞書のインストール方法

カレントディレクトリをdicに設定後、辞書をインストールする。

C:\>cd work/sen/dic (←カレントディレクトリを移動)
C:\work\sen\dic>ant -Dperl.bin=C:\Perl\bin\perl.exe (←辞書のインストール)
Buildfile: C:\work\sen\dic\build.xml
<中略>
BUILD SUCCESSFUL
Total time: 1 minute 2 seconds
C:\work\sen\dic>

動作確認

%SEN_HOME%\sen.batをダブルクリックする。

C:\work\sen\bin>rem set classpath
C:\work\sen\bin>SET CLASSPATH=C:\work\sen\lib\sen.jar
C:\work\sen\bin>SET CLASSPATH=C:\work\sen\lib\sen.jar;C:\work\sen\lib\commons-logging.jar
done.
Please input Japanese sentence:
2010/03/25 0:29:44 net.java.sen.Dictionary 
情報: token file = C:\work\sen\dic/token.sen
2010/03/25 0:29:44 net.java.sen.Dictionary 
情報: time to load posInfo file = 16[ms]
2010/03/25 0:29:44 net.java.sen.Dictionary 
情報: double array trie dictionary = C:\work\sen\dic/da.sen
2010/03/25 0:29:44 net.java.sen.util.DoubleArrayTrie load
情報: loading double array trie dict = C:\work\sen\dic/da.sen
2010/03/25 0:29:45 net.java.sen.util.DoubleArrayTrie load
情報: loaded time = 0.453[ms]
2010/03/25 0:29:45 net.java.sen.Dictionary 
情報: pos info file = C:\work\sen\dic/posInfo.sen
2010/03/25 0:29:45 net.java.sen.Dictionary 
情報: time to load pos info file = 0[ms]
2010/03/25 0:29:45 net.java.sen.Tokenizer loadConnectCost
情報: connection file = C:\work\sen\dic\matrix.sen
2010/03/25 0:29:45 net.java.sen.Tokenizer loadConnectCost
情報: time to load connect cost file = 141[ms]
hello
hello   (hello) 未知語(0,5,5)   null    null
こんにちは
こんにちは      (こんにちは)    感動詞(0,5,5)   コンニチハ      コンニチワ

関連すると思われる記事:

Sponsored Link

This entry was posted in Java and tagged , , . Bookmark the permalink.

Facebook comments:

2 Responses to Java: 形態素解析Senをインストール(Windows編)

  1. Pingback: ken-taka7

  2. Pingback: ななしkamidake

コメントを残す

メールアドレスが公開されることはありません。

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>