Monthly Archives: 3月 2008

検索エンジンを実装 (3)文書内の検索語を特定

今回実装したことは、 IndexRecordクラスにフィールド更新用のメソッドやハッシュフィールドを追加(今後改善の必要大)。 検索語を含んでいるファイルをピックアップする(色々と無駄な部分あり)。 辺りです。 後述に現 … Continue reading

Posted in Java | Tagged , , | Leave a comment

検索エンジンを実装 (2)出現位置とその文書ID

id:d-kamiさんから改良版Make2Gram付きトラックバックを頂きました(連絡方法がわからんのでトラックバックで – マイペースなプログラミング日記)(はてなダイヤリーから移転前)。d-kamiさん、 … Continue reading

Posted in Java | Tagged , , | Leave a comment

検索エンジンを実装 (1)転置インデックス作成

今回はN-gramでテキストを分解します。N-gram法とは対象の文字列を一定のN文字単位で分解し、それの出現頻度を求める方法です。これによって、検索エンジンに使われる転置インデックスを作成したいと思います。転置インデッ … Continue reading

Posted in Java | Tagged , , , | 1 Comment

ArrayListのコンストラクタに初期容量を指定することで要素の追加処理を高速化

javaのArrayListのコンストラクタにはオーバーロードで幾つかの種類がありますが、その一つに以下のようなものがあります。 ArrayList(int initialCapacity) 指定された初期サイズで空のリ … Continue reading

Posted in Java | Tagged , , , | Leave a comment

JavaとRubyで文字列の終端の扱いの違い

RubyのコードをJavaに書き直す際に注意する相違点が幾つかあったので、そのうちの一つを挙げてみます。特に文字列関係は色々やりにくいです。 a = “4321″ p a[4] #=> nil Rubyでは文字を[]で指 … Continue reading

Posted in Java, Ruby | Tagged , , , | Leave a comment