Monthly Archives: 3月 2008
検索エンジンを実装 (3)文書内の検索語を特定
今回実装したことは、 IndexRecordクラスにフィールド更新用のメソッドやハッシュフィールドを追加(今後改善の必要大)。 検索語を含んでいるファイルをピックアップする(色々と無駄な部分あり)。 辺りです。 後述に現 … Continue reading
検索エンジンを実装 (2)出現位置とその文書ID
id:d-kamiさんから改良版Make2Gram付きトラックバックを頂きました(連絡方法がわからんのでトラックバックで – マイペースなプログラミング日記)(はてなダイヤリーから移転前)。d-kamiさん、 … Continue reading
検索エンジンを実装 (1)転置インデックス作成
今回はN-gramでテキストを分解します。N-gram法とは対象の文字列を一定のN文字単位で分解し、それの出現頻度を求める方法です。これによって、検索エンジンに使われる転置インデックスを作成したいと思います。転置インデッ … Continue reading
JavaとRubyで文字列の終端の扱いの違い
RubyのコードをJavaに書き直す際に注意する相違点が幾つかあったので、そのうちの一つを挙げてみます。特に文字列関係は色々やりにくいです。 a = “4321″ p a[4] #=> nil Rubyでは文字を[]で指 … Continue reading