Tag Archives: N-gram

WordPress: Similar Posts の紹介と設定例 – 関連記事[投稿|エントリ]を表示するプラグイン

投稿した記事に関連する記事を自動で選択し、サイドバーを含む任意の位置に表示できる WordPress のプラグインであるSimilar Posts(Author: Rob Marsh, SJ) の設定の一例を紹介します。 … Continue reading

Posted in WordPress | Tagged , , , | 82 Comments

検索エンジンを実装 (3)文書内の検索語を特定

今回実装したことは、 IndexRecordクラスにフィールド更新用のメソッドやハッシュフィールドを追加(今後改善の必要大)。 検索語を含んでいるファイルをピックアップする(色々と無駄な部分あり)。 辺りです。 後述に現 … Continue reading

Posted in Java | Tagged , , | Leave a comment

検索エンジンを実装 (2)出現位置とその文書ID

id:d-kamiさんから改良版Make2Gram付きトラックバックを頂きました(連絡方法がわからんのでトラックバックで – マイペースなプログラミング日記)(はてなダイヤリーから移転前)。d-kamiさん、 … Continue reading

Posted in Java | Tagged , , | Leave a comment

検索エンジンを実装 (1)転置インデックス作成

今回はN-gramでテキストを分解します。N-gram法とは対象の文字列を一定のN文字単位で分解し、それの出現頻度を求める方法です。これによって、検索エンジンに使われる転置インデックスを作成したいと思います。転置インデッ … Continue reading

Posted in Java | Tagged , , , | 1 Comment