Monthly Archives: 5月 2008
Java: 文字列の先頭・末尾の文字を削除するstrip()メソッド
テキストマイニングを行う際、文書を単語集合に区切ったのはいいけれど、単語の先頭・末尾に以下のような文字が入っている場合は辞書に格納する際に削除したいですね。 Hello! page.” “Hi, 単語の前後に複数の記号( … Continue reading
検索エンジンを実装 (5)OR演算
前回がAND演算でしたので今回はOR演算ついて紹介します。今記事で紹介している演算アルゴリズムよりも高効率なものは存在するようですが、今回は割愛します。 OR演算処理の概要 上の図から、ある2つの語の転置インデックスリス … Continue reading
Yahoo!検索 サイトエクスプローラー を利用するブックマークレット
追記:Yahoo!検索 サイトエクスプローラーのサービスって終了してしまったんですね。。 任意のWebページ上でワンクリックでサイトエクスプローラー – Yahoo!検索のインデックス検索が出来るブックマーク … Continue reading
検索エンジンを実装 (4)AND演算
AND演算処理の概要 上の図から、ある2つの語の転置インデックスリストをA, Bとします。ここで、要素をそれぞれa, b(整数)とし演算結果を格納するリストをCとするとき、AND演算は主に以下の処理内容を繰り返します。 … Continue reading
JavaプログラムからExcite翻訳を利用
POSTメソッドを用いてWebページのフォームにリクエストを送信し、そのレスポンスを取得するプログラム例として、エキサイト 翻訳を利用してみます。 送信クエリの1つは翻訳言語設定、2つ目は翻訳対象文字列でレスポンスのWe … Continue reading
java.lang.OutOfMemoryErrorが発生する原因とその解決法の一例
JVMがGCを行えるように、開放するインスタンスへの参照を切っていたのだけれど、なぜか例外が投げられ続けていました。色々調べてみたら、java.io.ObjectOutputStream#writeObject(Obje … Continue reading