Tag Archives: RegExp

Bash: 数値と文字列の判別

手っ取り早く数字文字列とそれ以外の文字列を判別する条件式は以下のとおり。 コード #!/bin/sh if expr “$1″ : ‘[0-9]*’ > /dev/null ; then echo “数値です” else … Continue reading

Posted in Linux | Tagged , , , | Leave a comment

Python: 正規表現の基本 – 最長、最短マッチング

直前の文字、メタ文字を繰り返しマッチングさせる量指定記号である「*」「+」「?」などは、テキスト中にその繰り返しパターンがマッチする箇所が複数ある場合は、通常最後にマッチした箇所をオブジェクトに記録します。このような最長 … Continue reading

Posted in Python | Tagged , , | 1 Comment

Python: 正規表現の基本 – 文字範囲の指定「[ ]」

ソースコード # coding: Shift_JIS import re # 正規表現を扱うモジュールのインポート # 正規表現のチェックプリント用の関数 def PrintRegMatch(pat, txt): # 探 … Continue reading

Posted in Python | Tagged , | Leave a comment

Python: 正規表現の基本 – 繰り返し「*」「+」「?」

ソースコード # coding: Shift_JIS import re # 正規表現を扱うモジュールのインポート # 正規表現のチェックプリント用の関数 def PrintRegMatch(pat, txt): # 書 … Continue reading

Posted in Python | Tagged , , | Leave a comment

Python: 正規表現の基本 – メタ文字「.」「^」「$」

ソースコード # coding: Shift_JIS import re # 正規表現を扱うモジュールのインポート # 正規表現のチェックプリント用の関数 def PrintRegMatch(pat, txt): # 書 … Continue reading

Posted in Python | Tagged , | Leave a comment

JavaプログラムからExcite翻訳を利用

POSTメソッドを用いてWebページのフォームにリクエストを送信し、そのレスポンスを取得するプログラム例として、エキサイト 翻訳を利用してみます。 送信クエリの1つは翻訳言語設定、2つ目は翻訳対象文字列でレスポンスのWe … Continue reading

Posted in Java | Tagged , , , | Leave a comment

Webページから指定したタグの要素を抜き出すRuby関数

単一のWebページから抜き出した複数の要素を配列に格納して返します。 以下の例はaタグの要素(エレメント)を抽出した場合です。 Rubyコード require 'net/http' require & … Continue reading

Posted in Ruby | Tagged , , , | Leave a comment

タグの中の要素を抜き出すRuby関数

ライブラリを使えば簡単ですが、正規表現の学習の為に。 ソースコード def return_between(unporsed, start, termi) unporsed =~ /#{start}(.*?)#{termi … Continue reading

Posted in Ruby | Tagged , | 1 Comment

POSTメソッドを用いてExcite翻訳を行うRubyコード

しかし、未完です。 Webの巡回などにはWWW::Mechanizeという便利なライブラリがありますが、あえてnet/httpのPOSTメソッドを使う理由は、単にPOSTそのものと正規表現の学習をするためです。 今回は正 … Continue reading

Posted in Ruby | Tagged , , | Leave a comment

チャットログから本文を抽出

先日、メッセンジャーのチャットで会話するボットを作りました。 そのボットに「学習」させるネタに、会話文であるWindows Live Messengerのチャットログを用いることにしました。しかし、ログはXML形式なので … Continue reading

Posted in Ruby | Tagged , , , | Leave a comment