サイト内検索
2012年2月 月 火 水 木 金 土 日 « 1月 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 -
最近の投稿
Sponsored Link
Tag Archives: RegExp
Bash: 数値と文字列の判別
手っ取り早く数字文字列とそれ以外の文字列を判別する条件式は以下のとおり。 コード #!/bin/sh if expr “$1″ : ‘[0-9]*’ > /dev/null ; then echo “数値です” else … Continue reading
Python: 正規表現の基本 – 最長、最短マッチング
直前の文字、メタ文字を繰り返しマッチングさせる量指定記号である「*」「+」「?」などは、テキスト中にその繰り返しパターンがマッチする箇所が複数ある場合は、通常最後にマッチした箇所をオブジェクトに記録します。このような最長 … Continue reading
Python: 正規表現の基本 – 文字範囲の指定「[ ]」
ソースコード # coding: Shift_JIS import re # 正規表現を扱うモジュールのインポート # 正規表現のチェックプリント用の関数 def PrintRegMatch(pat, txt): # 探 … Continue reading
Python: 正規表現の基本 – 繰り返し「*」「+」「?」
ソースコード # coding: Shift_JIS import re # 正規表現を扱うモジュールのインポート # 正規表現のチェックプリント用の関数 def PrintRegMatch(pat, txt): # 書 … Continue reading
Python: 正規表現の基本 – メタ文字「.」「^」「$」
ソースコード # coding: Shift_JIS import re # 正規表現を扱うモジュールのインポート # 正規表現のチェックプリント用の関数 def PrintRegMatch(pat, txt): # 書 … Continue reading
JavaプログラムからExcite翻訳を利用
POSTメソッドを用いてWebページのフォームにリクエストを送信し、そのレスポンスを取得するプログラム例として、エキサイト 翻訳を利用してみます。 送信クエリの1つは翻訳言語設定、2つ目は翻訳対象文字列でレスポンスのWe … Continue reading
Webページから指定したタグの要素を抜き出すRuby関数
単一のWebページから抜き出した複数の要素を配列に格納して返します。 以下の例はaタグの要素(エレメント)を抽出した場合です。 Rubyコード require 'net/http' require & … Continue reading
タグの中の要素を抜き出すRuby関数
ライブラリを使えば簡単ですが、正規表現の学習の為に。 ソースコード def return_between(unporsed, start, termi) unporsed =~ /#{start}(.*?)#{termi … Continue reading
POSTメソッドを用いてExcite翻訳を行うRubyコード
しかし、未完です。 Webの巡回などにはWWW::Mechanizeという便利なライブラリがありますが、あえてnet/httpのPOSTメソッドを使う理由は、単にPOSTそのものと正規表現の学習をするためです。 今回は正 … Continue reading
チャットログから本文を抽出
先日、メッセンジャーのチャットで会話するボットを作りました。 そのボットに「学習」させるネタに、会話文であるWindows Live Messengerのチャットログを用いることにしました。しかし、ログはXML形式なので … Continue reading