かなり使えるPHPの正規表現まとめ

SPONSORED LINK

Pocket

php_top

【さらに追記】

さらに追記です。さまざまな方につっこまれたのでちょっと調べてみました・・・。一番つっこまれたメールアドレスについては、厳密にやろうとするととてつもなく複雑になる、ことをまずはご理解ください。そのほかの電話番号やクレジットカード番号についてもご指摘いただきました。ありがとうございます。

このブログやブックマークでの厳しいご指摘ありがとうございました。以後、気をつけます。

【追記】
こちらもあわせてご覧ください・・・。すみません、以後気をつけます。
» 404 Blog Not Found:「PHP使いはもう正規表現をblogに書くな」と言わせないでくれ

これはメモしておかないと!「10 Practical PHP Regular Expression Recipes」です。PHPでウェブサービスをつくるときにはげしく使えそうな正規表現がまとまっていますよ(日本で使えそうもないものもちょっとありますが)。

個人的にまだ検証していないのであれですが、まずはメモということで・・・。

  • メールアドレスの正規表現
  • メールアドレスは厳密にチェックしようとするとなかなか難しいのですが、簡単なチェックだったらこれでOKぽいですね。

    $email = "test@example.com";
    if (preg_match('/^[^0-9][a-zA-Z0-9_]+([.][a-zA-Z0-9_]+)*[@][a-zA-Z0-9_]+([.][a-zA-Z0-9_]+)*[.][a-zA-Z]{2,4}$/',$email)) {
        echo "Your email is ok.";
    } else {
        echo "Wrong email address format";
    }
    
  • ユーザー名の正規表現
  • 英数字と下線を入れた、5文字以上20文字以下のユーザー名チェック用です。

    $username = "user_name12";
    if (preg_match('/^[a-z\d_]{5,20}$/i', $username)) {
        echo "Your username is ok.";
    } else {
        echo "Wrong username format.";
    }
    
  • 電話番号の正規表現
  • US用ですが。これをもとに日本語版をつくる勉強してもいいかもですね。

    $phone = "(021)423-2323";
    if (preg_match('/\(?\d{3}\)?[-\s.]?\d{3}[-\s.]\d{4}/x', $phone)) {
        echo "Your phone number is ok.";
    } else {
        echo "Wrong phone number.";
    }
    
  • IPアドレスの正規表現
  • IPアドレスチェック用。

    $IP = "198.168.1.78";
    if (preg_match('/^(([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]).){3}([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])$/',$IP)) {
        echo "Your IP address is ok.";
    } else {
        echo "Wrong IP address.";
    }
    
  • 郵便番号の正規表現
  • またしてもUS用ではありますが。

    $zipcode = "12345-5434";
    if (preg_match("/^([0-9]{5})(-[0-9]{4})?$/i",$zipcode)) {
        echo "Your Zip code is ok.";
    } else {
        echo "Wrong Zip code.";
    }
    
  • SSNの正規表現
  • アメリカのソーシャルセキュリティ番号ですね。USではよく使います。

    $ssn = "333-23-2329";
    if (preg_match('/^[\d]{3}-[\d]{2}-[\d]{4}$/',$ssn)) {
        echo "Your SSN is ok.";
    } else {
        echo "Wrong SSN.";
    }
    
  • クレジットカード番号の正規表現
  • これも知っておくと良いかも。

    $cc = "378282246310005";
    if (preg_match('/^(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|6011[0-9]{12}|3(?:0[0-5]|[68][0-9])[0-9]{11}|3[47][0-9]{13})$/', $cc)) {
        echo "Your credit card number is ok.";
    } else {
        echo "Wrong credit card number.";
    }
    
  • ドメインの正規表現
  • こちらもたまに必要になりますね。

    $url = "http://komunitasweb.com/";
    if (preg_match('/^(http|https|ftp):\/\/([A-Z0-9][A-Z0-9_-]*(?:\.[A-Z0-9][A-Z0-9_-]*)+):?(\d+)?\/?/i', $url)) {
        echo "Your url is ok.";
    } else {
        echo "Wrong url.";
    }
    
  • URLからドメインを抽出する正規表現
  • 他の命令使えばできるような・・・ま、でも勉強にはなりますね。

    $url = "http://komunitasweb.com/index.html";
    preg_match('@^(?:http://)?([^/]+)@i', $url, $matches);
    $host = $matches[1];
    
    echo $host;
    
  • 特定のキーワードを強調表示
  • 特定の文字列にスタイルを当てたいことってありますよね。そうしたときに使えそうです。

    $text = "Sample sentence from KomunitasWeb, regex has become popular in web programming. Now we learn regex. According to wikipedia, Regular expressions (abbreviated as regex or regexp, with plural forms regexes, regexps, or regexen) are written in a formal language that can be interpreted by a regular expression processor";
    
    $text = preg_replace("/\b(regex)\b/i", '<span style="background:#5fc9f6">\1</span>', $text);
    
    echo $text;
    

正規表現は慣れないと使いづらいですよね。しかし使えると超絶便利。よく使うパターンを覚えておいて応用を利かせていきたいものです。

» 10 Practical PHP Regular Expression Recipes | KomunitasWeb

ツイッターもやっています!

SPONSORED LINK

    • 404から
    • March 19th, 2009

    http://blog.livedoor.jp/dankogai/archives/51189905.html
    弾さんがお怒りです
    まぁメモだって書いてるんだからそれほど目くじら立てんでもとおもいつつ。

  1. というか、メールアドレス以外の正規表現もダメダメですよね。元ネタがそもそもよくない。

    ユーザー名だって、なぜ \w を使わないのかさっぱり理解できませんし、末尾に改行文字があったときに通ってしまいますよね。($ は末尾の改行文字より手前にマッチします)

    IP アドレスの検証も明らかに間違いで、「3332899150」も正当なアドレスなのに通りません。PHP ならば正規表現ではなく ip2long と long2ip で検証するのが好ましいでしょう。

    SSN も [\d] のように1文字だけ文字クラスに入れる意図が分かりません。これなら \d\d\d と書く方がシンプルです。

    ドメインなんて、アンダースコア (_) を通している時点で RFC1123 無視ですし、文字数制限をチェックしてないのはいけてないですね。

    残念ながら、今回のは「使いものにならない正規表現10選」だと思います。正規表現を語るならば、「詳説 正規表現」は必読だと思いますが、元ネタ筆者がこれを読んでないことは明らかでしょう ;-)

    • ちょんまげ犬
    • March 20th, 2009

    管理人さんが正規表現をまるで分かっていないことは初心者の自分ですら
    分かるレベルなので今一度ちゃんと勉強されたほうが。。

    (?! ~ )

    とか

    (?: ~ )

    の使い方すら知らないのでは無いかと思ってしまう感じです。

    日本には表現の自由があるので「~を書くな」的なことを言う
    つもりはありませんが、読者さんに迷惑がかかってしまうのは
    残念ですね。

  2. 参考になりました。ありがとうございました!

  1. March 19th, 2009
    Trackback from : 404 Blog Not Found
  2. March 19th, 2009
    Trackback from : 漫ろで行こう
  3. March 20th, 2009
    Trackback from : Your Way, My Way, Any Way