- 2007-11-11 (Sun) 9:39
- 開発ツール・技術
これはちょっと使ってみたい。忘れないようにメモ的エントリー。
htmlSQLはPHPで使うライブラリです。これを使えばHTMLの要素をSQLちっくに取り出すことができます。例えば次のような命令が書けるようになります。

↑ わかりやすいっす。
ちょっとあのページのタイトルだけ取り出したい、あのリンク集のURLだけ取り出したい、といったときに便利そうですね。ソースを勉強してみるのもいいかも。
デモサイトもあるので挙動を確認したい人はどうぞ。返り値は配列のようです。

↑ こちらでデモができますよ。
ダウンロード&詳細はこちらから。ライセンスなどを確認の上、ご利用ください。
» jonasjohn.de: htmlSQL – a PHP class to query the web by an SQL like language
Comments:0
Trackbacks:1
- Trackback URL for this entry
- http://www.ideaxidea.com/archives/2007/11/htmlsqlphphtmlsql.html/trackback
- Listed below are links to weblogs that reference
- HTMLの要素をSQLのように取り出せるPHPのライブラリ『htmlSQL』 from IDEA*IDEA ~ 百式管理人のライフハックブログ
- trackback from camelmasaの開発日記 09-02-19 (Thu) 11:14
-
[php]phpのSnoopy+htmlSQLでスクレイピングする時、POSTメソッドでhttpリクエスト出来ない対処方法。
phpのSnoopyライブラリはPEAR::HTTP_Requestと同じようなライブラリなのですが、HTTPリクエスト後、スクレイピングする処理は様々な方法があるようです。 http://saboten009.blogspot.com/2008/08/php.html 僕は使用した事が無いのですが、Tidy関数を利用すると上手くスクレ


























