続・久しぶりにmechanizeを使ってみる
前回の続き
from mechanize import Browser from BeautifulSoup import BeautifulSoup br = Browser() br.set_handle_robots(False) br.open("http://code.google.com/p/django-logging/source/list") html = br.response().read() soup = BeautifulSoup(html)
ここからは、位置の確認のため非効率的な方法を。
効率的な方法はドキュメントを確認して今後。
#revisionがあるテーブルを取得 table = soup.find All('table')[4] rev = table.findAll('tr')[1] #revision取得 rev.findAll('td')[0] >>><td class="id"><a href="detail?r=21">r21</a></td> #更新説明 rev.findAll('td')[1] >>><td onclick="if (!cancelBubble) _goDetail(21)"><div><a href="detail?r=21">Updated copyright year in the licence file.</a></div></td> #更新日取得 rev.findAll('td')[2] >>><td onclick="if (!cancelBubble) _goDetail(21)" title="Wed Mar 12 12:50:49 2008" nowrap="nowrap"><a onclick="cancelBubble=true" href="detail?r=21">Mar 12, 2008</a></td>
こんな感じ。
今日はBeautifulSoupのサイトが調子が良いようなので、ローカルにドキュメントを保存しておこう。
久しぶりにmechanizeを使ってみる
以前mechanizeでGoogle Codeのリビジョンを取得するコードを書いたが、
現在は変更されているため使えない。
ということで、取得できるか試してみた。
from mechanize import Browser br = Browser() br.set_handle_robots(False) br.open("http://code.google.com/p/django-logging/source/list")
で、取得されたページのtitleを表示してみる。
br.title
>>>'django-logging - Google Code'
おっ、出来た:)
あとは、BeautifulSoupに任せれば色々と出来るな:)
巡回
iptablesで特定IPをはじく
Now your mobile phones get to take some Acid
海外のフリーフォトサイトから商用利用可の写真を横断検索「PicFindr」
Create a spiral ornament Symbol in Illustrator
クリック位置のヒートマップを作成できるオープンソースやサービス色々
CSSによるデザインワークと相性のよいHTMLって?
Google、ガジェット開発者向け開発環境「iGoogle Sandbox」公開
どんなデジカメでも使えるGoogle Earth対応のGPSユニット
Webブラウザにパスワード入力機能,産総研がFirefoxとApacheモジュールを公開
ネットで集客に参考になるサイト
信用性とインパクトを両立させるデザイン
アートピンホールカメラの設計図がダウンロードできる「Corbis ReadyCam」
twitter、nowa、frepaのヒトコトをrubyで更新
rubyのmechanizeでプチプロフのヒトコト更新
クリエイティブなベクタープロジェクト「vector4free.com」
CDをFAX送信「cdfax」
Firefox PicLensアドオン
CodeReposのフィードを絞り込むYahoo! Pipes
[Ubuntu] git-svn を使ってみる
フリーのレトロチックなアイコンのベクター素材
[JS]アプリケーション構築も可能なライブラリExt 2.1, Ext GWT 1.0がリリース
[CSS]スタイルシートの記述簡略化のチートシート
[JavaScript]Twitterを読み上げるGreasemonkeyスクリプト
JavascriptでSuffixArray
巡回
couchdb-python CouchDB Python Library
[Python]データファイルの頭の数行だけ読む
中国語でPython
Things.app のデータを hoge る
Eclipse で Mercurial をつかう
[プログラミング] ShareSourceに登録
Pythonで空のフォームのデータを取得する
exec-文字列を実行する
URLをリンクに変更する
[BeautifulSoup]findAllと親要素
メールとMIME Typeと拡張子
Python iterative operation benchmark
Python を試してみる
[python][programing]PASMOのマイページをスクレイピングして、交通費の精算に必要なデータを取り出してみる。
[python][Project Euler]Problem 21-30
[everyday][parser][PLY] エラーまわり
巡回
WindowsでPyGtkを使うには 2008年4月版
[Mac][Python]音を鳴らす方法
シカクいアタマをマルくする問題 その1
Java meets Python - 第5回 二分木と辞書
Perlクックブックのお題をPythonで解いてみた59
TurboGearsでSESSIONを使う。
[python] python チュートリアル確認
[python] python チュートリアル確認 (2)
[IT][仕事] MySQLdbの設定にはまる
気軽に Jython《01》九九の表を作ってみよう
[Python]ゲームを作りたい その2
Pyxis のデフォルトテンプレート
わかち書かないでマルコフ連鎖
Python版ニコニコ動画ライブラリを試しに公開してみる
[IT][勉強][Python] lxmlでAmazonAPI (objectify使ってみたよ)
Python 2.6α2と3.0α4がリリースされている
pdfcat 1.0dev-r17
Pythonでの関数のテスト用コード
[Python] Python プログラムを書く前に