現代ビジネス
#現代ビジネス #2010/01/08 # http://gendai.ismedia.jp/ author: naoki35 custom_feed_handle: http://gendai.ismedia.jp/ custom_feed_follow_link: articles/\-/\d\d handle: http://gendai.ismedia.jp/articles/\-/\d\d extract: <div id="main-contents">(.*?)<div id="article-end"> extract_capture: body
昨日からはじまりましたね!期待の無料硬派週刊誌現代ビジネス!
…半年続くかな…。
久しぶりにxpathではなく、普通のExtract_captureを使いましたよ。
ちなみにカテゴリごとに個別URLが階層化されていたりはしないので、特定のカテゴリだけを読みたい場合はクロールし始める"handle"の指定を例えば"http://gendai.ismedia.jp/category/culture"とかにすればよいと思います。