現代ビジネス

#現代ビジネス
#2010/01/08
# http://gendai.ismedia.jp/
author: naoki35
custom_feed_handle: http://gendai.ismedia.jp/
custom_feed_follow_link: articles/\-/\d\d 
handle: http://gendai.ismedia.jp/articles/\-/\d\d 
extract: <div id="main-contents">(.*?)<div id="article-end">
extract_capture: body

昨日からはじまりましたね!期待の無料硬派週刊誌現代ビジネス!
…半年続くかな…。

久しぶりにxpathではなく、普通のExtract_captureを使いましたよ。

ちなみにカテゴリごとに個別URLが階層化されていたりはしないので、特定のカテゴリだけを読みたい場合はクロールし始める"handle"の指定を例えば"http://gendai.ismedia.jp/category/culture"とかにすればよいと思います。