マイコミジャーナルをタグ別に読みたいな
#Mycom Journal(タグ別) # #2008/6/19 author: naokii35 custom_feed_handle: http://journal\.mycom\.co\.jp/tag/\d{7}/ custom_feed_follow_link: http://journal\.mycom\.co\.jp/news/\d{4}/\d\d/\d\d/\d\d\d/index\.html handle: http://journal\.mycom\.co\.jp/news/\d{4}/\d\d/\d\d/\d\d\d/index\.html extract_xpath: title: //title/text() body: //p[@class="author"]
記事名と筆者の照合が目的だったのでbodyはそういうことになってるけど、本文を取りたかったらdiv class="articleContent"辺りかな。
ただ残念ながらタグに対応してしてるのは一部カテゴリの様子(PCとか携帯とか)。
いやぁ「データ取得のためだけに使い捨てっぽいyaml書く」なんて日が来るなんて!