雑誌ネット
久しぶりにちょっと色々心境の変化もありやってみた。
でもCustomfeedって確か重複排除がうまくきかなかった気がする。
#Zasshinet 検索結果 #2010/01/04 # http://www.zassi.net/ author: naokii35 match: http://www\.zassi\.net/search\_result\.php\?word\=.*?&Submit=\%B8\%A1\%BA\%F7 # Submit=以降は解読すると「検索」なのでいじらないほうがいいっぽい。ていうか日本語で指定するか普通。 extract_xpath: title: // div[@id="leftContents"] extract_after_hook: | $data->{title} =~ s/(h1|h2)/h4/g; # $data->{body} =~ s/mag\_/http\:\/\/www\.zassi\.net\/mag\_/g;
最後の行は送られてくるのが全部相対リンクだから絶対になおしたくてやってるんだけど、こういう書き方だとURLが文に書かれてないと反応してくれないのよね…。どうにかならないのかしら。
ちなみに下の書き込みの後は怒りのあまり削除した様子です。今バックアップから復旧しました。