いい加減携帯に送るでござるよ!

いい加減いくつかのフィードを携帯に送りたいわたし。

ということで色々ぐぐっていたら少なくともauだと文字コードUTF-8だとだめなのね。ISOだったらよくなるのかしら、ということで、

FormatTextとIso_2022_jp_mail
踊る犬.net

を見てやってみた。
見事に、だめである。

Unknown encoding 'MIME-Header-ISO_2022_JP' at D:/Perl/site/lib/Plagger/Plug
in/Publish/Iso_2022_jp_mail.pm line 44

でもさーその44行目って

  my $msg = MIME::Lite->new(

とかなんだよね。
できっとこのMIME-Header-ISO_2022_JPって名前がいかんのだろうと思って46-49行目の前半削ってISO_2022_JPにしたらこの行は通過するんだけど、今度は

SMTP Failed to connect to mail server: Bad file descriptor

とかって怒られんのね。

わからんなぁ。

現代ビジネス

#現代ビジネス
#2010/01/08
# http://gendai.ismedia.jp/
author: naoki35
custom_feed_handle: http://gendai.ismedia.jp/
custom_feed_follow_link: articles/\-/\d\d 
handle: http://gendai.ismedia.jp/articles/\-/\d\d 
extract: <div id="main-contents">(.*?)<div id="article-end">
extract_capture: body

昨日からはじまりましたね!期待の無料硬派週刊誌現代ビジネス!
…半年続くかな…。

久しぶりにxpathではなく、普通のExtract_captureを使いましたよ。

ちなみにカテゴリごとに個別URLが階層化されていたりはしないので、特定のカテゴリだけを読みたい場合はクロールし始める"handle"の指定を例えば"http://gendai.ismedia.jp/category/culture"とかにすればよいと思います。

雑誌ネット

久しぶりにちょっと色々心境の変化もありやってみた。
でもCustomfeedって確か重複排除がうまくきかなかった気がする。

#Zasshinet 検索結果
#2010/01/04
# http://www.zassi.net/
author: naokii35
match: http://www\.zassi\.net/search\_result\.php\?word\=.*?&Submit=\%B8\%A1\%BA\%F7
# Submit=以降は解読すると「検索」なのでいじらないほうがいいっぽい。ていうか日本語で指定するか普通。
extract_xpath:
  title: // div[@id="leftContents"]
extract_after_hook: |
  $data->{title} =~ s/(h1|h2)/h4/g;
#  $data->{body} =~ s/mag\_/http\:\/\/www\.zassi\.net\/mag\_/g;

最後の行は送られてくるのが全部相対リンクだから絶対になおしたくてやってるんだけど、こういう書き方だとURLが文に書かれてないと反応してくれないのよね…。どうにかならないのかしら。


ちなみに下の書き込みの後は怒りのあまり削除した様子です。今バックアップから復旧しました。

1236

libxml入れようとして入ってたマニュアル通りにnmakeしたらincludeがどうとかでno such file or directoryだってさ。確かにそんなものはない。1110に書いたのと同じ症状な気がする。もういいからforce install Plaggerとかで全部解決しないかな…