注意

最後にドル。

基本的な話かもしれないけど、普通にEFTするとhuga.html#commentとかってのもhuga.htmlと別個に取られてきちゃう場合もあるで、そういう場合はcustom_feed_follow_link:の最後にhuga.html$とつけるとそこで終わってるもののみFollowされ、結果的に幸せになれ…

"not aggregated by any aggregator"のもうひとつの原因

そもそも設定がちゃんとされてない場合に起こると2chなんかに書いてあるんだけど、 http://d.hatena.ne.jp/ablabo/20070203/1170509149 のようにそもそもGlobal書かなかったりする場合ともうひとつ、文字コードがUTF-8じゃないorそうなっててもBOMがついてる…

凡ミス備忘

expression: $args->{entry}->title =~ s/hoge//g;ではなく expression: $args->{entry}->{title} =~ s/hoge//g;ですよね。検索すると上の方が結構ヒットしたりしてミスリーディングだけど(多分Googleが"{}"を認識してないだけ)、 サブルーチンがどうのと…

車輪の再発明。

handle: http://blog.goo.ne.jp/.+otsuneさんが書いたというEFT。自分で書いているのはすべて一対一対応のものだったんだけど(上記の".+"が普通の固有アドレス)そういやhandleするURLにだって正規表現は使えるんだよね…勉強になりました。

突然module:: Dedupedが動作しなくなったりしたら

Dedupedで溜めてるキャッシュが壊れてる?可能性が。 CacheフォルダのDeduped.dbを消すと直る。いつもconfigをまとめて流してると気づきにくいので たまには個別に指定して流れる結果を読むといいみたい。その際全部を送りなおすとGmailの送信規制に引っかか…

Y!newsの文字コードって

もしやEUC…? エディタでソースを開けない。 エンコードをEUCにすると開ける。ちゃんとExtractの範囲を指定してもtitleしかとってこれないのはこれのせい? にくい。 しかもEFT用configでextract_encode:euc-jp 指定してもなおらん… まぁタイトルだけでも取…

あとあと

EFTの参考になるページのどこにも書いてない(多分…)けど custom_feed_follow_linkってcustom_feed_handleの子ディレクトリ?を指定する必要はなくって ちゃんとhandleのページからリンクさえ張ってあれば絶対パス入れれば通るのね。勉強になるわー。

わかんねーなおい

Config側では -urlを指定する際に正規表現である必要はないのに、 EFT側では正規表現じゃないとお馴染みの「not agregated by any aggregator」が出るんだ…。 しかしこの問題、capture(またはxpath)で「bodyだけ」を指定した時だけ出るんだよな。 titleとbod…