注意
基本的な話かもしれないけど、普通にEFTするとhuga.html#commentとかってのもhuga.htmlと別個に取られてきちゃう場合もあるで、そういう場合はcustom_feed_follow_link:の最後にhuga.html$とつけるとそこで終わってるもののみFollowされ、結果的に幸せになれ…
そもそも設定がちゃんとされてない場合に起こると2chなんかに書いてあるんだけど、 http://d.hatena.ne.jp/ablabo/20070203/1170509149 のようにそもそもGlobal書かなかったりする場合ともうひとつ、文字コードがUTF-8じゃないorそうなっててもBOMがついてる…
expression: $args->{entry}->title =~ s/hoge//g;ではなく expression: $args->{entry}->{title} =~ s/hoge//g;ですよね。検索すると上の方が結構ヒットしたりしてミスリーディングだけど(多分Googleが"{}"を認識してないだけ)、 サブルーチンがどうのと…
handle: http://blog.goo.ne.jp/.+otsuneさんが書いたというEFT。自分で書いているのはすべて一対一対応のものだったんだけど(上記の".+"が普通の固有アドレス)そういやhandleするURLにだって正規表現は使えるんだよね…勉強になりました。
Dedupedで溜めてるキャッシュが壊れてる?可能性が。 CacheフォルダのDeduped.dbを消すと直る。いつもconfigをまとめて流してると気づきにくいので たまには個別に指定して流れる結果を読むといいみたい。その際全部を送りなおすとGmailの送信規制に引っかか…
もしやEUC…? エディタでソースを開けない。 エンコードをEUCにすると開ける。ちゃんとExtractの範囲を指定してもtitleしかとってこれないのはこれのせい? にくい。 しかもEFT用configでextract_encode:euc-jp 指定してもなおらん… まぁタイトルだけでも取…
EFTの参考になるページのどこにも書いてない(多分…)けど custom_feed_follow_linkってcustom_feed_handleの子ディレクトリ?を指定する必要はなくって ちゃんとhandleのページからリンクさえ張ってあれば絶対パス入れれば通るのね。勉強になるわー。
Config側では -urlを指定する際に正規表現である必要はないのに、 EFT側では正規表現じゃないとお馴染みの「not agregated by any aggregator」が出るんだ…。 しかしこの問題、capture(またはxpath)で「bodyだけ」を指定した時だけ出るんだよな。 titleとbod…