サイト内の特定のノードを切り出す(再)

ここを更新してないだけで、日々未だ自分の情報収集の根幹はPla様です。Gunosy?ぺっぺっぺっ。

サイト内の特定のノードだけから切り出す

この時はまったく違う手段で解決したんだけど、東洋経済なんかもまったく同じ「URLにジャンル情報や作者情報が含まれていない」系だということにいまさら気づいて体温が上がっています。管理の都合上内部的にタグなりなんなり持っていない訳がないので、ケチな野郎だと思うだけなのですが。

ほかにも方法あるのかもしれないけど、URLだけでなく「どこから切り抜くか」を指定できればそこでメインカラムの記事に該当する部分だけを指定してどうにか…と思うんだけど、どう書けばいいんだろう。extract_after_hook:内で書いたりとかでどうにかなるんだろうか…

で、悩んでいた所

空繰再繰 Plagger::Plugin::Subscription::Parse

あーこれでいけそう。


と思ったら

Use of uninitialized value in pattern match (m//) at C:\Perl\site\lib\Plagger\Pl
ugin\Subscription/parse.pm line 49.
Use of uninitialized value in subroutine entry at C:\Perl\site\lib\Plagger\Plugi
n\Subscription/parse.pm line 80.

49は

>        if ( $xhtml =~ m{<title>\s*(.*?)\s*</title>}i ) {

80は

>    $tree->parse( $xhtml );

…。



(遠くで匙を投げる音)


あー。僕Plagger使いだしてもう何年経ってるかわかんないんすけど。