Plagger エラーメモ

新年明けてからちょくちょくPlaggerをいじり始めたのだけど、どうもうまくいかない。
2006-09-12の設定ファイルをまるごとコピー・手直しして使用しているのだが、下記のような謎のエラーメッセージに悩まされている。

Plagger [error] http://www.yomiuri.co.jp/science/ is not aggregated by any aggregator


原因と思われるものを調べつくし、ちょっと頭打ち感があるので、この辺で使用設定ファイルとエラーメッセージを晒して一時休戦としてみます。

まずは設定ファイルから。

plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://www.yomiuri.co.jp/science/

  - module: Filter::EntryFullText
    config:
      store_html_on_failure: 1

  - module: Filter::BreakEntriesToFeeds

  - module: Publish::OutlineText
    config:
      filename: sample.txt
      encoding: Shift_JIS


次に、Filter::EntryFullTextモジュールで適用される設定ファイル。

author: Toshi
custom_feed_handle: http://www\.yomiuri\.co\.jp/science/
custom_feed_follow_link: /science/news
handle: http://www\.yomiuri\.co\.jp/science/news/
extract: <!--// headline_start //-->(.*?)<!--// article_end //-->
extract_capture: body


最後に、エラーメッセージ。

C:\00work\Plagger>plagger -c sample.yaml
Plagger [info] plugin Plagger::Plugin::Subscription::Config loaded.
Plagger [info] plugin Plagger::Plugin::Filter::EntryFullText loaded.
Plagger [info] plugin Plagger::Plugin::Filter::BreakEntriesToFeeds loaded.
Plagger [info] plugin Plagger::Plugin::Publish::OutlineText loaded.
Plagger [info] plugin Plagger::Plugin::Bundle::Defaults loaded.
Plagger [info] plugin Plagger::Plugin::Aggregator::Simple loaded.
Plagger [info] plugin Plagger::Plugin::Summary::Auto loaded.
Plagger [info] plugin Plagger::Plugin::Summary::Simple loaded.
Plagger [info] plugin Plagger::Plugin::Namespace::HatenaFotolife loaded.
Plagger [info] plugin Plagger::Plugin::Namespace::MediaRSS loaded.
Plagger [info] plugin Plagger::Plugin::Namespace::ApplePhotocast loaded.
Plagger::Plugin::Aggregator::Simple [info] Fetch http://www.yomiuri.co.jp/science/
Plagger::Cache [debug] Cache MISS: Aggregator-Simple|http://www.yomiuri.co.jp/science/
Plagger::Plugin::Aggregator::Simple [debug] 200: http://www.yomiuri.co.jp/science/
Plagger [error] http://www.yomiuri.co.jp/science/ is not aggregated by any aggregator

C:\00work\Plagger>


むーん。Subscription::Configで記述されたurlへのフェッチは行っていて、それはキャッシュとして確認できるのだが、それ以降進行していない模様。


大きい疑問点を列挙していく。

  • urlのフェッチ以降が進行していない
    • Filter::EntryFullTextの設定ファイルのextractに問題がある?
  • なぜPlagger::Plugin::Namespace::HatenaFotolifeが読み込まれるのか
    • Filter::EntryFullTextの別の設定ファイルfollow_linkにマッチしている?