SVX日記
2005-02-10(Thu) namazuじゃらし作戦
昨日、仕掛けたnamazuであるが、どーも調子が悪い。Google以上に検索ワードが引っかかってこない。いくらなんでもオカシイので追加調査である……と、その前に、squeeze.rbが生成するhtmlに本日のリンク元が入ってしまう問題を解消しよう。namazuに検索ワードとして登録させるのは、本文とツッコミだけで十分だ。これにはsqueeze.rbに1行追加すればいい。
290 begin
291 conf = TDiary::Config::new
292 conf.header = ''
293 conf.footer = ''
294 conf.show_comment = true
295 conf.hide_comment_form = true
296 conf.show_referer = false # <オレサマ用追加>
297 def conf.bot?; true; end
298 output_path = "#{conf.data_path}/cache/html" unless output_path
299 Dir.mkdir(output_path, 0755) unless File.directory?(output_path)
300 TDiary::YATDiarySqueezeMain.new(output_path, all_data, compat, conf, suffix)
301 rescue
よし、対策完了。しかし、相変わらずnamazuの検索精度は非常に悪い。こんなに悪いわけはない。イロイロ調べていると、どうもindex作成時のロケールが英語になっているらしい。英語は語の区切り目がスペースだから、そのつもりで日本語文書に対してindexを作成すると、マトモな検索ワードが抽出できないワケだ。それに対する対処は環境変数LANGをjaに設定してmknmzをやり直す……が、なんだ? エラーだ。PerlがNKF.pmが見つからないとかゴネる……そうか、んじゃ、
# apt-cache search nkf perl
namazu2 - Full text search engine (namazu binary and cgi)
namazu2-common - Full text search engine (Document files)
namazu2-index-tools - Full text search engine (Tools for index handling)
libnkf-perl - Network Kanji code conversion Filter for Perl
pkf - Perl Kanji code conversion Filter
apt-get install libnkf-perl
export LANG=ja
mknmz -c /home/svx/diary/cache/html --output-dir=/home/svx/diary/index
5 3 * * * export LANG=ja; mknmz -c /home/svx/diary/cache/html --output-dir=/home/svx/diary/index
<meta http-equiv="content-style-type" content="text/css">
<link rel="stylesheet" href="/tdiary/theme/base.css" type="text/css" media="all">
<link rel="stylesheet" href="/tdiary/theme/default/default.css" title="default" type="text/css" media="all">
以上の対処を加え、検索すると……バッチリである。もーそりゃ重箱の隅を削り取るイキオイで隅々までツブサに検索してくれる……が、namazuに説教くらった気分……ぐは。
それはそうと、今日はケーブルで神林長平原作「敵は海賊〜猫たちの饗宴〜」のアニメ版が放送されるのだった。かなり昔の作品だが、ちょうど観たくなった頃の放送なので異様に気合が入っている。5分前にはテレビの前にスタンバイである。しかし、しかしだッ!! その前にひとつ放送局のanimaxにヒトコト言っておきたいッ!! この番組紹介のテキトーさは、ナンダッ!!
二人の主人公の名前を、しかも両方とも間違えるなッ!! ラケルとアポロじゃないッ!! ラテルとアプロだっつーのッ!! まぁ、ラケルとアポロの方が一般的で実際に居そうな名前なんだろうが。しかしながら、徹底してラケルとアポロかと思えばサにあらず。ページ中には各々4回名前が登場するが、ラケル3箇所、アポロ3箇所、ラテル1箇所、アプロ1箇所……ギャグかよ。