2002/06/25(火): 勝負
とは言っても一応相棒さんを驚かすことには成功.一歩前進♪
2002/06/25(火): mknmz するときに "-L ja_JP.EUC" で言語指定
こんなとこからも支援 されてた.今やってるのは Cygwin で SJIS だから,-L ja_JP.SJIS とでも指定するんかな.
たぶん Namazu はデフォルトでは自分で文字コードを判別してるんだろうけど,
文字コードが決まってるなら,あらかじめ指定したほうが精度も上がるんだろうね.
ほんとはいかにも UNIX になるように EUC にしたかったんだけど,
すべては日本語添付ファイル名がいけないんだな.
まあ,そのファイル名を復元しないでおけばいいんだけどさ,
それじゃやっぱりあんまりなんで….
2002/06/24(月): HP-UX 10.20
2002/06/24(月): mlist2html
環境変数かなんかの問題だろうか?
よく分からないが,mlist2html の中身を見てみると,ヘッダをいじってる部分があったので,
それを外したらうまくいくようになった(ように見える).
2002/06/24(月): というわけで
Namazu でメール検索 on Cygwin はひとまず完成.
副産物として,ローカルに IMAP サーバができてしまったので,
古いメールはそこに放り込むようにした.
結果として,IMAP 対応メーラならなんにでも乗り換えOKな状態になってしまった(笑).
しかしこれ,Celeron 600MHz メモリ 128MB では力不足なのか,ちょっとレスポンスが悪い.
しばらく作業してから httpd や imapd, ipop3d にアクセスすると,
スワップされてたのが戻ってくるのか,しばらく待たされる.
このシステムを作ろうと思った動機は,
メールが増えてきて OE の検索が遅くてやってられない!
だったのだが,やや本末転倒のような気がしないでもない….
2002/06/24(月): 恥
2002/06/24(月): いなばさんおめでた(違">いなばさんおめでた(違
1週間遅れでおめでとうございます!
む〜,書類出すのはもしかしたら逆転できるかと思ったんだけどなあ….
ぜんぜん話にならんじゃん>自分.まあ,とりあえず,あした
勝負ですよ.給料日(+ボーナス)で目標額突破なので.
2002/06/23(日): Namazu
さんざん待たされたあげくに Out of memory といわれてしまった.
--checkpoint とかいうオプションも試したが無駄だった.
そこで,mknmz も月ごとのディレクトリ単位で実行することにした.
今は cron で昼休みに6月のディレクトリだけ実行してる.
現在日時から自動的に対象ディレクトリを決めて mknmz するスクリプトでも書くかな.
M$ Word, Excel, PowerPoint も検索対象に :
ActivePerl だと oleword.pl とかのフィルタが使えるんだろうか?
Cygwin では他の UNIX と同じようにツールをコンパイルして入れたら
フィルタが使えるようになった.
ただし,ファイルによって Excel のインデックスを作ってるときに
メモリを食いつぶして落ちることがあるようだ.
ファイル名がいかんのか,Excelファイル内のマクロがいかんのかは不明.
あと,xpdf は置いてあった Win 用バイナリを入れたが,日本語が読めないみたい.
検索結果 SJIS に :
日本語添付ファイル名を SJIS にしたので,
検索結果に日本語ファイル名.xls などがあると文字化けしてしまう.
.namazurc で Lang ja_JP.SJIS とフルで指定したら
検索結果全体が SJIS になってめでたしめでたし.
2002/06/23(日): MHonArc
最新版はパッチを当てなくてもリソースの書き方次第で日本語もうまくいくらしい.
が,日本語添付ファイル名のデコードはさすがにうまくいかないらしいので,
あらかじめ nkf でデコードする.
さて,今までに届いてたメールを MHonArc に通すわけだが,こんなとこで IMAP が大活躍.
OE から Drug & Drop で mbox 形式に変換できる.
しかし,1年ちょっとで2000件以上のメールをひとつの IMAP フォルダに放り込んだら,
かなりレスポンスが悪くなった.また,これを HTML に変換するときも,
直接 MHonArc に食わせてひとつディレクトリに出力しようとすると,
これまたとんでもない時間とリソースを食う.
そこで mlist2html の登場となるのだが,このスクリプト,
標準入力から1件分のメールを入力するのが前提なので,
最初のヘッダの年月で放り込むディレクトリを決定している.
なので,IMAP 経由で作った巨大 mbox を月ごとに分割するスクリプト
*3をゴリゴリ書いて,めでたく HTML 化完了.
fetchmail で取り込んだメールも procmail 経由でちゃんと追加されていく.
*3:スクリプトでは From ヘッダの時間で判断してたが(最初の行だから),
mlist2html は Date: ヘッダで判断してるらしく,
ちょうど月をまたがってるメールがあって,
1か月分放り込み先を間違えたのがあった.(;_;
2002/06/23(日): mlist2html
メーリングリスト html化に利用してたもの.自動で月ごとにディレクトリを分けてくれる.