日本語全文検索システム「Namazu」の最新版2.0.19が公開

日本語全文検索システム「Namazu」の最新版である、2.0.19が公開された。


これは、1年ぶりのリリースになるのかな?

今回のリリースで追加になったのかよく分からないが、UTF-8の文書も処理できるようになったらしい。namazuは数年前に使ったことあるのだが、そのころはまだUTFは処理できなかったような気がする・・・

以下、リリースノートからの抜粋です。


■ 主な変更内容

1.追加/修正
- LTVERSION="8:1:1" に変更。
- mknmz にファイルサイズのチェックを追加。
- 各フィルタを extutf8.pl, extzip.pl 拡張機能モジュールに対応。
- pltests にテストを追加。

2.バグフィックス
下記の不具合を修正

- namazu, namazu.cgi フレーズ検索を含む複雑な検索式の解析部分を
修正。

■ 拡張機能モジュール

* 個々のフィルタで行っていた処理を拡張機能モジュールとして統合整理。
* 2つの拡張機能モジュールを用意しました。

pl/extutf8.pl: UTF-8 処理拡張モジュール
- extutf8.pl 対応フィルタから呼び出され、UTF-8 処理を行います。
- UTF-8 処理に必要なツール、モジュールの判定を次の順で行い、
利用可能な場合は UTF-8 処理にそれらのツール、モジュールを利用しま
す。

1. NKF Perl モジュール 2.04 以上
2. Perl 5.8 以上
3. lv コマンド
4. unicode.pl モジュール

pl/extzip.pl: zip 処理拡張モジュール
- extzip.pl 対応フィルタから呼び出され、zip 処理を行います。
- zip 処理に必要なツール、モジュールの判定を次の順で行い、
利用可能な場合は zip 処理にそれらのツール、モジュールを利用します。

1. Compress::Zlib, Archive::Zip, (IO::String)
IO::String がインストールされている場合は処理が高速化します。
2. unzip コマンド


また使ってみようかな。。。

改訂 Namazuシステムの構築と活用