- Posted at 2009/03/14 18:29
- Categories: 自宅サーバ
日本語全文検索システム「Namazu」の最新版である、2.0.19が公開された。
これは、1年ぶりのリリースになるのかな?
今回のリリースで追加になったのかよく分からないが、UTF-8の文書も処理できるようになったらしい。namazuは数年前に使ったことあるのだが、そのころはまだUTFは処理できなかったような気がする・・・
以下、リリースノートからの抜粋です。
■ 主な変更内容
1.追加/修正
- LTVERSION="8:1:1" に変更。
- mknmz にファイルサイズのチェックを追加。
- 各フィルタを extutf8.pl, extzip.pl 拡張機能モジュールに対応。
- pltests にテストを追加。
2.バグフィックス
下記の不具合を修正
- namazu, namazu.cgi フレーズ検索を含む複雑な検索式の解析部分を
修正。
■ 拡張機能モジュール
* 個々のフィルタで行っていた処理を拡張機能モジュールとして統合整理。
* 2つの拡張機能モジュールを用意しました。
pl/extutf8.pl: UTF-8 処理拡張モジュール
- extutf8.pl 対応フィルタから呼び出され、UTF-8 処理を行います。
- UTF-8 処理に必要なツール、モジュールの判定を次の順で行い、
利用可能な場合は UTF-8 処理にそれらのツール、モジュールを利用しま
す。
1. NKF Perl モジュール 2.04 以上
2. Perl 5.8 以上
3. lv コマンド
4. unicode.pl モジュール
pl/extzip.pl: zip 処理拡張モジュール
- extzip.pl 対応フィルタから呼び出され、zip 処理を行います。
- zip 処理に必要なツール、モジュールの判定を次の順で行い、
利用可能な場合は zip 処理にそれらのツール、モジュールを利用します。
1. Compress::Zlib, Archive::Zip, (IO::String)
IO::String がインストールされている場合は処理が高速化します。
2. unzip コマンド
また使ってみようかな。。。
こちらの記事もあわせてどうぞ!
関連書籍
- Newer: 初恋の人からの手紙を公開してみる
- Older: ブログを驚くほどパワーアップさせるWordPressプラグインTOP 60
Comments:2
- opengl2772 2009/03/25 0:54
-
UTF-8 の文書の処理は、大昔の Namazu から扱えます。
nkf のバージョンに依存するだけ。Namazu 2.0.19 では、従来個々の文書フィルタで行っていた UTF-8 処理を拡張機能として統合しただけのこと。
従来は個々のフィルタで動作に違いがあったが、共通化、最適化を行うことで安定性と速度(わずかだが)の向上をはかっている。 - showBOO 2009/03/25 8:53
-
なるほど、そうだったんですか(^^ゞ
失礼しました。確かにnkfは昔から対応してましたもんね。
しばらくnamazuを使ってない分、かなり記憶があいまいですんませんm(_)m
Trackbacks:0
- Trackback URL for this entry
- http://www.multiburst.net/ElectricBrain/2009/03/fulltext-indexing-system-namazu-2019/trackback
- Listed below are links to weblogs that reference
- 日本語全文検索システム「Namazu」の最新版2.0.19が公開 from ElectricBrain Standard



















































