Home > 自宅サーバ > 日本語全文検索システム「Namazu」の最新版2.0.19が公開

日本語全文検索システム「Namazu」の最新版2.0.19が公開

日本語全文検索システム「Namazu」の最新版である、2.0.19が公開された。

これは、1年ぶりのリリースになるのかな?

今回のリリースで追加になったのかよく分からないが、UTF-8の文書も処理できるようになったらしい。namazuは数年前に使ったことあるのだが、そのころはまだUTFは処理できなかったような気がする・・・

以下、リリースノートからの抜粋です。

■ 主な変更内容

1.追加/修正
  - LTVERSION="8:1:1" に変更。
  - mknmz にファイルサイズのチェックを追加。
  - 各フィルタを extutf8.pl, extzip.pl 拡張機能モジュールに対応。
  - pltests にテストを追加。

2.バグフィックス
  下記の不具合を修正

  - namazu, namazu.cgi フレーズ検索を含む複雑な検索式の解析部分を
    修正。

■ 拡張機能モジュール

  * 個々のフィルタで行っていた処理を拡張機能モジュールとして統合整理。
  * 2つの拡張機能モジュールを用意しました。

  pl/extutf8.pl: UTF-8 処理拡張モジュール
  - extutf8.pl 対応フィルタから呼び出され、UTF-8 処理を行います。
  - UTF-8 処理に必要なツール、モジュールの判定を次の順で行い、
    利用可能な場合は UTF-8 処理にそれらのツール、モジュールを利用しま
    す。

    1. NKF Perl モジュール 2.04 以上
    2. Perl 5.8 以上
    3. lv コマンド
    4. unicode.pl モジュール

  pl/extzip.pl: zip 処理拡張モジュール
  - extzip.pl 対応フィルタから呼び出され、zip 処理を行います。
  - zip 処理に必要なツール、モジュールの判定を次の順で行い、
    利用可能な場合は zip 処理にそれらのツール、モジュールを利用します。

    1. Compress::Zlib, Archive::Zip, (IO::String)
       IO::String がインストールされている場合は処理が高速化します。
    2. unzip コマンド

また使ってみようかな。。。

改訂 Namazuシステムの構築と活用

関連記事

Comments:2

opengl2772 2009/03/25

UTF-8 の文書の処理は、大昔の Namazu から扱えます。
nkf のバージョンに依存するだけ。

Namazu 2.0.19 では、従来個々の文書フィルタで行っていた UTF-8 処理を拡張機能として統合しただけのこと。
従来は個々のフィルタで動作に違いがあったが、共通化、最適化を行うことで安定性と速度(わずかだが)の向上をはかっている。

showBOO 2009/03/25

なるほど、そうだったんですか(^^ゞ
失礼しました。確かにnkfは昔から対応してましたもんね。
しばらくnamazuを使ってない分、かなり記憶があいまいですんませんm(_)m

Comment Form
Remember personal info

Trackbacks:0

Trackback URL for this entry
http://www.multiburst.net/sometime-php/2009/03/fulltext-indexing-system-namazu-2019/trackback/
Listed below are links to weblogs that reference
日本語全文検索システム「Namazu」の最新版2.0.19が公開 from Sometime PHP

Additional comments powered by BackType

Home > 自宅サーバ > 日本語全文検索システム「Namazu」の最新版2.0.19が公開

Subscribe This Blog
Subscribe This Blog
FeedBurner

Search
Categories
Tag Cloud
Twitter Counter
Archives
My Other Blogs
Translator
Japanese flagEnglish flag

Return to page top