Home > 自宅サーバ > 日本語全文検索システム「Namazu」の最新版2.0.19が公開

日本語全文検索システム「Namazu」の最新版2.0.19が公開

  • Posted at 2009/03/14 18:29
  • Categories: 自宅サーバ
  • Tags: ,
  • hatena button
  • hatena count

日本語全文検索システム「Namazu」の最新版である、2.0.19が公開された。

これは、1年ぶりのリリースになるのかな?

今回のリリースで追加になったのかよく分からないが、UTF-8の文書も処理できるようになったらしい。namazuは数年前に使ったことあるのだが、そのころはまだUTFは処理できなかったような気がする・・・

以下、リリースノートからの抜粋です。

■ 主な変更内容

1.追加/修正
  - LTVERSION="8:1:1" に変更。
  - mknmz にファイルサイズのチェックを追加。
  - 各フィルタを extutf8.pl, extzip.pl 拡張機能モジュールに対応。
  - pltests にテストを追加。

2.バグフィックス
  下記の不具合を修正

  - namazu, namazu.cgi フレーズ検索を含む複雑な検索式の解析部分を
    修正。

■ 拡張機能モジュール

  * 個々のフィルタで行っていた処理を拡張機能モジュールとして統合整理。
  * 2つの拡張機能モジュールを用意しました。

  pl/extutf8.pl: UTF-8 処理拡張モジュール
  - extutf8.pl 対応フィルタから呼び出され、UTF-8 処理を行います。
  - UTF-8 処理に必要なツール、モジュールの判定を次の順で行い、
    利用可能な場合は UTF-8 処理にそれらのツール、モジュールを利用しま
    す。

    1. NKF Perl モジュール 2.04 以上
    2. Perl 5.8 以上
    3. lv コマンド
    4. unicode.pl モジュール

  pl/extzip.pl: zip 処理拡張モジュール
  - extzip.pl 対応フィルタから呼び出され、zip 処理を行います。
  - zip 処理に必要なツール、モジュールの判定を次の順で行い、
    利用可能な場合は zip 処理にそれらのツール、モジュールを利用します。

    1. Compress::Zlib, Archive::Zip, (IO::String)
       IO::String がインストールされている場合は処理が高速化します。
    2. unzip コマンド

また使ってみようかな。。。

改訂 Namazuシステムの構築と活用

こちらの記事もあわせてどうぞ!

関連書籍

Comments:2

opengl2772 2009/03/25 0:54

UTF-8 の文書の処理は、大昔の Namazu から扱えます。
nkf のバージョンに依存するだけ。

Namazu 2.0.19 では、従来個々の文書フィルタで行っていた UTF-8 処理を拡張機能として統合しただけのこと。
従来は個々のフィルタで動作に違いがあったが、共通化、最適化を行うことで安定性と速度(わずかだが)の向上をはかっている。

showBOO 2009/03/25 8:53

なるほど、そうだったんですか(^^ゞ
失礼しました。確かにnkfは昔から対応してましたもんね。
しばらくnamazuを使ってない分、かなり記憶があいまいですんませんm(_)m

Comment Form
Remember personal info

Trackbacks:0

Trackback URL for this entry
http://www.multiburst.net/ElectricBrain/2009/03/fulltext-indexing-system-namazu-2019/trackback
Listed below are links to weblogs that reference
日本語全文検索システム「Namazu」の最新版2.0.19が公開 from ElectricBrain Standard

Home > 自宅サーバ > 日本語全文検索システム「Namazu」の最新版2.0.19が公開

Sponsored Link
今読んでいる本
RSS はてブ人気エントリー
楽天AD
楽ワード
Hatena Bookmark

この日記のはてなブックマーク数

feedburner

あわせて読みたい
Blogpolis
feedmeter

フィードメーター - ElectronicBrain is eating BreakFast

Trackword
Trackfeed

track feed ElectricBrain Standard

Return to page top