罪と罰++二律背反


FrontPage

全文検索namazuの設定

使用プラットホーム:Vine Linux 2.5

*基本的な使い方 [#xa6cfa8d]

デフォでインストールされており、マニュアルのインデックスが作成されているので使用可能な模様。/home/cgi-bin/namazu.cgiで検索できる

とりあえず、homeにtestディレクトリを作り、インデックスを作成してみる
 mknmz (対象のディレクトリ) 
 mknmz /home/httpd/html

で、NMZ.* というインデクスファイルが作成される

インデクスから検索
 namazu "キーワード" .(インデクスパス)
インデクスを指定しない場合は、以下の基本インデクスとなる
 /usr/local/var/namazu/index

 namazu "キーワード" +(dirA) +(dirB) 
 +(dirA)で基本ディレクトリ+dirAとなる

*mknmzの設定ファイル [#r6df598d]

 /usr/local/etc/mknmz/mknmzrc
およびホームディレクトリのmknmzrc
両方にファイルがある場合は両方読み込まれる

読み込まれるファイルの内容 mknmz -C で確認
設定は以下の書式で書かれている
 定義=設定値
 # ←コメント
 $HTML_SUFFIX = "html?|[ps]html\\.[a-z]{2}";
 htm, html, phtml, shtml, .html.jaなど(.htmlの後にアルファベット2文字)

 $ADDRESS:管理者のメールアドレス
 $ON_MEMORY_MAX:最大使用メモリ
 $DIRECTORY_INDEX:省略するファイル名

 $HTML_SUFFIX:HTMLファイル
 $ALLOW_FILE:対象ファイル
 $DENY_FILE:対象外ファイル
 $EXCLUDE_PATH:対象外ディレクトリ
 $FILE_SIZE_MAX:対象ファイルの最大サイズ
 $TEXT_SIZE_MAX:対象テキストファイルの最大サイズ

 $NKF:nkfのパスとオプション
 $KAKASI:KAKASIの起動方法
 $CHASEN:CHASENの起動方法
 $WAKATI:わかち書き使用ツール

 $LIBDIR:Perlライブラリのディレクトリ
 $FILTERDIR:フィルタのディレクトリ
 $TEMPLATEDIR:テンプレートのディレクトリ

設定値は[[正規表現]]で指定

*namazu設定ファイル [#j47060e4]
-テンプレートファイルはmknmzを実行すると書き換えられるので注意

カスタマイズしたら別に保存しておく
-NMZ.head.jaのidxnameでインデクスを切り替えられる

詳細は、ファイル参照のこと


 Index:基本インデクス
 Template:テンプレートファイルのディレクトリ
 Replace:URI置き換え
 Logging:検索キーワードのログ on(有効)/off(無効)
 Lang:使用する言語、文字コード
 EmphasisTags:検索キーワードの表示用タグ

*その他のファイル [#t1d78bf8]
Word: wvWare と lv
http://www.wvware.com/

lv: waWareがutf-8を吐くのでShift-JISにコンバート
http://www.ff.iij4u.or.jp/~nrt/freeware/lv4494.tar.gz
※解凍先のbuildフォルダでコンパイル

Excel: xlHtml と lv
http://www.xlhtml.org/

PDF:xpdf付属のpdftotext
http://www.foolabs.com/xpdf/

*cgi [#sef28602]
 namazu.cgiと同じディレクトリに/etc/namazu/namazurcをコピー
 cp /etc/namazu/namazurc /home/httpd/cgi-bin/.namazurc



参考書籍(というか、このページって、まんまだなぁ):
全文検索・データベースWEBの作り方

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS