-- 全文検索 |
|
調べたい単語を一つ指定するだけのもっとも基本的な検索手法です。
例:
namazu
ある単語とある単語の両方を含む文書を検索します。検索結果を絞
り込むのに有効です。3つ以上の単語を指定することも可能です。
単語と単語の間に and を挿みます。例:
Linux and Netscape
and は省略できます。単語を空白で区切って羅列す
るとそれらの語すべてを含む文書をAND検索します。
ある単語とある単語のどちらかを含む文書を検索します。3つ以上
の単語を指定することも可能です。単語と単語の間に
or を挿みます。例:
Linux or FreeBSD
ある単語を含み、ある単語を含まない文書を検索します。3つ以上
の単語を指定することも可能です。単語と単語の間に
not を挿みます。例:
Linux not UNIX
AND検索、OR検索、NOT検索を括弧でグループ化できます。括弧の両
隣には空白を入れる必要があります。例:
( Linux or FreeBSD ) and Netscape not Windows
2語以上からなる複合語を検索します。 "..." と2重引用符で、あるいは {...} と中括弧で囲みます。Namazuのフ
レイズ検索は精度が 100 % ではないため、ときどき誤ることがあ
ります。例:
{GNU Emacs}
部分一致検索には前方一致、中間一致、後方一致の 3種類があります。
- 前方一致検索
inter*
(inter から始まる単語を含む文書を検索)
- 中間一致検索
*text*
(text を内包する単語を含む文書を検索)
- 後方一致検索
*net
(net で終わる単語を含む文書を検索)
検索するキーワードを正規表現で指定します。正規表現は
/.../ のようにスラッシュ記号で囲みます。正規表
現のエンジンにはRubyのコードを利用
しています。正規表現の書式はPerlとほぼ同じです。 例:
/インター?フェ[イー]ス/
Subject: , From: ,
Message-Id: といったフィールドを指定して検
索する手法です。特にMail/News のファイルを扱う際に効果を発揮
します。例:
- いずれの検索方法でもアルファベットの大文字・小文字の区別
はしません。
- 日本語の複合語は形態素単位に分割し、それらを フレイズ検索します。分割は不適切に
行なわれることがあります。
- JIS X 0208 (いわゆる全角文字) の英数字と記号の一部
(ASCIIと重複しているもの) は ASCII (いわゆる半角文字) として
処理されます。
- 記号を含む語の検索ができます。例:
TCP/IP 。
ただし、記号の処理は完全ではないので TCP and IP
のように分割してAND検索をかけた方が取りこ
ぼしがありません (その代わり余計なファイルまでヒットしてしま
う可能性があります)。
- 中間一致・後方一致、正規表現、フィールド指定の検索には少
し時間がかかります。
and , or , not を単語として検索したいときはそれ
ぞれ、 "..." と2重引用符で、
あるいは {...} と中括弧で囲みます。
この全文検索システムは
Namazu v2.0.16
によって構築されています。
|