目次 Edit


関連 Edit

検索:検索

検索周辺のタグ Edit

Array

検索 Edit


  1. オブジェクト生成
    検索/クエリー
  2. 評価
    検索/フィルタリング
    検索/スコアリング
  3. ページ
    検索/ソート
    検索/フォーマット

※いずれも検索/クエリーで作ったオブジェクトの機能で。

思い付き Edit

使い方 Edit

閲覧と作成と検索の操作を統合。

  1. 入力欄に(見たい|書きたい)ページ名入力。Enter。
  2. ページがあれば示。(見ることができる)
  3. ページがなければ「もしかして・・・」と新規作成リンク(または新規作成フォーム)を示。(検索と書くことが両方できるし、書くときの参考資料も分かる)
    新規作成フォームでは1行目がページ名

「まとめておきました」 Edit

検索機能でWikiページをまとめると、その検索/クエリーは新しいページの名前のようなものになる。
このページを誰かの利用者ページや他サイト(ブログ、他のWiki)から参照できるようにすれば個人的な(読むだけ)Wikiを作ることができる。

  • 「このWikiの再編後に残すページをまとめておいたので、意見があれば自分の利用者ページに「再編について」という見出しで書き込みしてください」
  • 「Wikiに残っている履歴からこのアイテムの1月〜6月の相場価格を抜き出したところ、4月あたりから乱高下しているのが分かりました」
    …などのように活用したい。

「同時に更新したページ Edit

条件を与えると一覧示。(同じページにあるフォームで)
※URLクエリーに条件があればすぐに一覧示。

new_pa1.png

条件はページ名(ということはディレクトリ名も)、章名、日時の範囲、関連付ける期間

編集の衝突検索できる。

スコア加算条件を複数に Edit

「ホットな記事、クールな記事」の「ホット」は検索スコアに加味する要素のこと。
だから他の評価方法(これも加味する要素のこと)と併用できるように。

似ているページ報告 Edit

利用者ページ間のつながりを変える。
→これはページ内のリンクタグを付けることで行う。
関連項目」とでも書いておけばいい。

類似した情報を見つけることで利用者間のスケジュール調整とかアポイントメントに。

実装 Edit

AND、ORを使わない Edit

検索検索クエリーをページ構造と同じ構造のオブジェクトに変換、類似度判定で実現。
そのため、ANDやORは使えない。代わりに必須かオプションかを検索キーワード毎に指定。

語1 語2 語3?

…で、語1と語2を含むページを指定、語3まで含むものを上位に示。

語1 AND 語2 OR 語3

…などは現できないので、代わりに

語1 語2
語3

…に分けることになる。

必須(何もつけない)か、語頭か語尾に「!」
オプション語頭か語尾に「?」
不要語頭か語尾に「-」

インデックスを作るなら別プロセスで Edit

インデックスを作成・更新するなら別プロセスか、本体プロセスの余り時間に。
ページを更新するたびに必要、かつページの更新処理には不要なので。

インデックス再作成を要する操作→インデックス再作成完了までの間、更新されたページ(インデックスに入っていないドキュメント)はインデックスなしの全文検索対象にする。

ヒットする対象は1オブジェクトだけ Edit

複数のオブジェクトにヒットしたら最も高いスコアになるものだけに。
継承ツリーとは無関係に。

100キロ
  1. 数字
  2. 重さ
  3. 距離
  4. データ量

…などのいずれとしても解釈できるし、上下関係は無い。
Element系クラスは継承関係で現できない。

たくさん合えばスコア増 Edit

RegExpグループに合った数だけスコアを増やす。

/([0-9]+)(キロ)?/

…なら0〜2コのグループに合う。
→スコアを0〜2倍に。

こうして単位(キロ)を含めて合った場合に高スコアにできる。

検索履歴 Edit

検索フォーム
利用者×ページ×検索ワード
を保存。
「自分が…というページを読んでいるとき検索したくなったこと」が…というページ検索フォームにリストアップされるように。

保存する領域は利用者
利用者ページに記録する。
ということで、利用者自身が編集できる。(追加も削除も)

検索フレームワーク機能 Edit

プラグインから呼び出すように。

用語集を使って関連語検索 Edit

検索時、用語集(というページ)にある用語が見つかれば同義語・関連語検索
または同義語・関連語検索するためのリンクを併せて示。

検索/クエリーがリンクに適合した場合、リンクリンクのまま示。というだけ。

個人用の用語集も作れて、それを検索でも利用できれば理想的。
利用者の下位にページを作って。

これで、公式のページ名以外のキーワードでページを指定できる。
検索機能活用法が多彩になれば思いがけない使い方ができそう。

入力されたキーワードを関連付ける Edit

主観検索のために。

検索キーワードのOR結合を同義、AND結合を上下関係のある言葉として検索時に使用。
検索処理内で使うか、検索結果に関連語として示するか。

OR結合の結果は切る Edit

検索でOR結合がある場合、結果1件ごとに合った検索ワードを併記。

検索キーワードをリンク Edit

再利用しやすくなる。

検索ページ Edit

検索/クエリーを検索プラグイン呼び出しに書き入れると出力が(参照時の)検索結果になる。
例えばタグ[Wiki]のページを作ると、タグ[Wiki]を含むページの一覧になる。

検索は集約 Edit

検索ページを集約する機能でもある。
検索/クエリーに適合したページを1つのページにまとめる。
検索結果を検索すれば集約をさらに集約することになる。

検索結果をRSS化 Edit

検索/フィルタリングで実現。

ページのリソースを取得するプラグインと、RSSを解析するプラグインでRSSをページ化。
他サイトのリソースを取得するプラグインはあっても良いがRSS取得のためなら要らない。

1ページ、1ソート順 Edit

ソート順が違うなら別のページに。
そうしないと自動処理しづらい。

検索/クエリーのリスト1つあたり1ページに。

フィルタリング、変換 Edit

  1. 検索フォームからの入力
    フィルタリング、変換→検索クエリー
  2. ページ
    フィルタリング、変換→検索ページ
  3. 検索クエリーと適合した検索ページのみ検索結果に追加する
  4. 検索結果をソートする

…を検索/クエリーの数だけ繰り返す。
フィルタリングルール、またはソートルールだけの検索/クエリーも可能。

UIでフィルタリング、変換のルールを指定したりしない。面倒になる。
プラグインを作ることで利用可能に。

日記を特定のキーワードで検索して「その1日前に何をしていたか」を一覧したい Edit

検索結果1件ごとに「1日前」というリンクを辿って、その1件をリンク先と置き換える。
検索結果からそれぞれの1日前ページ一覧を作れる。
…というのをフィルタリングルールで。

  1. フィルタリング1回目
    ページからキーワードを含むページのみを得て、それを結果へ。
  2. フィルタリング2
    結果から「1日前」というリンクを得て、それを展開して、結果へ。
    展開は リンクリンク先のページ をするプラグインを使って。
  3. フィルタリング3
    結果の見出しのみを得て、それを結果へ。

検索キーワードではAndAlso検索をするように指定。検索:AndAlso

検索結果に要約と「編集リンク Edit

  • ページ内容の内、該当部分も示させたい。(ページ単位よりも小さい単位で)
    段落単位か行単位で。(文字/文節単位だと意味が分からない)
    ツリー形式の出力なら段落単位、形式の出力なら行単位で。
ページの一覧
	ページ1
		章1 [[編集:ページ1/章1]]
		該当部分(段落単位)
		--------
		章4 [[編集:ページ1/章4]]
		該当部分(段落単位)
	ページ3
		…

出力はHTML Edit

  • ページの一部分
    ページに埋め込んで示できる形式。
  • 章ではない
    章としての機能を持たないため。

2次元検索 Edit

1つのページバージョン検索
新→旧の順に優先して示。

ある言葉がいつ(加えられた|消された)かが分かる。

日時を指定して、その時点での前ページを探すのもいい。

これも全バージョンの一覧というページ内を検索することで実現。

ページを探す、文字列を探す Edit

  • ページから条件に合うページを探す。
  • 1ページ内の全テキストから条件に合う部分を探す。
    行単位で。

→統一
これをページ内のテキストを探す方だけに統一できる。
「全ページの一覧ページ」を検索、このページには全ページが章として埋め込まれている。
で、章を含めて検索
章を含めた検索編集時のテキストを検索するのと同じ。章を展開して1つのWikiTextの形式にして処理。
章の展開を適切にすれば負荷を低減できる。

設計 Edit

アルゴリズム Edit

  • 並べ替えをする
    →複数の要素が必要

要素とは?
→Element
newとoutができるもの。


  • 変換もする。
    URL→ページ内容に。
    その中の~月~日だけを(1つ)返す。

解釈 Edit

数値なら近い数にも高スコアを。

#000000、#000なら各桁ごとに近い数かどうか判断。

#309と#209は最も近い数ということになる。

  • 20061231と20070101も近い。
  • 月と日も近く、水と火も近い。
    文字列ならページで辞書を定義。それで間に合う。
 

…これをページ/名前リンクで定義できれば尚可。

  • 特殊な数値もページで定義できる。
    →マッピング。
    1次元の値に写像すればいい。
    x1〜x2→y5〜y6
  • クエリー作成に時間がかかりそうなので、クエリー作成と検索を分けてもいい。
    操作不要、自動で続けるようにして。クエリー作成でマッピング後の現にして。

懸案 Edit

処理とデータの Edit

  • 検索処理から検索結果を得るとき
  • データの単位と処理繰り返しの単位