- バックアップ一覧
- 差分 を表示
- 現在との差分 を表示
- 現在との差分 - Visual を表示
- ソース を表示
- :i/AutoLink改善案 …で別物扱いにしているので… へ行く。
- 1 (2016-07-09 (土) 04:13:26)
AutoLinkの改善案。
bodyはスキャンしてる。
このスキャンを廃すにはbodyにランダムアクセスしないと。
body上にマークしていくことになる。
あとでマークの連続部分をスキャン。→ それは前のアルゴリズム。
bodygramに同じものが重複。これを除く…のは不可。同じN-gramでも単語内のいくつめかで別物扱いにしているので、重複していても取り除けない。wordgramにないgramはbodyから除ける。というか、連続しているのを1つの「絶対にマッチしないgram」に置き換えられる。
wordgramを部分的にロードできるように(DBに入れるとか)したらwordgramへのアクセスをメモ化してデシリアライズが要らないぶん速くなりそう。