一橋2008
ひまわりの検索結果に形態素解析をかけて、ゴミの除去に応用してみる。
かなり無理矢理な方法。
1.ひまわり検索結果をExcelにコピー†
2.Excelの前文脈・キー・語彙素をエディタにコピーして次の処理†
- 置換(前文脈にある前文の残りを削除)
^[^\t]*。
↓
- 置換(後文脈にある後続文の先頭部分を削除)
。[^\t]*?$
↓
。
- 置換(キーの区切りを削除)
\t
↓
3.この結果を茶まめに貼り付けて形態素解析†
4.形態素解析結果をテキストエディタに出力して次の処理†
- 置換(文頭以外の行の改行文字を削除)
\nchamame\tI
↓
5.最初の検索結果(Excel)の空いている列に貼り付け†
その列をオートフィルタ(~を含む)で絞り込み