[[一橋2008]] ひまわりの検索結果に形態素解析をかけて、ゴミの除去に応用してみる。 かなり無理矢理な方法。 ***1.ひまわり検索結果をExcelにコピー [#f124b1ac] ***2.Excelの前文脈・キー・語彙素をエディタにコピーして次の処理 [#le568da4] ***2.Excelの前文脈・キー・語彙素をテキストエディタにコピーして次の処理 [#le568da4] -(1) 置換(前文脈にある前文の残りを削除) ^[^\t]*。 ↓ -(2) 置換(後文脈にある後続文の先頭部分を削除) 。[^\t]*?$ ↓ 。 -(3) 置換(キーの区切りを削除) \t ↓ ***3.この結果を茶まめに貼り付けて形態素解析 [#r92dbf77] ***4.形態素解析結果をテキストエディタに出力して次の処理 [#jf4b2f35] -(1) 置換(文頭以外の行の改行文字を削除) \nchamame\tI ↓ -(2) 置換(後で見やすいようにタブを,に置換) \t ↓ , ***5.最初の検索結果(Excel)の空いている列に貼り付け [#r32d79f0] -その列をオートフィルタ(~を含む)で絞り込み --(ほしい語が入っているかどうか、,区切りの形態素解析結果を条件に指定する)