grepと置換でKWICを作る†
- KeyWord In Context
- 一部の正規表現を使った検索結果や、原文中にカンマが現れる場合には対応できません
K2Editor編†
- 調べたい文字列をgrep
- ファイル先頭のいらない部分(=====で囲まれたあたり)を削除
- 行頭のいらない部分(G:\…\)を削除
- 区切り(「,」)を入れる(以下の置換では「ファイル先頭から」on、「正規表現」offにしておくこと)
- 「\」を「,」に置換
- 「txt(」を「txt,」に置換(拡張子が邪魔なら「.txt(」を「,」に置換)
- 「):」を「,」に置換
- 1.で調べた文字列を置換 例:「新聞紙」を「,新聞紙,」
- 「名前を付けて保存」で拡張子をcsvとして保存
1行に複数出てきた場合の対処†
- 正規表現onで次の置換
- 検索語:(^.+,)([^,]+)(,新聞紙,)([^,]+)(,新聞紙,[^,]+)\n
- 置換する語:\1\2\3\4\n\1\4\5\6\n
- これをヒットしなくなくなるまで繰り返す(1行に3個以上出てきたときのため)