成蹊2019

レポートテーマの確認(1)

2019/12/13 CHJ中納言の使い方

「中納言」の利用:形態論情報を使った検索

形態論情報を使った検索

品詞体系と見出し語の階層

検索条件式の利用

キー: (品詞 LIKE "形容詞%" AND 活用形 LIKE "連体形%")
 AND 後方共起: 語彙素="言葉" ON 1 WORDS FROM キー
 WITH OPTIONS tglKugiri="|" AND tglBunKugiri="#" AND limitToSelfSentence="1"
AND tglFixVariable="2" AND tglWords="20" AND unit="1" AND encoding="UTF-16LE" AND endOfLine="CRLF"

「中納言」検索結果のダウンロードとExcelでの利用

  1. ダウンロード
  2. Excelでインポート

2019/12/06 検索結果のExcelによる集計(2)

課題(復習)

分類用の列を作って集計する

サンプリング調査

レポートテーマについて(予告)

2019/11/29 検索結果のExcelによる集計

Excelの基本操作(再)

ひまわり検索結果をExcelで扱う

生年代による集計(通時的変化)

  1. Himawariで「すべて選択」後、「すべて選択」「コピー(列名含む)」をする
  2. Excelで生年月日の列が貼り付けられることになる列(NとO)を丸ごと選択し、書式を「文字列」とする
  3. Excelに貼り付ける

2019/11/22 (欅祭で休み) 

2019/11/15 全文検索システム「ひまわり」

正規表現小テスト

「ひまわり」とその使い方

himawari_aozora.png

ひまわり検索結果をExcelで扱う

Excelの基本操作

2019/11/8休講

2019/10/31 やや高度な正規表現(復習)/全文検索システム「ひまわり」の導入

検索文字列の中での後方参照(復習)

振り仮名の修正

全文検索システム「ひまわり」

全文検索システム「ひまわり」について

「青空文庫パッケージ」のインストール

  1. 青空文庫パッケージのダウンロード
    1. ひまわり用「青空文庫」パッケージのダウンロードページから「青空文庫パッケージ」をUSBメモリに直接ダウンロードして保存(サイズが大きいのでPCにダウンロードできない)
  2. USBメモリにコピーしたフォルダ内のhimawari.exeを起動
    1. Himawari画面上にダウンロードしたzipファイルをドラッグ&ドロップ*1
    2. しばらく待つと完了(数分から10分程度はかかる)
  3. 要らなくなったUSBメモリ上の青空文庫パッケージzipファイルは不要なので削除する

2019/10/26(土)の金曜日不足分授業日は休講

2019/10/25 正規表現

テキストエディタ・正規表現(文字クラス)の復習

正規表現のいろいろ

正規表現の応用

タグ付き正規表現

検索文字列の中での後方参照

最長一致の原則(greedy matching)

正規表現に関する参考資料

#amazon(4873114500) #amazon(4873113598)

2019/10/18 (四大戦で休み)

2019/10/11 テキストエディタの利用


ショートカットキー

grepと置換でKWIC(CSVファイル)を作る(簡易版)

正規表現を使ってみる

正規表現とは

2019/10/04 テキストデータとテキストエディタ

テキストデータ

テキストエディタ

2019/09/27

イントロダクション

授業で利用する主なソフトウェア

ソフトウェアの種類・名前利用目的
テキストエディタ サクラエディタ正規表現を使ったテキストの検索・整形
全文検索ソフトひまわりデータの検索
表計算ソフトExcelピボットテーブルによる分析・グラフ作成
ワープロWord「スタイル」を利用したレポート作成

2019/09/20


*1 または、メニューのファイル>インストールをえらび、青空文庫パッケージのzipファイルを指定

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS