- 追加された行はこの色です。
- 削除された行はこの色です。
#author("2024-04-25T16:44:06+09:00","default:ogiwiki","ogiwiki")
#author("2024-04-26T14:20:08+09:00","default:ogiwiki","ogiwiki")
[[成蹊2024]]
*応用日本語講座 [#vb1e1a30]
-2023年度後期・金曜2限:''10:40~12:20''
-教室:7号館303 ※4月19日から変更になりました。
-Mail: ogiso@ogiso.net
//-[[コーパス検索アプリケーション''「中納言」''>https://chunagon.ninjal.ac.jp/]]
-[[シラバス>https://portal.seikei.ac.jp/campusweb/slbssbdr.do?value(risyunen)=2024&value(semekikn)=1&value(kougicd)=125236130&value(crclumcd)=50224-0100]]
-[[CoursePower授業ページ>https://lms.seikei.ac.jp/lms/lginLgir/index?target=x4eCxpPC]]
**05/03【休講】(憲法記念日:授業実施日) [#df4a9b8a]
-授業実施日ですが休講とします。
-下記を課題としますので、次の授業回(5月10日)までに行ってください。
--キストエディタの操作方法を復習するとともに,[[リンク先の説明ページ>https://www.ogiso.net/wiki/index.php?%E6%8E%88%E6%A5%AD%E8%B3%87%E6%96%99/%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE]]を確認して、授業時に配布したデータを対象に、正規表現を用いた検索を行うこと。
**04/26 テキストエディタの利用 [#y663f53c]
-[[サクラエディタの使い方(PDF)>https://lms.seikei.ac.jp/lms/lginLgir/index?target=BsnThzyh]]
***テキストデータ(青空文庫の夏目漱石作品)の配布 [#bd04ed6f]
-★[[soseki2.zip>https://www.dropbox.com/s/gw1j25svf2s9tki/soseki2.zip?dl=1]] (今日の授業で使います)
***復習[#j546f1d9]
-検索・置換、grep
--検索で初出行を調べる
--置換で用例数を数える
--grepで用例リストを作る
--タグジャンプで文脈を確認する
***ショートカットキー [#da449f25]
-[[授業資料/覚えておきたいショートカットキー]]
-Mac のキーボードショートカット https://support.apple.com/ja-jp/HT201236
***grepと置換でKWIC(CSVファイル)を作る(簡易版) [#u3ab2d6f]
-CSVファイルとは:テキストファイルで表を表現する
[[用語:CSVファイル>http://e-words.jp/w/CSV.html]]
-KWIC:KeyWord In Context
***正規表現を使ってみる [#u471d57b]
-文字クラス
--例:読[まみむめもん]
---半角ブラケットの中に文字を並べる→並べた文字いずれか1文字
***正規表現とは [#d216d4e0]
-''正規表現'' [[>用語>http://e-words.jp/w/E6ADA3E8A68FE8A1A8E78FBE.html]]
--文字を表すための特殊な文字(メタ文字)を使って文字列のパターンを表現する
--テキストエディタでは置換・検索・grepで利用できる (エディタ以外にもさまざまなアプリケ-ションやコンピュータ言語で利用されている)
--特殊な文字(メタ文字)はすべて半角
//--特殊な文字そのものを表す場合には\でエスケープする(特殊な意味を打ち消す) 例:1\+2
***正規表現のいろいろ [#q514651f]
-[[授業資料/正規表現]]
--文字クラス [ ]
--文字クラスの否定(補集合)[^ ]
--繰り返し ? + *
--グループ化 ()
--or(論理和) |
--文頭 ^、文末 $
***USBメモリの準備について [#v2ebc37c]
**04/19 テキストデータと文字コード [#d34ebd0b]
***文字コード [#g8eacf69]
-[[授業資料/文字コード関連リンク]]
***テキストデータ [#k896318b]
-すべての基本となる文字が並ぶだけのデータ
-[[授業資料/テキストデータとは]]
--バイナリデータとテキストデータ
--テキストデータとテキストファイル
-TXT,CSV,HTM…
--ファイルの種類と拡張子 参考:[[拡張子辞典>http://www.7key.jp/data/ext_new/]]
--[[拡張子(wikipedia)>http://ja.wikipedia.org/wiki/%E6%8B%A1%E5%BC%B5%E5%AD%90]]
-授業で使うテキストデータ
--[[授業資料/テキストデータ紹介]]
***テキストエディタ [#q7ae852c]
-テキストエディタとはどんなものか
--[[授業資料/テキストエディタ]]
***テキストエディタのダウンロードとインストール [#bf5ea59f]
フリーソフトウェア(無償)のサクラエディタを使います。(PC教室のパソコンにはインストール済み)
(以下は自分のPCで使う場合)
-★[[サクラエディタのダウンロード:https://github.com/sakura-editor/sakura/releases/download/v2.4.1/sakura-tag-v2.4.1-build2849-ee8234f-Win32-Release-Installer.zip]]
---(参考) サクラエディタホームページ:https://sakura-editor.github.io/
-インストールの手順
--ダウンロードしたzipファイルの中のsakura_install~.exeをダブルクリック
--以下、画面の指示に従ってインストール
-PCに詳しい人には[[Visual Studio Codeがおすすめ>https://code.visualstudio.com/]]
--授業はサクラエディタで説明します
***テキストエディタを使ってみる [#zc42842b]
-テキストエディタの設定
--行の折り返し
--行番号表示
---スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)
-練習用サンプルデータ(漱石 こころ.txt)
--[[sample.zip>https://www.dropbox.com/s/fi5kg860wvlgwir/sample.zip?dl=1]]
-検索・置換、grep
--検索で初出行を調べる
--置換で用例数を数える
--grepで用例リストを作る
--タグジャンプで文脈を確認する
***ショートカットキー [#da449f25]
-Windowsの主なショートカットキー[[授業資料/覚えておきたいショートカットキー]]
--Macのショートカットキー https://support.apple.com/ja-jp/HT201236
//------
**テキストエディタの利用 [#y663f53c]
-[[サクラエディタの使い方(PDF)>https://lms.seikei.ac.jp/lms/lginLgir/index?target=Q-mCif-I]]
***テキストデータ(青空文庫の夏目漱石作品)の配布 [#bd04ed6f]
-★[[soseki2.zip>https://www.dropbox.com/s/gw1j25svf2s9tki/soseki2.zip?dl=1]] (今日の授業で使います)
***復習[#j546f1d9]
-検索・置換、grep
--検索で初出行を調べる
--置換で用例数を数える
--grepで用例リストを作る
--タグジャンプで文脈を確認する
***ショートカットキー [#da449f25]
-[[授業資料/覚えておきたいショートカットキー]]
-Mac のキーボードショートカット https://support.apple.com/ja-jp/HT201236
***grepと置換でKWIC(CSVファイル)を作る(簡易版) [#u3ab2d6f]
-CSVファイルとは:テキストファイルで表を表現する
[[用語:CSVファイル>http://e-words.jp/w/CSV.html]]
-KWIC:KeyWord In Context
***正規表現を使ってみる [#u471d57b]
-文字クラス
--例:読[まみむめもん]
---半角ブラケットの中に文字を並べる→並べた文字いずれか1文字
***USBメモリの準備について [#v2ebc37c]
**04/12 イントロダクション [#j7eb4b41]
-[[自己紹介]]
--大学共同利用機関法人人間文化研究機構 国立国語研究所 https://www.ninjal.ac.jp/
---[[言語資源開発センター>https://clrd.ninjal.ac.jp/]]
-シラバス確認
--この授業の[[シラバス>https://portal.seikei.ac.jp/campusweb/slbssbdr.do?value(risyunen)=2024&value(semekikn)=1&value(kougicd)=125236130&value(crclumcd)=50224-0100]]
--この授業の目的
--授業の進め方
--評価方法
***授業で利用する主なソフトウェア [#i06478d2]
|ソフトウェアの種類・名前|利用目的|h
|[[テキストエディタ ''サクラエディタ''>http://sourceforge.net/projects/sakura-editor/]] &br;%% or [[''VisualStudio Code ''>https://code.visualstudio.com/]]%%|テキストデータの作成・整備、正規表現を使った検索など|
|[[全文検索ソフト''ひまわり''>http://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9]]|データの検索|
|表計算ソフト''Excel''|ピボットテーブルによる分析・グラフ作成|
|ワープロ''Word''|文書構造を意識したレポート作成|
***授業で利用する主なデータ [#g7f34e64]
-[[青空文庫>https://www.aozora.gr.jp/]]の近代の小説
-国立国語研究所のコーパス
--[[「現代日本語書き言葉均衡コーパス」>https://clrd.ninjal.ac.jp/bccwj/]]
--[[「日本語日常会話」>https://www2.ninjal.ac.jp/conversation/cejc.html]]
--[[「昭和・平成書き言葉コーパス」>https://clrd.ninjal.ac.jp/shc/]]
--[[「日本語歴史コーパス」>https://clrd.ninjal.ac.jp/chj/]]
***デモ [#hb184f26]
--テキストエディタとgrep, 正規表現
--全文検索システム[[ひまわり>https://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9]]
--Excel(ピボットテーブル)
--形態素解析:[[Web茶まめ>https://chamame.ninjal.ac.jp]]
-現代語コーパス
--[[少納言>https://shonagon.ninjal.ac.jp]]