日本語テキスト処理基礎講座2023
をテンプレートにして作成
開始行:
*日本語テキスト処理のためのPC基礎講座2023 [#weccda4c]
**はじめに [#x3584c26]
-時間が足りないので、講習中に完全に理解するのは難しい場合...
-自分で検索して調べ直すためのキーワードは分かるはずなので...
-勤務時間内だけで全部すませたい方は参加しない方がいいと思...
***利用する主なソフトウェア [#i06478d2]
|ソフトウェアの種類・名前|利用目的|h
|[[テキストエディタ ''Visual Studio Code''>https://azure....
|表計算ソフト''Excel''|ピボットテーブルによる分析、文字列...
|ターミナル ''WSL(Ubuntu)''|Linux CUIの基本的なファイル操...
**目次 [#qc83a889]
-録画を見るにはNINJALのMicrosoftアカウントが必要です。
***[[DAY1 7月18日(火)①テキストエディタと正規表現>日本語テ...
-資料:[[日本語テキスト処理基礎講座2023/①テキストエディタ...
-録画:https://ninjal-my.sharepoint.com/:v:/g/personal/to...
***[[DAY2 7月25日(火)②Excelの利用>日本語テキスト処理基礎...
-資料:[[日本語テキスト処理基礎講座2023/②Excelの利用]]
-録画:https://ninjal-my.sharepoint.com/:v:/g/personal/to...
***[[DAY3 8月1日(火)③XMLの基礎>日本語テキスト処理基礎講座...
-資料:[[日本語テキスト処理基礎講座2023/③XMLの基礎]]
-録画:https://ninjal-my.sharepoint.com/:v:/g/personal/to...
***[[DAY4 8月8日(火)④コマンドラインの基礎>日本語テキスト...
-資料:[[日本語テキスト処理基礎講座2023/④コマンドラインの...
-録画:https://ninjal-my.sharepoint.com/:v:/g/personal/to...
🍣🍻
**歴史を振り返る [#h883c88d]
***紙の資料からコーパスまで ~テキストの電子化とアノテー...
+(紙の)本文
+(紙の)総索引(コンコーダンス)
+電子化テキスト:テキストファイル (199x年代~)
--[[授業資料/テキストデータ紹介]]
+構造化テキスト:テキスト+XMLによる構造化タグ (200x年代...
--[[太陽コーパス>https://ccd.ninjal.ac.jp/cmj/taiyou/]]など
+単語情報付きのコーパス:テキスト+XMLによる構造化タグ+形...
--[[現代日本語書き言葉均衡コーパス(BCCWJ)>https://ccd.n...
--[[日本語歴史コーパス(CHJ)>https://ccd.ninjal.ac.jp/ch...
***コーパスのファイル形式とアプリケーション [#v16f2d86]
||ファイル形式|利用アプリケーション|年代|h
|電子テキスト|プレーンテキストファイル,CSVファイル|テキ...
|構造化テキスト|XMLファイル|全文検索システム[[「ひまわり...
|単語情報付きデータ|単語情報を埋め込んだXML/XMLファイル...
終了行:
*日本語テキスト処理のためのPC基礎講座2023 [#weccda4c]
**はじめに [#x3584c26]
-時間が足りないので、講習中に完全に理解するのは難しい場合...
-自分で検索して調べ直すためのキーワードは分かるはずなので...
-勤務時間内だけで全部すませたい方は参加しない方がいいと思...
***利用する主なソフトウェア [#i06478d2]
|ソフトウェアの種類・名前|利用目的|h
|[[テキストエディタ ''Visual Studio Code''>https://azure....
|表計算ソフト''Excel''|ピボットテーブルによる分析、文字列...
|ターミナル ''WSL(Ubuntu)''|Linux CUIの基本的なファイル操...
**目次 [#qc83a889]
-録画を見るにはNINJALのMicrosoftアカウントが必要です。
***[[DAY1 7月18日(火)①テキストエディタと正規表現>日本語テ...
-資料:[[日本語テキスト処理基礎講座2023/①テキストエディタ...
-録画:https://ninjal-my.sharepoint.com/:v:/g/personal/to...
***[[DAY2 7月25日(火)②Excelの利用>日本語テキスト処理基礎...
-資料:[[日本語テキスト処理基礎講座2023/②Excelの利用]]
-録画:https://ninjal-my.sharepoint.com/:v:/g/personal/to...
***[[DAY3 8月1日(火)③XMLの基礎>日本語テキスト処理基礎講座...
-資料:[[日本語テキスト処理基礎講座2023/③XMLの基礎]]
-録画:https://ninjal-my.sharepoint.com/:v:/g/personal/to...
***[[DAY4 8月8日(火)④コマンドラインの基礎>日本語テキスト...
-資料:[[日本語テキスト処理基礎講座2023/④コマンドラインの...
-録画:https://ninjal-my.sharepoint.com/:v:/g/personal/to...
🍣🍻
**歴史を振り返る [#h883c88d]
***紙の資料からコーパスまで ~テキストの電子化とアノテー...
+(紙の)本文
+(紙の)総索引(コンコーダンス)
+電子化テキスト:テキストファイル (199x年代~)
--[[授業資料/テキストデータ紹介]]
+構造化テキスト:テキスト+XMLによる構造化タグ (200x年代...
--[[太陽コーパス>https://ccd.ninjal.ac.jp/cmj/taiyou/]]など
+単語情報付きのコーパス:テキスト+XMLによる構造化タグ+形...
--[[現代日本語書き言葉均衡コーパス(BCCWJ)>https://ccd.n...
--[[日本語歴史コーパス(CHJ)>https://ccd.ninjal.ac.jp/ch...
***コーパスのファイル形式とアプリケーション [#v16f2d86]
||ファイル形式|利用アプリケーション|年代|h
|電子テキスト|プレーンテキストファイル,CSVファイル|テキ...
|構造化テキスト|XMLファイル|全文検索システム[[「ひまわり...
|単語情報付きデータ|単語情報を埋め込んだXML/XMLファイル...
ページ名: