総研大2025
言語資源学演習1†
- 月曜4限
- 10月27日からはオンライン(Zoom)で実施
11月17日 XMLファイルの整備†
言語処理100本ノック 2025†
11月10日 OCR済みテキストの処理(コマンドラインの基礎)†
データ処理環境の確認†
- VisualStudio Code
- WSL (Ubuntu)
OCR済みテキストの整備†
10月27日 資料選定とOCR†
資料選定†
OCR†
- お手軽
- AdobeAcrobat のOCR機能
- Google Drive のOCR機能
- 市販OCRソフト
- 国立国会図書館 NDLOCR
- 最近話題のLLM系
10月20日 ガイダンス†
- 整備した資料をOpenCHJの一部として公開することを検討
データ処理環境の整備†
- VisualStudio Code
- WSL (Ubuntu)