CHJBootCamp2018/DAY1

CHJBootCamp2018

CHJ Boot camp DAY 1

関係データベースとSQL(1)

関係データベース(リレーショナルデータベース:RDB)

準備

用語

テーブル
列名1列名2列名3
レコード1
レコード2

SQL

データベース問い合わせ言語

SELECT文

とりあえずこれだけ!覚える

CHJ Boot camp DAY 2

集計

SQLの書式など(SQL Server)

表の結合

関係データベースとSQL(2)

BCCWJデータ

use chunagon_bccwj

関数のいろいろ

組み込み関数

ユーザー定義関数

select top 100 dbo.fn前文脈(サンプルID,出現書字形開始位置,20),キー,dbo.fn後文脈(サンプルID,出現書字形開始位置,20) from 短単位
select top 100 サンプルID,dbo.fn前文脈(サンプルID,出現書字形開始位置,20),キー,dbo.fn後文脈(サンプルID,出現書字形開始位置,20),語彙素,語彙素読み,品詞 from 短単位
where 語彙素 like '鰻'

コーパスデータを使った実習

補足

(復習)表の結合

 select 作品名, count(*) as 総語数
 from 短単位 as S inner join 書誌情報 as B on S.サンプルID=B.サンプルID
 where S.サブコーパス名 like '平安'
 group by 作品名

CASE式

 select 作品名, count(*) as 総語数,sum(CASE WHEN 本文種別='歌' THEN 1 ELSE 0 END) as 歌語数
 from 短単位 as S inner join 書誌情報 as B on S.サンプルID=B.サンプルID
 where S.サブコーパス名 like '平安'
 group by 作品名

辞書の階層化された見出し表を扱う

use unidicSQL

コーパスと辞書を繋ぐ

select L.語彙素,SUW.レジスター,count(SUW.キー) from 短単位語彙素 as L inner join chunagon_bccwj.dbo.短単位 as SUW on L.語彙素ID=SUW.語彙素ID
where L.語彙素 like '夏%' and L.語彙素読み like 'ナツ%'
group by L.語彙素, SUW.レジスター

表の結合(復習)

連続する語の取り出し

サブクエリ

括弧でくくったSELECT文に名前を付けて、あたかもテーブルであるかのように扱える

一時テーブルの作成

#で始まるテーブル名は、DB切断後削除される一時テーブルとなる。現在の権限でも一時テーブルは作成できる。

select * into 鰻テーブル from 短単位 where 語彙素='鰻'
create table #ogiso_tmp ( ID int ,調査語彙素 varchar(10) ,調査語彙素読み varchar(10) )

受講者アンケート


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS