SELECT 語彙素,語彙素読み FROM 短単位 WHERE 品詞='接続詞' GROUP BY 語彙素,語彙素読み
SELECT 語彙素,語彙素読み FROM 短単位 WHERE 品詞='接続詞' GROUP BY 語彙素,語彙素読み ORDR BY 語彙素読み,語彙素
SELECT 語彙素,語彙素読み,count(語彙素) FROM 短単位 WHERE 品詞='接続詞' GROUP BY 語彙素,語彙素読み
SELECT 語彙素,語彙素読み,count(語彙素) FROM 短単位 WHERE 品詞='接続詞' GROUP BY 語彙素,語彙素読み ORDER BY 語彙素読み
SELECT 語彙素,語彙素読み,count(語彙素) FROM 短単位 WHERE 品詞='接続詞' GROUP BY 語彙素,語彙素読み ORDER BY count(語彙素) DESC
select top 100 * from 短単位 as S inner join 書誌情報 as B on S.サンプルID=B.サンプルID
select top 100 * from 短単位 as S left join 長単位 as L on S.サンプルID=L.サンプルID and S._文字開始位置=L._文字開始位置
select 作品名, count(*) as 総語数 from 短単位 as S inner join 書誌情報 as B on S.サンプルID=B.サンプルID where S.サブコーパス名 like '平安' group by 作品名
select top 100 dbo.fn前文脈(サンプルID,出現書字形開始位置,20),キー,dbo.fn後文脈(サンプルID,出現書字形開始位置,20) from 短単位
select top 100 サンプルID,dbo.fn前文脈(サンプルID,出現書字形開始位置,20),キー,dbo.fn後文脈(サンプルID,出現書字形開始位置,20),語彙素,語彙素読み,品詞 from 短単位 where 語彙素 like '鰻'
use chunagon_bccwj
select 作品名, count(*) as 総語数,sum(CASE WHEN 本文種別='歌' THEN 1 ELSE 0 END) as 歌語数 from 短単位 as S inner join 書誌情報 as B on S.サンプルID=B.サンプルID where S.サブコーパス名 like '平安' group by 作品名
select top 100 s1.語彙素,s1.語彙素読み,s1.品詞,dbo.fn前文脈(s1.サンプルID,s1.出現書字形開始位置,20),s1.キー,dbo.fn後文脈(s1.サンプルID,s1.出現書字形開始位置,20) from 短単位 as s1 inner join 短単位 as s2 on s1.サンプルID=s2.サンプルID and s1.連番 + 10 = s2.連番 where s2.語彙素 like '鰻'
select top 100 s1.キー+s2.キー+s3.キー+s4.キー+s5.キー+s6.キー, s1.語彙素+'/'+s2.語彙素+'/'+s3.語彙素+'/'+s4.語彙素+'/'+s5.語彙素+'/'+s6.語彙素 from 短単位 as s1 inner join 短単位 as s2 on s1.サンプルID=s2.サンプルID and s1.連番 + 10 = s2.連番 inner join 短単位 as s3 on s2.サンプルID=s3.サンプルID and s2.連番 + 10 = s3.連番 inner join 短単位 as s4 on s3.サンプルID=s4.サンプルID and s3.連番 + 10 = s4.連番 inner join 短単位 as s5 on s4.サンプルID=s5.サンプルID and s4.連番 + 10 = s5.連番 inner join 短単位 as s6 on s5.サンプルID=s6.サンプルID and s5.連番 + 10 = s6.連番 where s1.サブコーパス名='平安' order by s1.サンプルID, s1.連番
select 作品名--,S.本文種別 ,sum(case when S.文境界 = 'B' then 1 else 0 end) as 文数 ,sum(case when 文節='B' then 1 else 0 end) as 文節数 ,count(L.語彙素) as 長単位数 ,count(S.語彙素) as 短単位数 from 短単位 as S inner join 書誌情報 as B on S.サンプルID = B.サンプルID left join 長単位 as L on S.サンプルID = L.サンプルID and S._文字開始位置 = L._文字開始位置 where B.サブコーパス名 like '平安' group by B.作品名--,S.本文種別
括弧でくくったSELECT文に名前を付けて、あたかもテーブルであるかのように扱える
select x.サブコーパス名, count(*) from (select サブコーパス名, count(*) as 語数 from 短単位 where 品詞 not like '記号%' group by 語彙素ID,サブコーパス名) as x group by x.サブコーパス名
select x.サブコーパス名, count(*) as 異なり語数, sum(語数) as 延べ語数, CONVERT(float,count(*))/sum(語数) as TTR from (select サブコーパス名, count(*) as 語数 from 短単位 where 品詞 not like '記号%' group by 語彙素ID,サブコーパス名) as x group by x.サブコーパス名
use unidicSQL
select * from 短単位語彙素 where 語彙素 like '夏%' and 語彙素読み like 'ナツ%'
SELECT 語形,入力活用型 from 短単位語形 as F inner join 短単位語彙素 as L on L.語彙素ID=F.語彙素ID where 語彙素 like '見る' and 語彙素読み like 'ミル'
SELECT 語形,書字形 from 短単位書字形 as O inner join 短単位語形 as F on F.語形ID=O.語形ID inner join 短単位語彙素 as L on L.語彙素ID=F.語彙素ID where 語彙素 like '見る' and 語彙素読み like 'ミル'
use chunagon_bccwj select L.語彙素,SUW.レジスター,count(SUW.キー) from 短単位語彙素 as L inner join chunagon_bccwj.dbo.短単位 as SUW on L.語彙素ID=SUW.語彙素ID where L.語彙素 like '夏%' and L.語彙素読み like 'ナツ%' group by L.語彙素, SUW.レジスター
use chunagon_bccwj select L.語彙素,SUW.レジスター,count(SUW.キー) from 短単位語彙素 as L left join chunagon_bccwj.dbo.短単位 as SUW on L.語彙素ID=SUW.語彙素ID where L.語彙素 like '夏%' and L.語彙素読み like 'ナツ%' group by L.語彙素, SUW.レジスター
select * into 鰻テーブル from 短単位 where 語彙素='鰻'
select * into #鰻テーブル from 短単位 where 語彙素='鰻' select * from #鰻テーブル
drop table #鰻テーブル
drop table #短単位文番号 --文頭(文境界=B)の表(仮テーブル#文番号tmp)を連番入りで作る select ROW_NUMBER() over(order by サンプルID,連番) as 文番号,* into #文番号tmp from 短単位 where サブコーパス名='奈良' and 文境界='B' --上のテーブルを一つずらして結合して、文の開始連番と次の文の開始連番の入った表(#短単位文番号)を作る select a.サンプルID,a.文番号,a.連番 as 文開始連番,b.連番 as 次文開始連番 into #短単位文番号 from #文番号tmp as a inner join #文番号tmp as b on a.文番号+1=b.文番号 order by a.サンプルID,a.連番 --最初の仮テーブルを消す drop table #文番号tmp --#短単位文番号テーブルに最後の一文の情報を追加(次文開始連番は最後の語の連番) insert into #短単位文番号 (サンプルID,文番号,文開始連番,次文開始連番) values ('10-万葉0759_00020',4809,45380,45520) --短単位テーブルを#短単位文番号テーブルと結合 select 文番号,s.* from 短単位 as s inner join #短単位文番号 as x on s.サンプルID =x.サンプルID and s.連番>=x.文開始連番 and s.連番<x.次文開始連番 order by s.サンプルID,s.連番