スナガ テツヤ
SUNAGA Tetsuya
須永 哲矢 所属
人間文化学部 日本語日本文学科
近代文化研究所 所属教員
職種
教授
|
|
言語種別 | 日本語 |
発行・発表の年月 | 2012/10 |
形態種別 | その他 |
標題 | 近代語文献を電子化するための異体字処理 |
執筆形態 | 単著 |
掲載誌名 | 近代語コーパス設計のための文献言語研究 成果報告書』 国立国語研究所共同研究報告12‐03 |
掲載区分 | 国内 |
巻・号・頁 | 65-82頁 |
概要 | 「近代語コーパス」構築にあたり、印刷媒体の原資料の異体字を電子的にどのように表現すべきかを考察した。『明六雑誌』全43巻、約18万語の中から、そのままでは電子的に表現することが不可能な異体字が延べ2100字あることを明らかにし、それらの処理方針を検討した。処理方針は大きく①JIS漢字包摂規準の拡張②別字代用の2つで、①、包摂規準を28種追加することにより1774字、さらに②の別字代用により295字が処理できることを示し、ここで作成した追加包摂規準の、『明六雑誌』以外の適用可能性も示した。 |