スナガ テツヤ
SUNAGA Tetsuya
須永 哲矢 所属
人間文化学部 日本語日本文学科
近代文化研究所 所属教員
職種
教授
|
|
言語種別 | 日本語 |
発行・発表の年月 | 2013/11 |
形態種別 | 大学・研究所等紀要 |
査読 | 査読あり |
標題 | 『日本語歴史コーパス』のための書籍活字の電子化-小学館新全集『今昔物語集』を事例として- |
執筆形態 | 共著 |
掲載誌名 | 国立国語研究所論集 |
出版社・発行元 | 国立国語研究所 |
巻・号・頁 | (6),163-181頁 |
概要 | (全体概要)印刷された紙媒体の書籍を電子データ化する場合には、符号化文字集合にない活字をどのように処理するかが問題となる。国立国語研究所において構想されている『日本語歴史コーパス』での文字処理指針を画定するため、電子化しにくい特殊活字が多く含まれる小学館新編全集版『今昔物語集』を事例として、特殊活字の別字代用の在り方を検討し、代用字確定の方針を提案、代用による効果も検証した。
(担当部分概要)共同研究につき本人担当部分抽出不可能。主に活字字形の日本語学的検討・処理方針案作成:須永担当、データ処理・機械による統計処理:堤担当。 共著者:須永哲矢・堤智昭 |