スナガ テツヤ    SUNAGA Tetsuya
   須永 哲矢
   所属
人間文化学部 日本語日本文学科
 
近代文化研究所 所属教員
   職種
教授
言語種別 日本語
発行・発表の年月 2013/11
形態種別 大学・研究所等紀要
査読 査読あり
標題 『日本語歴史コーパス』のための書籍活字の電子化-小学館新全集『今昔物語集』を事例として-
執筆形態 共著
掲載誌名 国立国語研究所論集
出版社・発行元 国立国語研究所
巻・号・頁 (6),163-181頁
概要 (全体概要)印刷された紙媒体の書籍を電子データ化する場合には、符号化文字集合にない活字をどのように処理するかが問題となる。国立国語研究所において構想されている『日本語歴史コーパス』での文字処理指針を画定するため、電子化しにくい特殊活字が多く含まれる小学館新編全集版『今昔物語集』を事例として、特殊活字の別字代用の在り方を検討し、代用字確定の方針を提案、代用による効果も検証した。
(担当部分概要)共同研究につき本人担当部分抽出不可能。主に活字字形の日本語学的検討・処理方針案作成:須永担当、データ処理・機械による統計処理:堤担当。
共著者:須永哲矢・堤智昭