スナガ テツヤ    SUNAGA Tetsuya
   須永 哲矢
   所属
人間文化学部 日本語日本文学科
 
近代文化研究所 所属教員
   職種
教授
言語種別 日本語
発行・発表の年月 2020/12
形態種別 学術雑誌
査読 査読あり
標題 多重の読みを持つ宣命コーパスの構築
執筆形態 共著
掲載誌名 人文科学とコンピュータシンポジウム「じんもんこん2020」論文集
掲載区分国内
出版社・発行元 情報処理学会
著者・共著者 呉寧真・池田幸恵・須永哲矢・小木曽智信
概要 (全体概要)
国立国語研究所『日本語歴史コーパス』に宣命を収録するにあたり、宣命特有の事情に合わせたデータ形式を考案した。一般的なコーパスのしようとしては、一つのテキストに一つの読みを付与するという形式となるが、宣命研究においては、原文の漢字テキストと読み下しの和文の両方が必要であり、さらに読みに関しても、研究目的によって、コーパスの仕様に合わせた読みをする場合、従来の訓読に従った読みをする場合いずれが望ましいかも変わりうる。そのため、原文の漢字テキストと読み下した和文のテキストを用意し,両者を対応付けることで二つのテキストを同時に参照可能とし、同一箇所に複数の形態論情報を付与することで表記と単語情報とが単純に対応しない問題も解決できることを示した。
(担当部分概要)
共同研究につき、本人担当部分抽出不可能。個別の解決方法の具体化以前の、宣命コーパスの基本仕様、全体構成を主に担当。