「中古和文 【UniDic】」における言語単位の設計小椋秀樹 須永哲...
...においては,現代語用の形態素解析用辞書 【UniDic】 が開発され[5],BCCWJ に対して...
小木曽,小椋,近藤は,現代語用の 【UniDic】 を基に近代の文語論説文を対象とした「近...
本稿では,「中古和文 【UniDic】」の言語単位の設計等について述べるととも...
2. 「中古和文【UniDic】」の概要2.1 開発の経緯筆者らは,現代...
「近代文語 【UniDic】」は近代文語論説文という漢文訓読調の,漢...
2.2 作成方法「中古和文 【UniDic】」を作成するためには,現代語用の Uni...
しかし,「中古和文 【UniDic】」 の基になる 2 種のUniDic に...
そこで,「近代文語 【UniDic】」で解析した中古の仮名文学作品のテキスト...
「中古和文 【UniDic】」の開発に当たり,整備した学習用コーパス...
表1:「中古和文【UniDic】」の学習用コーパス2.3 解析精度最新版...
...約 97%という解析精度は,現代語用の 【UniDic】 で 現代語のテキストを解析した場合の約...
しかし現代語用の 【UniDic】 に比べて学習用コーパスのジャンル 作 ...
表2:各種【UniDic】による中古和文の解析精度3. 「中古和文...
「中古和文 【UniDic】」では,言語単位に現代語用のUniDic...
3.2 短単位認定規定の概要「中古和文 【UniDic】」で採用した短単位の認定規定について,そ...
...・地名などについても規定を設けて中古和文【UniDic】0.5近代文語UniDic1.1(現代語...
...への適用3 節で述べたように「中古和文 【UniDic】」では短単位を採用した。これにより,我々...
...る基本的な考え方は同じであり,現代語用の【UniDic】,「近代文語 UniDic」と「中古和文...
4.2 UniDicの階層構造の活用【UniDic】 では,表記や語形の違いにかかわらず,同...
我々は,この 【UniDic】 の階層構造を活用して,中古語と現代語・...
「中古和文 【UniDic】」の学習用コーパスに出現した語のうち,現...
表3:【UniDic】への中古語の登録(1)中古語には,現代語...
...字形の層に追加した。(以上表 4)表4:【UniDic】への中古語の登録(2)以上のように,現代...
現代語用の 【UniDic】 では,連体詞「この」「その」を 1 短...
このような例を踏まえ,「中古和文 【UniDic】」では,「こ」「そ」を代名詞と認め,「の...
...て用いられている。そのため,「中古和文 【UniDic】」では「同じ」を形容詞とした。これと同様...
...おける基本的な考え方である。「中古和文 【UniDic】」では,その考え方に基づいて,「行く」「...
なお,【UniDic】 では,補助用言としての用法を持つ動詞に...
...みが定めにくい語については,現代語用の 【UniDic】 では,(1)現代における漢字使用の目安...
このような例については,「中古和文 【UniDic】」でも,現代語と同様に基準を立て,その基...
...,語の読みの問題についても,「中古和文 【UniDic】」では現代語用の UniDic 等と同様...
.... 終わりに以上,本稿では,「中古和文 【UniDic】」における言
...短単位認定規定の一部である。「中古和文 【UniDic】」の学習用コーパス整備に当たって,現代語...
【UniDic】 では,名詞と形状詞の両用法を持つ語には...
...。今後,同種の他の例も含めて現代語用の 【UniDic】 等との互換性を保持した処理案を検討する...
...学習用コーパスの整備を進め,「中古和文 【UniDic】」の解析精度の向上を図っていきたい。
...文を対象とした形態素解析辞書・近代文語 【UniDic】」『日本語学会 2008年度春季大会予稿...
関連URL【UniDic】:http:download.uni...