未知語処理の定義

概要

未知語処理(辞書に載っていない単語の形態素解析の処理)についてユーザが再定義できます。

設定ファイル

配布辞書のディレクトリにある char.def と unk.def という2つのファイル を変更します.

char.def

未知語処理のルールです. こちらを御覧ください.

unk.def

未知語に対する品詞列のテーブルです. こちらを 御覧ください.

ケーススタディ

数字の連続を1つの形態素とする

ASCII 文字列は、スペース/タブのみで分割する (kakasiと同一動作)