FC2ブログ

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

migemoでの半角数字の扱い

migemoは使うと便利ですが、私の環境だけなのか、半角数字を独立して認識してくれません。
「8gatu」は

$ migemo -d /usr/share/migemo/migemo-dict -u /usr/share/migemo/user-dict
8gatu
8(?:gatu|がつ|ガツ)|8gatu

となってしまい、「8月」にマッチしてくれません。

/usr/bin/migemoのsegment関数を以下のように変更すると、

def segment (pattern)
# pattern.scan(/[A-Z]?[^A-Z]+|[A-Z]+/)
pattern.scan(/[A-Z]?[^A-Z0-9]+|[A-Z]+|[0-9]+/)
end

$ migemo -d /usr/share/migemo/migemo-dict -u /usr/share/migemo/user-dict
8gatu
(?:8(?:gatu|がつ|ガツ)|8gatu)|[88八](?:[月歹]|gatu|gatu|がつ|ガツ)

となって、「8月」にマッチするようになりました。自分で試した限りでは自分の思ったように動いています。
ただ他への影響がどう出るかについては未知数です。
スポンサーサイト

コメント

非公開コメント

検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。