大退散 もしかして 太田胃散

Google は賢い。
「大退散」と入れたらちゃんと "もしかして 太田胃散のつもり?" って聞いてくれる。
こんなのまで出るんだなぁと思った時、ふと適当に似たようなことする方法が思い浮かんだので書いておく。
未検証なので本当にできるかどうかは知らない。


まず、"もしかして?" に出すほうのリストをなんらかの方法で作る。
Google だったら実際に検索に使われたことのある単語のリストが使えるけど、
そうじゃなかったらそれなりに苦労してリストを作らなきゃいけないかも。
形態素解析→隣り合って出現するペアが本当は一語じゃないかどうか検証→辞書にフィードバック→形態素解析に戻る、のループとかで作れるのかなぁ?
どちらにしても手作業じゃ不毛そうなのは間違いない。
それで、出来上がったリストの各項目のカナ表現を MS-IME に食わせて候補の一覧を得る。
その中で、元の語と一致しないものを「間違って打ち込まれる可能性の高い表現」としてマークする。


こんなもんでどうだろう?