文字コードの判別に使えるかもしれない情報

文字コードの判別って言うとあり得るバイトの並びとか、バイトの(もしくは文字コードを仮定した上での各コードの)出現頻度とかが基本的な所なのではないかと思うけど、特定の状況下ではもっと的確かもしれない情報が得られる可能性がある。
Emacs のファイル変数と Ruby, Python, Gauche あたりのマジックコメントが書式が似せてあって、二行目まで(shebangを考慮)の間に -*- と -*- で囲んだ中に coding: utf-8 とかが書いてあるかもしれない。
ただまあ、HTML の文字コード指定と同じで、それを信じると実際のエンコーディングが違ってぐちゃぐちゃという事もあるかもしれないなぁ。