Snap.Shot.cx

トップページへ戻る

[雑談] Mozillaの日本語auto-detect
05/26/2000 02:48 (投稿者:たかの)

Jcode MLに投げたちょっとしたtopic。初心者向けです。

初心者向けFAQ:

文字コード、なんでも自動認識できると思わないでください。
とくに文字数が少ない場合、バイナリ「だけ」から文字コードを特定する手法は皆無です。たとえば最近話題のmozillaでは、ドキュメント全体を順に見ていって、「xx文字目にコードセットSJISではありえないコードが含まれているから、これはSJISではない」というように、消去法でコードセットを特定しています。
最後に残ったコードセットを「これはSJISでもJISでもUTF8でもないから、このドキュメントのコードセットはEUC(だろう)」という仕掛けです。

メールでコメント

(Powered by Zope)
リンクはご自由にどうぞ。各記事には記事番号がついていますので、URLは変わりません。
© 2000-2012 Yukimasa TAKANO, all RIGHTs reserved.