文字コードとは
パソコンで、ブラウザやメールなど世界共通で使用されている文字は、文字コードというルールを使って表記、記述しています。時々、ブラウザで文字化けという現象が起きるのは、何らかの影響でこの文字コードが正しく理解できなかった、異なる文字コードと認識してしまったなどの理由が考えられます。
では、文字コードとは、どんなものがあるのか調べてみましょう。
【ANSIコード】:英数字記号文字を含む、7bitの基本的な文字コード。ほかの文字コードでも、英数字部分の文字コードはこのANSI文字コードをベースにしているものがほとんどである。ASCIIコードとも呼ばれる。
日本語には、対応していないので日本には向いていない。
【Latin 1コード】:英語以外の、ラテン系の欧州言語(仏語や独語、伊語ほか)で使用されるコード。
【JISコード】:ANSI文字コードと漢字文字コードを、「エスケープ・シーケンス」と呼ばれる特別な文字シーケンスで切り替えながら共存させている。ほとんどの場合、電子メールは、この文字コードで送受信される。
【シフトJIS】:MS-DOSの時代から広く使われている文字コード。漢字文字コードの「JISコード」をベースにして、ANSI文字と共存させている。PC環境では一般的な日本語文字コード。
【EUC】:UNIX環境で広く使われている日本語文字コード。シフトJISとは異なる方法でANSI文字と漢字文字を共存させている。
【Unicode】:Unicodeは、世界中の文字を16bitもしくは32bitの固定長の文字コードで統一的に扱うために作られたコード。
などがある。このうち、現在日本語メールとして広く一般に利用されている文字コードはJISコードであり、ほとんどのメールではこれが利用されている。シフトJISやEUCは、Webページの制作などではまだ利用されているが、メール環境ではほとんど利用されていない。最近では文字コードとしてUnicode(UTF-7もしくはUTF-8)が利用されるケースも少なからずある。
これらの文字コードは、普段はブラウザやメーラーが自動的に判断して、そのコードを使って文字を表示するようになっている。しかし、メーラーやブラウザで、文字化けを起こしたのならば手動でこの文字コードを切り替えることんによって文字を正しく表示できることがあるので覚えておきたい。Windowsのメモ帳もファイルを保存するときに、文字コードを指定することができる。




">





