UTF-8

UTF-8とは

UTF-8(旧UTF-2)はISO/IEC 10646(UCS)とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。
正式名称は、ISO/IEC 10646では'UCS Transformation Format 8'、Unicodeでは'Unicode Transformation Format-8'という。
両者はISO/IEC 10646Unicodeのコード重複範囲で互換性がある。
2バイト目以降に'/'などのコードが現れないように工夫されていることから、'UTF-FSS'(File System Safe)ともいわれる。
RFCにも仕様がある。
データ交換方式、ファイル形式としては一般的にUTF-8が使われる傾向がある。
LinuxMac OS Xのように、OSの標準文字エンコードとして使用される例も増えている。
当初は、ベル研究所において Plan 9で用いるエンコードとして、ロブ・パイクによる設計指針のもと、ケン・トンプソンによって考案された<ref>RFC 3629 Page-3</ref>。

出典: フリー百科事典『ウィキペディア(Wikipedia)』
[ UTF-8の改定履歴 ]


注目用語
1位 セキュリティポリシー
2位 ビジネスインテリジェンス
3位 マルウェア
4位 ディザスタリカバリ
5位 ファイアーウォール