オペレーティングシステム
バイトオーダーマーク
メインフレーム
メインページ
ルックアップテーブル
協定世界時
国際化ドメイン名
文字コード
縦書きと横書き
ASCII
CJK統合漢字
COBOL
DB2
EBCDIC
Extensible Markup Language
GB 18030
IBM
ISO/IEC 10646
Java
PL/I
Punycode
UTF-16
UTF-32
UTF-8
UTF-EBCDIC
Unicode
Unicode#.E3.82.A8.E3.83.B3.E3.82.B3.E3.83.BC.E3.83.87.E3.82.A3.E3.83.B3.E3.82.B0.EF.BC.88.E7.AC.A6.E5.8F.B7.E5.8C.96.E6.96.B9.E5.BC.8F.EF.BC.89
Unicode#.E6.A6.82.E8.A6.81
Unicode文字のマッピング
Z/OS
バイトオーダーマーク
メインフレーム
メインページ
ルックアップテーブル
協定世界時
国際化ドメイン名
文字コード
縦書きと横書き
ASCII
CJK統合漢字
COBOL
DB2
EBCDIC
Extensible Markup Language
GB 18030
IBM
ISO/IEC 10646
Java
PL/I
Punycode
UTF-16
UTF-32
UTF-8
UTF-EBCDIC
Unicode
Unicode#.E3.82.A8.E3.83.B3.E3.82.B3.E3.83.BC.E3.83.87.E3.82.A3.E3.83.B3.E3.82.B0.EF.BC.88.E7.AC.A6.E5.8F.B7.E5.8C.96.E6.96.B9.E5.BC.8F.EF.BC.89
Unicode#.E6.A6.82.E8.A6.81
Unicode文字のマッピング
Z/OS
Unicode
符号化方式
UTF-7
UTF-8
CESU-8
UTF-16/UCS-2
UTF-32/UCS-4
UTF-EBCDIC
SCSU
Punycode (IDN/IDNA)
GB 18030
その他
UCS
マッピング
書字方向
BOM
漢字統合
UnicodeとHTML
Unicodeと電子メール
Unicodeフォント
UTF-EBCDICはUnicode文字の表現に使われる文字コードである。EBCDICと親和性があり、メインフレーム上で動作する従来のEBCDICアプリケーションが大きな困難なしに文字を処理できるようにすることを意図している。既存のEBCDICベースのシステムにとっての利点は、既存のASCIIベースシステムにとってのUTF-8の利点に類似する。UTF-EBCDICの詳細はUnicode技術報告 #16で定義されている。
UTF-EBCDICで符号化されたUnicode符号位置の並びを得るには、UTF-8に基づいた符号化 (UTF-8-Modと呼ばれる仕様) をまず適用する。この符号化がUTF-8と主に異なる点は、Unicode符号位置のU+0080からU+009Fまで (C1制御文字) を、後で対応するEBCDICの制御文字へマップするため1バイトで表現できるようにしている点である。これを達成するため、10XXXXXXの代わりに101XXXXXがマルチバイトシーケンスにおける後続バイトの形式として使われる。これは1バイトあたり6ビット保持できるUTF-8と異なり5ビットしか保持できないため、一般にUTF-EBCDICは同じ入力データに対してUTF-8よりも大きな出力を生成する。
この変換ではデータはまだASCIIベースの形式であるため、表索引を用いて可逆なバイト単位の変換をこのデータに適用し、可能な限り通常のEBCDICコードページに近づける。これらの手順を逆にたどることにより容易にUnicode符号位置へ復元できる。
一般に、設計対象であったEBCDICベースのメインフレームにおいてさえ、この符号化形式は滅多に使われない。z/OSのような、IBM製のEBCDICベースのメインフレームのオペレーティングシステムは、通常完全なUnicodeサポートにUTF-16を使用する。たとえば、DB2 UDB、COBOL、PL/I、JavaおよびIBM XMLツールキットはIBMのメインフレーム上でUTF-16をサポートする。
編集 参考資料
用語の日本語表記は原則として次にならった。“Unicode Terminology English - Japanese”. Unicode, Inc. 2010年1月1日閲覧。
編集 外部リンク
Unicode Technical Report #16: UTF-EBCDICの定義(英語)
UTR #16: UTF-EBCDIC
The term UTF-EBCDIC stands for EBCDIC-friendly Unicode (or UCS) Transformation Format. ... The UTF-EBCDIC encoding is derived from the Unicode scalar values ...
Utf-ebcdic
Utf-ebcdic on WN Network delivers the latest Videos and Editable pages for News & Events, including Entertainment, Music, Sports, Science and more, ...
RealTech: Resource Library
UTF-EBCDIC is a character encoding used to represent Unicode characters. ... Details on UTF-EBCDIC are defined in Unicode Technical Report #16. ...
Extended Binary Coded Decimal Interchange Code - Wikipedia ...
EBCDIC descended from the code used with punched cards and the corresponding six ... IBM mainframes support UTF-16, but they do not support UTF-EBCDIC natively. ...
Groove|Asia Directory: UTF-EBCDIC
UTF-EBCDIC is a character encoding used to represent Unicode characters. ... Details on UTF-EBCDIC are defined in Unicode Technical Report #16. ...
Utf-ebcdic
UTF-EBCDIC is a character encoding used to represent Unicode characters. ... Details on UTF-EBCDIC are defined in Unicode Technical Report #16. To produce ...
Utf-ebcdic
The use utf8 pragma tells the Perl parser to allow UTF-8 in the program text in the current lexical scope (allow UTF-EBCDIC on EBCDIC based platforms) ...
UTF-EBCDIC
존재 EBCDIC 근거한 체계를 위한 그것의 이점은 유사하다와 UTF-8'존재를 위한 s 이점 ASCII- 근거한 체계. ... UTF-EBCDIC를 생성하는 것은 일련의 Unicode 코드 포인트의 버전을, (UTF 8 Mod로 명세에서 알려지는) UTF-8에 근거한 암호화 첫째로 적용된다 암호로 고쳐 썼다. ...
Utf-EBCDIC
Utf-EBCDIC is a karakter het coderen gebruikt om te vertegenwoordigen Unicode karakters. ... De details op utf-EBCDIC worden bepaald in Unicode Technisch Rapport #16. ...







