外字(user-defined character)とは、標準の文字コード規格に含まれていない文字を、特定のソフトウェアメーカーやユーザーが独自に追加した文字です。
この技術は、特殊な人名や地名、歴史的な文字など、標準の文字セットに収録されていない文字を扱うために利用されます。
本記事では、外字の定義、実際の利用方法、そしてその歴史的背景について詳しく解説します。
外字の基本概念
外字とは?
外字(user-defined character)は、標準の文字コードに含まれていない文字を追加する技術です。
通常の文字コードでは対応できない特定の文字を、独自の識別番号やフォントデータを用いて定義します。
これにより、標準文字と同様に入力、表示、印刷が可能となります。
外字の利用方法
外字は以下のように利用されます:
- 特殊な人名や地名:標準の文字コードに含まれていない特定の人名や地名を表現するため。
- 歴史的な文字:歴史的に重要な文字や特殊な用途の文字を扱うため。
外字の種類
ユーザー定義文字とベンダー定義文字
ユーザー定義文字は、一般の利用者が専用のソフトウェアを用いて作成するもので、個人や特定のグループが必要に応じて追加する文字です。
一方、ベンダー定義文字は、ソフトウェアメーカーが標準規格に追加する外字のセットであり、自社のシステムや製品で使用されます。
例えば:
- IBM外字:MS-DOSなどで使用されていたIBM独自の外字。
- NEC外字(98外字):NECが定義した外字で、特に日本語環境で使用されていました。
- 入管正字:法務省が外国人名などに使用するために作成した外字。
外字の互換性
外字を含むテキストデータは、その外字に対応したシステム以外では同様に表示、印刷することができません。
例えば、IBM外字やNEC外字は、それぞれのメーカーのシステムでは使用できますが、他社のシステムでは表示されない場合があります。
外字の歴史と変遷
歴史的背景
外字の技術は、特定の文字セットが標準化される以前から存在していました。
以下のような過去の外字セットが、その後の標準化に影響を与えました:
- ARIB外字:字幕放送で使用された外字セット。
- iモード絵文字:NTTドコモが携帯電話で使用した絵文字セット。
- 共同通信外字(U-PRESS外字):新聞記事などで用いられた外字セット。
多くの外字は、後にUnicodeなどの標準文字コード規格に取り込まれ、現在では標準文字として使用されています。
標準化の進展
外字が標準化されることで、異なるシステム間でも文字の互換性が保たれるようになりました。
Unicodeの導入により、多くの外字が公式に文字コード規格に組み込まれ、広く利用されています。
まとめ
外字(user-defined character)は、標準文字コードに収録されていない特殊な文字を追加するための技術です。
ユーザー定義文字とベンダー定義文字があり、それぞれ異なる用途で使用されます。
外字の歴史的な背景や実際の利用方法を理解することで、特定の文字を扱う際の課題や解決策が見えてきます。
現在では、多くの外字がUnicodeに取り込まれ、標準化が進んでいます。
さらに参考してください。