Unicode文字を理解する(Microsoft Word)
Unicodeという用語を以前に聞いたことがあるかもしれませんが、それが何を意味するのか疑問に思いました。通常のシングルバイトエンコーディングスキーム(ASCIIやANSIなど)
最大256個の固有の個別文字のみをエンコードしてコンピューターに表示できます。各メンバーがそれぞれの言語で作業する必要があるグローバルなコンピューターコミュニティでは、これは問題です。
世界中で256文字をはるかに超える文字が一般的に使用されています。
ここでUnicodeが役立ちます。
使用されているUnicodeのバージョンに応じて、標準では各文字をエンコードするために2〜5バイトが必要です。この記事の執筆時点で、現在のUnicode標準は9.0.0であり、5バイトと128,172文字が定義されています。この標準は、Unicodeコンソーシアム(http://www.unicode.org)によって考案および推進されており、世界中のほぼすべての固有の言語文字の表示を可能にします。コンピュータの専門家、言語学者、学者のチームは、Unicodeの実際の開発に引き続き取り組んでいます。
各文字を定義するために複数のバイトを使用することは、Unicodeを使用して世界の主要言語で使用されるほとんどの文字をエンコードできることを意味します。標準には拡張メカニズムも組み込まれています。つまり、必要に応じて、さらに100万文字近くをエンコードすることができます。この機能は、すべての既知の言語要件に加えて、世界のすべての歴史的なスクリプトのエンコードに十分なはずです。 (これには、使用されなくなった言語と記号が含まれます。)
現在定義されているように、Unicode 9.0.0(最新バージョン、2016年6月にリリース)には、アラビア語、アルメニア語、バリ語、ベンガル語、ボポモフォ語、ブヒド語、カナダ音節、チェロキー語など、世界の主要なテルグ語で使用される文字のコードが含まれています。中国語、キリル語、デセレット語、デバナガリ語、エチオピア語、グルジア語、ゴシック語、ギリシャ語、グジャラティ語、グルムキ語、ハン語、ハングル語、ハヌン語、ヘブライ語、ヒラガナ語、カンナダ語、カタカナ語、クメール語、ラオス語、ラテン語、マラヤラム語、モンゴル語、ミャンマー語、オガム語、 Old Italic(Etruscan)、Oriya、Phoenician、Runic、Sinhala、Syriac、Tagalog、Tagbanwa、Tamil、Telugu、Thaana、Thai、Tibetan、およびYi。あまり知られていない言語からさらに文字を追加する作業が進行中です。
さらに、Unicodeには、数字、一般的な発音区別符号、一般的な句読点、一般的な記号、ディンバット、絵文字、矢印、ブロック、罫線入り用紙、幾何学的形状、数学記号、音楽記号(西洋およびビザンチン)、技術記号など、さまざまな記号も含まれています。 、ブライユ点字、康煕部。
Unicodeは、WindowsおよびWordのすべての最新バージョンでサポートされています。サポートされているUnicodeの正確な標準は、問題のWindowsとWordのバージョンによって異なります。
_WordTips_は、費用効果の高いMicrosoftWordトレーニングのソースです。
(Microsoft Wordは、世界で最も人気のあるワードプロセッシングソフトウェアです。)このヒント(11277)は、Microsoft Word 2007、2010、2013、および2016に適用されます。Wordの古いメニューインターフェイス用のこのヒントのバージョンは、次の場所にあります。
linkUnicode文字を理解する。