Es posible que haya oído hablar del término Unicode antes y se haya preguntado qué significa. Esquemas de codificación normales de un solo byte (como ASCII y ANSI)

Permita que solo se codifiquen y muestren en la computadora hasta 256 caracteres individuales únicos. En la comunidad informática mundial, donde cada miembro debe trabajar en su propio idioma, esto es un problema.

Hay más de 256 caracteres de uso común en todo el mundo.

Aquí es donde entra en juego Unicode. El estándar Unicode requiere la asignación de dos bytes (dieciséis bits) para codificar cada carácter. Esto significa que puede haber 65.536 caracteres únicos definidos. Este estándar, ideado y promovido por Unicode Consortium (http://www.unicode.org), permite la visualización de prácticamente todos los caracteres lingüísticos únicos del mundo. Un equipo de profesionales de la informática, lingüistas y académicos trabajó en el desarrollo real de Unicode.

El uso de dos bytes para definir cada carácter significa que Unicode se puede utilizar para codificar la mayoría de los caracteres utilizados en los principales idiomas del mundo. También hay un mecanismo de extensión integrado en el estándar, lo que significa que es posible codificar cerca de un millón de caracteres más, si es necesario. Esta capacidad debería ser suficiente para todos los requisitos de idiomas conocidos, además de la codificación de todas las escrituras históricas del mundo. (Esto incluye idiomas y símbolos que ya no se utilizan).

Tal como se define actualmente, Unicode 6.1 (la última versión) incluye códigos para caracteres utilizados en los principales idiomas escritos del mundo, incluidos árabe, armenio, balinés, bengalí, bopomofo, buhid, sílabas canadienses, cherokee, chino, cirílico, Deseret, devanagari , Etíope, georgiano, gótico, griego, gujarati, gurmukhi, han, hangul, hanunoo, hebreo, hiragana, kannada, katakana, jemer, lao, latín, malayalam, mongol, Myanmar, Ogham, cursiva antigua (etrusca), oriya, fenicia , Rúnico, cingalés, siríaco, tagalo, tagbanwa, tamil, telugu, thaana, tailandés, tibetano y yi. Se está trabajando para agregar más caracteres de idiomas menos conocidos.

Además, Unicode también incluye muchos símbolos diferentes, incluidos números, diacríticos generales, puntuación general, símbolos generales, dingbats, flechas, bloques, formas de dibujo de caja, formas geométricas, símbolos matemáticos, símbolos musicales (occidentales y bizantinos), símbolos técnicos, braille. patrones y radicales Kangxi.

Unicode es compatible con todas las versiones modernas de Windows y Word.

WordTips es su fuente de formación rentable en Microsoft Word.

(Microsoft Word es el software de procesamiento de texto más popular del mundo). Este consejo (1788) se aplica a Microsoft Word 97, 2000, 2002 y 2003. Puede encontrar una versión de este consejo para la interfaz de cinta de Word (Word 2007 y más tarde) aquí:

link: / wordribbon-Understanding_Unicode_Characters [Comprensión de los caracteres Unicode].