Возможно, вы слышали о термине Unicode раньше и задавались вопросом, что он означает. Обычные однобайтовые схемы кодирования (такие как ASCII и ANSI)

позволяют кодировать и отображать на компьютере только до 256 уникальных отдельных символов. В глобальном компьютерном сообществе, где каждый член должен работать на своем родном языке, это проблема.

Во всем мире используется более 256 символов.

Вот где в игру вступает Юникод. Стандарт Unicode требует выделения двух байтов (шестнадцати битов) для кодирования каждого символа. Это означает, что может быть определено 65 536 уникальных символов. Этот стандарт, разработанный и продвигаемый Консорциумом Unicode (http://www.unicode.org), позволяет отображать практически все уникальные языковые символы в мире. Над реальной разработкой Unicode работала группа компьютерных профессионалов, лингвистов и ученых.

Использование двух байтов для определения каждого символа означает, что Unicode может использоваться для кодирования большинства символов, используемых в основных языках мира. В стандарт также встроен механизм расширения, что означает, что при необходимости можно закодировать еще около миллиона символов. Этой способности должно хватить для выполнения всех известных языковых требований, а также для кодирования всех исторических сценариев мира. (Сюда входят языки и символы, которые больше не используются.)

В соответствии с настоящим определением, Unicode 6.1 (последняя версия) включает коды символов, используемых в основных письменных языках мира, включая арабский, армянский, балийский, бенгали, бопомофо, бухид, канадское слоговое письмо, чероки, китайский, кириллица, десерет, деванагари. , Эфиопский, грузинский, готический, греческий, гуджарати, гурмукхи, хань, хангыль, хануну, иврит, хирагана, каннада, катакана, кхмерский, лаосский, латынь, малаялам, монгольский, мьянманский, огам, древнеитальянский (этрусский), ория, финикийский , Рунический, сингальский, сирийский, тагальский, тагбанва, тамильский, телугу, тхана, тайский, тибетский и йи. Продолжается работа над добавлением символов из менее известных языков.

Кроме того, Unicode также включает в себя множество различных символов, включая числа, общие диакритические знаки, общую пунктуацию, общие символы, дингбаты, стрелки, блоки, формы рисования прямоугольников, геометрические фигуры, математические символы, музыкальные символы (западные и византийские), технические символы, шрифт Брайля. узоры и радикалы Канси.

Юникод поддерживается во всех современных версиях Windows и Word.

WordTips — ваш источник экономичного обучения работе с Microsoft Word.

(Microsoft Word — самая популярная программа для обработки текстов в мире.) Этот совет (1788) применим к Microsoft Word 97, 2000, 2002 и 2003. Вы можете найти версию этого совета для ленточного интерфейса Word (Word 2007 и позже) здесь:

link: / wordribbon-Understanding_Unicode_Characters [Описание символов Unicode].