Возможно, вы слышали о термине Unicode раньше и задавались вопросом, что он означает. Обычные однобайтовые схемы кодирования (такие как ASCII и ANSI)

позволяют кодировать и отображать на компьютере только до 256 уникальных отдельных символов. В глобальном компьютерном сообществе, где каждый член должен работать на своем родном языке, это проблема.

Во всем мире используется более 256 символов.

Вот где в игру вступает Юникод.

В зависимости от используемой версии Unicode стандарт требует от двух до пяти байтов для кодирования каждого символа. На момент написания этой статьи текущим стандартом Unicode является 9.0.0, который использует пять байтов и 128 172 символа. Этот стандарт, разработанный и продвигаемый Консорциумом Unicode (http://www.unicode.org), позволяет отображать практически все уникальные языковые символы в мире. Команда компьютерных профессионалов, лингвистов и ученых продолжает работать над фактическим развитием Unicode.

Использование нескольких байтов для определения каждого символа означает, что Unicode можно использовать для кодирования большинства символов, используемых в основных языках мира. В стандарт также встроен механизм расширения, что означает, что при необходимости можно закодировать еще около миллиона символов. Этой способности должно хватить для выполнения всех известных языковых требований, а также для кодирования всех исторических сценариев мира. (Сюда входят языки и символы, которые больше не используются.)

В соответствии с настоящим определением, Unicode 9.0.0 (последняя версия, выпущенная в июне 2016 года) включает коды символов, используемых в основных письменных языках мира, включая арабский, армянский, балийский, бенгальский, бопомофо, бухид, канадскую слоговую букву, чероки и т. Д. Китайский, кириллица, десерет, деванагари, эфиопский, грузинский, готический, греческий, гуджарати, гурмукхи, хань, хангыль, ханун-о, иврит, хирагана, каннада, катакана, кхмерский, лаосский, латынь, малаялам, монгольский, мьянма, огам, Старый курсив (этрусский), ория, финикийский, рунический, сингальский, сирийский, тагальский, тагбанва, тамильский, телугу, тхана, тайский, тибетский и йи. Продолжается работа над добавлением символов из менее известных языков.

Кроме того, Unicode также включает в себя множество различных символов, включая числа, общие диакритические знаки, общую пунктуацию, общие символы, дингбаты, эмодзи, стрелки, блоки, формы рисования прямоугольников, геометрические фигуры, математические символы, музыкальные символы (западные и византийские), технические символы. , узоры Брайля и радикалы канси.

Юникод поддерживается во всех современных версиях Windows и Word. То, какой именно стандарт Unicode поддерживается, зависит от версии Windows и Word.

WordTips — ваш источник экономичного обучения работе с Microsoft Word.

(Microsoft Word — самая популярная программа для обработки текстов в мире.) Этот совет (11277) применим к Microsoft Word 2007, 2010, 2013 и 2016. Вы можете найти версию этого совета для более старого интерфейса меню Word здесь:

link: / word-Understanding_Unicode_Characters [Что такое символы Unicode].