Bạn có thể đã nghe nói về thuật ngữ Unicode trước đây và tự hỏi nó có nghĩa là gì. Các lược đồ mã hóa một byte thông thường (chẳng hạn như ASCII và ANSI)

chỉ cho phép tối đa 256 ký tự riêng lẻ duy nhất được mã hóa và hiển thị trên máy tính. Trong cộng đồng máy tính toàn cầu, nơi mỗi thành viên được yêu cầu làm việc bằng ngôn ngữ riêng của họ, đây là một vấn đề.

Có hơn 256 ký tự được sử dụng phổ biến trên khắp thế giới.

Đây là lúc Unicode phát huy tác dụng.

Tùy thuộc vào phiên bản Unicode đang được sử dụng, tiêu chuẩn yêu cầu từ hai đến năm byte để mã hóa mỗi ký tự. Theo cách viết này, tiêu chuẩn Unicode hiện tại là 9.0.0, sử dụng năm byte và 128.172 ký tự được xác định. Tiêu chuẩn này, do Unicode Consortium (http://www.unicode.org) phát minh và quảng bá, cho phép hiển thị hầu như tất cả các ký tự ngôn ngữ duy nhất trên thế giới. Một nhóm các chuyên gia máy tính, nhà ngôn ngữ học và học giả tiếp tục làm việc để phát triển thực tế Unicode.

Việc sử dụng nhiều byte để xác định từng ký tự có nghĩa là Unicode có thể được sử dụng để mã hóa hầu hết các ký tự được sử dụng trong các ngôn ngữ chính trên thế giới. Cũng có một cơ chế mở rộng được tích hợp trong tiêu chuẩn, có nghĩa là có thể mã hóa thêm gần một triệu ký tự, nếu cần. Khả năng này phải đủ cho tất cả các yêu cầu ngôn ngữ đã biết, cộng với việc mã hóa tất cả các chữ viết lịch sử trên thế giới. (Điều này bao gồm các ngôn ngữ và ký hiệu không còn được sử dụng.)

Như được định nghĩa hiện tại, Unicode 9.0.0 (phiên bản mới nhất, phát hành vào tháng 6 năm 2016) bao gồm các mã cho các ký tự được sử dụng trong các ngôn ngữ viết chính trên thế giới, bao gồm tiếng Ả Rập, tiếng Armenia, tiếng Bali, tiếng Bengali, Bopomofo, Buhid, Canada Syllabics, Cherokee, Tiếng Trung, Kirin, Deseret, Devanagari, Ethiopic, Georgia, Gothic, Greek, Gujarati, Gurmukhi, Han, Hangul, Hanun — o, Hebrew, Hiragana, Kannada, Katakana, Khmer, Lao, Latin, Malayalam, Mongolian, Myanmar, Ogham, Old Italic (Etruscan), Oriya, Phoenician, Runic, Sinhala, Syriac, Tagalog, Tagbanwa, Tamil, Telugu, Thaana, Thái, Tây Tạng và Yi. Công việc đang được tiến hành để thêm nhiều ký tự hơn từ các ngôn ngữ ít được biết đến hơn.

Ngoài ra, Unicode cũng bao gồm nhiều ký hiệu khác nhau, bao gồm số, dấu phụ chung, dấu câu chung, ký hiệu chung, dingbats, biểu tượng cảm xúc, mũi tên, khối, hình hộp, hình dạng hình học, ký hiệu toán học, ký hiệu âm nhạc (phương Tây và Byzantine), ký hiệu kỹ thuật , các mẫu chữ nổi, và các gốc Khang Hy.

Unicode được hỗ trợ trong tất cả các phiên bản Windows và Word hiện đại. Chính xác tiêu chuẩn Unicode nào được hỗ trợ phụ thuộc vào phiên bản Windows và Word được đề cập.

WordTips là nguồn của bạn để đào tạo Microsoft Word hiệu quả về chi phí.

(Microsoft Word là phần mềm xử lý văn bản phổ biến nhất trên thế giới.) Mẹo này (11277) áp dụng cho Microsoft Word 2007, 2010, 2013 và 2016. Bạn có thể tìm phiên bản của mẹo này cho giao diện menu cũ hơn của Word tại đây: