Hiểu các ký tự Unicode (Microsoft Word)
Bạn có thể đã nghe nói về thuật ngữ Unicode trước đây và tự hỏi nó có nghĩa là gì. Các lược đồ mã hóa một byte thông thường (chẳng hạn như ASCII và ANSI)
chỉ cho phép tối đa 256 ký tự riêng lẻ duy nhất được mã hóa và hiển thị trên máy tính. Trong cộng đồng máy tính toàn cầu, nơi mỗi thành viên được yêu cầu làm việc bằng ngôn ngữ riêng của họ, đây là một vấn đề.
Có hơn 256 ký tự được sử dụng phổ biến trên khắp thế giới.
Đây là lúc Unicode phát huy tác dụng. Tiêu chuẩn Unicode yêu cầu phân bổ hai byte (mười sáu bit) để mã hóa mỗi ký tự. Điều này có nghĩa là có thể có 65.536 ký tự duy nhất được xác định. Tiêu chuẩn này, do Unicode Consortium (http://www.unicode.org) phát minh và quảng bá, cho phép hiển thị hầu như tất cả các ký tự ngôn ngữ duy nhất trên thế giới. Một nhóm các chuyên gia máy tính, nhà ngôn ngữ học và học giả đã làm việc trên sự phát triển thực tế của Unicode.
Việc sử dụng hai byte để xác định mỗi ký tự có nghĩa là Unicode có thể được sử dụng để mã hóa hầu hết các ký tự được sử dụng trong các ngôn ngữ chính trên thế giới. Cũng có một cơ chế mở rộng được tích hợp trong tiêu chuẩn, có nghĩa là có thể mã hóa thêm gần một triệu ký tự, nếu cần. Khả năng này phải đủ cho tất cả các yêu cầu ngôn ngữ đã biết, cộng với việc mã hóa tất cả các chữ viết lịch sử trên thế giới. (Điều này bao gồm các ngôn ngữ và ký hiệu không còn được sử dụng.)
Như được định nghĩa hiện tại, Unicode 6.1 (phiên bản mới nhất) bao gồm các mã cho các ký tự được sử dụng trong các ngôn ngữ viết chính trên thế giới, bao gồm tiếng Ả Rập, tiếng Armenia, tiếng Bali, tiếng Bengali, Bopomofo, Buhid, Canada Syllabics, Cherokee, Chinese, Cyrillic, Deseret, Devanagari , Ethiopic, Georgia, Gothic, Greek, Gujarati, Gurmukhi, Han, Hangul, Hanunoo, Hebrew, Hiragana, Kannada, Katakana, Khmer, Lao, Latin, Malayalam, Mongolian, Myanmar, Ogham, Old Italic (Etruscan), Oriya, Phoenicia , Runic, Sinhala, Syriac, Tagalog, Tagbanwa, Tamil, Telugu, Thaana, Thái, Tây Tạng và Yi. Công việc đang được tiến hành để thêm nhiều ký tự hơn từ các ngôn ngữ ít được biết đến hơn.
Ngoài ra, Unicode cũng bao gồm nhiều ký hiệu khác nhau, bao gồm số, dấu phụ chung, dấu câu chung, ký hiệu chung, dingbats, mũi tên, khối, hình hộp, hình dạng hình học, ký hiệu toán học, ký hiệu âm nhạc (phương Tây và byzantine), ký hiệu kỹ thuật, chữ nổi các mẫu, và các gốc Khang Hy.
Unicode được hỗ trợ trong tất cả các phiên bản Windows và Word hiện đại.
WordTips là nguồn của bạn để đào tạo Microsoft Word hiệu quả về chi phí.
(Microsoft Word là phần mềm xử lý văn bản phổ biến nhất trên thế giới.) Mẹo này (1788) áp dụng cho Microsoft Word 97, 2000, 2002 và 2003. Bạn có thể tìm thấy phiên bản của mẹo này cho giao diện ribbon của Word (Word 2007 và sau này) tại đây: