Cách chuyển mã văn bản trong word 2010 với uoffice năm 2024

Thông thường, bạn có thể chia sẻ tệp văn bản mà không cần lo lắng về các chi tiết cơ sở về cách lưu trữ văn bản. Tuy nhiên, nếu bạn chia sẻ tệp văn bản với những người làm việc với các ngôn ngữ khác, hãy tải xuống các tệp văn bản trên Internet, hoặc chia sẻ tệp văn bản với các hệ thống máy tính khác, bạn có thể cần phải chọn một tiêu chuẩn mã hóa khi mở hoặc lưu tệp.

Khi bạn hoặc người khác mở tệp văn bản trong Microsoft Word hoặc trong một chương trình khác — có lẽ trên một máy tính có phần mềm hệ thống trong một ngôn ngữ khác với ngôn ngữ được sử dụng để tạo tệp — tiêu chuẩn mã hóa sẽ giúp chương trình xác định cách thức đại diện cho văn bản để nó có thể đọc được.

Bạn muốn làm gì?

Tìm hiểu mã hóa văn bản

Điều gì sẽ xuất hiện với bạn như văn bản trên màn hình thực sự được lưu trữ dưới dạng các giá trị số trong tệp văn bản. Máy tính của bạn dịch các giá trị số thành các ký tự có thể nhìn thấy được. Nó thực hiện điều này bằng cách sử dụng tiêu chuẩn mã hóa.

Tiêu chuẩn mã hóa là một sơ đồ đánh số gán cho mỗi ký tự văn bản trong một ký tự được đặt là một giá trị số. Bộ ký tự có thể bao gồm các ký tự chữ cái, số và ký hiệu khác. Các ngôn ngữ khác nhau thường bao gồm các tập ký tự khác nhau, vì vậy nhiều tiêu chuẩn mã hóa khác nhau tồn tại để đại diện cho bộ ký tự được sử dụng trong các ngôn ngữ khác nhau.

Tiêu chuẩn mã hóa khác nhau cho các bảng chữ cái khác nhau

Tiêu chuẩn mã hóa được lưu bằng tệp văn bản cung cấp thông tin mà máy tính của bạn cần hiển thị văn bản trên màn hình. Ví dụ, trong mã hóa Cyrillic (Windows), ký tự й có giá trị số 201. Khi bạn mở một tệp có chứa ký tự này trên một máy tính sử dụng mã hóa Cyrillic (Windows), thì máy tính sẽ đọc giá trị số 201 và hiển thị й trên màn hình.

Tuy nhiên, nếu bạn mở cùng một tệp trên một máy tính sử dụng mã hóa khác, thì máy tính sẽ hiển thị ký tự bất kỳ tương ứng với giá trị số 201 trong tiêu chuẩn mã hóa mà máy tính sử dụng theo mặc định. Ví dụ, nếu máy tính của bạn sử dụng tiêu chuẩn mã hóa Tây Âu (Windows), ký tự trong tệp gốc Cyrillic ban đầu sẽ được hiển thị dưới dạng É chứ không phải là й vì trong mã hóa Western European (Windows), giá trị 201 bản đồ thành É.

Unicode: một tiêu chuẩn mã hóa cho nhiều bảng chữ cái

Để tránh các vấn đề với mã hóa và giải mã các tệp văn bản, bạn có thể lưu tệp với mã hóa Unicode. Unicode chứa hầu hết các ký tự tập trung vào tất cả các ngôn ngữ được sử dụng thường xuyên giữa những người dùng máy tính hiện nay.

Vì Word được dựa trên Unicode, Word sẽ tự động lưu các tệp được mã hóa dưới dạng Unicode. Bạn có thể mở và đọc các tệp được mã hóa Unicode trên hệ thống máy tính ngôn ngữ tiếng Anh của bạn bất kể ngôn ngữ của văn bản. Tương tự như vậy, khi bạn sử dụng hệ thống ngôn ngữ tiếng Anh để lưu các tệp được mã hóa là Unicode, tệp có thể bao gồm các ký tự không được tìm thấy trong bảng chữ cái Tây Âu, chẳng hạn như tiếng Hy Lạp, Tiếng Kirin, tiếng ả Rập hoặc tiếng Nhật.

Chọn một tiêu chuẩn mã hóa khi bạn mở một tệp

Nếu bạn mở một tệp, văn bản xuất hiện bị cắt xén hoặc là dấu hỏi hoặc hộp, Word có thể không phát hiện chính xác tiêu chuẩn văn bản mã hóa trong tệp. Bạn có thể chỉ định tiêu chuẩn mã hóa mà bạn có thể sử dụng để hiển thị (giải mã) văn bản.

  1. Bấm vào tab Tệp.
  2. Bấm Tùy chọn.
  3. Bấm Nâng cao.
  4. Cuộn tới phần chung , rồi chọn hộp kiểm xác nhận chuyển đổi định dạng tệp khi mở . Lưu ý: Khi chọn hộp kiểm này, Word sẽ hiển thị hộp thoại chuyển đổi tệp mỗi khi bạn mở một tệp ở định dạng khác với định dạng Word (định dạng Word bao gồm các tệp. doc,. dot,. docx,. docm,. dotx, hoặc. dotm). Nếu bạn thường xuyên làm việc với các tệp như vậy nhưng hiếm khi muốn chọn một tiêu chuẩn mã hóa, hãy nhớ tắt tùy chọn này để ngăn không cho hộp thoại này đang mở không cần thiết.
  5. Đóng, rồi mở lại tệp.
  6. Trong hộp thoại chuyển đổi tệp , chọn văn bản được mã hóa.
  7. Trong hộp thoại chuyển đổi tệp , chọn mã hóa khác, rồi chọn tiêu chuẩn mã hóa bạn muốn từ danh sách. Bạn có thể xem trước văn bản trong khu vực xem trước để kiểm tra xem tất cả văn bản có được dễ đọc trong tiêu chuẩn mã hóa mà bạn đã chọn.

Nếu hầu như tất cả văn bản trông giống nhau (ví dụ, tất cả các hộp hoặc tất cả các dấu chấm), phông chữ cần thiết để hiển thị các ký tự có thể không được cài đặt. Nếu phông chữ mà bạn cần không sẵn dùng, bạn có thể cài đặt phông chữ bổ sung.

Để cài đặt phông chữ bổ sung, hãy làm như sau:

  1. Trong Microsoft Windows, bấm nút Bắt đầu và sau đó bấm Pa-nen Điều khiển.
  2. Thực hiện một trong những thao tác sau:

    Trong Windows 7

    1. Trong Panel điều khiển, hãy bấm dỡ cài đặt một chương trình.
    2. Trong danh sách chương trình, hãy bấm vào danh sách dành cho Microsoft Office hoặc Microsoft Word, tùy thuộc vào việc bạn đã cài đặt Word như một phần của Office hoặc là một chương trình riêng lẻ, rồi bấm thay đổi. Trong Windows Vista
    3. Trong Panel điều khiển, hãy bấm dỡ cài đặt một chương trình.
    4. Trong danh sách chương trình, hãy bấm vào danh sách dành cho Microsoft Office hoặc Microsoft Word, tùy thuộc vào việc bạn đã cài đặt Word như một phần của Office hoặc là một chương trình riêng lẻ, rồi bấm thay đổi. Trong Microsoft Windows XP
    5. Trong Pa-nen điều khiển, bấm vào Thêm hoặc loại bỏ chương trình.
    6. Trong hộp hiện đang được cài đặt chương trình , hãy bấm vào danh sách dành cho Microsoft Office hoặc Microsoft Word, tùy thuộc vào việc bạn đã cài đặt Word như một phần của Office hoặc là một chương trình riêng lẻ, rồi bấm thay đổi.
  3. Bên dưới thay đổi cài đặt Microsoft Office, hãy bấm Thêm hoặc loại bỏ tính năng, rồi bấm vào tiếp tục.
  4. Bên dưới tùy chọn cài đặt, bung rộng các tính năng của Office được chia sẻ, sau đó bung rộng hỗ trợ quốc tế.
  5. Chọn thiết đặt phông chữ mà bạn cần, bấm vào mũi tên bên cạnh vùng chọn của bạn, rồi chọn chạy từ máy tính của tôi.

Mẹo: Khi bạn mở một tệp văn bản được mã hóa, Word sẽ áp dụng các phông chữ được xác định trong hộp thoại tùy chọn web . (Để đến hộp thoại tùy chọn web , hãy bấm vào nút Microsoft Office, bấm vào tùy chọn Word, rồi bấm nâng cao. Trong phần chung , hãy bấm tùy chọn web.) Bạn có thể chọn các tùy chọn trên tab phông chữ trong hộp thoại tùy chọn web để tùy chỉnh phông chữ cho từng tập ký tự.

Chọn một tiêu chuẩn mã hóa khi bạn lưu tệp

Nếu bạn không chọn một tiêu chuẩn mã hóa khi bạn lưu tệp, Word mã hóa tệp dưới dạng Unicode. Thông thường, bạn có thể sử dụng mã hóa Unicode mặc định, vì nó hỗ trợ hầu hết các ký tự trong hầu hết các ngôn ngữ.

Nếu tài liệu của bạn sẽ được mở trong một chương trình không hỗ trợ Unicode, bạn có thể chọn một tiêu chuẩn mã hóa khớp với tên của chương trình đích. Ví dụ, Unicode cho phép bạn tạo một tài liệu ngôn ngữ tiếng Trung truyền thống trên hệ thống ngôn ngữ tiếng Anh của bạn. Tuy nhiên, nếu tài liệu sẽ được mở trong một chương trình ngôn ngữ tiếng Trung truyền thống mà không hỗ trợ Unicode, bạn có thể lưu tài liệu bằng mã hóa tiếng Trung (Big5). Khi tài liệu được mở trong chương trình ngôn ngữ tiếng Trung truyền thống, tất cả văn bản được hiển thị đúng cách.

Lưu ý: Vì Unicode là tiêu chuẩn toàn diện nhất, hãy lưu văn bản trong bất kỳ mã hóa nào khác có thể dẫn đến một số ký tự không còn được hiển thị. Ví dụ, một tài liệu được mã hóa trong Unicode có thể chứa văn bản Hebrew và Kirin. Nếu tài liệu này được lưu bằng mã hóa Cyrillic (Windows), văn bản tiếng Do Thái không còn có thể hiển thị và nếu tài liệu được lưu bằng mã hóa Hebrew (Windows), văn bản Cyrillic không còn có thể hiển thị.

Nếu bạn chọn một tiêu chuẩn mã hóa không hỗ trợ các ký tự mà bạn đã sử dụng trong tệp, dấu từ trong màu đỏ các ký tự mà nó không thể lưu. Bạn có thể xem trước văn bản trong tiêu chuẩn mã hóa mà bạn chọn trước khi lưu tệp.

Văn bản được định dạng trong phông chữ ký hiệu hoặc trong mã trường sẽ bị loại bỏ khỏi tệp khi bạn lưu tệp dưới dạng văn bản được mã hóa.

Chọn một tiêu chuẩn mã hóa

  1. Bấm tab Tệp.
  2. Bấm vào Lưu như. Nếu bạn muốn lưu tệp vào một thư mục khác, hãy định vị và mở thư mục.
  3. Trong hộp Tên tệp, hãy gõ tên mới cho tệp.
  4. Trong hộp lưu dưới dạng , hãy chọn văn bản thuần.
  5. Bấm Lưu.
  6. Nếu hộp thoại bộ kiểm tra tương thích của Microsoft Office Word xuất hiện, hãy bấm tiếp tục.
  7. Trong hộp thoại chuyển đổi tệp , hãy chọn tùy chọn cho tiêu chuẩn mã hóa mà bạn muốn sử dụng:
    • Để sử dụng tiêu chuẩn mã hóa mặc định cho hệ thống của bạn, hãy bấm Windows (mặc định).
    • Để dùng chuẩn mã hóa MS-DOS, hãy bấm MS-DOS.
    • Để chọn một tiêu chuẩn mã hóa cụ thể, hãy bấm mã hóa khác, rồi chọn tiêu chuẩn mã hóa bạn muốn từ danh sách. Bạn có thể xem trước văn bản trong khu vực xem trước để kiểm tra xem tất cả văn bản có được dễ đọc trong tiêu chuẩn mã hóa mà bạn đã chọn. Lưu ý: Bạn có thể đổi kích cỡ hộp thoại chuyển đổi tệp để bạn có thể xem trước tài liệu của bạn.
  8. Nếu bạn nhận được thông báo rằng các trạng thái, "văn bản được đánh dấu bằng màu đỏ sẽ không lưu chính xác trong mã hóa được chọn, bạn có thể tìm cách chọn một mã hóa khác hoặc bạn có thể chọn hộp kiểm cho phép thay thế ký tự . Khi bạn cho phép thay thế ký tự, Word sẽ thay thế một ký tự không thể hiển thị với ký tự tương đương gần nhất trong mã hóa mà bạn đã chọn. Ví dụ: ba dấu chấm thay thế dấu ngoặc kép và dấu nháy thẳng thay thế dấu ngoặc kép hình nhọn. Nếu mã hóa mà bạn chọn không có ký tự tương đương cho ký tự được đánh dấu bằng màu đỏ, ký tự được đánh dấu bằng màu đỏ sẽ được lưu dưới dạng ký tự vắng mặt, chẳng hạn như dấu chấm hỏi.
  9. Nếu tài liệu đó sẽ được mở trong một chương trình không ngắt dòng văn bản từ một dòng này đến kế tiếp, bạn có thể bao gồm ngắt dòng cứng trong tài liệu bằng cách chọn hộp kiểm Chèn ngắt dòng , rồi xác định xem liệu bạn có muốn ngắt dòng không được phân tách bằng một ô chuyển (CR), dòng nguồn cấp

Tra cứu tiêu chuẩn mã hóa sẵn dùng trong Word

Word nhận ra một số tiêu chuẩn mã hóa và nó hỗ trợ các tiêu chuẩn mã hóa được cung cấp với phần mềm hệ thống trên máy tính của bạn.

Danh sách các hệ thống viết sau đây Hiển thị các tiêu chuẩn mã hóa (còn được gọi là trang mã) được liên kết với mỗi hệ thống viết.

Hệ thống viết

Tiêu chuẩn mã hóa

Phông chữ được áp dụng

Ngôn

Unicode (UCS-2 Little-endian và Big-endian, UTF-8, UTF-7)

Phông chữ mặc định dựa trên kiểu thông thường cho phiên bản ngôn ngữ của Word

Tiếng Ả Rập

Windows 1256, ASMO 708

Courier New

Tiếng Trung giản thể

GB2312, GBK, EUC-CN, ISO-2022-CN, HZ

SimSun

Tiếng Trung Phồn thể

BIG5, EUC-TW, ISO-2022-TW

MingLiU

Kir

Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866

Courier New

Script tiếng Anh, Tây Âu hoặc tiếng La-tinh khác

Windows 1250, 1252-1254, 1257, ISO8859-x

Courier New

Tiếng Hy Lạp

Windows 1253

Courier New

Tiếng Do Thái

Windows 1255

Courier New

Tiếng Nhật

Shift-JIS, ISO-2022-JP (JIS), EUC-JP

MS Mincho

Tiếng Hàn Quốc

Wansung, Johab, ISO-2022-KR, EUC-KR

Gothic của malgun

Tiếng Thái

Windows 874

Tahoma

Tiếng Việt

Windows 1258

Courier New

Indic: tiếng Tamil

57004 ISCII

Latha

Indic: tiếng Nepal

ISCII 57002 (Devanagari)

Mangal

Indic: tiếng Konkani

ISCII 57002 (Devanagari)

Mangal

Indic: tiếng Hindi

ISCII 57002 (Devanagari)

Mangal

Indic: tiếng Assamese

57006 ISCII

Indic: tiếng Bengali

57003 ISCII

Indic: tiếng Gujarati

57010 ISCII

Indic: tiếng Kannada

57008 ISCII

Indic: tiếng Malayalam

57009 ISCII

Indic: tiếng Oriya

57007 ISCII

Indic: tiếng Marathi

ISCII 57002 (Devanagari)

Indic: tiếng Punjabi

57011 ISCII

Indic: tiếng Phạn

ISCII 57002 (Devanagari)

Indic: tiếng Telugu

57005 ISCII

  • Sử dụng các ngôn ngữ Indic yêu cầu hỗ trợ hệ thống và phông chữ OpenType thích hợp.

Chỉ có hỗ trợ giới hạn sẵn dùng cho Nepal, tiếng Assam, tiếng Bengali, tiếng Gujarati, Malayalam và tiếng Oriya.