在打开和保存文件时选择文本编码

通常,可以共享文本文件,而无需担心如何存储文本的基础详细信息。 但是,如果与使用其他语言的人共享文本文件、通过 Internet 下载文本文件或与其他计算机系统共享文本文件,可能需要在打开或保存文件时选择编码标准。

当你或其他人在 Microsoft Word 或其他程序中打开文本文件时(也许在具有系统软件的计算机上,其语言不同于用于创建该文件的语言)时,编码标准可帮助该程序确定如何表示文本,以便其可读。

您要做什么?

了解文本编码

在屏幕上显示为文本的内容实际上以数值形式存储在文本文件中。 计算机将数字值转换为可见字符。 它通过使用编码标准来这样做。

编码标准是一种编号方案,用于将字符集的每个文本字符分配到数值。 字符集可以包含字母字符、数字和其他符号。 不同的语言通常由不同的字符集组成,因此存在许多不同的编码标准来表示不同语言中使用的字符集。

不同字母表的不同编码标准

与文本文件一起保存的编码标准提供计算机在屏幕上显示文本所需的信息。 例如,在 Windows (编码) 西里尔文Й数字值 201。 在使用西里尔文 (Windows) 编码的计算机上打开包含此字符的文件时,计算机将读取 201 数字值,并在屏幕上Й数字。

但是,如果在使用不同编码的计算机上打开同一文件,计算机会显示与计算机默认使用的编码标准中的 201 数字值相对应的任何字符。 例如,如果计算机使用西欧 (Windows) 编码标准,则原始西里尔文文件中的字符将显示为 É 而不是 Й,因为在西欧 (Windows) 编码中,值 201 映射到 É。

Unicode:许多字母表的一个编码标准

为了避免对文本文件进行编码和解码时出现问题,可以使用 Unicode 编码保存文件。 Unicode 适用于计算机用户目前常用的所有语言中的大多数字符集。

由于 Word 基于 Unicode,Word 会自动保存编码为 Unicode 的文件。 无论文本的语言如何,都可以在英语计算机系统上打开和读取 Unicode 编码的文件。 同样,使用英语系统保存编码为 Unicode 的文件时,该文件可以包含西欧字母表中找不到的字符,例如希腊语、西里尔文、阿拉伯语或日语字符。

返回页首

打开文件时选择编码标准

如果打开文件时,文本出现乱码或问号或框,Word 可能未准确检测到文件中文本的编码标准。 可以指定编码标准,可用于在文本 (解码) 编码。

  1. 单击“文件”选项卡。

  2. 单击“选项”

  3. 单击“高级”。

  4. 滚动到" 常规" 部分,然后选中"打开 时确认文件格式转换 "复选框。

    注意: 选中此复选框后,每次以 Word格式打开文件时,Word 都会显示"转换文件"对话框 (Word 格式包括 .doc、.dot、.docx、.docm、.dotx 或 .dotm) 。 如果经常处理此类文件,但很少想要选择编码标准,请记得关闭此选项以防止不必要地打开此对话框。

  5. 关闭文件,然后重新打开该文件。

  6. 在"转换文件"对话框中,选择"编码文本"。

  7. 在"文件转换"对话框中,选择"其他编码",然后从列表中选择想要的编码标准。

    可以预览"预览"区域中的文本,检查所有文本是否采用所选编码标准可读。

如果几乎所有文本看起来都 (例如,所有框或所有圆点) ,则可能不会安装显示字符所需的字体。 如果所需的字体不可用,可以安装其他字体。

若要安装其他字体,请执行下列操作:

  1. 在 Microsoft Windows 中,单击“开始”按钮,然后单击“控制面板”

  2. 执行下列操作之一:

    在 Windows 7 中

    1. 在"控制面板"中,单击"卸载程序"。

    2. 在程序列表中,单击 Microsoft Office 或 Microsoft Word 的列表,具体取决于你是作为 Office 的一部分还是作为单个程序安装了 Word,然后单击"更改"。

    在 Windows Vista 中

    1. 在"控制面板"中,单击"卸载程序"。

    2. 在程序列表中,单击 Microsoft Office 或 Microsoft Word 的列表,具体取决于你是作为 Office 的一部分还是作为单个程序安装了 Word,然后单击"更改"。

    在 Microsoft Windows XP 中

    1. 在"控制面板"中,单击"添加或删除程序"。

    2. 在"当前安装的程序"框中,单击 Microsoft Office 或 Microsoft Word 的一览,具体取决于你是作为 Office 的一部分还是作为单个程序安装了 Word,然后单击"更改"。

  3. "更改安装Microsoft Office,单击"添加或删除功能",然后单击"继续"。

  4. "安装选项"下,展开"Office 共享功能",然后展开"国际支持"。

  5. 选择所需的字体集,单击所选内容旁边的箭头,然后选择"从我的计算机运行"。

提示: 打开编码的文本文件时,Word 将应用在"Web 选项"对话框中 定义的 字体。 (到达"Web 选项"对话框,请单击"Microsoft Office按钮",单击"Word 选项",然后单击"高级"。 在" 常规" 部分中,单击 "Web 选项") 可以在"Web 选项"对话框中的"字体"选项卡上选择选项,以自定义每个字符集的字体。

返回页首

保存文件时选择编码标准

如果在保存文件时未选择编码标准,Word 将文件编码为 Unicode。 通常,可以使用默认的 Unicode 编码,因为它支持大多数语言中的大多数字符。

如果文档将在不支持 Unicode 的程序中打开,可以选择与目标程序的编码标准相匹配的编码标准。 例如,Unicode 使你能够在英语系统中创建繁体中文文档。 但是,如果文档将在不支持 Unicode 的繁体中文程序中打开,可以使用繁体中文 (Big5) 文档。 使用繁体中文程序打开文档时,所有文本都正确显示。

注意: 由于 Unicode 是最全面的标准,因此在任何其他编码中保存文本可能会导致某些字符不再显示。 例如,用 Unicode 编码的文档可以包含希伯来语和西里尔文文本。 如果本文档是使用西里尔文 (Windows) 编码保存的,则不再显示希伯来语文本;如果文档是使用希伯来语 (Windows) 编码保存的,则无法再显示西里尔文文本。

如果选择的编码标准不支持文件中使用的字符,Word 会用红色标记无法保存的字符。 可以在保存文件之前以选择的编码标准预览文本。

将文件另存为编码文本时,将从文件中删除"符号"字体或域代码格式的文本。

选择编码标准

  1. 单击“文件”选项卡。

  2. 单击“另存为”

    如果要将文件保存在其他文件夹中,请找到并打开该文件夹。

  3. 在“文件名”框中,键入文件的新名称。

  4. 在"保存类型"框中,选择"纯文本"。

  5. 单击“保存”

  6. 如果"Microsoft Office兼容性检查器"对话框出现,请单击"继续"。

  7. "文件转换 "对话框中,选择想要使用的编码标准选项:

    • 若要为系统使用默认编码标准,请单击"Windows (默认) "。

    • 若要使用 MS-DOS 编码标准,请单击"MS-DOS"。

    • 若要选择特定的编码标准,请单击"其他编码",然后从列表中选择想要的编码标准。 可以预览"预览"区域中的文本,检查所有文本是否采用所选编码标准可读。

      注意: 可以调整" 文件转换" 对话框的大小,以便预览更多文档。

  8. 如果收到一条消息,指出"标记为红色的文本在所选编码中无法正确保存",可以尝试选择其他编码,也可以选中"允许替换 字符"复选框

    如果允许字符替换,Word 将替换在选择的编码中无法使用最接近的等效字符显示的字符。 例如,三个点替换省略号,直引号替换引号。

    如果选择的编码没有标记为红色字符的等效字符,则标记为红色的字符将保存为上下文外字符,如问号。

  9. 如果文档将在不将文本从一行换行到下一行的程序中打开,可以通过选中"插入换行符"复选框,然后指定是否希望换行符用回车符 (CR) 、换行符 (LF) 或两者在"带结束行"框中进行绘制。

返回页首

查找 Word 中可用的编码标准

Word 可识别多种编码标准,并支持计算机上系统软件提供的编码标准。

以下写入系统列表显示了编码标准 (也称为与每个编写) 关联的代码页。

写入系统

编码标准

已应用的字体

多语言

Unicode (UCS-2 little-endian 和 big-endian、UTF-8、UTF-7)

基于 Word 语言版本的"普通"样式的默认字体

阿拉伯语

Windows 1256、ASMO 708

Courier New

简体中文

GB2312、GBK、EUC-CN、ISO-2022-CN、HZ

新宋体

繁体中文

BIG5、EUC-TW、ISO-2022-TW

MingLiU

西里尔文

Windows 1251、KOI8-R、KOI8-RU、ISO8859-5、DOS 866

Courier New

英语、西欧或其他拉丁语脚本

Windows 1250、1252-1254、1257、ISO8859-x

Courier New

希腊语

Windows 1253

Courier New

希伯来语

Windows 1255

Courier New

日语

Shift-JIS、ISO-2022-JP (JIS) EUC-JP

MS Mincho

朝鲜语

Wansung、Johab、ISO-2022-KR、EUC-KR

Malgun Gothic

泰语

Windows 874

Tahoma

越南语

Windows 1258

Courier New

印度语:泰米尔语

ISCII 57004

Latha

印度语:尼泊尔语

ISCII 57002 (Devanagari)

Mangal

印度语:Konkani

ISCII 57002 (Devanagari)

Mangal

印度语:印地语

ISCII 57002 (Devanagari)

Mangal

印度语:阿萨马语

ISCII 57006

印度语:孟加拉语

ISCII 57003

印度语:古吉拉特语

ISCII 57010

印度语:卡纳达语

ISCII 57008

印度语:马拉雅拉姆语

ISCII 57009

印度语:奥里雅语

ISCII 57007

印度语:马拉地语

ISCII 57002 (Devanagari)

印度语:旁遮普语

ISCII 57011

印度语:梵文

ISCII 57002 (Devanagari)

印度语:泰卢固语

ISCII 57005

  • 使用印度语需要系统支持和相应的 OpenType 字体。

  • 仅对尼泊尔语、阿萨马语、孟加拉语、古吉拉特语、马拉雅拉姆语和奥里雅语提供有限支持。

返回页首

需要更多帮助?

扩展你的 Office 技能
了解培训
抢先获得新功能
加入 Office 预览体验计划

此信息是否有帮助?

谢谢您的反馈!

谢谢你的反馈! 可能需要转接到 Office 支持专员。

×