通常,你可以共享文本文件,而不必担心如何存储文本的基本详细信息。 但是,在以下情况下打开或保存文件时,可能需要选择编码标准:
-
与使用其他语言工作的人员共享文本文件
-
通过 Internet 下载文本文件
-
与其他计算机系统共享文本文件
编码标准可帮助 Microsoft Word和其他程序确定如何表示文本,使其可读。 在系统软件的语言与创建文本时所使用的语言不同的计算机上,可能需要执行此操作。
若要了解详细信息,可以展开和折叠以下任何主题。
屏幕上显示为文本的内容实际上以数值的形式存储在文本文件中。 计算机将数值转换为可见字符。 它通过使用编码标准来执行此操作。
编码标准是一种编号方案,可将字符集中的每个文本字符分配给数值。 字符集可以包含字母字符、数字和其他符号。 不同的语言通常由不同的字符集组成,因此存在许多不同的编码标准来表示在不同语言中使用的字符集。
'
不同字母表的不同编码标准
随文本文件一起保存的编码标准提供计算机在屏幕上显示文本所需的信息。 例如,在西里尔文 (Windows) 编码中,字符 Й 的数值为 201。 在使用西里尔文 (Windows) 编码的计算机上打开包含此字符的文件时,计算机将读取 201 数值并在屏幕上显示 Й。
但是,如果在使用不同编码的计算机上打开同一个文件,则计算机将显示计算机默认使用的编码标准中与 201 数值对应的任何字符。 例如,如果计算机使用西欧 (Windows) 编码标准,则基于西里尔文的原始文件中的字符将显示为 É 而不是 Й,因为在西欧 (Windows) 编码中,值 201 映射到 É。
'
Unicode:许多字母表的一个编码标准
为了避免在对文本文件进行编码和解码时出现问题,可以使用 Unicode 编码保存文件。 Unicode 适用于当今计算机用户中常用的所有语言中的大多数字符集。
由于Word基于 Unicode,因此Word自动保存编码为 Unicode 的文件。 无论文本的语言如何,都可以在英语计算机系统上打开和读取 Unicode 编码的文件。 同样,使用英语系统保存编码为 Unicode 的文件时,该文件可以包含西欧字母表中未找到的字符,例如希腊语、西里尔文、阿拉伯语或日语字符。
如果打开文件时,文本出现乱码或问号或框,Word可能未准确检测到文件中文本的编码标准。 可以指定可用于显示 (解码) 文本的编码标准。
-
单击“文件”选项卡。
-
单击“选项”。
-
单击“高级”。
-
滚动到“常规”部分,然后选择“打开检查时确认文件格式转换”框。
注意: 选中此检查框时,Word每次打开除Word格式以外的格式的文件时显示“转换文件”对话框, (Word 格式包括 .doc、.dot、.docx、.docm、.dotx 或 .dotm 文件) 。 如果经常使用此类文件,但很少希望选择编码标准,请记得关闭此选项以防止不必要地打开此对话框。
-
关闭然后重新打开该文件。
-
在“ 转换文件 ”对话框中,选择“ 编码文本”。
-
在“ 文件转换 ”对话框中,选择“ 其他编码”,然后从列表中选择所需的编码标准。
可以在“预览”区域中预览文本,以检查所选编码标准中是否可读所有文本。
如果几乎所有文本看起来都相同 (例如,所有框或所有点都) ,则可能不安装显示字符所需的字体。 如果所需的字体不可用,可以安装其他字体。
若要安装其他字体,请执行以下操作:
-
在 Microsoft Windows 中,单击“开始”按钮,然后单击“控制面板”。
-
请执行下列操作之一:
在 Windows 7 中
-
在“控制面板”中,单击“卸载程序”。
-
在程序列表中,根据你是将Word安装为 Office 的一部分还是作为单个程序安装,单击 Microsoft Office 或 Microsoft Word的列表,然后单击“更改”。
在 Windows Vista 中
-
在“控制面板”中,单击“卸载程序”。
-
在程序列表中,根据你是将Word安装为 Office 的一部分还是单个程序,单击 Microsoft Office 或 Microsoft Word的列表,然后单击“更改”。
在 Microsoft Windows XP 中
-
在“控制面板”中,单击“添加或删除程序”。
-
在“当前安装的程序”框中,根据你是将Word安装为 Office 的一部分还是作为单个程序安装,单击 Microsoft Office 或 Microsoft Word列表,然后单击“更改”。
-
-
在 “更改 Microsoft Office 安装”下,单击“ 添加或删除功能”,然后单击“ 继续”。
-
在 “安装选项”下,展开 “Office 共享功能”,然后展开“ 国际支持”。
-
选择所需的字体集,单击所选内容旁边的箭头,然后选择“ 从我的电脑运行”。
提示: 打开编码的文本文件时,Word应用“Web 选项”对话框中定义的字体。 (若要访问“Web 选项”对话框,请单击“Microsoft Office 按钮”,单击“Word选项”,然后单击“高级”。 在“ 常规 ”部分中,单击“ Web Options.) 可以在“Web 选项”对话框中选择“字体”选项卡上的选项来自定义每个字符集的字体。
如果在保存文件时未选择编码标准,Word将该文件编码为 Unicode。 通常,可以使用默认 Unicode 编码,因为它支持大多数语言中的大多数字符。
如果文档将在不支持 Unicode 的程序中打开,则可以选择与目标程序匹配的编码标准。 例如,Unicode 使你能够在英语系统上创建繁体中文文档。 但是,如果文档将在不支持 Unicode 的繁体中文语言程序中打开,则可以使用繁体中文 (Big5) 编码保存文档。 在繁体中文程序中打开文档时,所有文本都正确显示。
注意: 由于 Unicode 是最全面的标准,因此在任何其他编码中保存文本可能会导致某些字符不再显示。 例如,以 Unicode 编码的文档可以包含希伯来语和西里尔文文本。 如果此文档是使用西里尔文 (Windows) 编码保存的,则无法再显示希伯来语文本,并且如果文档是使用希伯来语 (Windows) 编码保存的,则无法再显示西里尔文文本。
如果选择的编码标准不支持在文件中使用的字符,Word红色标记它无法保存的字符。 在保存文件之前,可以预览所选编码标准中的文本。
将文件另存为编码文本时,将从文件中删除采用符号字体或域代码格式的文本。
'
选择编码标准
-
单击“文件”选项卡。
-
单击“另存为”。
如果要将文件保存在其他文件夹中,请找到并打开文件夹。
-
在“文件名”框中,键入文件的新名称。
-
在 “保存类型 ”框中,选择“ 纯文本”。
-
单击“保存”。
-
如果出现“Microsoft Office Word兼容性检查器”对话框,请单击“继续”。
-
在“ 文件转换 ”对话框中,为要使用的编码标准选择选项:
-
若要为系统使用默认编码标准,请单击“ Windows (默认) ”。
-
若要使用 MS-DOS 编码标准,请单击“ MS-DOS”。
-
若要选择特定的编码标准,请单击“ 其他编码”,然后从列表中选择所需的编码标准。 可以在“预览”区域中预览文本,以检查所选编码标准中是否可读所有文本。
注意: 可以调整 “文件转换 ”对话框的大小,以便可以预览更多文档。
-
-
如果收到一条消息,指出“标记为红色的文本不会在所选编码中正确保存”,可以尝试选择其他编码,也可以选择“允许字符替换检查框。
如果允许字符替换,Word会将不能显示的字符替换为所选编码中最接近的等效字符。 例如,三个点替换省略号,直引号替换大括号。
如果选择的编码对于标记为红色的字符没有等效字符,则标记为红色的字符将保存为上下文外字符,例如问号。
-
如果文档将在不会将文本从一行换行到下一行的程序中打开,则可以在文档中加入硬换行符,方法是选中“插入换行符检查”框,然后指定是否希望使用回车符 (CR) 、换行 (LF) 来划分换行符, 或两者,位于“结尾行与”框中。
Word可识别多种编码标准,并支持计算机上系统软件提供的编码标准。
以下编写系统列表显示了与每个编写系统关联的编码标准 (也称为代码页) 。
写入系统 |
编码标准 |
应用的字体 |
---|---|---|
多 语种 |
Unicode (UCS-2 little-endian 和 big-endian、UTF-8、UTF-7) |
基于语言版本的“普通”样式的默认字体Word |
阿拉伯语 |
Windows 1256、ASMO 708 |
Courier New |
简体中文 |
GB2312、GBK、EUC-CN、ISO-2022-CN、HZ |
新宋体 |
繁体中文 |
BIG5、EUC-TW、ISO-2022-TW |
明柳 |
西里尔 |
Windows 1251、KOI8-R、KOI8-RU、ISO8859-5、DOS 866 |
Courier New |
英语、西欧或其他拉丁语脚本 |
Windows 1250、1252-1254、1257、ISO8859-x |
Courier New |
希腊语 |
Windows 1253 |
Courier New |
希伯来语 |
Windows 1255 |
Courier New |
日语 |
Shift-JIS、ISO-2022-JP (JIS) 、EUC-JP |
MS Mincho |
朝鲜语 |
Wansung,Johab,ISO-2022-KR,EUC-KR |
马尔贡哥特式 |
泰语 |
Windows 874 |
Tahoma |
越南语 |
Windows 1258 |
Courier New |
指数:泰米尔语 |
ISCII 57004 |
Latha |
索引:尼泊尔语 |
ISCII 57002 (Devanagari) |
Mangal |
索引:康卡尼 |
ISCII 57002 (Devanagari) |
Mangal |
索引:印地语 |
ISCII 57002 (Devanagari) |
Mangal |
索引:阿萨姆语 |
ISCII 57006 |
|
索引:孟加拉语 |
ISCII 57003 |
|
索引:古吉拉特语 |
ISCII 57010 |
|
索引:卡纳达 |
ISCII 57008 |
|
索引:马拉雅拉姆语 |
ISCII 57009 |
|
索引:奥里亚 |
ISCII 57007 |
|
索引:马拉地语 |
ISCII 57002 (Devanagari) |
|
索引:旁遮普语 |
ISCII 57011 |
|
索引:梵文 |
ISCII 57002 (Devanagari) |
|
索引:泰卢固语 |
ISCII 57005 |
-
使用索引语言需要系统支持和适当的 OpenType 字体。
-
只有尼泊尔语、阿萨姆语、孟加拉语、古吉拉特语、马拉雅拉姆语和奥里亚语提供有限的支持。