INFO: Internet Explorer siempre envía datos Unicode como UTF-8

Exención de responsabilidades de contenido KB retirado

Este artículo se refiere a productos para los que Microsoft ya no ofrece soporte técnico. Por tanto, el presente artículo se ofrece "tal cual" y no será actualizado.

Resumen

Para páginas de Unicode DHTML, Internet Explorer siempre los mensajes en UTF-8 formato de datos Unicode, independientemente de la codificación Unicode específica utilizada.

Más información

Cuando se trabaja con conjuntos de caracteres y de globalización, es importante distinguir entre conjuntos de caracteres y codificaciones del juego de caracteres. Un juego de caracteres es una asignación de valores numéricos a caracteres de un repertorio de caracteres. Un conjunto de caracteres es una representación de bit específico de los valores enteros en el conjunto de caracteres. Unicode es un juego con varias codificaciones diferentes, incluyendo UCS-2, UTF-16, UTF-7 y UTF-8 de caracteres de 16 bits. Los desarrolladores Web normalmente especifican la codificación de la página (y por lo tanto, en consecuencia, el juego de caracteres) utilizando el valor de charset META, como sigue:

<META Name="Content-Type" Value="text/html;charset=utf-16">
Normalmente, Internet Explorer codifica los datos POST según la codificación de página. Si escribes una página japonés que utiliza el japonés Shift-JIS codificación de caracteres, Internet Explorer envía los datos POST Shift-JIS. Si la página utiliza el juego de caracteres Unicode, sin embargo, que codifica la presentación como UTF-8, aunque la codificación utilizada es, por ejemplo, UTF-16. Esto es debido a que muchos servidores Web (incluido IIS) no pueden procesar a los suplentes UTF-16, que son extensiones Unicode especiales que permiten usar 32 bits para tratar un carácter en vez de la habitual 16.

Tenga en cuenta que esta regla se aplica independientemente de si el formulario utiliza ENCTYPE de application/x--www-form-urlencoded o multipart/form-data.

A partir de la redacción de este artículo, el formato de las transmisiones de Unicode POST actualmente no obedece a ningún estándar; Sin embargo, borradores de trabajo por el World Wide Web Consortium (W3C) indican un avance hacia UTF-8 como codificación Unicode estándar para la Web. Los desarrolladores deben usar UTF-8 para todos los datos de Unicode que envía a y recibe desde el explorador.

Los desarrolladores que también están usando SQL Server tenga que utilizar una de las soluciones que se sugieren en el siguiente artículo de Knowledge Base para almacenar datos de UTF-8 en los campos de Unicode UCS-2 de SQL Server:

232580 INF: almacenar UTF-8 en SQL Server

Referencias

Para obtener más información sobre el W3C, consulte el siguiente sitio Web:
World Wide Web Consortium
http://www.w3.org


Codificaciones de conjunto de caracteres de Unicode se definen en detalle en el estándar Unicode, que está disponible desde el siguiente sitio Web:
Para obtener información sobre los conjuntos de caracteres en Internet Explorer, consulte el siguiente sitio Web de Microsoft Developer Network (MSDN):

Reconocimiento del juego de caracteres
http://msdn2.microsoft.com/en-us/library/Aa752010.aspx
WebCast de soporte técnico: Globalización en Internet Explorer
http://support.microsoft.com/servicedesks/webcasts/wc050400/wcblurb050400.asp
Para obtener más información acerca de cómo desarrollar soluciones basadas en Web para Microsoft Internet Explorer, visite los siguientes sitios Web de Microsoft:
Propiedades

Id. de artículo: 303612 - Última revisión: 22 ene. 2017 - Revisión: 1

Comentarios