Bạn hiện đang ngoại tuyến, hãy chờ internet để kết nối lại

Mô tả về lưu trữ dữ liệu UTF-8 trong SQL Server

QUAN TRỌNG: Bài viết này được dịch bằng phần mềm dịch máy của Microsoft chứ không phải do con người dịch. Microsoft cung cấp các bài viết do con người dịch và cả các bài viết do máy dịch để bạn có thể truy cập vào tất cả các bài viết trong Cơ sở Kiến thức của chúng tôi bằng ngôn ngữ của bạn. Tuy nhiên, bài viết do máy dịch không phải lúc nào cũng hoàn hảo. Loại bài viết này có thể chứa các sai sót về từ vựng, cú pháp hoặc ngữ pháp, giống như một người nước ngoài có thể mắc sai sót khi nói ngôn ngữ của bạn. Microsoft không chịu trách nhiệm về bất kỳ sự thiếu chính xác, sai sót hoặc thiệt hại nào do việc dịch sai nội dung hoặc do hoạt động sử dụng của khách hàng gây ra. Microsoft cũng thường xuyên cập nhật phần mềm dịch máy này.

Nhấp chuột vào đây để xem bản tiếng Anh của bài viết này:232580
TÓM TẮT
Một số ứng dụng (đặc biệt là những được dựa trên Web) phải đối phó với Unicode dữ liệu được mã hóa với các phương pháp mã hóa UTF-8. SQL Server 7.0 và SQL Server 2000 sử dụng một khác nhau Unicode encoding (UCS-2) và không công nhận UTF-8 như dữ liệu nhân vật hợp lệ. Bài viết này thảo luận về một số tùy chọn để đối phó với tình trạng này.
THÔNG TIN THÊM
Unicode dữ liệu có thể được mã hóa trong nhiều cách khác nhau. UTF-8 và UCS-2 có hai cách phổ biến để lưu trữ các mô hình bit mà đại diện cho ký tự Unicode. Microsoft Windows NT, SQL Server, Java, COM, và trình điều khiển SQL Server ODBC và OLEDB nhà cung cấp tất cả các bên trong đại diện cho Unicode dữ liệu như UCS-2.

Các tùy chọn để sử dụng SQL Server 7.0 hoặc SQL Server 2000 như một máy chủ phụ trợ cho một ứng dụng gửi và nhận dữ liệu Unicode được mã hóa như UTF-8 bao gồm:
 1. Nếu ứng dụng của bạn sử dụng Active Server Pages (ASP) và bạn đang sử dụng Internet Information Server (IIS) 5.0 và Microsoft Windows 2000, bạn có thể thêm "< % Session.Codepage=65001% >" script ASP phía máy chủ của bạn. Điều này chỉ thị IIS để chuyển đổi tất cả các tạo động dây (ví dụ: Response.Write) từ UCS-2 để UTF-8 tự động trước khi gửi chúng cho khách hàng.

  Nếu bạn không muốn để kích hoạt phiên, bạn có thể hoặc sử dụng chỉ thị phía máy chủ "< % @ CodePage = 65001% >".

  Bất kỳ dữ liệu UTF-8 được gửi từ các khách hàng đến máy chủ thông qua GET hoặc POST cũng chuyển đổi sang UCS-2 tự động. Bất động sản Session.Codepage là phương pháp được đề nghị để xử lý dữ liệu UTF-8 trong một ứng dụng web. Thiết đặt Codepage này không phải là có sẵn trên IIS 4.0 và Windows NT 4.0. Để biết thêm chi tiết, xem bài viết sau trong cơ sở kiến thức Microsoft:
  254313 Thông báo lỗi: Hoạt động các trang lỗi hệ phục vụ 'ASP 0203' mã không hợp lệ
 2. Dịch đến và đi từ UCS-2 hoặc UTF-8 là thích hợp trong các ứng dụng. Mã mẫu cho các loại chuyển đổi được đặt tại Unicode Consortium trang web:

  Một mô tả ở cấp độ cao của các thuật toán để chuyển đổi UCS-2 để UTF-8 có thể được tìm thấy trong tài liệu Internet yêu cầu cho ý kiến RFC2279.

  Trên Windows NT hoặc Windows 2000, bạn có thể sử dụng chức năng Win32 MultiByteToWideCharWideCharToMultiByte để chuyển đổi UTF-8 đến và đi từ UCS-2 bằng cách đi qua CP_UTF8 liên tục (65001) như tham số đầu tiên để các chức năng.
 3. Sửa đổi ứng dụng sử dụng UCS-2 thay vì UTF-8 mã hóa.
 4. Lưu trữ dữ liệu UTF-8 thực tế trên máy chủ bằng cách sử dụng các cột BINARY/VARBINARY/hình ảnh. Lưu trữ dữ liệu UTF-8 ngày SQL Server có nghĩa rằng bạn không thể sử dụng SQL Server để sắp xếp hoặc tìm thấy phạm vi của các giá trị này như nếu dữ liệu là dữ liệu nhân vật hợp lệ. Các loại hoạt động kinh doanh trên cột có chứa dữ liệu UTF-8 sẽ không trở về kết quả dự kiến sẽ bao gồm "Tự do", lớn hơn-hơn ">" và ít hơn-hơn "<" comparisons,="" and="" the="" built-in="" sql="" server="" string="" manipulation="" functions="" such="" as=""></">

  Tuy nhiên, bình đẳng so sánh, sẽ làm việc miễn là các dây đang được so sánh tương đương ở mức byte. Lưu ý rằng nếu bạn lưu trữ dữ liệu UTF-8 trong SQL Server bạn không nên sử dụng ký tự cột (CHAR/NCHAR/VARCHAR và vv). UTF-8 không phải là nhân vật hợp lệ dữ liệu phục vụ SQL, và bằng cách lưu trữ dữ liệu không ký tự trong cột nhân vật bạn có nguy cơ gặp phải những vấn đề như các vấn đề thảo luận trong bài viết cơ sở kiến thức Microsoft sau:
  155723 INF: SQL Server Truncation của một chuỗi DBCS
  234748 PRB: Điều khiển ODBC SQL Server chuyển đổi các sự kiện ngôn ngữ để Unicode
  Nếu bạn đang xem xét tùy chọn này, hãy nhớ rằng nếu bạn đã bao giờ cần để truy cập dữ liệu UTF-8 được lưu giữ trong SQL Server từ bất kỳ ứng dụng khác với một trình duyệt Web (ví dụ, từ một phi-Web dựa trên ODBC đơn) cần thiết để làm một chuyển đổi từ UTF-8 UCS-2 trong ứng dụng này như ODBC, OLEDB, COM, các cuộc gọi Win32 API, VB, và c runtime chuỗi thao tác chức năng không làm việc với dữ liệu UTF-8. Điều này di chuyển gánh nặng của bản dịch sang một ứng dụng khác nhau.
 5. Nếu yêu cầu của bạn không bao gồm sự cần thiết để lưu trữ dữ liệu từ một sự kết hợp của ngôn ngữ mà không thể được hài lòng bởi một trang duy nhất mã, bạn có thể không cần phải sử dụng Unicode.
Hỗ trợ Unicode được giới thiệu với SQL Server bắt đầu với SQL Server 7.0. Kể từ khi SQL Server 6,5 không hỗ trợ lưu trữ dữ liệu Unicode, các lựa chọn duy nhất cho SQL Server 6,5 được nêu trong bước 4 và bước 5.
UTF-16 UTF16 quốc tế UTF8 UCS2

Cảnh báo: Bài viết này được dịch tự động

Thuộc tính

ID Bài viết: 232580 - Xem lại Lần cuối: 08/21/2011 11:53:00 - Bản sửa đổi: 2.0

Microsoft SQL Server 2000 Standard Edition, Microsoft SQL Server 6.5 Standard Edition, Microsoft SQL Server 7.0 Standard Edition, Microsoft SQL Server 2005 Standard Edition, Microsoft SQL Server 2005 Express Edition, Microsoft SQL Server 2005 Developer Edition, Microsoft SQL Server 2005 Enterprise Edition, Microsoft SQL Server 2005 Workgroup Edition

 • kbinfo kbmt KB232580 KbMtvi
Phản hồi