Bỏ qua để tới nội dung chính
Đăng nhập với Microsoft
Đăng nhập hoặc tạo một tài khoản.
Xin chào,
Chọn một tài khoản khác.
Bạn có nhiều tài khoản
Chọn tài khoản bạn muốn đăng nhập.

Bạn có thể đã nghe nói về Ngôn ngữ Đánh dấu Mở rộng (XML) và bạn có thể đã nghe thấy nhiều lý do tại sao tổ chức của bạn nên sử dụng ngôn ngữ đó. Nhưng XML là gì, chính xác là gì? Bài viết này giải thích những điều cơ bản về XML — xml là gì và cách hoạt động.

Trong bài viết này

Xem nhanh đánh dấu, đánh dấu và thẻ

Để hiểu XML, sẽ giúp hiểu ý tưởng đánh dấu dữ liệu. Con người đã tạo ra các tài liệu trong nhiều thế kỷ, và chỉ trong bao lâu họ đã đánh dấu những tài liệu đó. Ví dụ: giáo viên trường học luôn đánh dấu giấy tờ của học viên. Họ yêu cầu học viên di chuyển đoạn văn, làm rõ câu, sửa lỗi chính tả, v.v. Đánh dấu một tài liệu là cách chúng tôi xác định cấu trúc, ý nghĩa và hình thức trực quan của thông tin trong tài liệu. Nếu bạn đã từng sử dụng tính năng Theo dõi Thay đổi trong Microsoft Office Word, bạn đã sử dụng một biểu mẫu đánh dấu được máy tính hóa.

Trong máy tính, "đánh dấu" cũng đã phát triển thành "đánh dấu". Đánh dấu là quy trình sử dụng các mã được gọi là thẻ (hoặc đôi khi là mã thông báo) để xác định cấu trúc, hình thức trực quan và — trong trường hợp XML — ý nghĩa của bất kỳ dữ liệu nào.

Mã HTML cho bài viết này là một ví dụ tốt về máy tính đánh dấu tại nơi làm việc. Nếu bạn duyệt qua trang đó (trong Microsoft Internet Explorer, bấm chuột phải vào trang, rồi bấm Xem Nguồn), bạn sẽ thấy kết hợp các thẻ văn bản có thể đọc được và Ngôn ngữ Đánh dấu Siêu văn bản (HTML), chẳng hạn như <p><h2>. Thẻ trong tài liệu HTML và XML rất dễ nhận ra vì chúng được đặt trong dấu ngoặc vuông góc. Trong mã nguồn cho bài viết này, các thẻ HTML làm nhiều công việc, chẳng hạn như xác định đầu và kết thúc của mỗi đoạn văn (<p> ... </p>) và đánh dấu vị trí của mỗi hình ảnh.

Vì vậy, những gì làm cho nó XML?

Tài liệu HTML và XML chứa dữ liệu được đặt trong thẻ, nhưng đó là nơi kết thúc sự giống nhau giữa hai ngôn ngữ. Trong HTML, các thẻ xác định giao diện dữ liệu của bạn — tiêu đề đến đây, đoạn văn bắt đầu ở đó, v.v. Trong XML, các thẻ xác định cấu trúc và ý nghĩa của dữ liệu của bạn — dữ liệu là gì.

Khi mô tả cấu trúc và ý nghĩa của dữ liệu, bạn có thể tái sử dụng dữ liệu đó theo bất kỳ số lượng nào. Ví dụ, nếu bạn có một khối dữ liệu bán hàng và mỗi mục trong khối được xác định rõ ràng, bạn có thể chỉ tải các mục mà bạn cần vào báo cáo doanh số bán hàng và tải các mục khác vào cơ sở dữ liệu kế toán. Đặt một cách khác, bạn có thể sử dụng một hệ thống để tạo dữ liệu của bạn và đánh dấu nó bằng thẻ XML, sau đó xử lý dữ liệu đó trong bất kỳ số lượng hệ thống nào khác, bất kể nền tảng phần cứng hoặc hệ điều hành. Đó là lý do tại sao XML đã trở thành một trong những công nghệ phổ biến nhất để trao đổi dữ liệu.

Hãy nhớ những điều này khi bạn tiếp tục:

  • Bạn không thể sử dụng HTML thay cho XML. Tuy nhiên, bạn có thể ngắt dòng dữ liệu XML của mình trong thẻ HTML và hiển thị nó trong một trang Web.

  • HTML được giới hạn trong một tập hợp thẻ được xác định trước mà tất cả người dùng chia sẻ.

  • XML cho phép bạn tạo bất kỳ thẻ nào mà bạn cần để mô tả dữ liệu của mình và cấu trúc của dữ liệu đó. Ví dụ: giả sử bạn cần lưu trữ và chia sẻ thông tin về vật nuôi. Bạn có thể tạo mã XML sau đây:

    <?xml version="1.0"?>
    <CAT>
      <NAME>Izzy</NAME>
      <BREED>Siamese</BREED>
      <AGE>6</AGE>
      <ALTERED>yes</ALTERED>
      <DECLAWED>no</DECLAWED>
      <LICENSE>Izz138bod</LICENSE>
      <OWNER>Colin Wilcox</OWNER>
    </CAT>
    

Bạn có thể thấy rằng các thẻ XML giúp bạn có thể biết chính xác loại dữ liệu mà bạn đang xem. Ví dụ: bạn biết đây là dữ liệu về một con mèo và bạn có thể dễ dàng tìm thấy tên, tuổi của con mèo, v.v. Khả năng tạo thẻ xác định hầu như mọi cấu trúc dữ liệu là điều làm cho XML "có thể mở rộng".

Nhưng đừng nhầm lẫn thẻ trong mẫu mã đó với thẻ trong tệp HTML. Ví dụ, nếu bạn dán cấu trúc XML đó vào một tệp HTML và xem tệp trong trình duyệt của bạn, kết quả sẽ trông như thế này:

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

Trình duyệt bỏ qua thẻ XML của bạn và chỉ hiển thị dữ liệu.

Một từ về dữ liệu được hình thành tốt

Bạn có thể nghe thấy ai đó từ bộ phận CNTT của bạn đề cập đến XML "được hình thành tốt". Tệp XML được hình thành tốt phù hợp với một tập hợp các quy tắc rất nghiêm ngặt chi phối XML. Nếu tệp không phù hợp với các quy tắc đó, XML sẽ ngừng hoạt động. Ví dụ: trong mẫu mã trước, mỗi thẻ mở đều có thẻ đóng, vì vậy mẫu tuân theo một trong các quy tắc để được hình thành tốt. Nếu bạn loại bỏ thẻ và tìm cách mở tệp đó ở một trong các chương trình Office, bạn sẽ thấy thông báo lỗi và chương trình sẽ ngăn bạn sử dụng tệp.

Bạn không nhất thiết phải biết các quy tắc để tạo XML được hình thành tốt (mặc dù chúng rất dễ hiểu), nhưng bạn cần nhớ rằng bạn có thể chia sẻ dữ liệu XML giữa các chương trình và hệ thống chỉ khi dữ liệu đó được hình thành tốt. Nếu bạn không thể mở tệp XML, có thể tệp đó chưa được định dạng đúng.

XML cũng độc lập với nền tảng, nghĩa là bất kỳ chương trình nào được xây dựng để sử dụng XML đều có thể đọc và xử lý dữ liệu XML của bạn, bất kể phần cứng hoặc hệ điều hành. Ví dụ, với các thẻ XML phù hợp, bạn có thể dùng một chương trình trên máy tính để mở và làm việc với dữ liệu từ máy tính bảng chính. Và, bất kể ai tạo nội dung dữ liệu XML, bạn có thể làm việc với cùng một dữ liệu trong một số chương trình Office. Vì nó rất di động, XML đã trở thành một trong những công nghệ phổ biến nhất để trao đổi dữ liệu giữa các cơ sở dữ liệu và máy tính người dùng.

XML được triển khai cho các ứng dụng tiêu thụ

Ngoài dữ liệu được gắn thẻ, được hình thành tốt, các hệ thống XML thường sử dụng hai thành phần bổ sung: sơ đồ và chuyển đổi. Các mục sau đây giải thích cách thức hoạt động của những cấu phần bổ sung này.

Xem nhanh sơ đồ

Đừng để thuật ngữ "sơ đồ" làm bạn sợ. Sơ đồ chỉ là một tệp XML chứa các quy tắc cho những gì có thể và không thể nằm trong tệp dữ liệu XML. Tệp sơ đồ thường sử dụng phần mở rộng tên tệp .xsd, trong khi tệp dữ liệu XML sử dụng phần mở .xml mở rộng.

Sơ đồ cho phép các chương trình xác thực dữ liệu. Họ cung cấp khuôn khổ cho việc cấu trúc dữ liệu và đảm bảo rằng nó có ý nghĩa cho người tạo và bất kỳ người dùng nào khác. Ví dụ: nếu người dùng nhập dữ liệu không hợp lệ, chẳng hạn như văn bản vào trường ngày, chương trình có thể nhắc người dùng nhập dữ liệu chính xác. Miễn là dữ liệu trong tệp XML phù hợp với các quy tắc trong sơ đồ nhất định, bất kỳ chương trình nào hỗ trợ XML đều có thể sử dụng sơ đồ đó để đọc, diễn giải và xử lý dữ liệu. Ví dụ: như minh họa dưới đây, Excel có thể xác thực dữ <CAT> dữ liệu dựa trên sơ đồ CAT.

Sơ đồ cho phép các ứng dụng chia sẻ dữ liệu XML.

Sơ đồ có thể trở nên phức tạp và việc hướng dẫn bạn cách tạo sơ đồ nằm ngoài phạm vi bài viết này. (Bên cạnh đó, bạn có thể có bộ phận CNTT biết cách thực hiện.) Tuy nhiên, nó sẽ giúp biết những gì sơ đồ trông như thế nào. Sơ đồ sau đây xác định các quy tắc cho <CAT> ... </CAT> tập thẻ.

<xsd:element name="CAT">  
  <xsd:complexType>  
    <xsd:sequence>
      <xsd:element name="NAME" type="xsd:string"/>
      <xsd:element name="BREED" type="xsd:string"/>
      <xsd:element name="AGE" type="xsd:positiveInteger"/>
      <xsd:element name="ALTERED" type="xsd:boolean"/>
      <xsd:element name="DECLAWED" type="xsd:boolean"/>
      <xsd:element name="LICENSE" type="xsd:string"/>
      <xsd:element name="OWNER" type="xsd:string"/>        
    </xsd:sequence>
  </xsd:complexType>
</xsd:element>

Đừng lo lắng về việc tìm hiểu mọi thứ trong mẫu. Chỉ cần ghi nhớ những dữ kiện này:

  • Các mục dòng trong sơ đồ mẫu được gọi là khai báo. Nếu bạn cần thêm thông tin về một con vật, chẳng hạn như màu sắc hoặc dấu hiệu của động vật, có khả năng bộ phận CNTT của bạn sẽ thêm một khai báo vào sơ đồ. Bạn có thể thay đổi hệ thống XML khi nhu cầu kinh doanh của bạn phát triển.

  • Khai báo cung cấp một lượng lớn kiểm soát đối với cấu trúc dữ liệu. Ví dụ: khai báo <xsd:sequence> nghĩa là các thẻ, chẳng hạn như <NAME><BREED> , phải xuất hiện theo thứ tự được liệt kê ở trên. Khai báo cũng có thể kiểm soát các loại dữ liệu mà người dùng có thể nhập. Ví dụ: sơ đồ ở trên yêu cầu số dương cho tuổi của con mèo và các giá trị Boolean (TRUE hoặc FALSE) cho thẻ ALTERED và DECLAWED.

  • Khi dữ liệu trong tệp XML phù hợp với các quy tắc do sơ đồ cung cấp, thì dữ liệu đó được cho là hợp lệ. Quy trình kiểm tra tệp dữ liệu XML dựa trên sơ đồ được gọi là xác thực (đủ lô-gic). Lợi thế lớn của việc sử dụng sơ đồ là chúng có thể giúp ngăn chặn dữ liệu bị hỏng. Chúng cũng giúp bạn dễ dàng tìm thấy dữ liệu bị hỏng vì XML dừng khi gặp phải sự cố.

Xem nhanh các biến đổi

Như chúng tôi đã đề cập trước đó, XML cũng cung cấp các cách mạnh mẽ để sử dụng hoặc tái sử dụng dữ liệu. Cơ chế sử dụng lại dữ liệu được gọi là Chuyển đổi Ngôn ngữ Biểu phong cách Mở rộng (XSLT) hay đơn giản là chuyển đổi.

Bạn (ok, bộ phận CNTT của bạn) cũng có thể sử dụng các biến đổi để trao đổi dữ liệu giữa các hệ thống phía sau, chẳng hạn như cơ sở dữ liệu. Ví dụ: giả sử Cơ sở dữ liệu A lưu trữ dữ liệu doanh số trong cấu trúc bảng phù hợp với bộ phận bán hàng. Cơ sở dữ liệu B lưu trữ dữ liệu doanh thu và chi phí trong cấu trúc bảng phù hợp với bộ phận kế toán. Cơ sở dữ liệu B có thể sử dụng chuyển đổi để chấp nhận dữ liệu từ A và ghi dữ liệu đó vào đúng bảng.

Sự kết hợp giữa tệp dữ liệu, sơ đồ và chuyển đổi tạo thành một hệ thống XML cơ bản. Minh họa sau đây cho thấy các hệ thống như vậy thường hoạt động như thế nào. Tệp dữ liệu được xác thực dựa trên sơ đồ và sau đó được kết xuất theo bất kỳ số lượng cách nào có thể sử dụng bằng cách chuyển đổi. Trong trường hợp này, chuyển đổi sẽ triển khai dữ liệu vào bảng trong trang Web.

Một cấu trúc tệp XML cơ bản với một sơ đồ và phần chuyển đổi.

Mẫu mã sau đây cho thấy một cách để viết chuyển đổi. Nó sẽ tải dữ <CAT> dữ liệu vào bảng trên trang Web. Một lần nữa, điểm của mẫu không phải là chỉ cho bạn cách viết chuyển đổi mà là chỉ cho bạn một biểu mẫu mà chuyển đổi có thể thực hiện.

<?xml version="1.0"?>
<xsl:stylesheet version="1.0"> 
<TABLE>
  <TR>
    <TH>Name</TH>
    <TH>Breed</TH>
    <TH>Age</TH>
    <TH>Altered</TH>
    <TH>Declawed</TH>    
    <TH>License</TH>
    <TH>Owner</TH>
  </TR>
  <xsl:for-each select="CAT">
  <TR ALIGN="LEFT" VALIGN="TOP">
    <TD>
      <xsl:value-of select="NAME"/>
    </TD>
    <TD>
      <xsl:value-of select="BREED"/>
    </TD>
    <TD>
      <xsl:value-of select="AGE"/>
    </TD>
    <TD>
      <xsl:value-of select="ALTERED"/>
    </TD>
    <TD>
      <xsl:value-of select="DECLAWED"/>
    </TD>
    <TD>
      <xsl:value-of select="LICENSE"/>
    </TD>
    <TD>
      <xsl:value-of select="OWNER"/>
    </TD>
  </TR>
</xsl:for-each>
</TABLE>

Mẫu này cho biết một loại chuyển đổi có thể trông như thế nào khi được mã hóa, nhưng hãy nhớ rằng bạn chỉ cần mô tả những gì bạn cần từ dữ liệu bằng tiếng Anh thuần. Ví dụ: bạn có thể đến bộ phận CNTT của mình và nói rằng bạn cần in dữ liệu bán hàng cho các khu vực cụ thể trong hai năm qua, "và tôi cần dữ liệu đó để xem theo cách này". Bộ phận CNTT của bạn sau đó có thể viết (hoặc thay đổi) chuyển đổi để thực hiện công việc đó.

Điều làm cho tất cả điều này thậm chí thuận tiện hơn là Microsoft và một số lượng ngày càng tăng của các nhà cung cấp khác đang tạo ra các chuyển đổi cho công việc của tất cả các loại. Trong tương lai, có khả năng bạn sẽ có thể tải xuống một chuyển đổi đáp ứng nhu cầu của mình hoặc bạn có thể điều chỉnh cho phù hợp với mục đích của mình. Điều đó có nghĩa là XML sẽ tốn ít chi phí để sử dụng hơn theo thời gian.

Tóm tắt về XML trong Hệ thống Microsoft Office

Các phiên bản chuyên nghiệp của Office cung cấp hỗ trợ XML mở rộng. Bắt đầu với hệ thống Microsoft Office 2007, Microsoft Office dùng các định dạng tệp dựa trên XML, như .docx, .xlsx và .pptx. Vì XML lưu trữ dữ liệu ở định dạng văn bản thay vì định dạng nhị phân độc quyền, khách hàng của bạn có thể xác định sơ đồ của riêng họ và sử dụng dữ liệu của bạn theo nhiều cách hơn, tất cả mọi thứ mà không cần phải trả tiền bản quyền. Để biết thêm thông tin về các định dạng mới, hãy xem Mục Mở Định dạng XML và phần mở rộng tên tệp. Các ưu điểm khác bao gồm:

  • Kích cỡ tệp nhỏ hơn. Định dạng mới sử dụng ZIP và các công nghệ nén khác để giảm kích cỡ tệp xuống 75 phần trăm so với định dạng nhị phân được sử dụng trong các phiên bản Office cũ hơn.

  • Phục hồi thông tin dễ dàng hơn và bảo mật hơn. XML là tệp con người dễ đọc, vì vậy nếu tệp bị hỏng, bạn có thể mở tệp trong Microsoft Notepad hoặc bộ đọc văn bản khác và khôi phục ít nhất một số thông tin của bạn. Ngoài ra, các tệp mới sẽ an toàn hơn vì chúng không Visual Basic for Applications mã (VBA). Nếu bạn sử dụng định dạng mới để tạo mẫu, mọi điều khiển ActiveX và macro VBA sẽ nằm trong một phần riêng biệt, an toàn hơn của tệp. Ngoài ra, bạn có thể sử dụng các công cụ, chẳng hạn như Giám định viên Tài liệu, để loại bỏ bất kỳ dữ liệu cá nhân nào. Để biết thêm thông tin về cách dùng Giám định viên Tài liệu, hãy xem bài viết Loại bỏ dữ liệu ẩn và thông tin cá nhân bằng cách kiểm tra tài liệu.

Cho đến nay vẫn tốt, nhưng điều gì sẽ xảy ra nếu bạn có dữ liệu XML không có sơ đồ? Các chương trình Office hỗ trợ XML có phương pháp tiếp cận riêng để giúp bạn làm việc với dữ liệu. Ví dụ, Excel suy ra một sơ đồ nếu bạn mở một tệp XML chưa có sơ đồ. Sau đó Excel sẽ cung cấp cho bạn tùy chọn tải dữ liệu này vào bảng XML. Bạn có thể sử dụng danh sách XML và bảng để sắp xếp, lọc hoặc thêm tính toán vào dữ liệu.

Bật các công cụ XML trong Office

Tab Nhà phát triển không được hiển thị theo mặc định, nhưng bạn sẽ cần thêm nó vào dải băng khi bạn muốn sử dụng các lệnh XML trong Office.

Bạn cần thêm trợ giúp?

Bạn muốn xem các tùy chọn khác?

Khám phá các lợi ích của gói đăng ký, xem qua các khóa đào tạo, tìm hiểu cách bảo mật thiết bị của bạn và hơn thế nữa.

Cộng đồng giúp bạn đặt và trả lời các câu hỏi, cung cấp phản hồi và lắng nghe ý kiến từ các chuyên gia có kiến thức phong phú.

Thông tin này có hữu ích không?

Bạn hài lòng đến đâu với chất lượng dịch thuật?
Điều gì ảnh hưởng đến trải nghiệm của bạn?
Khi nhấn gửi, phản hồi của bạn sẽ được sử dụng để cải thiện các sản phẩm và dịch vụ của Microsoft. Người quản trị CNTT của bạn sẽ có thể thu thập dữ liệu này. Điều khoản về quyền riêng tư.

Cảm ơn phản hồi của bạn!

×